El Numérisation et OCR sur Ubuntu Apps nous montre plusieurs alternatives, parmi lesquelles je vous suggère d'utiliser Programme de numérisation d'images XSane ou Scan simple (généralement préinstallé dans 12.04 et peut-être aussi dans les versions antérieures) et/ou gscan2pdf pour faire numériser vos documents.
Mon préféré est gscan2pdf qui vous permettent de suivre le processus Scan/OCR dans la même interface graphique sans aucun problème.
Veuillez noter que j'essaie d'exécuter un OCR sur une capture d'écran.
Il vous suffit de numériser ou d'importer les documents/images et d'aller dans le menu Outils, de choisir l'option OCR et il vous sera demandé de choisir un moteur d'OCR. Choisissez simplement celui qui vous donne les meilleurs résultats et cliquez sur "Démarrer l'OCR".
Vous trouverez la sortie OCR dans l'onglet portant le même titre, comme indiqué dans la capture d'écran suivante.
Veuillez noter que même avec des images de bonne qualité, l'OCR peut ne pas interpréter certains caractères, ce qui peut donner lieu à des mots mal orthographiés ou simplement à des hiéroglyphes égyptiens. Le processus d'OCR d'un grand nombre de documents peut prendre un certain temps.
Voici un lien vers une vidéo complète qui explique le processus de numérisation et d'OCR dans GScan2PDF : http://www.youtube.com/watch?v=UjjogfWfWsQ
Bonne chance !