3 votes

Reconnaissance optique de caractères pour LibreOffice

J'ai un document papier. Il y a plusieurs pages contenant un tableau avec 3 colonnes (le numéro actuel, le nom et une note).

Je l'ai scanné et j'ai obtenu 16 documents jpeg. Chaque jpeg est une page scannée.

Maintenant, j'ai besoin d'un OCR pour convertir chaque jpeg en texte, afin d'insérer ce tableau dans un document excel.

J'utilise LibreOffice et Ubuntu 12.04.

4voto

El Numérisation et OCR sur Ubuntu Apps nous montre plusieurs alternatives, parmi lesquelles je vous suggère d'utiliser Programme de numérisation d'images XSane ou Scan simple (généralement préinstallé dans 12.04 et peut-être aussi dans les versions antérieures) et/ou gscan2pdf pour faire numériser vos documents.

Mon préféré est gscan2pdf qui vous permettent de suivre le processus Scan/OCR dans la même interface graphique sans aucun problème.

enter image description here

Veuillez noter que j'essaie d'exécuter un OCR sur une capture d'écran.

Il vous suffit de numériser ou d'importer les documents/images et d'aller dans le menu Outils, de choisir l'option OCR et il vous sera demandé de choisir un moteur d'OCR. Choisissez simplement celui qui vous donne les meilleurs résultats et cliquez sur "Démarrer l'OCR".

enter image description here

Vous trouverez la sortie OCR dans l'onglet portant le même titre, comme indiqué dans la capture d'écran suivante.

enter image description here

Veuillez noter que même avec des images de bonne qualité, l'OCR peut ne pas interpréter certains caractères, ce qui peut donner lieu à des mots mal orthographiés ou simplement à des hiéroglyphes égyptiens. Le processus d'OCR d'un grand nombre de documents peut prendre un certain temps.

Voici un lien vers une vidéo complète qui explique le processus de numérisation et d'OCR dans GScan2PDF : http://www.youtube.com/watch?v=UjjogfWfWsQ

Bonne chance !

3voto

RKVS Raman Points 31

Je réponds un peu tard à cette question.

Mais pour ceux qui viennent sur cette page à la recherche d'une solution OCR pour LibreOffice, j'ai récemment développé LibreOCR, un plugin OCR pour LibreOffice.

Il fait partie de Indic-OCR projet.

L'extension peut maintenant être trouvée à partir de Site web des extensions de LibreOffice

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X