54 votes

Comment transformer des photos de documents papier en un document numérisé ?

Mon scanner est cassé ! J'ai cependant un bon appareil photo et j'ai pris quelques photos des documents que je veux scanner... Cependant, elles ressemblent à des photos de papier, pas à des documents scannés :

  • Les images ne sont pas plates
  • L'éclairage n'est pas uniforme (ombres lorsque la page se déforme, etc.).
  • Le texte n'est évidemment pas transformé en texte PDF copiable.

Ils ne sont tout simplement pas adaptés à un usage professionnel, mais ils en sont proches.

Je suis à la recherche d'un outil (ou d'une méthode) capable de faire tout ou partie de ce qui précède, afin de pouvoir passer d'un certain nombre de fichiers JPG à un seul PDF annoté [facultatif] de l'ensemble, au bon format (A4 en général).

Des suggestions (à part l'achat d'un nouveau scanner) ?

50voto

wittich Points 1064

Il existe plusieurs façons de le faire. Bien que toutes mes suggestions aient un problème, elles n'aplatiront pas vraiment votre image. Une image plus ou moins bonne serait toujours nécessaire.

Une façon simple est d'essayer le logiciel ScanTailor ( scantailor.org )

sudo apt-get install scantailor 

Il vous guide à travers 6 étapes pour optimiser vos photos. À la dernière étape, vous pouvez sélectionner l'option "Égalisation de l'éclairage", ce qui vous donnera un bel aspect propre !


Personnellement, je me contente généralement d'utiliser GIMP . Mais vous avez besoin de quelques compétences de base pour atteindre votre objectif.

sudo apt-get install gimp 
  1. recadrer l'image de la manière souhaitée
  2. utiliser le Colors -> Curves option pour manipuler la sortie couleur comme vous le souhaitez...

Adjust Color Curves to get a nice clean output.


Un autre petit programme sympa est gscan2pdf où vous pouvez également charger des photos et les exporter au format PDF. Il y a même un lien vers GIMP pour que vous puissiez améliorer la photo en suivant les étapes décrites ci-dessus. .

sudo apt-get install gscan2pdf

25voto

Takkat Points 135194

Pour générer une copie imprimable ou un PDF à partir de la photo d'un document prise par un appareil photo, nous devons convertir manuellement un grand nombre de documents pour obtenir une image similaire à celle produite par un scanner. La plupart de ces conversions peuvent être effectuées avec Gimp.

  1. Essayez de faire en sorte que le le mieux que vous puissiez source originale image :

    • Choisissez une lumière vive pour réduire le bruit des pixels, mais pour éviter les reflets, les saignements ou la dispersion inégale de la lumière, n'utilisez pas de flash, sauf si vous disposez d'un équipement de flash de studio.
    • Si possible, choisissez d'éclairer la source d'au moins deux côtés (haut-bas ou droite-gauche).
    • Prenez la photo d'une plus grande distance en utilisant un téléobjectif plutôt qu'un grand angle.
    • Utilisez un trépied pour éviter les artefacts de tremblement.
    • Pointez la caméra orthogonalement à la surface de la source.
    • Incluez un espace en bordure de la source originale.
  2. Envisager une désaturation pour échelle de gris pour un meilleur contraste et la suppression des artefacts de pixels colorés.

    enter image description here

  3. Ajuster la luminosité et le contraste pour rendre le fond gris présumé blanc, et les lettres noires noires.

    • Cela peut être fait rapidement avec Gimp Couleurs > Niveaux où nous pouvons faire glisser le point noir (à gauche) et le point blanc (à droite) ou choisir les points noir/blanc avec le sélecteur de couleur.

    enter image description here

    • Les ombres sur les coins pliés ne peuvent pas être supprimées sans supprimer également des parties du texte (voir 6.).
  4. Supprimer la distorsion du coussin ?

    En fonction de la qualité de l'objectif de la photo et du niveau de zoom utilisé, il se peut que des artefacts de coussin soient présents, entraînant une courbure des bords extérieurs du document. Il existe des plugins pour supprimer ces artefacts, mais il est plus rapide de choisir un niveau de zoom de notre appareil photo où ils sont minimes. Après le recadrage (5.), nous ne les remarquerons peut-être même plus. La suppression des artefacts de coussin n'est donc nécessaire que dans le cas où notre image source comporte beaucoup de lignes droites dans les parties extérieures.

  5. Rotationculture oder transformation de la perspective l'image si nécessaire.

    Contrairement à un scanner, notre caméra peut ne pas obtenir la source parallèlement aux bords de l'image. The Gimp Rotation oder Perspective nous donnera un retour visuel pour pouvoir faire pivoter ou ajuster la perspective d'une image jusqu'à ce que les lignes de texte soient parallèles à la page.

    enter image description here
    Outil de perspective sur le côté droit

Nous pouvons maintenant sélectionner la source du document avec l'outil de sélection du rectangle pour recadrer l'image à l'intérieur du document.

  1. Retirer ombres indésirables de la courbure, des plis ou des artefacts de vignettage de l'objectif de la caméra.

    • Ces ombres sont difficiles à supprimer et il n'existe pas de plugin ou de filtre automatique pour nous aider.
    • Nous pourrions en théorie superposer un remplissage en gradient à ces régions, mais cela pourrait ne pas donner les résultats escomptés, et donc ne pas valoir le temps nécessaire.
    • La méthode la plus rapide est donc d'utiliser simplement l'outil gomme pour supprimer toutes ces vilaines ombres en dehors du texte (que nous devons épargner).

      enter image description here effacé -> enter image description here

  2. Image à l'échelle ?

    En fonction de la résolution de la caméra, l'agrandissement de l'image à la taille d'une image de scanner ne fera qu'augmenter la taille du fichier mais n'aura aucun avantage sur la qualité de l'image. Une réduction de l'échelle fera disparaître des détails. Par conséquent, il ne faut pas mettre l'image à l'échelle mais ajuster la taille d'impression à partir de la boîte de dialogue de l'imprimante (ou ci-dessous en 8.).

  3. Générer un PDF

    Nous pouvons importer notre image maintenant bien restaurée manuellement dans LibreOffice ( Insertion > Média ) à

    • Définir ses dimensions
    • Exporter en PDF
    • Imprimer (pour moi, imprimer à partir de LibreOffice conduit au résultat souhaité bien plus souvent qu'autre chose).

2voto

Dan Points 21

Si vous avez déjà l'image du document, il suffit de télécharger l'application CamScanner sur votre téléphone/tablette. Elle vous permettra d'importer l'image, puis vous proposera de la recadrer, de l'aplatir et d'ajuster les couleurs, le contraste, etc. Cela ne prend qu'une minute.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X