49 votes

Recherche de texte dans plusieurs PDF et documents

J'ai reçu un tas de notes écrites par d'autres étudiants, mais elles proviennent d'un vieux manuel qui n'aborde pas tous les sujets dans le même ordre, de sorte que je dois chercher dans les notes de chaque chapitre (chaque chapitre individuel se trouve dans un fichier .pdf ou .doc différent) pour trouver "trace conditioning" par exemple.

J'avais l'habitude d'utiliser Google Desktop pour cela, j'ai maintenant Launchy et je lui ai dit de rechercher des pdf, mais il ne recherche que les titres, pas le contenu.

Merci de votre aide.

48voto

Glutanimate Points 20429

Recoll est probablement le moteur de recherche de documents le plus polyvalent que vous trouverez sous Linux :

enter image description here

Il prend en charge une pléthore de formats différents et est très personnalisable.

Pour les instructions d'installation et d'autres conseils, veuillez consulter le site suivant cette réponse . La documentation officielle est également très utile.

33voto

Edward Torvalds Points 7511

Installer le paquet pdfgrep

sudo apt-get install pdfgrep

puis utiliser la commande :

find /path -iname '*.pdf' -exec pdfgrep pattern {} +

5voto

ligaz Points 1683

Utilisation DocFetcher Il s'agit d'une application Linux native qui indexe et recherche dans plusieurs types de documents.

1voto

N0rbert Points 86925

Je comprends qu'Adobe Reader est un logiciel propriétaire, mais il est bien conçu. Recherche dans les fichiers (accessible à partir de 編集部 -> Recherche ou en appuyant sur Ctrl + Shift + F ).

Options de recherche simples

Les Recherche simple est illustrée ci-dessous :

Simple search in Adobe Reader

Vous devez définir Où souhaitez-vous effectuer une recherche ? a Tous les documents PDF en puis sélectionnez le lieu dans le menu déroulant ( Rechercher un lieu ).

Vous pouvez saisir un élément de recherche dans le champ Quel est le mot ou la phrase que vous souhaitez rechercher ? et spécifier les options de recherche : Mots entiers uniquement , Sensible à la casse , Inclure des signets , Inclure les commentaires .

Options de recherche avancée

La recherche avancée est plus configurable - voir l'image ci-dessous :

Advanced Search

Le chemin de recherche est défini dans Regarder à l'intérieur .
Objet de la recherche - en Quel est le mot ou la phrase que vous souhaitez rechercher ? .
Retourner les résultats contenant a des options : Correspondance Mot ou expression exacts , Faites correspondre n'importe lequel des mots , Faites correspondre tous les mots , Requête booléenne .

D'autres options sont possibles : Mots entiers uniquement , Sensible au cas par cas , Proximité , Tige , Inclure des signets , Inclure les commentaires , Inclure les pièces jointes .


Remarque : vous pouvez toujours installer la version native d'Adobe Reader 9.5.5 comme indiqué ci-dessous. dans l'autre fil .

1voto

Paul Jurczak Points 407

rga (ou ripgrep-all) est un outil en ligne de commande qui permet de rechercher de manière récursive un motif regex dans tous les fichiers d'un répertoire. Il fonctionne sous Linux, macOS et Windows. Il s'agit d'une enveloppe pour ripgrep, le programme de recherche récursive orienté ligne, qui permet en outre de rechercher dans une multitude de types de fichiers tels que PDF, DOCX, ODT, EPUB, bases de données SQLite, sous-titres de films intégrés dans des fichiers MKV ou MP4, archives telles que ZIP ou GZ, et bien plus encore.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X