2 votes

Analyseur docx par défaut d'Ubuntu

Je viens d'installer Recoll pour indexer mes fichiers texte. Il fonctionne à merveille, mais ce qui m'a surpris, c'est qu'il était capable d'indexer les docx par défaut, alors qu'il me demandait d'installer antiword pour indexer les docs. Je sais que doc et docx ont des types MIME différents mais ils peuvent tous les deux être ouverts facilement par Libre.

Ce que je veux comprendre c'est : comment se fait-il que les fichiers docx soient analysés dès le départ, alors que les fichiers doc nécessitent une application supplémentaire (antiword) ? Soit Lible est utilisé par défaut pour les docx uniquement (ce dont je doute car lorsque je navigue dans mes fichiers dans Nautilus, les doc et docx sont reconnus comme des fichiers LibleOffice), soit Ubuntu dispose d'un autre parseur de docs dont je n'ai pas connaissance ?

En tout cas, je suis surpris de voir que les fichiers Win Office les plus complexes sont mieux pris en charge que les plus simples.

UPDATE: Je viens de vérifier les deux types MIME avec xdg-mine. Ma question est toujours d'actualité. Pourquoi les fichiers doc ne sont-ils pas indexés par défaut ?

yuranos@yuranos-XPS-15-9550:~/development$ xdg-mime query default application/msword
libreoffice-writer.desktop
yuranos@yuranos-XPS-15-9550:~/development$ xdg-mime query default application/vnd.openxmlformats-officedocument.wordprocessingml.document
libreoffice-writer.desktop

3voto

user60330 Points 46

Les fichiers docx sont basés sur XML et sont analysés par Recoll à l'aide d'une simple transformation xslt. Selon les versions de Recoll, il suffit d'installer xsltproc ou Python libxml2/libxslt. Il s'agit de dépendances communes et il se peut qu'elles soient présentes sur votre système pour une autre raison.

L'ancien format .doc est un format binaire qui ne peut pas être traité directement par recoll, qui utilise plutôt antiword pour extraire le texte.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X