Je viens d'installer Recoll pour indexer mes fichiers texte. Il fonctionne à merveille, mais ce qui m'a surpris, c'est qu'il était capable d'indexer les docx par défaut, alors qu'il me demandait d'installer antiword pour indexer les docs. Je sais que doc et docx ont des types MIME différents mais ils peuvent tous les deux être ouverts facilement par Libre.
Ce que je veux comprendre c'est : comment se fait-il que les fichiers docx soient analysés dès le départ, alors que les fichiers doc nécessitent une application supplémentaire (antiword) ? Soit Lible est utilisé par défaut pour les docx uniquement (ce dont je doute car lorsque je navigue dans mes fichiers dans Nautilus, les doc et docx sont reconnus comme des fichiers LibleOffice), soit Ubuntu dispose d'un autre parseur de docs dont je n'ai pas connaissance ?
En tout cas, je suis surpris de voir que les fichiers Win Office les plus complexes sont mieux pris en charge que les plus simples.
UPDATE: Je viens de vérifier les deux types MIME avec xdg-mine. Ma question est toujours d'actualité. Pourquoi les fichiers doc ne sont-ils pas indexés par défaut ?
yuranos@yuranos-XPS-15-9550:~/development$ xdg-mime query default application/msword
libreoffice-writer.desktop
yuranos@yuranos-XPS-15-9550:~/development$ xdg-mime query default application/vnd.openxmlformats-officedocument.wordprocessingml.document
libreoffice-writer.desktop