Les fichiers DOC sont (censés être) un format "hérité". Parfois, les fichiers DOC étaient au format binaire et parfois le fichier DOC était un fichier RTF en texte brut avec des extensions Word.
Les fichiers DOCX sont du XML en texte brut et d'autres données (par exemple, des images) stockées dans une arborescence de dossiers compressés et stockées au format zip. Vous pouvez changer l'extension en ZIP puis les ouvrir. (Pratique pour extraire des images).
Word 2010 sur Windows se contente de changer l'extension du fichier en DOC si vous utilisez "enregistrer sous", mais il s'agit toujours d'un fichier DOCX zippé.
Si vous l'enregistrez en tant que RTF, vous pourrez probablement reproduire le comportement dans votre environnement Windows.
J'ai fait un test avec une seule page de texte tirée au hasard d'un livre de Project Gutenberg :
- RTF = 205 Ko
- DOCX = 25 Ko
- RTF zippé avec un logiciel tiers = 31 Ko
Donc, d'après ce que je pense, la différence de taille de fichier est due à la compression ZIP.
Vue protégée ? Peut-être que le fichier est corrompu, peut-être avez-vous une macro VBA intégrée et ils ont une politique de restriction à 100% sur les macros, qui sait. Je vous recommande de poser cette question séparément.