J'ai un dépôt git où je définis le flux de travail (scripts + documentation) pour configurer une base de données : du téléchargement des données au formatage des données à la publication des données.
À la suite de l'étape de téléchargement, j'obtiens un ensemble de fichiers (JSON) totalisant environ ~150 Mo (que je peux compresser en un tarball d'environ ~40 Mo). Ensuite, ces fichiers passent par le pipeline pour finalement constituer une collection de base de données.
Voici ma question : je voudrais inclure le résultat de l'étape de téléchargement dans mon dépôt, mais je n'ai pas besoin que ces fichiers de données soient versionnés/contrôlés par git. En d'autres termes, je n'ai pas besoin que Git diff
ces fichiers chaque fois que je les mets à jour à l'avenir - j'espère ne jamais utiliser ces fichiers, mais si je le fais, j'aurai seulement besoin de la dernière version, je ne me soucie pas de leur historique.
Est-ce possible ?
"Pourquoi voudrais-je faire ça ?" - Supposons que le(s) fichier(s) téléchargé(s) changent complètement d'un commit à l'autre, l'ancienne version resterait dans l'historique en utilisant de l'espace pour aucune raison puisque je ne me soucie que de la dernière version ; c'est pourquoi j'ai emprunté cette voie. Est-ce que cela a du sens ?
Santé.