2 votes

Recherche d'un moyen de transcrire des fichiers audio en texte

Je prends beaucoup de mémos en recodant ma voix à l'aide de mon smartphone Android. Les enregistrements peuvent être une note rapide ou une longue dictée, et leur taille est donc très variable. Selon l'application que j'utilise, l'audio est enregistré sous forme de fichier WAV ou MP3.

Ce que je veux faire, c'est prendre ces mémos vocaux et ces dictées et les convertir en fichiers texte.

J'ai trouvé cette méthode qui utilise théoriquement pavucontrol pour diriger la lecture audio vers l'API de conversion de la voix en texte de Google Chrome, mais je n'arrive pas à le faire fonctionner. J'ai suivi les instructions et je n'obtiens aucune erreur, mais je ne vois pas de texte apparaître dans l'interface de Chrome. En tout cas, ce n'est pas beaucoup mieux que de tenir mon téléphone devant le microphone de mon ordinateur portable. J'espérais quelque chose où je n'aurais pas nécessairement à entendre l'audio pendant qu'il est converti en texte, comme je pourrais le faire avec mon ordinateur portable lorsque je suis dans un café ou autre.

L'idéal serait de disposer d'un logiciel permettant de charger un lot de fichiers audio et de produire un lot de fichiers texte, un pour chaque fichier audio.

Existe-t-il un logiciel ou une méthode pour cela sur Ubuntu ?

0voto

John Points 31

Essayez Mozilla DeepSpeech . C'est un outil opensource pour la transcription automatique. Mais vous aurez besoin d'entraîner l'outil. Vous pouvez télécharger le modèle pré-entraîné de Mozilla, ou utiliser Les ensembles de données vocales de Mozilla pour créer votre propre modèle, et vous pouvez l'utiliser pour des enregistrements en anglais. Pour des enregistrements très clairs, le taux de précision est relativement bon. Mais pour mes projets de transcription, ce n'était toujours pas suffisant, car les enregistrements avaient beaucoup de bruits de fond, ils n'étaient pas de bonne qualité, j'ai utilisé Transcripteur Il s'agit plutôt d'un éditeur basé sur le web qui permet la transcription automatique, mais vous devrez être connecté en ligne pour télécharger les enregistrements sur le serveur de Transcribear.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X