Je prends beaucoup de mémos en recodant ma voix à l'aide de mon smartphone Android. Les enregistrements peuvent être une note rapide ou une longue dictée, et leur taille est donc très variable. Selon l'application que j'utilise, l'audio est enregistré sous forme de fichier WAV ou MP3.
Ce que je veux faire, c'est prendre ces mémos vocaux et ces dictées et les convertir en fichiers texte.
J'ai trouvé cette méthode qui utilise théoriquement pavucontrol pour diriger la lecture audio vers l'API de conversion de la voix en texte de Google Chrome, mais je n'arrive pas à le faire fonctionner. J'ai suivi les instructions et je n'obtiens aucune erreur, mais je ne vois pas de texte apparaître dans l'interface de Chrome. En tout cas, ce n'est pas beaucoup mieux que de tenir mon téléphone devant le microphone de mon ordinateur portable. J'espérais quelque chose où je n'aurais pas nécessairement à entendre l'audio pendant qu'il est converti en texte, comme je pourrais le faire avec mon ordinateur portable lorsque je suis dans un café ou autre.
L'idéal serait de disposer d'un logiciel permettant de charger un lot de fichiers audio et de produire un lot de fichiers texte, un pour chaque fichier audio.
Existe-t-il un logiciel ou une méthode pour cela sur Ubuntu ?