La qualité de la transcription est primordiale : de Whisper local à l’API d'OpenAI
Item
- Title
- La qualité de la transcription est primordiale : de Whisper local à l’API d'OpenAI
- Description
-
Au départ, une exécution locale de Whisper‑medium donnait une qualité insuffisante sur des conférences en français avec accents; le passage à l’API OpenAI whisper‑1 a significativement amélioré la qualité globale.
Le workflow a été adapté pour découper l’audio en tranches de 15 minutes afin de respecter les contraintes d’entrée, puis agréger et réaligner les SRT en fin de chaîne.
Sur des vidéos de plus d’une heure, une dégradation reste toute de même présente dû aux limitations de n8n sur la longueur maximale des contextes allouer au LLM. - Photo / Vidéo de cette expérimentation
-
Capture d'écran d'un segment du workflow n8n 1
- Succès / Avancées notables
- Transcriptions plus robustes pour des conférences francophones grâce à l’utilisation du service de transcription API d'OpenAI, ce qui augmente la qualité global du traitement automatique.
- Problèmes rencontrés
- Limite de taille des fichiers pour la transcription API, imposant un découpage et un envoi par morceaux plutôt qu’unique.
- Décalages SRT/oral entraînant des citations mal synchronisé, nécessitant une correction humaine des marqueurs temporels.
- Solutions apportées
- Mise en place d’une segmentation de l’audio en tranches de 15 minutes, puis agrégation des sorties en une transcription consolidée et ajout d'un nœud de code Javascript pour réassemblé le SRT en un seul bloc exploitable.
- Suggestions pour d’autres expérimentateur.ices
-
Les modèles Whisper disponible au téléchargement local, en date du 13 novembre 2025, ne sont pas adapté à la transcription de contenue francophone avec accent la qualité de Whisper-1 (uniquement disponible via l'API) est grandement supérieur.
De plus, dans la version 1.111.0 et antérieur de n8n, il est préférable d'utilisé le nœud de base « HTTP Request » plutôt que le noeud « Transcribe a recording » d'OpenAI pour plus de stabilité. - Actant ayant créé ce retour d'expérience
-
Keven Laporte
- Modifications envisagées
- Ajouter un IA de control de qualité après chaque étape de génération pour relancé l'étape en cas de sorti de qualité inférieur. Bien que cela ajoute de la complexité, cet ajout augmenterait significativement l'autonomie du processus et la consistance de la qualité produit.
- Item sets
- EdiSem (Travaux étudiants)
Linked resources
| Title | Class |
|---|---|
Automatisation du traitement de résumés de conférences académiques par un workflow n8n |
Annotations
There are no annotations for this resource.




