La qualité de la transcription est primordiale : de Whisper local à l’API d'OpenAI

Item

Title
La qualité de la transcription est primordiale : de Whisper local à l’API d'OpenAI
Description
Au départ, une exécution locale de Whisper‑medium donnait une qualité insuffisante sur des conférences en français avec accents; le passage à l’API OpenAI whisper‑1 a significativement amélioré la qualité globale.​
Le workflow a été adapté pour découper l’audio en tranches de 15 minutes afin de respecter les contraintes d’entrée, puis agréger et réaligner les SRT en fin de chaîne.​
Sur des vidéos de plus d’une heure, une dégradation reste toute de même présente dû aux limitations de n8n sur la longueur maximale des contextes allouer au LLM.
Photo / Vidéo de cette expérimentation
Capture d'écran d'un segment du workflow n8n 1
Insérer un template outils
n8n
OpenAI Whisper
Succès / Avancées notables
Transcriptions plus robustes pour des conférences francophones grâce à l’utilisation du service de transcription API d'OpenAI, ce qui augmente la qualité global du traitement automatique.
Problèmes rencontrés
Limite de taille des fichiers pour la transcription API, imposant un découpage et un envoi par morceaux plutôt qu’unique.
Décalages SRT/oral entraînant des citations mal synchronisé, nécessitant une correction humaine des marqueurs temporels.
Solutions apportées
Mise en place d’une segmentation de l’audio en tranches de 15 minutes, puis agrégation des sorties en une transcription consolidée et ajout d'un nœud de code Javascript pour réassemblé le SRT en un seul bloc exploitable.
Suggestions pour d’autres expérimentateur.ices
Les modèles Whisper disponible au téléchargement local, en date du 13 novembre 2025, ne sont pas adapté à la transcription de contenue francophone avec accent la qualité de Whisper-1 (uniquement disponible via l'API) est grandement supérieur.

De plus, dans la version 1.111.0 et antérieur de n8n, il est préférable d'utilisé le nœud de base « HTTP Request » plutôt que le noeud « Transcribe a recording » d'OpenAI pour plus de stabilité.
Actant ayant créé ce retour d'expérience
Keven Laporte
Modifications envisagées
Ajouter un IA de control de qualité après chaque étape de génération pour relancé l'étape en cas de sorti de qualité inférieur. Bien que cela ajoute de la complexité, cet ajout augmenterait significativement l'autonomie du processus et la consistance de la qualité produit.

Linked resources

Items with "Intégrer des templates retours d'expérience: La qualité de la transcription est primordiale : de Whisper local à l’API d'OpenAI"
Title Class
Automatisation du traitement de résumés de conférences académiques par un workflow n8n

Annotations

There are no annotations for this resource.