Automatisation du traitement de résumés de conférences académiques par un workflow n8n
Item
- Title
- Automatisation du traitement de résumés de conférences académiques par un workflow n8n
- Intentions artistiques/théoriques
- Développer une chaîne de traitement automatisée permettant de transcrire le contenue, généré des résumées, d'extraire des citations ainsi que d'associé des mots-clés de vidéo de conférence académique pour faciliter leur indexation, leur valorisation documentaire et leur intégration dans Omeka S. L'objectif est d'accélérer le processus tout en maintenant une validation humaine finale pour garantir la qualité académique.
- Période d'expérimentation
- 2025
- Statut de l'expérimentation
- En cours
- Artiste(s)
-
Keven Laporte
- Type(s) de média / médium
- Numérique, audiovisuel (vidéo), audio (extraction MP3/WAV), textuel (transcriptions SRT, JSON structuré)
- Résumé de l'expérimentation
- Ce workflow n8n automatise le traitement de conférences académiques francophones hébergées sur YouTube. Il télécharge l'audio avec yt-dlp, le segmente en tranches de 15 minutes via ffmpeg, transcrit chaque segment avec l'API OpenAI Whisper-1, puis agrège et corrige les timestamps des fichiers SRT. Quatre agents IA (GPT-4o et GPT-4o-mini) génèrent ensuite un résumé chronologique (~120 mots), un résumé thématique (~300 mots), extraient 10 citations verbatim minutées et associent des mots-clés issus d'une base vectorielle Supabase. Le processus prend environ 7 minutes 30 secondes par vidéo et produit un fichier JSON prêt pour l'import batch dans Omeka S. L'expérimentation est à 80% de finalisation; des améliorations sont prévues pour la qualité d'extraction des citations et la conformité totale du JSON aux exigences d'import Omeka S.
- Outils / Logiciels / Dispositifs
-
n8n
-
FFmpeg
-
OpenAI Embeddings
-
GPT-4o
-
OpenAI Whisper
-
Supabase Vector Store
-
Docker
-
yt-dlp
- médias reliés à l'expérimentation (photo/vidéo)
-
Capture d'écran de la cinquième itération du workflow n8n de traitement automatique de vidéo
- Intégrer des templates retours d'expérience
-
Quelques limites des LLMs en production n8n
-
La qualité de la transcription est primordiale : de Whisper local à l’API d'OpenAI
-
Prototype de transcription et de génération de résumé par IA de vidéo
-
Ajout de nos mots-clés EdiSem dans la base vectorielle
- si un lien externe vers l'expérimentation existe
- Mettre l'url de la video du JSON (output) test.
- ratingValue
- 70
- Item sets
- EdiSem (Travaux étudiants)
- Media
Exemple-de-workflow-n8n
Linked resources
| Title | Class |
|---|---|
La qualité de la transcription est primordiale : de Whisper local à l’API d'OpenAI |
Annotations
There are no annotations for this resource.
