Ajout de nos mots-clés EdiSem dans la base vectorielle
Item
- Title
- Ajout de nos mots-clés EdiSem dans la base vectorielle
- Description
- Ce workflow n8n ingère le contenu de fichiers (PDF/CSV) et les indexe dans la base vectorielle de Supabase Vector Store afin que l’agent IA puisse associer et reconnaître nos mots-clés exacts lors de sa tâche. Il est conçu pour être réutilisable à tout moment pour ajouter de nouveaux mots-clés et mettre à jour la base vectorielle, garantissant que le RAG soit à jour.
- Succès / Avancées notables
- Chaîne complète de l’upload à l’indexation vectorielle fonctionnelle avec un minimum de nœuds.
- Intégration prête à l’emploi avec Supabase via les identifiants n8n dédiés.
- Ajout de métadonnées personnalisées (title=keywords_id) pour relier les vecteurs à des identifiants.
- Problèmes rencontrés
- La première version utilisait le « Basic Vector Store » de n8n qui causait plusieurs erreurs.
- Dépendance à l’API OpenAI (coûts/latence, gestion d’erreurs non détaillée).
- Il semble y avoir un problème avec les mots-clés comprenant un trait d'union : seule la seconde partie du mot est extraite lors du RAG. Par exemple, on verra « vérité » plutôt que « post-vérité ».
- Paramètres de découpage non explicités (taille/overlap), ce qui empêchait l'IA d'effectuer sa tâche d'association de mots-clés.
- Solutions apportées
- Passage par un Text Splitter récursif pour éviter les segments trop volumineux et homogénéiser l’indexation.
- Utilisation de Supabase Vector Store comme alternative efficace et stable. De plus, à notre échelle, son utilisation est gratuite.
- Ajout du nœud « Recursive Character Text Splitter » pour uniformiser l’indexation.
- Prolongements possibles
- Génération parallèle de mots-clés étendus stockés en métadonnées pour améliorer le rappel.
- Autres contextes d’application
- Ce workflow peut être utilisé pour ajouter toutes sortes de données dans un RAG, à condition que celles-ci sont au format CSV ou PDF.
- Item sets
- EdiSem (Travaux étudiants)
Linked resources
| Title | Class |
|---|---|
Automatisation du traitement de résumés de conférences académiques par un workflow n8n |
Annotations
There are no annotations for this resource.





