Ajout de nos mots-clés EdiSem dans la base vectorielle

Item

Title
Ajout de nos mots-clés EdiSem dans la base vectorielle
Description
Ce workflow n8n ingère le contenu de fichiers (PDF/CSV) et les indexe dans la base vectorielle de Supabase Vector Store afin que l’agent IA puisse associer et reconnaître nos mots-clés exacts lors de sa tâche. Il est conçu pour être réutilisable à tout moment pour ajouter de nouveaux mots-clés et mettre à jour la base vectorielle, garantissant que le RAG soit à jour.
Insérer un template outils
n8n
Supabase Vector Store
OpenAI Embeddings
Succès / Avancées notables
Chaîne complète de l’upload à l’indexation vectorielle fonctionnelle avec un minimum de nœuds.
Intégration prête à l’emploi avec Supabase via les identifiants n8n dédiés.
Ajout de métadonnées personnalisées (title=keywords_id) pour relier les vecteurs à des identifiants.
Problèmes rencontrés
La première version utilisait le « Basic Vector Store » de n8n qui causait plusieurs erreurs.
Dépendance à l’API OpenAI (coûts/latence, gestion d’erreurs non détaillée).
Il semble y avoir un problème avec les mots-clés comprenant un trait d'union : seule la seconde partie du mot est extraite lors du RAG. Par exemple, on verra « vérité » plutôt que « post-vérité ».
Paramètres de découpage non explicités (taille/overlap), ce qui empêchait l'IA d'effectuer sa tâche d'association de mots-clés.
Solutions apportées
Passage par un Text Splitter récursif pour éviter les segments trop volumineux et homogénéiser l’indexation.
Utilisation de Supabase Vector Store comme alternative efficace et stable. De plus, à notre échelle, son utilisation est gratuite.
Ajout du nœud « Recursive Character Text Splitter » pour uniformiser l’indexation.
Prolongements possibles
Génération parallèle de mots-clés étendus stockés en métadonnées pour améliorer le rappel.
Autres contextes d’application
Ce workflow peut être utilisé pour ajouter toutes sortes de données dans un RAG, à condition que celles-ci sont au format CSV ou PDF.

Linked resources

Items with "Intégrer des templates retours d'expérience: Ajout de nos mots-clés EdiSem dans la base vectorielle"
Title Class
Automatisation du traitement de résumés de conférences académiques par un workflow n8n

Annotations

There are no annotations for this resource.