Du descriptif au poétique
Item
- Title
- Du descriptif au poétique
- Description
-
Ce retour d’expérience porte sur la production de poèmes à partir des légendes associées aux photographies géolocalisées. Contrairement aux BMU_text, qui offrent une matière littéraire riche mais limitée en couverture, les légendes permettent de travailler à l’échelle de l’ensemble du corpus photographique. Elles rendent possible une génération poétique pour un très grand nombre de rues, à partir d’un matériau directement lié aux images et aux lieux photographiés.
L’expérimentation a toutefois nécessité un important travail de préparation des données. Le fichier CSV brut contenait des erreurs d’encodage, des caractères complexes et des problèmes de lisibilité qui ont dû être nettoyés avec Python. Il a aussi fallu croiser ce fichier avec un autre fichier contenant les informations sur les rues, afin d’associer chaque identifiant de photo à la rue géolocalisée correspondante. Les légendes ont ensuite été regroupées par rue pour former un texte de base, utilisé comme matière de départ pour la génération des poèmes.
Cette étape a montré que les légendes constituent une matière plus descriptive que les extraits littéraires, mais beaucoup plus complète sur le plan territorial. Les mêmes prompts stylistiques que dans l’expérimentation précédente ont pu être réutilisés pour les auteurs choisis, avec quelques ajustements afin de tenir compte du caractère plus visuel, factuel et descriptif du corpus. - Succès / Avancées notables
-
Les légendes permetten d’élargir considérablement la couverture du projet. Alors que les BMU_text étaient limités à 365 fichiers et ne couvraient pas l’ensemble des BMU photographiques, les légendes permettent de travailler à partir d’un corpus beaucoup plus vaste : 805 169 légendes associées aux photographies géolocalisées de 44 465 rues.
L’usage des légendes a donc rendu possible une génération poétique à l’échelle du territoire. Chaque rue peut être associée à un texte de base construit à partir des légendes des photographies qui lui sont liées. Cette méthode permet de mieux relier la production poétique aux images réellement géolocalisées sur chaque rue. - Le travail de fusion des données a aussi constitué une avancée importante. En associant les identifiants de photos aux informations de rue, il a été possible de rattacher les légendes au bon lieu. Cela a permis de produire un corpus textuel structuré par rue, directement exploitable pour la génération poétique.
- La méthode a permis de réutiliser les prompts développés précédemment pour les styles d’auteurs. Les ajustements nécessaires sont restés limités : il fallait surtout préciser que la matière de départ était plus descriptive que littéraire, afin d’éviter que le modèle se contente de reformuler les légendes.
- Problèmes rencontrés
- Le premier problème concernait la qualité du fichier brut. Le CSV contenait des erreurs d’encodage, des caractères complexes et des éléments difficiles à lire ou à traiter directement. Sans nettoyage préalable, ces problèmes risquaient de perturber la génération ou de produire des textes contenant des fragments incohérents.
- Une autre difficulté était l’association entre les légendes et les rues. Les légendes étaient liées aux identifiants des photos, mais il fallait les croiser avec un autre fichier contenant les informations géographiques et les noms de rues. Cette étape était essentielle pour savoir à quelle rue appartenait chaque photographie.
- Le volume de données représentait aussi un défi. Avec plus de 800 000 légendes et près de 45 000 rues, il n’était pas possible de traiter le corpus de manière manuelle. Il fallait donc automatiser le nettoyage, la fusion des fichiers et le regroupement des légendes par rue.
- Les légendes étant plus descriptives que les extraits littéraires, les poèmes générés risquaient de rester proches de l’inventaire visuel. Le
- Solutions apportées
- Un nettoyage du fichier CSV a été réalisé avec Python afin de corriger les problèmes d’encodage, de retirer ou normaliser certains caractères complexes et de rendre les données exploitables.
- Les légendes ont ensuite été croisées avec un fichier contenant les informations sur les rues. Cette fusion a permis d’associer chaque identifiant de photo à la rue correspondante, en s’appuyant sur les données de géolocalisation des images.
- Une fois cette association faite, les légendes ont été regroupées par rue. Pour chaque rue, l’ensemble des légendes liées aux photos correspondantes a été combiné dans un texte de base. Ce texte a ensuite servi de matière première pour la génération du poème.
- Actant ayant créé ce retour d'expérience
- Anjara Rafidison
- Prolongements possibles
- Cette expérimentation ouvre directement vers l’automatisation de la production poétique. Une fois les légendes nettoyées, associées aux bonnes rues et regroupées en textes de base, le corpus devient beaucoup plus facilement exploitable dans une chaîne de génération automatisée. L’enjeu suivant est donc de produire les poèmes à grande échelle, en limitant les interventions manuelles tout en conservant une structure claire pour relier chaque poème à sa rue d’origine.
Linked resources
| Title | Class |
|---|---|
III. De la légende au poème : transformation d’un corpus descriptif en écriture poétique |
Annotations
There are no annotations for this resource.


