Le dataset comme récit : qui décide de ce qu'une machine « voit » ?

Item

Titre de la relation / annotation
Le dataset comme récit : qui décide de ce qu'une machine « voit » ?
Argument de l'annotation
Zizi: Queering the Dataset commence par un geste de mise en récit critique : en intervenant directement sur les données d'entraînement d'un système de reconnaissance faciale, l'œuvre expose ce que les discours techno-industriels s'emploient généralement à masquer, à savoir que tout dataset est un récit avant d'être une ressource technique. Il encode des choix sur ce qui mérite d'être documenté, sur ce qui constitue un visage « valide », sur ce qui représente la normalité, et ces choix sont rarement neutres.
Pour produire l'œuvre, Elwes s'appuie sur StyleGAN, un réseau génératif adversarial développé par NVIDIA en 2019 et rapidement devenu l'un des modèles de référence pour la génération de visages synthétiques réalistes. StyleGAN est entraîné sur le dataset FFHQ (Flickr-Faces-HQ), qui contient 70 000 photographies de visages collectées en ligne sans consentement explicite des personnes photographiées. Ces visages sont majoritairement blancs, cisgenres et hétéronormatifs, non pas parce que les concepteurs auraient délibérément exclu les autres, mais parce que le dataset reproduit mécaniquement les structures de représentation déjà dominantes sur les plateformes numériques. La machine n'invente pas le biais : elle l'amplifie, le stabilise et le transforme en infrastructure. C'est précisément cette infrastructure que Zizi choisit de perturber de l'intérieur.

En injectant 1 000 images de drag performers dans ce corpus de 70 000 visages normés, Elwes réentraîne StyleGAN sur un dataset contaminé, forçant le réseau à reconfigurer ses représentations de ce qu'est un visage. Ce geste révèle que le dataset est toujours déjà une construction narrative, une décision sur ce qui compte, sur ce qui mérite d'être appris. La contamination n'est pas une correction technique : c'est une intervention politique qui expose la dimension idéologique de toute entreprise de classification algorithmique.

Ce faisant, l'œuvre met en lumière le récit dominant de la neutralité algorithmique, qui présente les systèmes d'IA comme des miroirs objectifs du réel, en montrant qu'ils en sont toujours des traductions orientées. La question que pose Zizi n'est pas « comment rendre le dataset plus représentatif ? » mais quelque chose de plus radical : à qui appartient le pouvoir de définir ce qu'un système doit apprendre ? Qui autorise la machine à voir, et à ne pas voir ?
Le contenu à relier (ressource physique, actant, conceptuelle)
Zizi (Queering the Dataset)
Média(s) (partie gauche)
Zizi - Queering the Dataset (extrait)
Media
cover_zizi1

Linked resources

Items with "Intégrer un template Analyse critique - Annotation: Le dataset comme récit : qui décide de ce qu'une machine « voit » ?"
Title Class
Zizi (Queering the Dataset) Event
Items with "Ressource(s) associée(s) (ressource physique, actant, conceptuelle): Le dataset comme récit : qui décide de ce qu'une machine « voit » ?"
Title Class
Consentement et propriété des données : un modèle éthique contre le récit extractiviste de l'IA Annotation
L'invisibilisation comme violence structurelle : le récit de l'objectivité algorithmique et ses angles morts Annotation
La drag comme épistémologie : ce que le drag enseigne à l'IA, et ce que l'IA enseigne à la drag Annotation

Annotations

There are no annotations for this resource.