LAION-5B

Item

Nom de l'outil/software
LAION-5B
Ce que fait l’outil
LAION-5B est un dataset ouvert constitué de 5,85 milliards de paires image-texte collectées automatiquement sur le web public. Il a été produit par l'organisation à but non lucratif LAION (Large-scale Artificial Intelligence Open Network) et est utilisé pour entraîner des modèles d'IA générative majeurs, dont Stable Diffusion. Sa constitution repose sur des logiques d'agrégation automatisée à grande échelle, largement détachées du consentement des créateur·ices dont les œuvres ont été moissonnées.
Type: Logiciel web, App mobile, Librairie Python, etc.
Dataset / Jeu de données d'entraînement — Infrastructure de données ouverte
Fonction de l'outil
Entraînement de modèles d'IA générative (image-texte) — Recherche en apprentissage automatique à grande échelle
Date de création
2022
Langage de programmation
Python
Linux, Mac, Windows
Multi-plateforme (accès via web et API, indépendant du système d'exploitation)
Formats de fichiers générés ou supportés
Parquet, JSON, WEBP, JPG — paires image + texte (alt-text)
Utilisé dans le projet
Have I Been Trained?

Annotations

There are no annotations for this resource.