LAION-5B
Item
- Nom de l'outil/software
- LAION-5B
- Ce que fait l’outil
- LAION-5B est un dataset ouvert constitué de 5,85 milliards de paires image-texte collectées automatiquement sur le web public. Il a été produit par l'organisation à but non lucratif LAION (Large-scale Artificial Intelligence Open Network) et est utilisé pour entraîner des modèles d'IA générative majeurs, dont Stable Diffusion. Sa constitution repose sur des logiques d'agrégation automatisée à grande échelle, largement détachées du consentement des créateur·ices dont les œuvres ont été moissonnées.
- Type: Logiciel web, App mobile, Librairie Python, etc.
- Dataset / Jeu de données d'entraînement — Infrastructure de données ouverte
- Fonction de l'outil
- Entraînement de modèles d'IA générative (image-texte) — Recherche en apprentissage automatique à grande échelle
- Date de création
- 2022
- Langage de programmation
- Python
- Linux, Mac, Windows
- Multi-plateforme (accès via web et API, indépendant du système d'exploitation)
- Formats de fichiers générés ou supportés
- Parquet, JSON, WEBP, JPG — paires image + texte (alt-text)
- Site web officiel
- https://laion.ai/blog/laion-5b/
- Utilisé dans le projet
-
Have I Been Trained?
- Media
LAION-5B_logo
Annotations
There are no annotations for this resource.
