-
DALLE-2 (dataset)
Le modèle DALL-E 2 a été entraîné sur un ensemble de données varié comprenant des millions de paires image-texte collectées sur Internet. Le dataset a été filtré de façon à mitiger certains types d’images tels que des images à caractère violent ou pornographique. Manque d’informations précises.
-
LAION-5B
Le dataset LAION-5B est un ensemble de données ouvertes de grande échelle contenant environ 5,85 milliards de paires d'images et de textes. Il a été conçu pour l'entraînement et l'évaluation de modèles d'apprentissage automatique, en particulier dans les domaines de la vision par ordinateur et du traitement du langage naturel.
-
ImageNet
ImageNet est une base de données d'images organisée selon la hiérarchie de WordNet, où chaque nœud de la hiérarchie est représenté par des centaines et des milliers d'images. Le projet a joué un rôle clé dans l'avancement de la recherche en vision par ordinateur et en apprentissage profond. Les données sont disponibles gratuitement pour les chercheurs et pour des fins non commerciales.