DeepSeek-R1

Item

Nom de l'outil/software
DeepSeek-R1
Logo ou produit, etc.
Logo de DeepSeek R1
Ce que fait l’outil
DeepSeek-R1 est un modèle de langage spécialisé dans le raisonnement logique, développé via l'apprentissage par renforcement (RL) à grande échelle. Il excelle dans la résolution de problèmes complexes en mathématiques, en programmation et en raisonnement analytique, avec des performances comparables à OpenAI-o1. Le modèle utilise une architecture Mixture of Experts (MoE) avec 671 milliards de paramètres totaux, dont 37 milliards activés par requête, permettant une efficacité optimale.
Type: Logiciel web, App mobile, Librairie Python, etc.
Modèle de langage (LLM), API web
Fonction de l'outil
Raisonnement logique, analyse complexe, résolution de problèmes mathématiques, génération de code, chaîne de pensée (Chain-of-Thought).
Médias (vidéo, photos, etc.)
Logo de DeepSeek R1
Date de création
20 janvier 2025
Langage de programmation
Python
Linux, Mac, Windows
Linux nativement, mais peux fonctionné sur Mac et Windows via des containeurs Docker
Formats de fichiers générés ou supportés
JSON (sortie structurée), Texte brut, SafeTensors (format de poids du modèle)
Licence: GPL, MIT, CC BY
MIT
Site web officiel
https://chat.deepseek.com/
Base de bugs connue : URI vers Github
https://github.com/deepseek-ai/DeepSeek-R1/issues

Linked resources

Items with "Insérer un template outils: DeepSeek-R1"
Title Class
Prototype de transcription et de génération de résumé par IA de vidéo

Annotations

There are no annotations for this resource.