OpenAI Whisper
Item
-
Nom de l'outil/software
-
OpenAI Whisper
-
Ce que fait l’outil
-
Le modèle Whisper est un système de reconnaissance vocale polyvalent. Il a été entraîné sur un vaste ensemble de données audio variées et il s’agit également d’un modèle multitâche capable d’effectuer la reconnaissance vocale multilingue, la traduction de la parole et l’identification des langues.
-
Type: Logiciel web, App mobile, Librairie Python, etc.
-
Modèle d'apprentissage automatique / API de service cloud / Librairie Python open-source
-
Fonction de l'outil
-
Transcription automatique de la parole en texte, traduction vocale vers l'anglais, identification de la langue parlée, et détection d'activité vocale
-
Date de création
-
Septembre 2022
-
Langage de programmation
-
Python
-
Linux, Mac, Windows
-
Linux, Mac, Windows
-
Formats de fichiers générés ou supportés
-
Formats audio d'entrée : .flac, .mp3, .mp4, .mpeg, .mpga, .m4a, .ogg, .wav, .webm (limite de 25 MB via API)
Formats de sortie : Texte brut, JSON, VTT (sous-titres), SRT (sous-titres), TSV
-
Licence: GPL, MIT, CC BY
-
MIT License
Annotations
There are no annotations for this resource.