Whisper est un modèle de reconnaissance vocale polyvalent. Il est entraîné sur un large ensemble de données audio diverses et est aussi un modèle multitâche qui peut effectuer une reconnaissance vocale multilingue ainsi qu'une traduction de la parole et une identification de la langue.
Outils de développement