02/02/2024





Модель распознавания речи с открытым исходным кодом.
Whisper V 3 – распознавание речи на многих языках. С открытым кодом.
https://openai.com/index/whisper
https://github.com/openai/whisper
не превосходит модели, специализирующиеся на производительности LibriSpeech, известного конкурентного эталона в распознавании речи.
https://paperswithcode.com/dataset/librispeech
https://www.tensorflow.org/datasets/catalog/librispeech?hl=ru

Цены 1дол за тысячу входных и 3 дол за 1000 выходных токинов.


Цены стала дешевле.

Это цены с тонкой настройкой.

GPTs – версия адаптирована под конкретные задачи.
API

