Перейти к содержимому

GPT4 — Whisper — Модель распознавания речи с открытым исходным кодом.docx

02/02/2024

Модель распознавания речи с открытым исходным кодом.

Whisper V 3 – распознавание речи на многих языках. С открытым кодом.

https://openai.com/index/whisper

https://github.com/openai/whisper

не превосходит модели, специализирующиеся на производительности LibriSpeech, известного конкурентного эталона в распознавании речи. 

https://www.openslr.org/12

https://paperswithcode.com/dataset/librispeech

https://www.tensorflow.org/datasets/catalog/librispeech?hl=ru

Цены 1дол за тысячу входных и 3 дол за 1000 выходных токинов.

Цены стала дешевле.

Это цены с тонкой настройкой.

GPTs – версия адаптирована под конкретные задачи.

API

Добавить комментарий