полезные ссылки
RHVoice — это свободно распространяемый многоязычный синтезатор речи с открытым исходным кодом, создатель RHVoice, Ольга Яковлева, сама незрячая.
Используется библиотека «gTTS» (Import the required module for text to speech conversion.)
Программа для чтения с Экрана сделанная слепыми.
'''
Программа из текст создает звук. И воспроизводит созданный файл,
но только если запускается с локального диска, а если с "nas", то не запускается, для этого нужно доделать программу.
'''
## ---- Настройки ----
mytext = 'The Countess of Wessex is getting real about menopause. Why her groundbreaking message matters' # текст который будем озвучивать.
language = 'en' ## ('ru' - русский; 'en' - Ангийский) язык воспроизведения.
file_named = "Recorded_text.mp3" ## Название файла куда будет записываться звуковой файл.
## ---- Программа ----
from gtts import gTTS ## Import the required module for text to speech conversion.
import os ## This module is imported so that we can play the converted audio
myobj = gTTS(text=mytext, lang=language, slow=False) ## Passing the text and language to the engine, here we have marked slow=False. Which tells the module that the converted audio should have a high speed.
myobj.save(file_named) ## Saving the converted audio in a mp3 file named.
#os.system("mpg321 welcome.mp3") ## В Linux, чтобы прослушать mp3. Если у вас нет "mpg321", то установите его: sudo apt-get install mpg321
os.system(file_named) ## В Windows, чтобы прослушать mp3. Будет запущена программа по умолчанию.
Привет озвучивания текста локально, т.е. не использую googl и API других сервизов.
'''
Программа из текст создает звук. И воспроизводит созданный файл,
но только если запускается с локального диска, а если с "nas", то не запускается, для этого нужно доделать программу.
gtts - https://gtts.readthedocs.io/en/latest/index.html
'''
## ---- Настройки ----
mytext = 'The Countess of Wessex is getting real about menopause. Why her groundbreaking message matters' # текст который будем озвучивать.
#language = 'en' ## ('ru' - русский; 'en' - Ангийский) язык воспроизведения.
file_named = "Recorded_text_local_v2.mp3" ## Название файла куда будет записываться звуковой файл.
## ---- Программа ----
import pyttsx3
# initialize Text-to-speech engine
engine = pyttsx3.init()
# convert this text to speech
#text = "Python is a great programming language"
engine.say(mytext)
# play the speech
engine.runAndWait()
# давайте узнаем подробности о скорости речи
# get details of speaking rate
rate = engine.getProperty("rate")
print(rate) #Выход: 200 это скорость по умолчанию
# Хорошо, давайте изменим это значение на 300 (чтобы говорить намного быстрее):
# setting new voice rate (faster)
engine.setProperty("rate", 300)
engine.say(mytext)
engine.runAndWait()
# Или медленнее:
# slower
engine.setProperty("rate", 100)
engine.say(mytext)
engine.runAndWait()
# все голосах, доступных на вашем компьютере
# get details of all voices available
voices = engine.getProperty("voices")
print("все голосах, доступных на вашем компьютере")
print(voices)
engine.setProperty("rate", 200)
# Если у вас больше одного голоса установлено на ПК, то можно выбрат другой
# set another voice
engine.setProperty("voice", voices[0].id)
engine.say(mytext)
engine.runAndWait()
# Вы также можете сохранить звук как файл с помощью save_to_file() метода вместо воспроизведения звука с помощью say()метода:
# saving speech audio into a file
engine.save_to_file(mytext, file_named)
engine.runAndWait()
URL источник
Синтез речи (или преобразование текста в речь) — это компьютерная симуляция человеческой речи. Он преобразует человеческий текст в человеческий речевой звук. В этом руководстве вы узнаете, как преобразовать текст в речь в Python.
В этом уроке мы не будем строить нейронные сети и обучать модель для достижения результатов, так как это довольно сложно и сложно сделать. Вместо этого мы будем использовать некоторые API и движки, которые это предлагают. Существует множество API-интерфейсов, которые предлагают эту службу, одна из наиболее часто используемых служб — это Google Text to Speech, в этом руководстве мы поиграем с ней вместе с другой автономной библиотекой: pyttsx3 .
Чтобы прояснить ситуацию, это руководство посвящено преобразованию текста в речь, а не наоборот. Если вы хотите вместо этого преобразовать речь в текст , ознакомьтесь с этим руководством .
Оглавление:
Для начала установим необходимые модули:
pip3 install gTTS pyttsx3 playsound
Преобразование текста в речь онлайн
Как вы можете догадаться, gTTS означает Google Text To Speech, это библиотека Python для взаимодействия с API преобразования текста в речь Google Translate. Для этого требуется подключение к Интернету, и им довольно легко пользоваться.
Откройте новый файл Python и импортируйте:
import gtts from playsound import playsound
Использовать эту библиотеку довольно просто, вам просто нужно передать текст в объект gTTS, который является интерфейсом для API преобразования текста в речь Google Translate :
# make request to google to get synthesis
tts = gtts.gTTS("Hello world")
До этого момента мы отправили текст и получили реальную звуковую речь из API, давайте сохраним этот звук в файл:
# save the audio file
tts.save("hello.mp3")
Вы увидите, что в текущем каталоге появился новый файл, давайте поиграем с ним, используя модуль playsound, установленный ранее: