полезные ссылки
RHVoice — это свободно распространяемый многоязычный синтезатор речи с открытым исходным кодом, создатель RHVoice, Ольга Яковлева, сама незрячая.
Используется библиотека «gTTS» (Import the required module for text to speech conversion.)
Программа для чтения с Экрана сделанная слепыми.
''' Программа из текст создает звук. И воспроизводит созданный файл, но только если запускается с локального диска, а если с "nas", то не запускается, для этого нужно доделать программу. ''' ## ---- Настройки ---- mytext = 'The Countess of Wessex is getting real about menopause. Why her groundbreaking message matters' # текст который будем озвучивать. language = 'en' ## ('ru' - русский; 'en' - Ангийский) язык воспроизведения. file_named = "Recorded_text.mp3" ## Название файла куда будет записываться звуковой файл. ## ---- Программа ---- from gtts import gTTS ## Import the required module for text to speech conversion. import os ## This module is imported so that we can play the converted audio myobj = gTTS(text=mytext, lang=language, slow=False) ## Passing the text and language to the engine, here we have marked slow=False. Which tells the module that the converted audio should have a high speed. myobj.save(file_named) ## Saving the converted audio in a mp3 file named. #os.system("mpg321 welcome.mp3") ## В Linux, чтобы прослушать mp3. Если у вас нет "mpg321", то установите его: sudo apt-get install mpg321 os.system(file_named) ## В Windows, чтобы прослушать mp3. Будет запущена программа по умолчанию.
Привет озвучивания текста локально, т.е. не использую googl и API других сервизов.
''' Программа из текст создает звук. И воспроизводит созданный файл, но только если запускается с локального диска, а если с "nas", то не запускается, для этого нужно доделать программу. gtts - https://gtts.readthedocs.io/en/latest/index.html ''' ## ---- Настройки ---- mytext = 'The Countess of Wessex is getting real about menopause. Why her groundbreaking message matters' # текст который будем озвучивать. #language = 'en' ## ('ru' - русский; 'en' - Ангийский) язык воспроизведения. file_named = "Recorded_text_local_v2.mp3" ## Название файла куда будет записываться звуковой файл. ## ---- Программа ---- import pyttsx3 # initialize Text-to-speech engine engine = pyttsx3.init() # convert this text to speech #text = "Python is a great programming language" engine.say(mytext) # play the speech engine.runAndWait() # давайте узнаем подробности о скорости речи # get details of speaking rate rate = engine.getProperty("rate") print(rate) #Выход: 200 это скорость по умолчанию # Хорошо, давайте изменим это значение на 300 (чтобы говорить намного быстрее): # setting new voice rate (faster) engine.setProperty("rate", 300) engine.say(mytext) engine.runAndWait() # Или медленнее: # slower engine.setProperty("rate", 100) engine.say(mytext) engine.runAndWait() # все голосах, доступных на вашем компьютере # get details of all voices available voices = engine.getProperty("voices") print("все голосах, доступных на вашем компьютере") print(voices) engine.setProperty("rate", 200) # Если у вас больше одного голоса установлено на ПК, то можно выбрат другой # set another voice engine.setProperty("voice", voices[0].id) engine.say(mytext) engine.runAndWait() # Вы также можете сохранить звук как файл с помощью save_to_file() метода вместо воспроизведения звука с помощью say()метода: # saving speech audio into a file engine.save_to_file(mytext, file_named) engine.runAndWait()
URL источник
Синтез речи (или преобразование текста в речь) — это компьютерная симуляция человеческой речи. Он преобразует человеческий текст в человеческий речевой звук. В этом руководстве вы узнаете, как преобразовать текст в речь в Python.
В этом уроке мы не будем строить нейронные сети и обучать модель для достижения результатов, так как это довольно сложно и сложно сделать. Вместо этого мы будем использовать некоторые API и движки, которые это предлагают. Существует множество API-интерфейсов, которые предлагают эту службу, одна из наиболее часто используемых служб — это Google Text to Speech, в этом руководстве мы поиграем с ней вместе с другой автономной библиотекой: pyttsx3 .
Чтобы прояснить ситуацию, это руководство посвящено преобразованию текста в речь, а не наоборот. Если вы хотите вместо этого преобразовать речь в текст , ознакомьтесь с этим руководством .
Оглавление:
Для начала установим необходимые модули:
pip3 install gTTS pyttsx3 playsound
Преобразование текста в речь онлайн
Как вы можете догадаться, gTTS означает Google Text To Speech, это библиотека Python для взаимодействия с API преобразования текста в речь Google Translate. Для этого требуется подключение к Интернету, и им довольно легко пользоваться.
Откройте новый файл Python и импортируйте:
import gtts from playsound import playsound
Использовать эту библиотеку довольно просто, вам просто нужно передать текст в объект gTTS, который является интерфейсом для API преобразования текста в речь Google Translate :
# make request to google to get synthesis tts = gtts.gTTS("Hello world")
До этого момента мы отправили текст и получили реальную звуковую речь из API, давайте сохраним этот звук в файл:
# save the audio file tts.save("hello.mp3")
Вы увидите, что в текущем каталоге появился новый файл, давайте поиграем с ним, используя модуль playsound, установленный ранее: