Syntezator mowy GOOGLE z pozycji shell / terminal -a

kobrawerde · Post autor: **kobrawerde** » 20 paź 2020, 14:02

Jeśli chcemy użyć syntezatora mowy usługi Google możemy to zrobić przy pomocy programu google-speech 1.1.0
krótka informacja:

Google Speech to proste, wieloplatformowe narzędzie wiersza poleceń do odczytywania tekstu za pomocą interfejsu API Google Translate TTS (Text To Speech).

Program jest oparty na pythonie i jest to chyba duża zaleta ponieważ można go uruchomić prawie na każdej platformie, także ARM ( raspberry pi , orange pi , odroid itd. )
Strona domowa : https://pypi.org/project/google-speech/
Metoda instalacji jest prosta ...ale czasem występują problemy z zależnościami. W moim przypadku najsprawniej można tego dokonać postępując :
Instalujemy pythona jeśli nie mamy go już w systemie co możemy sprawdzić :

Kod: Zaznacz cały

python --version

I pomimo iż w instrukcji pisze iż : Google Speech wymaga Python >= 3.4. ...u mnie w systemie wynik podaje : Python 2.7.16
a mimo to program działa poprawnie. Możemy jednak spróbować doinstalować:

Kod: Zaznacz cały

sudo apt-get install python3 python3-pip

Instalujemy program Sox i plugin:

Kod: Zaznacz cały

sudo apt-get install sox libsox-fmt-mp3

Instalujemy program google-speech 1.1.0

Kod: Zaznacz cały

git clone https://github.com/desbma/GoogleSpeech

przechodzimy do katalogu GoogleSpeech

Kod: Zaznacz cały

cd GoogleSpeech

i instalujemy

Kod: Zaznacz cały

python3 setup.py install

To wszystko teraz możemy wypróbować w praktyce działanie programu google-speech 1.1.0 w terminalu wpisując np.

Kod: Zaznacz cały

google_speech -l pl "w Szczebrzeszynie chrząszcz brzmi w trzcinie"

Taka podpowiedź dla tych co chcą użyć w/w programu (jak ja) do czytania aktualnej daty / godziny ( jako skrypt podpięty pod jeden z przycisków na pilocie) z radia internetowego opartego o programy mpd mpc + np. orange pi + dodatkowy układ dający b.dobry dźwięk DAC . Problem polega na tym iż dodatkowy układ (DAC) blokuję możliwość regulacji poziomu głośności w systemie / alsamixer .Jest możliwość tylko softwarowego pogłaśniania ... na szczęście program google-speech 1.1.0 / sox to potrafi ale trzeba się naszukać

opcja -e vol 0.10 -umożliwia zmianę poziomu głośności : 0.10 .... 0.40 ... itd
opcja -l pl - wybór języka
Odczytanie daty i godziny:

Kod: Zaznacz cały

#!/bin/bash
google_speech -e vol 0.40 -l pl "Jest $(date +"%A %d %B") godzina $(date +%R)"

powodzenia!

Syntezator mowy GOOGLE z pozycji shell / terminal -a

Syntezator mowy GOOGLE z pozycji shell / terminal -a

Kto jest online