Syntezator mowy GOOGLE z pozycji shell / terminal -a

Awatar użytkownika
kobrawerde
Gibki Gibbon
Gibki Gibbon
Posty: 2036
Rejestracja: 10 wrz 2006, 16:00
Płeć: Mężczyzna
Wersja Ubuntu: 22.04
Środowisko graficzne: Cinnamon
Architektura: x86_64
Kontakt:

Syntezator mowy GOOGLE z pozycji shell / terminal -a

Post autor: kobrawerde »

Jeśli chcemy użyć syntezatora mowy usługi Google możemy to zrobić przy pomocy programu google-speech 1.1.0
krótka informacja:
Google Speech to proste, wieloplatformowe narzędzie wiersza poleceń do odczytywania tekstu za pomocą interfejsu API Google Translate TTS (Text To Speech).
Program jest oparty na pythonie i jest to chyba duża zaleta ponieważ można go uruchomić prawie na każdej platformie, także ARM ( raspberry pi , orange pi , odroid itd. )
Strona domowa : https://pypi.org/project/google-speech/
Metoda instalacji jest prosta ...ale czasem występują problemy z zależnościami. W moim przypadku najsprawniej można tego dokonać postępując :
Instalujemy pythona jeśli nie mamy go już w systemie co możemy sprawdzić :

Kod: Zaznacz cały

python --version
I pomimo iż w instrukcji pisze iż : Google Speech wymaga Python >= 3.4. ...u mnie w systemie wynik podaje : Python 2.7.16
a mimo to program działa poprawnie. Możemy jednak spróbować doinstalować:

Kod: Zaznacz cały

sudo apt-get install python3 python3-pip
Instalujemy program Sox i plugin:

Kod: Zaznacz cały

sudo apt-get install sox libsox-fmt-mp3
Instalujemy program google-speech 1.1.0

Kod: Zaznacz cały

git clone https://github.com/desbma/GoogleSpeech
przechodzimy do katalogu GoogleSpeech

Kod: Zaznacz cały

cd GoogleSpeech
i instalujemy

Kod: Zaznacz cały

python3 setup.py install
To wszystko teraz możemy wypróbować w praktyce działanie programu google-speech 1.1.0 w terminalu wpisując np.

Kod: Zaznacz cały

google_speech -l pl "w Szczebrzeszynie chrząszcz brzmi w trzcinie"
Taka podpowiedź dla tych co chcą użyć w/w programu (jak ja) do czytania aktualnej daty / godziny ( jako skrypt podpięty pod jeden z przycisków na pilocie) z radia internetowego opartego o programy mpd mpc + np. orange pi + dodatkowy układ dający b.dobry dźwięk DAC . Problem polega na tym iż dodatkowy układ (DAC) blokuję możliwość regulacji poziomu głośności w systemie / alsamixer .Jest możliwość tylko softwarowego pogłaśniania ... na szczęście program google-speech 1.1.0 / sox to potrafi ale trzeba się naszukać :-)
opcja -e vol 0.10 -umożliwia zmianę poziomu głośności : 0.10 .... 0.40 ... itd
opcja -l pl - wybór języka
Odczytanie daty i godziny:

Kod: Zaznacz cały

#!/bin/bash
google_speech -e vol 0.40 -l pl "Jest $(date +"%A %d %B") godzina $(date +%R)"
powodzenia! :razz:
ODPOWIEDZ

Wróć do „Software-Inne”

Kto jest online

Użytkownicy przeglądający to forum: Obecnie na forum nie ma żadnego zarejestrowanego użytkownika i 56 gości