Program Perlbox Voice słucha tego co mówimy i na podstawie głosowych poleceń wykonuje komendy na naszym komputerze. Potrafi rozpoznać ok. 127 tys. słów angielskich. Kiedy wypowiadamy słowa takie, jak „mail”, czy „web”, komputer otwiera za nas klienta poczty, przeglądarkę, etc.
O programie dowiedziałem się z artykułu na newbie.linux.pl. Jest tam napisane, że do obsługi programu wystarczy „jako tako operować językiem angielskim”. Otóż ma on u mnie problemy ze zrozumieniem, gdy mówię „mail”, lub „search”. Za to dobrze radzi sobie z „web”. Po prostu trzeba się nauczyć wymawiać słowa tak, by rozumiał.
Instalacja programu jest o tyle łatwa, że wszędzie korzystamy z gotowych paczek.
1. Po pierwsze do poprawnego działania programu potrzebujemy zainstalowanego pakietu perl-tk:
sudo apt-get install perl-tk
2. Następnie musimy zainstalować program do rozpoznawania mowy Sphinx-2. Instalujemy aptem paczkę sphinx2-bin:
sudo apt-get install sphinx2-bin
3. Zalecana jest instalacja programu festival. Program ten służy do syntezy mowy. Przyda się, gdy będziemy chcieli usłyszeć, jak program czyta wpisany tekst, albo po wydaniu polecenia „night”, komputer odpowie nam „sleep well” ;). I tutaj wystarczy ściągnąć pakiet aptem:
sudo apt-get install festival
4. Po spełnieniu tych zależności, możemy już zainstalować Perlboksa. Nie ma go w repozytoriach Ubuntu, ale ściągniemy gotowy pakiet .deb i z niego zainstaluemy program. Linki podane przeze mnie prowadzą do nowszej wersji programu, niż te z newbie.linux.pl. Zresztą warto sprawdzić, czy nie ma nowszej wersji na http://perlbox.org.
wget http://heanet.dl.sourceforge.net/sourceforge/perlbox/perlbox-voice-0.09.noarch.deb
sudo dpkg -i perlbox-voice-0.09.noarch.deb
5. Pozostaje nam już tylko uruchomić program, poleceniem: perlbox-voice
Menu programu:
W zakładce Control włączamy i wyłączamy „nasłuchiwanie” programu. Możemy również wpisać tekst i kazać mu go przeczytać. To tutaj program informuje nas np. o tym, że nie zrozumiał co do niego powiedzieliśmy, jaką operację wykonuje, itd.
W zakładce Vocab ustawiamy słownictwo programu, czyli to, na jakie słowa ma reagować. W kolumnie „When You Say” jest to, co mówimy, a w „Computer Does”, to co program wykonuje. Możemy tam wpisać praktycznie każdą komendę. Konfiguracja prelboksa pozwala, aby odpowiadał on na nasze komendy.
say <i dalej wpisujemy tekst>
Program wtedy przeczyta to, co jest po say. Dodatkowo można wpisać:
say `i tutaj komenda`
Program wtedy przeczyta wynik komendy wpisanej w `..`. Np. po wpisaniu
say `ls -l ~`
program wyczyta zawartość folderu domowego.
W moim Vocabie znalazły się m. in. takie wpisy:
search - firefox http://google.pl
Komenda „search” otwiera stronę google w firefoksie
mail - mozilla-thunderbird
„Mail” otwiera mi thunderbirda
music - audacious -p
Po powiedzeniu „music”, program włącza mi muzykę w audaciousie
Zakładka Config to oczywiście konfiguracja perlboksa.
Set Talker’s Verbosity – Tutaj ustawiamy jak bardzo „gadatliwy” ma być program. Gdy ustawimy to maksimum – program nie przestanie mówić. Będzie czytał nam wszystkie komunikaty, w tym: „listening”, „I did not understand”, „I executed mail”.
Przy ustawieniu tej opcji na minimum, perlbox w ogóle nie będzie się odzywał.
Browser to view help documentation – czyli nazwa programu, który bedzie otwierał nam okno pomocy. U mnie „firefox”.
Desktop plugin – tutaj można wybrać jedną z dostępnych wtyczek. Domyślnie instalowana jest tylko wtyczka dla środowiska KDE. Można pewnie znaleźć dodatkowe pluginy na sieci – ja nie szukałem. Dostępne polecenia w pluginie „kde” to:”
desktop one – włącza pulpit pierwszy
desktop two – włącza drugi
i tak do desktop four ;).
dektop next/previous – włącza pulpit następny/poprzedni
desktop menu – włącza menu KDE
desktop exit now – włącza okienko wyłączania systemu
desktop execute – włącza „wykonaj polecenie”
desktop align icons – przyciąga ikony do siatki
desktop refresh – odświeża pulpit
desktop lock – blokuje pulpit
desktop rotate wallpaper – ustawia następną tapetę
use magic word? – jeżeli to ustawimy, program będzie nas słuchał dopiero po tym, jak powiemy „magiczne słowo”. Przydatne w hałaśliwych miejscach.
I została zakładka Help. Chyba nie trzeba tłumaczyć do czego ona służy ;).
Życzę miłej zabawy w sterowaniu Linuksem za pomocą głosu.
Działa… z rozpoznawaniem mowy jednak cieniutko 🙂
Ja tam już potrafię sobie otworzyć tak googla, maila, firefoksa, włączyć muzykę, folder domowy w Konquerorze, czy otworzyć konsolę. Czasami muszę powtórzyć ze trzy razy dane słowo, ale powoli zaczynam mówić tak, że mnie rozumie :P.
Chętnie bym to sprawdził. Jednak najpierw muszę uruchomić mój mikrofon. Domyślam się, że nie skompilowałem modułu. Narazie mogę jedynie dykcję poćwiczyć 🙂
FATAL_ERROR: „lm_3g.c”, line 666: Bad bigram: -0.3010 -0.3010
ktoś wie co zrobić, jak mam taki błąd po próbie włączenia „nasłuchu”?
Ja poczekam najpierw na paczkę, może pojawi się już wkrótce.
Zadziałało ale gada do mnie po hiszpańsku:( i nie ma głosu angielskiego jak go zainstalować?
witam a moze ma ktos jakas alternatywe dla tego programiku bo jest wszystkok no prawie wszystko bo cieniutko rozpoznaje mowe
Hehe takie coś genialnie ćwiczy wymowę słów po angielsku xD
Taa, popieram k-pax’a 😀 Ten program jest świetny, ale trzeba miec mowę angielską we krwi 😀