Ivona Reader - odpalanie pod linuxem

Tylko tematy nie mieszczące się powyżej.
kretyn
Sędziwy Jeż
Sędziwy Jeż
Posty: 31
Rejestracja: 06 lip 2010, 19:06
Płeć: Mężczyzna
Wersja Ubuntu: 11.10
Środowisko graficzne: Unity
Architektura: x86

Ivona Reader - odpalanie pod linuxem

Post autor: kretyn » 06 lip 2010, 19:33

Witam,

Chciałbym zainstalować program Ivona Reader pod Ubuntu. Nie ma wersji natywnej na linuxa ( dopytywałem się ) i nie zamierzają prędko wydawać. Polecili mi, abym skorzystał wirtualnej maszyny do jego zainstalowania.

Mimo, że już trochę korzystam z różnych linuxów, wciąż jestem raczej zielonym użytkownikiem i dużo pojęć informatycznych jest dla mnie niezrozumiałych. Proszę więc nie bić mocno za głupoty wypisywane :)


Przede wszystkim, spróbowałem zainstalować program przez WINE. Nie dało rady. Tzn. program zainstalowałem, ale nie mogłem go uruchomić, ponieważ brakowało jakiś bibliotek (tak, trochę temu to robiłem). Również na stronie WINE ktoś zamieścił informacje o tym, że próbował i nie działa.

Następnie chciałem spróbować zainstalować VM. Zainstalowałem QEmu i "postawiłem na obrazie" win XP. Mimo, że instalowałem i odpalałem z KQEmu, to wszystko wciąż działało bardzo wolno (a tak bardzo słabego laptopa nie mam). Czy to ma tak wolno chodzić ( wolno == przesunięcie kursro

Oprócz samego zainstalowania, chciałbym również móc korzystać z funkcji czytania [przez program] podświetlonego (zaznaczonego) tekstu. Darmowy program Ivona tylko tyle potrafi.


Podsumowując mój cel i prośbę:
Chciałbym zainstalować głosy Ivona na Ubuntu 10.04. Miło by było, gdyby do odczytywania ich był użyty Ivona Reader, ale nie jest to konieczne. Ponieważ głosy te kupiłem, więc nie chciałbym stracić pieniędzy, ale jednocześnie mam już dość Windowsa.


Jakieś sugestie, propozycje? Coś jeszcze napisać?
frytek
Wytworny Kaczor
Wytworny Kaczor
Posty: 330
Rejestracja: 06 sty 2006, 00:03
Płeć: Mężczyzna
Wersja Ubuntu: 10.04
Środowisko graficzne: GNOME
Architektura: x86
Kontakt:

Odp: Ivona Reader

Post autor: frytek » 07 lip 2010, 00:23

tu się wiąże kilka wątków.

po pierwsze, maszyna wirtualna. qemu nie jest najszczęśliwszym wyborem. z tego, co pamiętam, aby to chodziło szybko, trzeba zainstalować, mówiąc w uproszczeniu, coś w rodzaju sterownika, tzn. ładowalny moduł qemu dla jądra twojej dystrybucji. a najpierw chyba trzeba go skompilować, więc nie jest to robota dla osoby początkującej. bez tego modułu qemu jest dość słabo wydajne.

więc masz dwie możliwości. albo zainstalować z menadżera pakietów virtual box - jest łatwiejszy w konfiguracji (ale chyba ostatnio w darmowej wersji wycofali używanie usb na wirtualnej maszynie? nie wiem, czy to prawda, ale jeśli to dla ciebie nieistotne, to OK). virtualbox działa na pewno wydajniej niż qemu bez modułu jądra i jest w całości klikalne.

inne rozwiązanie to pobranie z internetu vmware player - osobiście uważam go za najbardziej wydajny i bez ograniczeń. i dopiero na tych programach postawienie windowsa. na moim laptopie z ubuntu i 1 GB RAM, odpalony wirtualny XP na vmware player (z przydzielonym 256 RAM) chodzi całkiem znośnie i synteza mowy działa płynnie - akurat sprawdzałem. nie pamiętam dokładnie, czy to był reader, ale któryś z tych prostszych programów demo z serii ivo-cośtam.

z vmware playerem mogę pomóc, z wirtualboxem w sumie też, ale mniej chętnie, bo go nie mam i w razie problemów musiałbym instalować, a jestem na to za leniwy ;)
w każdym razie możesz pisać na priv.

a teraz kwestia syntezy mowy
dla linuksa istnieją zasadniczo dwie możliwości. pierwsza to espeak. jest to bardzo prosty syntezator wbudowany w system, ale nie ma on porównania z głosami, do jakich przyzwyczaiły nas syntezatory mówiące głosem ludzkim. espeak mówi głosem w całości syntetycznym, co brzmi jak roboty z filmów s-f z lat 70.

zalety: wbudowanie w system, czyli zero problemów z konfiguracją oraz duża zrozumiałość mowy przy absurdalnie wysokim tempie odsłuchu. jeśli masz styczność z osobami niewidomymi, to wiesz że takiego tempa syntezy używa część takich osób, ponieważ dla nich których komputer musi czytać np. wszystkie pozycje menu i inne napisy na ekranie, więc żeby utrzymać tempo pracy, podkręcają tempo syntezy. zrozumiałość wynika m. in. z tego, że przy dużym tempie wymawiania można ustawić zwiększone pauzy między wyrazami. człowiek nie jest w stanie tak mówić, ale taka mowa jest całkowicie czytelna przy bardzo dużych prędkościach.

espeak też praktycznie nie obciąża systemu. możesz go przetestować poleceniem

Kod: Zaznacz cały

espeak -vpl "Litwo, ojczyzno moja, ty jesteś jak zdrowie"
albo

Kod: Zaznacz cały

cat plik_z_tekstem.txt | espeak -vpl -s 370 -g 10
tempo 370 słów na minutę będzie nadal całkowicie zrozumiałe.

myślę jednak, że to cię absolutnie nie zadowoli, bo raczej do książek się nie nadaje.


drugie rozwiązanie to, również darmowy, syntezator milena.

milena nie jest wbudowana w system, i trzeba ją pobrać osobno. do tego, jest ona tylko tak naprawdę końcówką dla systemu syntezy, który nazywa się mbrola, i który trzeba pobrać i zainstalować osobno.

no i najważniejsze / najgorsze: mbrola gada jedynym dostępnym polskim głosem, którego jakość również odbiega od ivonowego jacka itp.

niestety, nikt nie zrobił lepszego darmowego głosu, mamy tylko ten jeden (angielskich czy holenderskich jest kilka, i lepszej jakości...)

jest jednak parę zalet.
po pierwsze, milena jest lepszym syntezatorem. jeśli tylko będziesz skłonny przyzwyczaić się do barwy tego wyżej wspomnianego głosu mbrola to stwierdzisz, że tekst odczytywany jest dużo lepiej. głos nie drży, utrzymuje stałe tempo i o wiele lepiej interpretuje dialogi. to jedna z głównych zalet.

do tego, oprogramowanie do tworzenia audiobooków (text do mp3) jest dużo bardziej zaawansowane. pozwala łatwo rozformatować tekst (czyli usunąć zbędne "entery" na końcach linii, co często się zdarza przy skanowanych tekstach), usunąć numerację stron, znaleźć zbędne myślniki. ma opcję łatwego wyszukiwania w tekście nazw własnych w celu stworzenia słownika wymowy (tzn. program szykuje listę słow, i wtedy w jednym miejscu podstawiasz, że john* to dżon* i w całej książce nazwa czytana jest prawidłowo). spora ilość nazw własnych (zwłaszcza angielskich) jest już zawarta w domyślnym słowniku programu.

program stara się też wyłapać typowe błędy w skanowanych tekstach, np. "nic" przed czasownikiem zamienia na "nie" (bardzo częsty błąd OCR: "nic jest" -> "nie jest" itp).

program, oprócz czytania na żywo, generuje też mp3, które może automatycznie pociąć na odcinki np. po 3 minuty, w celu łatwiejszej nawigacji jeśli słuchasz książki na odtwarzaczu mp3.
do tego milena współpracuje z mplayerem, a więc może odczytywać napisy do filmów. używałem jej do tego celu we wcześniejszych wersjach i zdaje się, że w tej chwili jest na tyle zaawansowana, że potrafi w pewnym zakresie sterować tempem syntezy i opóźnieniami, aby radzić sobie z momentami filmu, w których następuje nagromadzenie dialogu.

wszystko to jest za cenę gorszej barwy głosu (ale naprawdę interpretacja tekstu JEST lepsza).

jeśli się zdecydujesz, to mogę poprowadzić cię za rękę przy instalacji. osobiście słucham w samochodzie bardzo dużo audiobooków wygenerowanych osobiście za pośrednictwem mileny, i na jacka z powrotem już na pewno się nie przesiądę.

demo porównujące czytanie dialogów przez ivonę i milenę jest tutaj:

http://chomikuj.pl/newsgrabber -> test syntezatora
obok leży przykładowa, wygenerowana mileną książka.

demo interaktywne mileny na stronie http://milena.polip.com
Awatar użytkownika
ethanak
Wygnańcy
Posty: 3054
Rejestracja: 04 gru 2007, 13:19
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: GNOME
Architektura: x86
Lokalizacja: Bielsko-Biała
Kontakt:

Odp: Ivona Reader

Post autor: ethanak » 07 lip 2010, 10:47

To ja dodam pare uwag co do syntezy mowy.

1) Frytek, Milena nie jest końcówką tylko NLP. (Natural Language Processor). System text to speech to NLP i DSP (w tym przypadku Mbrola) więc możemy sobie ustalić że Milena to "pół syntezatora" :)

2) Istnieje projekt OpenSapi który docelowo ma umożliwić odpalanie windowsowych syntezatorów SAPI5 pod Linuksem, ale na razie jest chyba w fazie radosnych marzeń

3) Ostatnio tu na forum viewtopic.php?p=747117#post747117 pokazywałem krok po kroku jak zainstalować Milenę i ABC (sprawdzane na świeżej instalacji Netbook Remix 10.04) - Frytek, jak możesz na to zerknąć i coś poprawić to by było fajnie... bo ja z Ubunciakiem to tak raczej na zasadzie obejrzenia filmu w barze :(

4) Co do czytania napisów - ostatnio (patrz wyżej) intensywnie testuję Milenowego submixera, na razie nie widze konieczności pchania do niego rączek (może co najwyżej jakiś konfigurator), ale
mam wrażenie że wszystko działa z kopa.

5) Czytanie zaznaczonego tekstu (i nie tylko) realizuje milena_gtk
kretyn
Sędziwy Jeż
Sędziwy Jeż
Posty: 31
Rejestracja: 06 lip 2010, 19:06
Płeć: Mężczyzna
Wersja Ubuntu: 11.10
Środowisko graficzne: Unity
Architektura: x86

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: kretyn » 07 lip 2010, 15:48

Wielkie dziękuję, Frytek :)

Zainstalowałem VM i działa. Mam jeszcze problem z uruchomieniem internetu na virtualnej maszynie, ale może zaraz coś mi się uda wykombinować. Bardzo dobrze obsługiwany jest wspólny schowek, co jest plusem. Szkoda tylko, że darmowy program dany przez Ivona czyta tylko ( i wyłącznie ) tekst podświetlony. W tym celu muszę kopiować do notatnika na VM i stamtąd czytać. Jest to mniej wygodne, ale pewnie da się przyzwyczaić. Ciekawe czy jest jakiś, który by czytał bezpośrednio ze schowka (ale tylko wtedy, gdy tego sobie zażyczę)?

Ten projekt ( OpenSapi ) zapowiada się fajnie. Szkoda tylko, że raczej jeszcze długo nim jakieś sensowne użytki z niego będą.


Co do Mileny/Mbroli to już wcześniej słyszałem o nich. Jednak porównując jakość dźwięku i w ogóle, samą syntezę to są baardzo daleko za Ivona. A szkoda. Bo co darmowe to fajne ;)
www.zwodnik.pl
Piegowaty Guziec
Piegowaty Guziec
Posty: 11
Rejestracja: 31 sty 2010, 11:15
Płeć: Kobieta
Wersja Ubuntu: inny OS
Środowisko graficzne: Inne
Architektura: x86
Kontakt:

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: www.zwodnik.pl » 07 lip 2010, 22:37

jest jeszcze darmowy NVDA jeśli już stawiasz na wirtualizacje xp
Awatar użytkownika
ethanak
Wygnańcy
Posty: 3054
Rejestracja: 04 gru 2007, 13:19
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: GNOME
Architektura: x86
Lokalizacja: Bielsko-Biała
Kontakt:

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: ethanak » 08 lip 2010, 09:52

www.zwodnik.pl pisze:jest jeszcze darmowy NVDA
NVDA to screenreader a nie syntezator. Ma wbudowanego espeaka i potrafi korzystać z SAPI5 - tylko zdaje się nie o to chodziło twórcy wątku? Bo jeśli potrzebny screenreader to w dystrybucji jest Orca i obejdzie się bez Windowsa.

Tak przy okazji - kiedyś uruchamiałem Expressivo na wirtualce (bo pod Wine nie działał) i sterowałem go przez port TCP z Linuksa. Jako-tako to chodziło... ale nie polecam tego rozwiązania.
frytek
Wytworny Kaczor
Wytworny Kaczor
Posty: 330
Rejestracja: 06 sty 2006, 00:03
Płeć: Mężczyzna
Wersja Ubuntu: 10.04
Środowisko graficzne: GNOME
Architektura: x86
Kontakt:

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: frytek » 08 lip 2010, 15:10

internet na wirtualce robisz konfigurując interfejs jako NAT - tak jest najprościej. można też skonfigurować współdzielenie plików po sambie z komputerem hostem. ;)

EDIT:
kretyn pisze: Jednak porównując jakość dźwięku i w ogóle, samą syntezę to są baardzo daleko za Ivona.
niestety, nie zgadzam się - jakość dźwięku: zgoda. synteza: milena interpretuje lepiej.


:)
kri17
Wygnańcy
Posty: 3
Rejestracja: 07 cze 2008, 14:42
Płeć: Mężczyzna
Wersja Ubuntu: 8.04

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: kri17 » 09 lip 2010, 02:36

Jakiś rok temu bawiłem się opensapi i ivoną pod kubuntu i całkiem ładnie to działało.
Już nawet zacząłem w Qt pisać GUI (takie uproszczone expressivo), ale niestety, po pewnym czasie coś pewnie skopali w wine i ivona po drugim uruchomieniu informowała że okres próbny się zakończył i wyłączała się.
Tego typu rozwiązanie jest o wiele lepsze niż zabawa z wirtualną maszyną.
Z tego co pamiętam jakość mowy była taka sama jak w windowsie, a obciążenie systemu było minimalne i nawet mniejsze jak w windowsie.
Całkiem możliwe, że jeżeli masz pełną wersję ivony, to powyższy problem z wyłączaniem się nie wystąpi.
Może w sobotę, jak będę miał czas, to sprawdzę jak to się obecnie spisuje i czy da się pod wine używać trialowej ivony.
Awatar użytkownika
ethanak
Wygnańcy
Posty: 3054
Rejestracja: 04 gru 2007, 13:19
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: GNOME
Architektura: x86
Lokalizacja: Bielsko-Biała
Kontakt:

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: ethanak » 09 lip 2010, 11:33

kri17 pisze:Jakiś rok temu bawiłem się opensapi i ivoną pod kubuntu i całkiem ładnie to działało.
Już nawet zacząłem w Qt pisać GUI (takie uproszczone expressivo), ale niestety, po pewnym czasie coś pewnie skopali w wine i ivona po drugim uruchomieniu informowała że okres próbny się zakończył i wyłączała się.
Ja swego czasu bawiłem się natywną wersją Ivony pod Linuksa. Miała być dostępna dla normalnego usera za jakieś niewielkie pieniądze (okolice ceny Expressivo) - niestety jakiś marketoid w Ivo Software stwierdził że boją się piractwa i nie będą tego sprzedawać (z ciekawostek - Ivonę Rehab w wersji crack można znaleźć w necie szybciej niż ichniejszą stronę). Zacząłem zabawę z Mileną przede wszystkim ze względu na niemożliwość wypowiedzenia przez Ivonę niektórych zbitek głosek potrzebnych przy wymowie obcojęzycznych zwrotów (np. nie udało mi się zmusić Jacka do wypowiedzenia "Giordano"), błedne akcentowanie ("mnie na nie stać" versus "mnie ma nie stać") i parę innych mniej lub bardziej irytujących baboli.

Ale w efekcie powstała biblioteka libdumbtts (do ściągnięcia ze strony Mileny) przeznaczona między innymi do "ulepszenia" Ivony. Jeśli chcesz kontynuować pracę z GUI dla OpenSapi spróbuj, może się przyda.
kri17
Wygnańcy
Posty: 3
Rejestracja: 07 cze 2008, 14:42
Płeć: Mężczyzna
Wersja Ubuntu: 8.04

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: kri17 » 10 lip 2010, 15:25

Jeżeli chodzi o polskie głosy, to ivona jest klasą samą w sobie i obecnie niema żadnej konkurencji.
Tak jak wyżej obiecałem, dziś ją zainstalowałem i muszę powiedzieć że wszystkie głosy ivony działają perfekcyjnie w linuxie.
Jednak zaznaczam, że perfekcyjnie działają głosy ivony, natomiast GUI, takie jak Expressivo źle działa i jest strasznie ociężałe.
Jeżeli ktoś by chciał próbować uruchomić Expressivo, to może tu zerknąć: http://keicam.wordpress.com/2008/04/07/ ... untu-wine/
Choć ja polecam znaleźć jakieś alternatywne i lekkie GUI potrafiące korzystać poprzez
SAPI 5.1 z głosów Ivony pod wine lub najlepiej zainstalować opensapi i następnie znaleźć coś ciekawego pod linuxem.
Tu może na przykładzie Expressivo trial 30-dniowy: http://www.dobreprogramy.pl/Expressivo, ... 12840.html
podam jak to zainstalować i używać z opensapi.
Tu jest opis z którego korzystałem:http://code.google.com/p/open-sapi/

1. W katalogu domowym odpalamy terminal i wydajemy polecenie:

Kod: Zaznacz cały

svn checkout http://open-sapi.googlecode.com/svn/trunk/open-sapi 
aby pobrać zródła open-sapi z svn-u. Zostanie pobrane prawie 70MB więc chwilkę to potrwa.

2. W katalogu domowym tworzymy sobie jakiś katalog i odpalamy w nim terminal.

3. pobieramy i odpalamy wineinit.exe:

Kod: Zaznacz cały

    wget http://open-sapi.googlecode.com/files/wineinit.exe
    wine wineinit.exe
4. Pobieramy i uruchamiamy w wine instalator Expressivo.
W instalatorze wybieramy głosy Ivony które to zostaną pobrane i internetu i zainstalowane.
Wszystkie głosy zostaną pobrane do katalogu c:\users\user\Temp\ivona i z niego instalator je zainstaluje.
Gdy wybierzemy wszystkie głosy, to będzie pobrane około 2 GB.
Na marginesie może dodam, że są to pliki *.dat, które to pod wine można normalnie odpalić.

5. pobieramy winetricks i instalujemy SAPI 5.1:

Kod: Zaznacz cały

    wget http://open-sapi.googlecode.com/files/winetricks.sh
    chmod 770 winetricks.sh
   ./winetricks.sh sapi51
6. pobieramy jednego dll-a i przenosimy go do katalogu wine:

Kod: Zaznacz cały

      wget http://open-sapi.googlecode.com/files/msvcp60.dll
      cp -f msvcp60.dll $HOME/.wine/drive_c/windows/system32/
7. I teraz należy poszukać lub samemu napisać jakieś lekkie GUI potrafiące korzystać z SAPI 5.1 pod wine
lub korzystać z opensapi pod linuxem.
Gdyby kogoś interesowało jak coś takiego napisać w Delphi,
to tu są ładne przykłady: http://www.blong.com/Conferences/DCon20 ... SAPI51.htm
Choć według mnie lepiej używać opensapi ponieważ zapewnia prawie natywną możliwość obsługi syntezy mowy w linuxie.

8. Tu jeszcze podam jak można używać opensapi w konsoli.
Dobrze by było używać jakiejś nakładki na terminal w typie Yakuake żeby pootwierane okna nie plątały nam się.

- odpalamy terminal i uruchamiamy w nim serwer:

Kod: Zaznacz cały

 wine ~/open-sapi/tools/tcl/bin/tclsh85.exe ~/open-sapi/src/unstable/osapi-srv.tcl 2> /dev/null
- Następnie w drugim terminalu uruchamiamy klienta z opcją "-p?".
Po uruchomieniu z tą opcją, w oknie serwera będziemy mieć spis wszystkich zainstalowanych głosów:

Kod: Zaznacz cały

~/open-sapi/src/unstable/osapi-cli.tcl -p ?
U mnie coś takiego się wyświetliło:

****************************************

Voice 0 = IVONA Ewa - polski głos żeński [22kHz] and is Female
Voice 1 = IVONA Brian - angielski brytyjski głos męski [22kHz] and is Male
Voice 2 = IVONA Eric - angielski amerykański głos męski [22kHz] and is Male
Voice 3 = IVONA Amy - angielski brytyjski głos żeński [22kHz] and is Female
Voice 4 = IVONA Jacek - polski głos męski [22kHz] and is Male
Voice 5 = IVONA Jan - polski głos męski [22kHz] and is Male
Voice 6 = IVONA Jennifer - angielski amerykański głos żeński [22kHz] and is Female
Voice 7 = IVONA Maja - polski głos żeński [22kHz] and is Female

****************************************

I teraz w oknie klienta wydajemy polecenie:

Kod: Zaznacz cały

~/open-sapi/src/unstable/osapi-cli.tcl -p 0 -t Tu wpisujemy tekst, który ma zostać przeczytany @@

Opcja "-p 0" informuje, że dany tekst ma czytać Ewa.
Jeżeli dam opcję "-p 1" to tekst zostanie przeczytany przez Briana itd.


Tu jeszcze dodam taką ciekawostkę.
Otóż przełączanie głosów odbywa się bardzo szybko więc można by spróbować napisać GUI które zamiast słownika do wypowiadania obcych słów
zmienia w locie głos.
Powiedzmy Ebook czy napisy do filmu czytane przez Jacka do spółki z Brianem mogły by ciekawie wypaść i myślę że o wiele lepiej niż
z wykorzystaniem standardowych słowników dostępnych do ivony.
Awatar użytkownika
ethanak
Wygnańcy
Posty: 3054
Rejestracja: 04 gru 2007, 13:19
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: GNOME
Architektura: x86
Lokalizacja: Bielsko-Biała
Kontakt:

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: ethanak » 10 lip 2010, 19:57

kri17 pisze: Tak jak wyżej obiecałem, dziś ją zainstalowałem i muszę powiedzieć że wszystkie głosy ivony działają perfekcyjnie w linuxie.
Pytanko (z ciekawości, jestem w takim miejscu że nie bardzo mogę sprawdzić) - da się zrobić cos w stylu "text to wave"?

Ze swej strony postaram się (jak tylko będę w normalnym miejscu) zrobić jakiś prowizoryczny gujowaty skrypcik. Dla niecierpliwych: zaciągnij milena_gtk z mojej strony i przerób na współpracę z opensapi :)
Otóż przełączanie głosów odbywa się bardzo szybko więc można by spróbować napisać GUI które zamiast słownika do wypowiadania obcych słów
zmienia w locie głos.
Powiedzmy Ebook czy napisy do filmu czytane przez Jacka do spółki z Brianem mogły by ciekawie wypaść i myślę że o wiele lepiej niż
z wykorzystaniem standardowych słowników dostępnych do ivony.
A teraz usiądź na spokojnie, przeczytaj jeszcze raz to co napisałeś i napisz tu (coby wszyscy wiedzieli) że już wiesz że to jest niemożliwe i dlaczego (hint: prozodia/fleksja).
kretyn
Sędziwy Jeż
Sędziwy Jeż
Posty: 31
Rejestracja: 06 lip 2010, 19:06
Płeć: Mężczyzna
Wersja Ubuntu: 11.10
Środowisko graficzne: Unity
Architektura: x86

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: kretyn » 11 lip 2010, 03:32

:) Bardzo fajnie. Znacznie lepiej z takiego czegoś będzie korzystać, niż włączać wirtualna maszynę pożerającą rzeczywistą pamięć.

Napisałem na szybko proste GUI w Pythonie. Można zmieniać głośność i szybkość czytania. Czyta wklejony tekst po wciśnięciu guzika ( lub Ctrl+Shift+Spacja). W pliku należy wpisać ścieżki serwera, klienta i jakiegoś exe. Ręcznie należy również sprawdzić nr głosu, który chce się odsłuchiwać.

Kod: http://wklej.org/id/363003/
Uwaga: Skrypt korzysta z PyQt4. Należy oczywiście pobrać ten moduł.

( PS nie można tutaj załączać plików, tak? )
Awatar użytkownika
ethanak
Wygnańcy
Posty: 3054
Rejestracja: 04 gru 2007, 13:19
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: GNOME
Architektura: x86
Lokalizacja: Bielsko-Biała
Kontakt:

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: ethanak » 11 lip 2010, 11:10

na szybko (bo trochę sie spieszę):

a) pobieramy i rozpakowujemy skrypt milena_gtk:

Kod: Zaznacz cały

 wget http://tts.polip.com/files/milena_gtk-0.2.tar.gz
tar -xzf milena_gtk-0.2.tar.gz
cd milena_gtk
b) instalujemy python-xlib:

Kod: Zaznacz cały

sudo apt-get install python-xlib
c) otwieramy plik milena_gtk.py w naszym ulubionym edytorze
d) znajdujemy linię (okolice linii 201):

Kod: Zaznacz cały

	cmd="milena_say -H -E UTF-8"
i zamieniamy np. na:

Kod: Zaznacz cały

	cmd="/home/twoj_user/open-sapi/src/unstable/osapi-cli.tcl --pipemode -r 4 -p 0"
oczywiście wpisując prawidłową ścieżkę do osapi-cli.tcl
d) znajdujemy linię (okolice linii 214):

Kod: Zaznacz cały

	pop.stdin.write(tekst)
i zmieniamy na:

Kod: Zaznacz cały

 	pop.stdin.write(tekst+'\n')
e) zapisujemy plik i uruchamiamy:

Kod: Zaznacz cały

 python milena_gtk.py
I to wszystko. Skrypt potrafi czytać schowek i zaznaczenie, współpracuje z Pidginem, potrafi otworzyć własne okienko do wpisywania tekstu i tak dalej.

Postaram się zrobić jakąś wersje dla opensapi ale to juz nie dziś...

Dopisane:
Niestety - nic z tego. Ivona wyekspirowała sobie po trzecim uruchomieniu, w związku z tym jakoś straciłem motywację...
Awatar użytkownika
figa
Zakręcona Traszka
Zakręcona Traszka
Posty: 549
Rejestracja: 05 lip 2006, 19:42
Płeć: Kobieta
Wersja Ubuntu: 11.04
Środowisko graficzne: GNOME
Architektura: x86

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: figa » 11 lip 2010, 13:24

Tak tylko że jakość czytania w Milenie jest o wiele gorsza niż w Ivonie :( .
Temat rozwiązany - dodaj do tematu [solved] za pomocą zaawansowanej edycji pierwszego wpisu wątku.
Awatar użytkownika
ethanak
Wygnańcy
Posty: 3054
Rejestracja: 04 gru 2007, 13:19
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: GNOME
Architektura: x86
Lokalizacja: Bielsko-Biała
Kontakt:

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: ethanak » 11 lip 2010, 13:43

figa pisze:Tak tylko że jakość czytania w Milenie jest o wiele gorsza niż w Ivonie :( .

Przede wszystkim pokazałem jak w milena_gtk zmienić wywołania Mileny na wywołania Ivony czyli nie bardzo rozumiem o co Ci biega.

Poza tym... czytał uważnie cały wątek?

Milena nie czyta sama tylko korzysta z zewnętrznego silnika wymowy. Nic nie stoi na przeszkodzie aby zmienić ten silnik na Ivonę (jedyny powód dla którego tego nie zrobiłem to brak działającej Ivony na Linuksa).

W tej sytuacji porównanie nie ma żadnego sensu. Porównywać można Mbrolę i Ivonę jeśli chodzi o brzmienie głosu (Ivona wygrywa bezapelacyjnie) albo Milenę i Ivonę jeśli chodzi o prawidłową interpretację tekstu (Milena wygrywa bezapelacyjnie). A na jakość czytania wpływają oba czynniki...

Jeśli mi się uda uruchomić w końcu Ivonę z opensapi obiecuję że zrobię moduł wyjściowy milena_ivona. Na razie jedyną działającą wersją jest niestety stara linuksowa wersja demo Jacka (ta co nie gra muzyczki w tle, ale za to nie wymawia "u"), już niedostępna - ewentualnie Ivona Biznes (mam dostęp do pełnej wersji pod Linuksa, ale też tylko okazjonalny).

Najlepszym wyjściem byłoby zmolestowanie Ivo Software aby wrócili do projektu "Ivona Dekstop" - może byśmy jakiś liścik wystosowali?
kri17
Wygnańcy
Posty: 3
Rejestracja: 07 cze 2008, 14:42
Płeć: Mężczyzna
Wersja Ubuntu: 8.04

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: kri17 » 16 lip 2010, 21:46

Widzę że wątek nie jest zamknięty, a trochę osób tu zagląda, więc zakładam że temat jest interesujący.
Może byście napisali, czy uruchomiliście ivone Trial i czy nadal wam działa.
A o ile po resecie się wyłączyła, to czy ktoś próbował dojść przyczyny?
A może ktoś znalazł rozwiązanie?
Awatar użytkownika
ethanak
Wygnańcy
Posty: 3054
Rejestracja: 04 gru 2007, 13:19
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: GNOME
Architektura: x86
Lokalizacja: Bielsko-Biała
Kontakt:

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: ethanak » 07 paź 2010, 07:23

Odgrzebuję wątek, ale informacja dość ważna.
kri17 pisze: Może byście napisali, czy uruchomiliście ivone Trial i czy nadal wam działa.
Ivona 2 zainstalowana wczoraj działa dzisiaj bez poroblemu (Jacek i Ewa, przez OpenSAPI) i pokazuje prawidłową ilość dni do końca okresu próbnego. Instalowałem co prawda nie na Ubuntu a na PLD, ale poprzednio zachowywało się to na obu identycznie.
Uwaga!
Przed instalacją musiałem wywalić cały ~/.wine - inaczej sypał błędami.
Кто жопой родился, чижиком не помрёт
miklewicz
Piegowaty Guziec
Piegowaty Guziec
Posty: 3
Rejestracja: 30 paź 2009, 14:28
Płeć: Mężczyzna
Wersja Ubuntu: 9.10
Środowisko graficzne: GNOME
Architektura: x86

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: miklewicz » 15 paź 2010, 15:30

[quote="ethanak"] [....]

e) zapisujemy plik i uruchamiamy:

Kod: Zaznacz cały

 python milena_gtk.py

Zrobiłem wszystko tak jak napisałeś, działa... mam oryginalną ivonę rehabilitacyjną. sama ivona działa świetnie, gorzej z tą nakładką graficzną... Przy dłuższych tekstach ze schowka niektóre fragmenty są pomijane, czy da się coś z tym zrobić, by tekst był czytany w całości? Jestem osobą niedowidzącą i brak możliwości pełnego uruchomienia ivony pod linuksem jest jedyną rzeczą jaka mnie trzyma przy windowsie. Byłbym w stanie nawet zapłacić jakąś kwotę (Do ustalenia) za dopracowanie kwestii czytania ze schowka czy to przez milena gtk czy jakiś inny program.
Próbowałem użyć programu kmouth i ktts z KDE do syntezy ale nie wiem jak to pożenić z OpenSapi... na wszelkie sugestie poprawy tego co jest czekam z niecierpliwością tu na forum albo na GG 1249775, czekam również na ewentualne propozycje odpłatnego wykonania programu lub poprawek, które umożliwiłyby odczytywanie zawartości schowka za pomocą jakiegoś skrótu klawiaturowego, nawet wtedy gdy program byłby zminimalizowany. Fajnie by było, też gdyby dało się jakoś zintegrować Ivone z Kadu.

P.S czy da się wykorzystać open-sapi / ivona do współpracy ze screenreaderem Orca?
Awatar użytkownika
ethanak
Wygnańcy
Posty: 3054
Rejestracja: 04 gru 2007, 13:19
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: GNOME
Architektura: x86
Lokalizacja: Bielsko-Biała
Kontakt:

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: ethanak » 16 paź 2010, 07:10

miklewicz pisze: Zrobiłem wszystko tak jak napisałeś, działa... mam oryginalną ivonę rehabilitacyjną. sama ivona działa świetnie, gorzej z tą nakładką graficzną... Przy dłuższych tekstach ze schowka niektóre fragmenty są pomijane, czy da się coś z tym zrobić, by tekst był czytany w całości?
Nie z nakładką graficzną - bo ta po pierwsze była przeznaczona dla Mileny a nie Ivony, a po drugie z Mileną problemów żadnych nie robi - tylko z opensapi i ichniejszym interfejsem który ma pewnie jakieś ograniczenia co do długości tekstu na wejściu.

Sprawdź czy w oknie spikera dłuższy tekst jest czytany prawidłowo, jeśli tak to na razie czytaj schowek przez okno spikera (masz coś takiego w ustawieniach) i daj znać, to może coś poradzę. Niestety, moja Ivona zdechła i nie ma zamiaru wstać, a nie chce mi się kolejny raz instalować jeśli nie będę miał bardzo konkretnego powodu.

Szczególnie że zdechła Ivona grzecznie przyblokowała mi cały interfejs SAPI i nawet Mały Miękki Sam nie chce ze mną rozmawiać...
Jestem osobą niedowidzącą i brak możliwości pełnego uruchomienia ivony pod linuksem jest jedyną rzeczą jaka mnie trzyma przy windowsie.
Rozumiem że Ivona jest jedynym słusznym syntezatorem, a inne dla niewidomych czy niedowidzących się nie nadają? Ciekawa teoria...
Byłbym w stanie nawet zapłacić jakąś kwotę (Do ustalenia) za dopracowanie kwestii czytania ze schowka czy to przez milena gtk czy jakiś inny program.
Ależ kupiłeś Ivonę rehabilitacyjną za parę stówek, no to niech Ci chłopcy z Ivo Software ruszą szanowne cztery litery i pomogą. W końcu za co zapłaciłeś.
Fajnie by było, też gdyby dało się jakoś zintegrować Ivone z Kadu.
Trzy linijki skryptu? Gdzieś kiedyś nawet publikowałem (na forum kadu chyba) taki skrypcik co potrafił podłączyć dowolny syntezator...
P.S czy da się wykorzystać open-sapi / ivona do współpracy ze screenreaderem Orca?
Tak, w dystrybucji opensapi jest generic do speech-dispatchera. Nie sprawdzałem (sam korzystam z Mileny) ale podobno działa.

Poza tym istnieje natywny moduł Ivony do speech-dispatchera, ale wymaga linuksowej wersji Ivony (ogólnie: serwera Ivony nasłuchującego na gniazdku inet).
Кто жопой родился, чижиком не помрёт
miklewicz
Piegowaty Guziec
Piegowaty Guziec
Posty: 3
Rejestracja: 30 paź 2009, 14:28
Płeć: Mężczyzna
Wersja Ubuntu: 9.10
Środowisko graficzne: GNOME
Architektura: x86

Odp: Ivona Reader - odpalanie pod linuxem

Post autor: miklewicz » 16 paź 2010, 10:55

Sprawdź czy w oknie spikera dłuższy tekst jest czytany prawidłowo, jeśli tak to na razie czytaj schowek przez okno spikera (masz coś takiego w ustawieniach) i daj znać, to może coś poradzę.
Niestety dzieje się to samo. Ale co ciekawe to nie jest tak, że po pewnej ilości znaków tekst jest ucinany bo to powiedzmy, że mógłbym zwalić na wersje beta, alpha czy jaki tam open-sapi ma status. Sytuacja wygląda tak, że czytana jest np. połowa tekstu a potem następuje przeskok np. na 2 - 3 zdania przed końcem tekstu i te zdania są czytane prawidłowo.
Na razie używam ivony pod linuxem w takiej konfiguracji: Ivona + wine + open-sapi + SynTalk 2.0 Neurosoftu też pod wine, w SynTalku 2.0 jest panel kontrolny gdzie można wykonać proste operacje na dowolnym głosie SAPI w systemie, typu czytaj tekst ze schowka, czytaj tekst z okna - odpowiednik mileny_gtk i jej spikera itp i jakoś to śmiga ale tam z kolei jest zong taki, że ten panel kontroli SynTalk odpalony pod wine nie reaguje na schowek ani skróty klawiaturowe, muszę każdorazowo wklejać tekst do tego okna dialogowego a-la spiker i z niego czytać dopiero tekst, co na dłuższą metę jest trochę męczące. No ale "lepszy wróbel w garści niż gołąb na dachu."

co ciekawe kilka postów wyżej w tym wątku kolega "kretyn" podał link do napisanego przez siebie GUI, sprawdziłem i to. Tam sytuacja wygląda tak, że wklejony tekst jest czytany do pierwszego entera. tzn. tekst może być dowolnie długi i czytany jest w całości ale jakby tylko jeden akapit
Rozumiem że Ivona jest jedynym słusznym syntezatorem, a inne dla niewidomych czy niedowidzących się nie nadają? Ciekawa teoria...
ależ nie - na pewno Ivona nie jest jedynym wyjściem, ale po pierwsze nie natknąłem się na jakiś sensowny opis instalacji mileny w linuksie i jakoś moje próby samodzielnej instalacji skończyły się niepowodzeniem.
Po drógie jak sam napisałeś zapłaciłem ładnych kilka stówek za ivonę, mało tego mam kilka głosów, w kilku wersjach i z licencjami na 3 komputery. W sumie zostawiłem tym panom z pIVO softłer grubo ponad 1300 zł więc nie uśmiecha mi się, żeby program za te pieniądze leżał jako podstawka pod kwiatek.
Ależ kupiłeś Ivonę rehabilitacyjną za parę stówek, no to niech Ci chłopcy z Ivo Software ruszą szanowne cztery litery i pomogą. W końcu za co zapłaciłeś.
sęk w tym, że przecież wg ivo nie ma problemu bo zawsze moge wykorzystać maszynę wirtualną, tylko po co mi wtedy linux? ehhh

Trzy linijki skryptu? Gdzieś kiedyś nawet publikowałem (na forum kadu chyba) taki skrypcik co potrafił podłączyć dowolny syntezator...
skoro tak to poszukam
Tak, w dystrybucji opensapi jest generic do speech-dispatchera. Nie sprawdzałem (sam korzystam z Mileny) ale podobno działa.
znasz może jakieś szczegóły, gdzie ten moduł i co mam z nim zrobić by zadziałał?

P.S Jeśli chceż to odezwij się na priv lub GG to dla wyższej ideii mogę się podzielić Panią ivonką w wersji "nie zdychającej"
ODPOWIEDZ

Wróć do „Inne”

Kto jest online

Użytkownicy przeglądający to forum: Obecnie na forum nie ma żadnego zarejestrowanego użytkownika i 13 gości