SubAloud - czyli niech nasze oczka się nie męczą :)

Miejsce, w którym użytkownicy forum mogą zaprezentować swoje własne projekty programistyczne.
Awatar użytkownika
ethanak
Wygnańcy
Posty: 3054
Rejestracja: 04 gru 2007, 13:19
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: GNOME
Architektura: x86
Lokalizacja: Bielsko-Biała
Kontakt:

SubAloud - czyli niech nasze oczka się nie męczą :)

Post autor: ethanak »

Mam niewątpliwy zaszczyt przedstawić pierwszą bardzo wstępną wersję programu SubAloud, czyli wielojęzycznego głosowego czytnika napisów w filmach.

Program jest naprawdę we wczesnej fazie rozwoju, toteż może sprawiać przeróżne problemy. Proszę o sygnalizację owych problemów tutaj lub na maila (znajdziesz w pliku README_pl).

Do ściągnięcia z http://tts.polip.com/files/subaloud/ (należy ściągać najnowszą wersję, nie bardzo mi się chce uaktualniać link za każdym razem gdy poprawię jakiegoś babola).

Przyszłość programu zależy od Was - jeśli nie będzie żadnych odpowiedzi, uznam że projekt jest niepotrzebny i zostanie zakończony.

Fragment z README_pl:
I. WYMAGANIA

1. Do kompilacji następujące pakiety:

milena-libs-dev
libivolektor-dev
libsapilektor-dev
libao-dev
libenca-dev
glib-2.0-dev

W Ubuntu trzy pierwsze pakiety można pobrać z repozytorium ppa:ethanak/milena
W pozostałych dystrybucjach milena i ivolektor dostępne są na stronie
http://milena.polip.com/download.shtml, sapilektor należy ściągnąć z
http://tts.polip.com/files/sapi/

2. DO PRACY
a) dla modułów milena, txt2pho i espeak-mbrola (planowany):
- mbrola
- głos odpowiedni dla języka (pl1 dla Mileny, de4 do de7 dla txt2pho)

b) dla modułu txt2pho - binaria txt2pho. Sam program txt2pho musi być dostępny
w ścieżce wykonania (PATH), dane należy umieścić w jednym z katalogów:
/usr/share/txt2pho/data
/usr/local/txt2pho/data
/usr/local/share/txt2pho/data

c) Dla mileny z głosami Ivony oraz modułu sapi - dostępny i uruchomiony
serwer sapi4linux (w Ubuntu z tego samego repozytorium, w pozostałych
dystrybucjach w http://tts.polip.com/files/sapi/).

II. KOMPILACJA

Bardzo prosta. Rozpakowujemy plik, wchodzimy w terminalu do tego pliku
i wydajemy kolejno polecenia:

make
sudo make install

Program będzie umieszczony w domyślnie w /usr/local, można to zmienić
podając odpowiedni parametr w make, np:

make prefix=/usr
sudo make prefix=/usr install

III. DZIAŁANIE PROGRAMU

Program przede wszystkim próbuje nawiązac komunikację z modułem syntezy.
Następnie wczytuje napisy i uruchamia mplayera z odpowiednimi
parametrami. Jeśli format napisów jest oparty na ramkach, dodaje
do mplayera parametr -identify aby poznać FPS filmu.

Jeśli nie podano ścieżki do napisów, program próbuje znaleźć napisy
podmieniając w nazwie pliku filmu rozszerzenie na jedno z
.asub, .sub, .srt lub .txt. Plik z rozszerzeniem asub może być
w dowolnym formacie, dodanie takiego pliku umożliwia proste
czytanie innych napisów i wyświetlanie innych.

W obecnej postaci program szuka biblioteki pulse_simple, i jeśli
ją znajdzie, wyjściem audio będzie pulseaudio. W przeciwnym przypadku
użyje biblioteki ao.

Zakończenie pracy mplayera spowoduje automatyczne zakończenie programu.
Również zakończenie programu spowoduje wysłanie do mplayera sygnału
zakończenia.

Program będzie czytał napisy z zadaną prędkością nominalną, jednak
w przypadku zagęszczenia kwestii prędkość będzie płynnie przyspieszona
aż do osiągnęcia prędkości maksymalnej. Jeśli mimo to opóźnienie
kwestii wyniesie ponad 3 sekundy, nastąpi resynchronizacja czytanych
napisów z bieżącą pozycją czasową - niektóre kwestie mogą zostać
pominięte.

IV. PARAMETRY WYWOŁANIA

-h - wyświetlenie pomocy
-M <nazwa_modulu> - obowiązkowy - jeden z modułów (aktualnie milena,
txt2pho lub sapi)
-V <nazwa głosu> - obowiązkowy (z wyjątkiem Mileny). Dla głosów SAPI
będzie to nazwa głosu wpisana w konfiguracji ivolektora lub
sapilektora, dla txt2pho jeden z głosów de4 do de7. Domyślnym
głosem modułu Milena jest Milena (synteza poprzez mbrolę)
-r <float> - szybkość czytania (od 1.0 do 2.0)
-R <float> - maksymalna szybkość czytania (od wartości -r do 2.0)
-m <ścieżka> - obowiązkowy poza trybem test - ścieżka do filmu
-s <ścieżka> - ścieżka do napisów, jeśli inne niż domyślne
-e <encoding> - kodowanie napisów (domyślnie automatyczne)
-l <code> - dwuliterowy kod języka napisów do automatycznego rozpoznania,
jeśli inny niż bieżący język systemu.
-T 'tekst' - tryb testowy. Program nie próbuje odtwarzać filmu, zamiast
tego wypowiada podany tekst z prędkością nominalną, następnie
z prędkościa maksymalną.
-A <parametr> - głośność lektora (z zakresu 0..100)

Dodatkowo wystapienie w parametrach ciągu '--' powoduje,
że następne parametry będą przeznaczone dla mplayera

Przykładowe wywołanie:

Kod: Zaznacz cały

subaloud -M milena -V jacek -m ~/Wideo/Fajny_film.avi \
	-r 1.3 -R 1.5 -- -noautosub
spowoduje uruchomienie mplayera bez wyświetlania napisów,
wczytanie np. napisów ~/Wideo/Fajny_film.txt oraz czytanie
napisów głosem Jacek syntezatora Ivona. Nominalna prędkość wyniesie
1.3 prędkości standardowej Ivony, maksymalna 1.5 tej prędkości.

V. ZDALNE STEROWANIE

UWAGA!!! Zdalne sterowanie działa wyłącznie pod linuksem!

Do zdalnego sterowania programem służy zamieszczony jako przykład
programik w Pythonie - subalctl.py. Wywołanie tego programu
bez żadnych parametrów lub z parametrem 's' spowoduje natychmiastowe
zatrzymanie czytania bieżącej kwestii oraz resynchronizację. Wywołanie
z parametrem '+' lub '-' spowoduje zwiększenie/zmniejszenie głośności
o wartość 5. Podanie parametru z zakresu 0 do 100 spowoduje
ustawienie głośności na zadaną wartość. Przy ustawianiu głośności
program zwraca aktualną wartość.

Program należy traktować jako przykładowy kod do stworzenia interfejsu
graficznego, chociaż może być przydatny bezpośrednio poprzez podpięcie
go do klawiszy (np. SUPER-9 i SUPER-0 sterują głośnością, SUPER-minus
resynchronizuje napisy).

Dzięki koledze Adlatus z Forum Ubuntu za sugestię resynchronizacji!
tdevril
Piegowaty Guziec
Piegowaty Guziec
Posty: 8
Rejestracja: 06 mar 2013, 14:06
Płeć: Mężczyzna
Wersja Ubuntu: 12.10
Środowisko graficzne: Inne
Architektura: x86_64
Kontakt:

Re: SubAloud - czyli niech nasze oczka się nie męczą :)

Post autor: tdevril »

hmm no ja powiem super sprawa co do tego twojego pomysłu, takiego czegoś brakowało mi w ubunciaku :D
A co do graficznego interfejsu może lepiej zrobić sam dodatek do mplayera, ala jakaś wtyczka ?
PC |Phenom X4 9750 2.4Ghz|GA-M61SME-S2|4GB DDR2|320GB Samsung+160GB WD SATA|Geforce GTX 650 1GB|DVDRW+BlueRAY|Monitor LCD 26' Full HD
Notebook Acer |Core Duo T6600 2.2Ghz|3GB DDR2|320GB WD| Radeon 4570 1GB| DVDRW
Awatar użytkownika
ethanak
Wygnańcy
Posty: 3054
Rejestracja: 04 gru 2007, 13:19
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: GNOME
Architektura: x86
Lokalizacja: Bielsko-Biała
Kontakt:

Re: SubAloud - czyli niech nasze oczka się nie męczą :)

Post autor: ethanak »

W tym problem, że to mplayer jest zaprojektowany do tego żeby robić za wtyczkę :(

Na razie wrzuciłem nową wersję - z ciekawszych rzeczy możliwość regulowania opóźnienia czytania napisów (ze skokiem 0.1.sekundy), obsługa svox pico i implementacja większości parametrów modułu potrzebnych do komfortowego oglądania filmu. Dodatkowo prosty preprocesor tekstu (niezależny od języka) i dla niemieckiego możliwość wykorzystania znanego programu Preproc. Co do interfejsu - zobaczymy...
salvadhor
Przyjaciel
Przyjaciel
Posty: 340
Rejestracja: 09 lip 2005, 18:33
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: Xfce
Architektura: x86_64
Kontakt:

Re: SubAloud - czyli niech nasze oczka się nie męczą :)

Post autor: salvadhor »

Brawo! Tylko filmów nie mam... :)
Root walks behind you.
404 sposoby na Linuksa: http://404.g-net.pl
#254787
Awatar użytkownika
ethanak
Wygnańcy
Posty: 3054
Rejestracja: 04 gru 2007, 13:19
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: GNOME
Architektura: x86
Lokalizacja: Bielsko-Biała
Kontakt:

Re: SubAloud - czyli niech nasze oczka się nie męczą :)

Post autor: ethanak »

Ech... więc życie Twe wegetacją nędzną jest jeno, jako że mego niewątpliwego arcydzieła docenić nie możesz :)

A tak na poważnie: właśnie wrzuciłem wersję 0.0.4, README proszę sobie przeczytać bo się nieco zmieniło (można nie kompilować modułów pico, sapi i milena) i w tej postaci można toto już testować - więcej ficzerów nie przewiduję.

Filmów nie dostarczę ;)
Awatar użytkownika
woolf
Serdeczny Borsuk
Serdeczny Borsuk
Posty: 165
Rejestracja: 03 mar 2010, 22:57
Płeć: Mężczyzna
Wersja Ubuntu: 12.10
Środowisko graficzne: Xfce
Architektura: x86

Re: SubAloud - czyli niech nasze oczka się nie męczą :)

Post autor: woolf »

To pobierz stąd, to stamtąd, do tego jeszcze to i przy tym (milena-0.2.54.9.tar.gz) jeszcze 10 pakietów, które nie wiadomo czy są potrzebne, a żeby się dowiedzieć czy to nie śmieci, to jeszcze przeczytać parę innych plików readme. Do tego "2. DO PRACY" znowu jakieś 3 opcje do wyboru, o co w tym chodzi? Sorry, ale nie siedzę w temacie i chciałbym zainstalować jedną paczkę .deb z Ivoną i mieć lektora, a nie szkolić się z syntezatorów mowy i dowiadywać się co jest do czego i czy to działa lepiej czy tamto. Poza tym inicjatywa dobra i potrzebna.
Awatar użytkownika
ethanak
Wygnańcy
Posty: 3054
Rejestracja: 04 gru 2007, 13:19
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: GNOME
Architektura: x86
Lokalizacja: Bielsko-Biała
Kontakt:

Re: SubAloud - czyli niech nasze oczka się nie męczą :)

Post autor: ethanak »

nie ma paczki deb z ivoną i prawdopodobnie nigdy nie będzie - ivo software nie interesuje linux z ubuntu na czele.
jeśli twoim zdaniem program który dopiero powstaje ma być od razu w debach, rpmach, pacach i innych pakietach - wybacz, ale śmieszny jesteś. nie chcesz pomagać to nie, ale nie stroj fochów i nie przeszkadzaj.
a przy okazji - w ubuntu wszystko co potrzebne masz w pakietach, dodać ppa to chyba nie takie trudne?
macios4x

Re: SubAloud - czyli niech nasze oczka się nie męczą :)

Post autor: macios4x »

@Ethanak czy ten program jest tylko pod Ubuntu czy na Debiana też zadziała? Bo w repo Debiana nie ma wymaganych zalezności
Awatar użytkownika
ethanak
Wygnańcy
Posty: 3054
Rejestracja: 04 gru 2007, 13:19
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: GNOME
Architektura: x86
Lokalizacja: Bielsko-Biała
Kontakt:

Re: SubAloud - czyli niech nasze oczka się nie męczą :)

Post autor: ethanak »

czego dokładnie nie ma? w debianie milenę i ivolektora musisz skompilować sam, reszta powinna być w repo.
oczywiście kompilujesz bez pico i sapi - dla polskiego nie są potrzebne.
starałem się utrzymać jak najmniejszą ilość zależności, ale może o czymś zapomniałem?
macios4x

Re: SubAloud - czyli niech nasze oczka się nie męczą :)

Post autor: macios4x »

Wynik:

Kod: Zaznacz cały

maciek@debian:~$ sudo aptitude install -R milena-libs-dev libivolektor-dev libsapilektor-dev libao-dev libenca-dev libglib-2.0-dev libespeak-dev libttspico-dev 
[sudo] password for maciek: 
Nie znaleziono pakietu, którego nazwa lub opis zawierałyby "milena-libs-dev"
Nie znaleziono pakietu, którego nazwa lub opis zawierałyby "libivolektor-dev"
Nie znaleziono pakietu, którego nazwa lub opis zawierałyby "libsapilektor-dev"
Nie znaleziono pakietu, którego nazwa lub opis zawierałyby "libglib-2.0-dev"
Nie znaleziono pakietu, którego nazwa lub opis zawierałyby "milena-libs-dev"
Nie znaleziono pakietu, którego nazwa lub opis zawierałyby "libivolektor-dev"
Nie znaleziono pakietu, którego nazwa lub opis zawierałyby "libsapilektor-dev"
Nie znaleziono pakietu, którego nazwa lub opis zawierałyby "libglib-2.0-dev"
Następujące NOWE pakiety zostaną zainstalowane:
  libao-dev libenca-dev libespeak-dev libttspico-data{a} libttspico-dev 
  libttspico0{a} 
0 pakietów aktualizowanych, 6 instalowanych, 0 do usunięcia i 0 nieaktualizowanych.
Do pobrania 5340 kB archiwów. Zajęte po rozpakowaniu: 8955 kB.
Kontynuować? [Y/n/?] 
Awatar użytkownika
ethanak
Wygnańcy
Posty: 3054
Rejestracja: 04 gru 2007, 13:19
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: GNOME
Architektura: x86
Lokalizacja: Bielsko-Biała
Kontakt:

Re: SubAloud - czyli niech nasze oczka się nie męczą :)

Post autor: ethanak »

no to tak:
jak wspomniałem wcześniej
1. zainstaluj milenę i ivolektora ze źródeł
2. sapilektora nie potrzebujesz
3. nie wiem jak się w debianie nazywa pakiet developerski do gliba, ale w zwuązku z brakiem debiana mam małe szanse aby się tak szybko dowiedzieć
poza tym ubuntu nie debian...
frytek
Wytworny Kaczor
Wytworny Kaczor
Posty: 330
Rejestracja: 06 sty 2006, 00:03
Płeć: Mężczyzna
Wersja Ubuntu: 10.04
Środowisko graficzne: GNOME
Architektura: x86
Kontakt:

Re: SubAloud - czyli niech nasze oczka się nie męczą :)

Post autor: frytek »

woolf pisze:To pobierz stąd, to stamtąd, do tego jeszcze to i przy tym (milena-0.2.54.9.tar.gz) jeszcze 10 pakietów, które nie wiadomo czy są potrzebne, a żeby się dowiedzieć czy to nie śmieci, to jeszcze przeczytać parę innych plików readme.
Zawsze możesz kupić i zainstalować Windows oraz Ivonę. Tam chyba jest jakiś lektor do filmów.

Bo chyba trochę przesadzasz. Z całej instalacji najdłużej trwa pobranie głosów demo z Ivo Software.
Awatar użytkownika
woolf
Serdeczny Borsuk
Serdeczny Borsuk
Posty: 165
Rejestracja: 03 mar 2010, 22:57
Płeć: Mężczyzna
Wersja Ubuntu: 12.10
Środowisko graficzne: Xfce
Architektura: x86

Re: SubAloud - czyli niech nasze oczka się nie męczą :)

Post autor: woolf »

Nie chodzi o "strojenie fochów". Napisałem tylko, że instalacja sprawia trudności, czego dowodem są chociażby posty macios4x.
frytek pisze:Zawsze możesz kupić i zainstalować Windows oraz Ivonę. Tam chyba jest jakiś lektor do filmów.
Pisząc Ivona miałem na myśli głos z Ivony. Poza tym na Windzie nigdy nie korzystałem z Ivony, a SubAloud chciałem tylko potestować.
Awatar użytkownika
socrates
Wytworny Kaczor
Wytworny Kaczor
Posty: 289
Rejestracja: 15 maja 2011, 01:00
Płeć: Mężczyzna
Wersja Ubuntu: inny OS
Środowisko graficzne: Xfce
Architektura: x86_64

Re: SubAloud - czyli niech nasze oczka się nie męczą :)

Post autor: socrates »

@ethanak gratuluje pomyslu i wiedzy oraz checi zrobienia czegos dla innych.
Niemniej jednak @woolf troche racji ma. Rowniez chcialem pomoc potestowac. Ale jak w repo nie bylo potrzebnych pakietow to dalem sobie spokoj...
Moze jak znajde czas i checi to sprobuje znow.
Fajnie byloby gdyby tak tylko dpkg -i...
Gentoo + XFCE
Awatar użytkownika
ethanak
Wygnańcy
Posty: 3054
Rejestracja: 04 gru 2007, 13:19
Płeć: Mężczyzna
Wersja Ubuntu: 12.04
Środowisko graficzne: GNOME
Architektura: x86
Lokalizacja: Bielsko-Biała
Kontakt:

Re: SubAloud - czyli niech nasze oczka się nie męczą :)

Post autor: ethanak »

woolf pisze:Nie chodzi o "strojenie fochów". Napisałem tylko, że instalacja sprawia trudności, czego dowodem są chociażby posty macios4x.
Jeśli do kogoś nie dociera prosty fakt, że Ubunciane repozytoria mają prawo na Debianie nie działać to cóż... nie spodziewałbym się efektów.
woolf pisze:Pisząc Ivona miałem na myśli głos z Ivony.
Nie zrozumiałeś chyba czegoś...

Pakietu deb z głosem Ivony nie ma i nie będzie, chyba że Amazon sprzeda Ivonę Mareczkowi. To w końcu windowsowy program i raczej ciężko by było go spakietować. Jak sobie wyobrażasz pakiet (typu instalator) do programu, którego nie da się ściągnąć z sieci normalnymi metodami tylko należy używać jakiejś windowsowej klikanej aplikacji (której zresztą ze strony autorów też się nie da ściągnąć, na szczęście istnieje coś takiego jak instalki.pl), a licencja absolutnie wyklucza redystrybucję?

Zastanawia mnie przy okazji coś innego: gracze będą się męczyć z piętnastoma wersjami wine, instalować pod wine jakieś patche i w ogóle staną się specjalistami od wine żeby pograć sobie w GTA (którego również w pakiecie nie ma). I gracze będą szczęśliwi, bo po ciężkich bojach wreszcie uda im się odpalić grę. Tu masz wszystko co trzeba aby jednym palcem zainstalować Ivonę (wymaga to wydania dwóch poleceń, ew. trzeciego jeśli Ivonę od razu aktywujesz), ale nie, jest źle, bo aptgetem nie zainstalujesz...
socrates pisze:Ale jak w repo nie bylo potrzebnych pakietow to dalem sobie spokoj...
O to że w repo Debiana czego nie ma pretensje proszę kierować do maintainerów repo Debiana a nie do autora softu. To że akurat bawię się w maintainera w przypadku własnych programów wynika z faktu, że sam Ubuntu używam, programów potrzebuję na kilku maszynach a poza tym zależy mi na jak najszybszej publikacji poprawek (szczególnie milena-data).

Przy okazji: pakiety źródłowe dla Ubuntu są dostępne, akurat w przypadku mileny i ivolektora możecie sobie je ściągnąć i zrobić paczki do swojego systemu (chociaż IMHO instalacja ze źródeł jest w tym przypadku szybsza). Sapi4linux w ogóle nie powinien być w debie - to że w Ubuntu jest to tylko efekt mojego zdania o przeciętnym użytkowniku Ubuntu który jak ma rozpakować tar.gz to jest trzy dni chory, dwa następne spędza na korespondencji na forach z takimi samymi użytkownikami, a w końcu instaluje Total Commandera pod wine i ma pretensje do całego świata że to takie skomplikowane.

Tak przy okazji - naprawdę nie można mojego ppa podłączyć do Debiana? Podobno to nowoczesny system, więc ten od Quantala czy Precizego pewnie by pasował...

-- 12 mar 2013 10:24 --

Dla leniwych: subaloud jest już w moim ppa (dla 12.04 i 12.10). Nie robiłem podziału na moduły bo po prostu nie miałem czasu na zabawy z debami.
Przy okazji nadmieniam, iż deby są dla UBUNTU.
ODPOWIEDZ

Wróć do „Nasza twórczość”

Kto jest online

Użytkownicy przeglądający to forum: Obecnie na forum nie ma żadnego zarejestrowanego użytkownika i 71 gości