Program do pobrania samego tekstu z całego serwisu www

Tylko tematy nie mieszczące się powyżej.
Awatar użytkownika
elkanguro
Serdeczny Borsuk
Serdeczny Borsuk
Posty: 133
Rejestracja: 26 lip 2007, 11:11
Płeć: Mężczyzna
Wersja Ubuntu: 18.04
Środowisko graficzne: GNOME
Architektura: x86_64
Lokalizacja: KRK
Kontakt:

Program do pobrania samego tekstu z całego serwisu www

Post autor: elkanguro »

Witam, poszukuję programu, który mógłby mi pobrać cały tekst z serwisu www i chodzi mi tu wyłącznie o tekst widoczny na stronie (bez kodu i bez obrazków) aby móc zobaczyć jak wiele jest do przetłumaczenia. Można do tego wykorzystać jakoś wgeta? Ktoś pomoże?
piokowa
Sędziwy Jeż
Sędziwy Jeż
Posty: 42
Rejestracja: 30 wrz 2010, 20:13
Płeć: Mężczyzna
Wersja Ubuntu: 14.04
Środowisko graficzne: Unity
Architektura: x86_64

Re: Program do pobrania samego tekstu z całego serwisu www

Post autor: piokowa »

Zainstaluj sobie links
Potem wpisz w terminalu:
links -dump adres_strony > plik_wyjściowy.txt
Awatar użytkownika
elkanguro
Serdeczny Borsuk
Serdeczny Borsuk
Posty: 133
Rejestracja: 26 lip 2007, 11:11
Płeć: Mężczyzna
Wersja Ubuntu: 18.04
Środowisko graficzne: GNOME
Architektura: x86_64
Lokalizacja: KRK
Kontakt:

Re: Program do pobrania samego tekstu z całego serwisu www

Post autor: elkanguro »

No o to mniej więcej chodzi, jeszcze żeby tylko dało się także za jednym zamachem wyciągnąć wszystkie podstrony... da radę? Jakaś opcja --recursive czy coś takiego?
ODPOWIEDZ

Wróć do „Inne”

Kto jest online

Użytkownicy przeglądający to forum: Obecnie na forum nie ma żadnego zarejestrowanego użytkownika i 5 gości