Program do pobrania samego tekstu z całego serwisu www
- elkanguro
- Serdeczny Borsuk
- Posty: 133
- Rejestracja: 26 lip 2007, 11:11
- Płeć: Mężczyzna
- Wersja Ubuntu: 18.04
- Środowisko graficzne: GNOME
- Architektura: x86_64
- Lokalizacja: KRK
- Kontakt:
Program do pobrania samego tekstu z całego serwisu www
Witam, poszukuję programu, który mógłby mi pobrać cały tekst z serwisu www i chodzi mi tu wyłącznie o tekst widoczny na stronie (bez kodu i bez obrazków) aby móc zobaczyć jak wiele jest do przetłumaczenia. Można do tego wykorzystać jakoś wgeta? Ktoś pomoże?
-
- Sędziwy Jeż
- Posty: 42
- Rejestracja: 30 wrz 2010, 20:13
- Płeć: Mężczyzna
- Wersja Ubuntu: 14.04
- Środowisko graficzne: Unity
- Architektura: x86_64
Re: Program do pobrania samego tekstu z całego serwisu www
Zainstaluj sobie links
Potem wpisz w terminalu:
links -dump adres_strony > plik_wyjściowy.txt
Potem wpisz w terminalu:
links -dump adres_strony > plik_wyjściowy.txt
- elkanguro
- Serdeczny Borsuk
- Posty: 133
- Rejestracja: 26 lip 2007, 11:11
- Płeć: Mężczyzna
- Wersja Ubuntu: 18.04
- Środowisko graficzne: GNOME
- Architektura: x86_64
- Lokalizacja: KRK
- Kontakt:
Re: Program do pobrania samego tekstu z całego serwisu www
No o to mniej więcej chodzi, jeszcze żeby tylko dało się także za jednym zamachem wyciągnąć wszystkie podstrony... da radę? Jakaś opcja --recursive czy coś takiego?
Kto jest online
Użytkownicy przeglądający to forum: Obecnie na forum nie ma żadnego zarejestrowanego użytkownika i 5 gości