Strona 1 z 1

wget - nie chce pobrać całej witryny

: 01 lip 2023, 20:29
autor: Noster
Cześć,
Chciałem zarchiwizować sobie witrynę, bo ma być za niedługo usunięta, używam polecenia:
$ wget -m -R "*.jpg, *.gif, *png" - https://ousamaranking.wbijam.pl/
ale nie pobiera mi jej całej, bo podstrone ściąga normalnie np: https://ousamaranking.wbijam.pl/pierwsza_seria-14.html
ale nie chce pobrać z niej następnej strony z odtwarzaczem np: https://ousamaranking.wbijam.pl/odtwarz ... SRN1W.html
https://imgur.com/gallery/81KLRlh
Mógłby mi ktoś wytłumaczyć co źle robię? Przy użyciu webhttptrack jest ten sam problem

Re: wget - nie chce pobrać całej witryny

: 02 lip 2023, 09:43
autor: mario_7
To pewnie wina tego, że na stronie są skrypty które dodają linki itp. Wget jest prostym narzędziem - nie renderuje strony, a jedynie pobiera jej zawartość. Jeśli są na niej skrypty, które nie zadziałają lokalnie po pobraniu, to części rzeczy nie zobaczysz na pobranej kopii.

Aby w pełni odwzorować stronę w lokalnej kopii zapewne musiałbyś użyć czegoś z Chrome Headless albo podobnym, np. tutaj: https://pptr.dev/

Re: wget - nie chce pobrać całej witryny

: 04 lip 2023, 08:59
autor: jacekalex
@Noster
Httrack próbowałeś?

Sznurek:
https://www.httrack.com/