Wyciąganie adresów e-mail ze strony internetowej

Bash, C, C++, Java, PHP, Ruby, GTK, Qt i wiele innych - wszystko tutaj.
Awatar użytkownika
wiktor1984
Piegowaty Guziec
Piegowaty Guziec
Posty: 12
Rejestracja: 06 sie 2014, 19:07
Płeć: Mężczyzna
Wersja Ubuntu: 14.04

Wyciąganie adresów e-mail ze strony internetowej

Post autor: wiktor1984 »

Witam próbuje wykombinować jak pobrać wszystkie adresy ze strony http://panoramafirm.pl
Od razu zaznaczam że prawnie nie posłużą do spamowania gdyż są to adresy firm a nie prywatne.

Próbowałem pobrać programem NetTools pod windowsem pobiera
ale również skacze po innych stronach,
wykombinowałem aby pobrać całą witrynę na twardy dysk i odłączyć internet Aby program nie skakał po innych stronach
ale program działa tylko na stronach www umieszczonych na serwerach.

Mógłby ktoś napisać jak można było by taki skrybcik w bashu napisać, aby przeszukiwał ściągniętą stronę z podstronami i wyciągał adresy e-mail

Pozdrawiam
Awatar użytkownika
igotit4free
Przyjaciel
Przyjaciel
Posty: 6453
Rejestracja: 29 paź 2008, 22:51
Płeć: Mężczyzna
Architektura: x86_64
Lokalizacja: KRK

Re: Wyciąganie adresów e-mail ze strony internetowej

Post autor: igotit4free »

Usunąłem ci podpis ponieważ nieuważnie przeczytałeś Regulamin.
Windows 10 @ GA-P67A-D3-B3, i3-2100 3.10GHz, 8GB RAM, Gigabyte HD6850 1GB RAM
Android 7.0 @ Motorola Moto G4+
Awatar użytkownika
wytrzeszcz
Sędziwy Jeż
Sędziwy Jeż
Posty: 47
Rejestracja: 27 mar 2008, 21:13
Płeć: Mężczyzna
Wersja Ubuntu: inny OS
Środowisko graficzne: GNOME
Kontakt:

Re: Wyciąganie adresów e-mail ze strony internetowej

Post autor: wytrzeszcz »

Kod: Zaznacz cały

wget <adres_strony> -m index.html && cat * |sed 's/[<> ]/\n'| grep -oE "[^ =\"\']*@[^ =\"\']*" > maile 
lekturra

Kod: Zaznacz cały

man grep
man awk
man sed 
man wget
http://stackoverflow.com/questions/2013 ... il-address
ODPOWIEDZ

Wróć do „Programowanie”

Kto jest online

Użytkownicy przeglądający to forum: Obecnie na forum nie ma żadnego zarejestrowanego użytkownika i 13 gości