Witam.
Mam takie pytanie czy jest jakiś program albo skrypt do exportu danych z plików pdf?? dokładnie chodzi mi o tabelki , np : http://www.bannerbatterien.com/banner/f ... BlocPl.pdf.
Dokładnie chodzi o tabelkę/ki z drugiej strony. Dziękuję
Export z pdf do odt lub xls
- Dwimenor
- Przebojowy Jelonek
- Posty: 1260
- Rejestracja: 18 mar 2008, 16:14
- Płeć: Mężczyzna
- Wersja Ubuntu: 13.10
- Architektura: x86_64
Re: Export z pdf do odt lub xls
To nie są skany/zdjęcia - wszystko jest tekstem. nie ma więc problemu z zwykłym kopiuj ->wklej. Inna sprawa, że nie idzie ustawić separatorów i trzeba kolumna po kolumnie (a nagłówki osobno) kopiować.
Coś do automatyzacji? Potrzebne tu będzie OCR.
Coś do automatyzacji? Potrzebne tu będzie OCR.
Poniższe zdanie jest fałszywe.
Powyższe zdanie jest prawdziwe.
Powyższe zdanie jest prawdziwe.
- ethanak
- Wygnańcy
- Posty: 3054
- Rejestracja: 04 gru 2007, 13:19
- Płeć: Mężczyzna
- Wersja Ubuntu: 12.04
- Środowisko graficzne: GNOME
- Architektura: x86
- Lokalizacja: Bielsko-Biała
- Kontakt:
Re: Export z pdf do odt lub xls
Po co ocr? O ile wiem żaden linuksowy silnik tabelek nie obsługuje.
Ja dostaję pdf-y z mBanku, przepuszczam przez pdftohtml i dostaję xml-a. Fakt że z tabelkami jest problem, ale na szczęście w xml-u dla każdego stringu jest podana pozycja na stronie czyli można sobie to jakoś ułożyć wiedząc jak tabelka wygląda.
Inna sprawa, że kawałek (i to niemały) programu do interpretacji tego xml-a trzeba było napisać.
Ja dostaję pdf-y z mBanku, przepuszczam przez pdftohtml i dostaję xml-a. Fakt że z tabelkami jest problem, ale na szczęście w xml-u dla każdego stringu jest podana pozycja na stronie czyli można sobie to jakoś ułożyć wiedząc jak tabelka wygląda.
Inna sprawa, że kawałek (i to niemały) programu do interpretacji tego xml-a trzeba było napisać.
-
- Piegowaty Guziec
- Posty: 9
- Rejestracja: 15 lut 2012, 00:34
- Płeć: Mężczyzna
- Wersja Ubuntu: 11.10
- Środowisko graficzne: LXDE
- Architektura: x86
- Lokalizacja: Katowice / Tychy
- Kontakt:
Re: Export z pdf do odt lub xls
Witam. Jeżeli można to wolałbym robic to z automatu. A co do CTRL-C i CTRL-V, po próbie wklejenia, u mnie libreoffice dostał szału. Mam wszystko w jednej kolumnie
- ABCD
- Sędziwy Jeż
- Posty: 87
- Rejestracja: 31 lip 2011, 16:59
- Płeć: Mężczyzna
- Wersja Ubuntu: inny OS
- Środowisko graficzne: WindowMaker
- Architektura: x86_64
Re: Export z pdf do odt lub xls
Można tez otworzyć pdf Gimpem i zapisać jako obraz. Oczywiście można też i edytować, ale jak słabo znasz Gimpa to za efekty nie ręczę.
Przypomniało mi się jeszcze.. http://linuxappfinder.com/editors/pdf
sudo apt-get install pdfedit np.
Ja tego programu nie używałem.. pamiętam że ze jeszcze jakimś programem dawało się zamienić pdf na dokument w innym formacie.. jak tylko wygoogluję dam znać.
Przypomniało mi się jeszcze.. http://linuxappfinder.com/editors/pdf
sudo apt-get install pdfedit np.
Ja tego programu nie używałem.. pamiętam że ze jeszcze jakimś programem dawało się zamienić pdf na dokument w innym formacie.. jak tylko wygoogluję dam znać.

Na początku było słowo, sądząc po tym co jest teraz musiało być niecenzuralne.
Kto jest online
Użytkownicy przeglądający to forum: Obecnie na forum nie ma żadnego zarejestrowanego użytkownika i 5 gości