Skan PDF na doc.

mariob74 · Post autor: **mariob74** » 29 sty 2013, 23:58

Czy jest możliwość skonwertowania skanu pliku PDF, na format doc. Ponieważ jest to obszerny materiał nie chciałbym przepisywać wszystkiego ręcznie

Czy istnieje do tego jakiś program?

Czeslavus · Post autor: **Czeslavus** » 30 sty 2013, 03:26

Adobe Reader otwórz i zapisz jako txt, a potem LibreOfice Writer otwórz txt i zapisz jako doc. Tak myślę, choć głowy nie dam ...

ethanak · Post autor: **ethanak** » 30 sty 2013, 07:48

Genialne w swej prostocie... Adobe magicznym sposobem zamieni skan na tekst... powinieneś koniecznie to opatentować, będziesz bogaty!

@mariob74: było wałkowane na forum długo i namiętnie - tesseract i trochę zabawy.

Czeslavus · Post autor: **Czeslavus** » 30 sty 2013, 15:00

Otwórz plik pdf Adobe Reader 9 i potem Zapisz jako i txt jest do wyboru.
Nie rozumiem ironii ... Tylko nie wiem co ten skan tu robi.

mistrz1 · Post autor: **mistrz1** » 30 sty 2013, 15:15

Skan to jest zdjęcie, więc potrzebujesz programu, który czyta tekst ze zdjęcia.

ethanak · Post autor: **ethanak** » 30 sty 2013, 15:49

w sumie można spróbować milena-abc i w "otwórz" zaznaczyć tesseract. niestety - cuneiform na ubuntu od wersji 12 nie działa.

-- 30 sty 2013 15:54 --

Czeslavus pisze:Nie rozumiem ironii ... Tylko nie wiem co ten skan tu robi.

to następnym razem jeśli czegoś nie rozumiesz to swoje porady zasadź w doniczce z hortensją.
no - chyba że po prostu lubisz robić z siebie publicznie durnia. tego już nie zabronię...

mariob74 · Post autor: **mariob74** » 30 sty 2013, 16:12

Dla przejrzystości zaznaczę że jest to skan pdf-u, a nie plik pdf.

ethanak · Post autor: **ethanak** » 30 sty 2013, 16:21

a skan jest w jakim formacie i jakiej rozdzielczości? bo jeśli jpg i 100 dpi to szybciej będzie przepisać.

woolf · Post autor: **woolf** » 30 sty 2013, 17:57

Spróbuj coś z tego:
http://www.onlineocr.net/
http://www.free-ocr.com/
http://michelle.ocrgrid.org/e2/
http://www.sciweavers.org/free-online-ocr

ethanak · Post autor: **ethanak** » 31 sty 2013, 07:19

no to jeszcze http://www.robobraille.org

mariob74 · Post autor: **mariob74** » 31 sty 2013, 07:34

Dziękuję pomogło

Nawet nie wiedziałem że można to zrobić online

fabians · Post autor: **fabians** » 30 sie 2013, 19:05

Do kolekcji ocr dodałbym jeszcze jedną stronę. Wydaje mi się najlepiej sprawdzająca się w temacie i osobiście polecam:

http://www.newocr.com/

siloam · Post autor: **siloam** » 02 wrz 2013, 16:13

hipolitkwiatkowski pisze:Ja kiedyś kopiowałem za pomocą pdf creator z foxit readera.

Jeżeli to jest skan to tekst przechowywany jest w postaci obrazu. Najpierw należałoby go poddać obróbce OCR. Powstanie zwykły plik tekstowy, który będzie można przekonwertować do formatu .doc. Jednak imho bez ręcznej ingerencji w tak utworzony plik i tak się nie obejdzie.

xxx666xxx · Post autor: **xxx666xxx** » 02 wrz 2013, 17:14

Jeżeli ktoś ma licencję oraz program Finereader to pod najnowszym wine go można bez problemów uruchomić i używać . Kiedyś jak używałem windows to tego używałem potem jak przeszedłem na linux to długo pod Wine nie mogłem tego odpalić . Przypomnieliście mi o tym programie i sprawdziłem go teraz pod Wine 1.7 bardzo dobrze śmiga ! ( screen : http://s7.postimg.org/lxfponyqj/finereader_wine.png )

ethanak · Post autor: **ethanak** » 02 wrz 2013, 17:31

znasz jeszcze inne programy które się odpalają na wine? może założysz specjalny wątek? np. na temat użycia notepada pod winem zamiast gedita...
tak przy okazji: znasz takie trudne słowo "biernik"?

Yuri20 · Post autor: **Yuri20** » 03 wrz 2013, 19:48

Teraz biernik wcześniej miejscownik, kiedyś dojdziemy do wołacza.

pavbaranov · Post autor: **pavbaranov** » 04 wrz 2013, 15:56

Jest kilka programów pod Windows, które działają z wine np. pdf2doc. Jest kilka możliwości zrobienia tego on-line. Jest kilka możliwości "na okrętkę" w linuksie.
Generalnie, polecam: https://www.linuxquestions.org/question ... er-344569/
http://www.freewaregenius.com/how-to-co ... ve-test-2/
Problem będzie, jeśli pdf to "zdjęcie/grafika", a nie prawdziwy pdf. Wówczas należy zrobić skan takiego pdf do jakiegoś formatu, który rozpoznaje jakiś OCR (np. tesseract) i dopiero wówczas się bawić w zamianę do doc. Jeśli np. pdf został wygenerowany z Worda przez jakąś "drukarkę PDF", to wówczas wszelkie próby konwersji pdf do czegokolwiek nic nie dadzą. Dopiero jego skan itd.

Skan PDF na doc.

Skan PDF na doc.

Re: Skan PDF na doc.

Re: Skan PDF na doc.

Re: Skan PDF na doc.

Re: Skan PDF na doc.

Re: Skan PDF na doc.

Re: Skan PDF na doc.

Re: Skan PDF na doc.

Re: Skan PDF na doc.

Re: Skan PDF na doc.

Re: Skan PDF na doc.

Re: Skan PDF na doc.

Re: Skan PDF na doc.

Re: Skan PDF na doc.

Re: Skan PDF na doc.

Re: Skan PDF na doc.

Re: Skan PDF na doc.

Kto jest online