Czy jest możliwość skonwertowania skanu pliku PDF, na format doc. Ponieważ jest to obszerny materiał nie chciałbym przepisywać wszystkiego ręcznie
Czy istnieje do tego jakiś program?
w sumie można spróbować milena-abc i w "otwórz" zaznaczyć tesseract. niestety - cuneiform na ubuntu od wersji 12 nie działa.
-- 30 sty 2013 15:54 --
Czeslavus pisze:Nie rozumiem ironii ... Tylko nie wiem co ten skan tu robi.
to następnym razem jeśli czegoś nie rozumiesz to swoje porady zasadź w doniczce z hortensją.
no - chyba że po prostu lubisz robić z siebie publicznie durnia. tego już nie zabronię...
hipolitkwiatkowski pisze:Ja kiedyś kopiowałem za pomocą pdf creator z foxit readera.
Jeżeli to jest skan to tekst przechowywany jest w postaci obrazu. Najpierw należałoby go poddać obróbce OCR. Powstanie zwykły plik tekstowy, który będzie można przekonwertować do formatu .doc. Jednak imho bez ręcznej ingerencji w tak utworzony plik i tak się nie obejdzie.
Jeżeli ktoś ma licencję oraz program Finereader to pod najnowszym wine go można bez problemów uruchomić i używać . Kiedyś jak używałem windows to tego używałem potem jak przeszedłem na linux to długo pod Wine nie mogłem tego odpalić . Przypomnieliście mi o tym programie i sprawdziłem go teraz pod Wine 1.7 bardzo dobrze śmiga ! ( screen : http://s7.postimg.org/lxfponyqj/finereader_wine.png )
znasz jeszcze inne programy które się odpalają na wine? może założysz specjalny wątek? np. na temat użycia notepada pod winem zamiast gedita...
tak przy okazji: znasz takie trudne słowo "biernik"?
Jest kilka programów pod Windows, które działają z wine np. pdf2doc. Jest kilka możliwości zrobienia tego on-line. Jest kilka możliwości "na okrętkę" w linuksie.
Generalnie, polecam: https://www.linuxquestions.org/question ... er-344569/ http://www.freewaregenius.com/how-to-co ... ve-test-2/
Problem będzie, jeśli pdf to "zdjęcie/grafika", a nie prawdziwy pdf. Wówczas należy zrobić skan takiego pdf do jakiegoś formatu, który rozpoznaje jakiś OCR (np. tesseract) i dopiero wówczas się bawić w zamianę do doc. Jeśli np. pdf został wygenerowany z Worda przez jakąś "drukarkę PDF", to wówczas wszelkie próby konwersji pdf do czegokolwiek nic nie dadzą. Dopiero jego skan itd.