Strona 1 z 1

program obraz na tekst

: 04 mar 2025, 19:24
autor: Benita
Czy jest jakiś dobry program na ubuntu, który potrafi sczytać tekst ze zdjęcia, tak aby dało się to wkleić do pliku tekstowego?
Tekst na zdjęciach to chiński tradycyjny. Nie nadążam z zapisywaniem podczas i robię zdjęcia slajdów podczas zajęć.
Do tej pory korzystałam z darmowych stron, ale ostatnio prawie wszystkie wprowadziły limity...
W centrum oprogramowania ubuntu pobrałam: OCR Feeder, gimageReader i jakieś dwa image to text. Ale żaden z nich nie działa. W dwu nie ma opcji azjatyckich znaków, są ograniczone do angielskiego tylko. :confused:
Bardzo proszę o pomoc, bo przepisywanie zabiera strasznie dużo czasu....

Re: program obraz na tekst

: 04 mar 2025, 20:01
autor: kobrawerde
Chyba na linux-a nie znajdziesz takowego... tzn dobrze działającego. Jak lata temu szukałem alternatywy dla Windowsowego abbyy finereader -a ale nic godnego polecenia nie znalazłem :-( ... a ten wspomniany abbyy finereader to faktycznie niezły "kozak" :mrgreen:
Choć można znaleźć info że jakaś wersja była pod linux-a jednak nie testowałem .. i nawet coś znalazłem ale czy to będzie działać ? czy to może jakaś staroć lub.... pirat ?
https://archive.org/details/abbyy-finer ... 12.4.7.948

Re: program obraz na tekst

: 04 mar 2025, 23:56
autor: Benita
To chyba jednak pirat... :evil: Trzeba rejestrować, podać nr seryjny??? :confused:
Pierwszy raz coś tak dziwnego widzę. :confused:
Ale faktycznie program ma dobra opinię użytkowników na innych systemach.
Naprawdę nic na linuxa nie ma??? Jak to możlwe? W przypadku innych programów jest tyle lepszych alternatyw... :cry:

Re: program obraz na tekst

: 05 mar 2025, 08:44
autor: TECUMSEH12

Re: program obraz na tekst

: 05 mar 2025, 11:49
autor: Benita
Zainstalowałam ten program YAGF, tradycyjne znaki są, ale .... nic z tego nie wyszło. Klikałam już we wszystkie opcje w programie i nie wyciągnęło żadnego tekstu ze zdjęć.
Próbowałam też z polskim tekstem, jest tak samo.
Patrząc na stronę projektu, powinno wyciągnąć pismo automatycznie, po kliknięciu w ikonkę ABC, ale u mnie jest ta opcja zablokowana, można dodać tylko zdjęcie, ustawić język i zaznaczyć obszar na zdjęciu.
Chyba że coś źle robię?

Wcześniej też tak samo było z programem lios.

Re: program obraz na tekst

: 05 mar 2025, 12:32
autor: TECUMSEH12
Trzeba dodać (zainstalować) https://github.com/tesseract-ocr/tesseract

Pokazuje, że obsługuje tradycyjny chiński.

Tylko nie wiem jak ze zdjęciami.

Jak wcześniej bawiłem się w ocerowanie tekstu, to robiłem skan książki, poprawiałem programem scan tailor i dopiero wczytywałem w YGFA, bądź OCRFeeder, bądź Tesseract Gui.

Re: program obraz na tekst

: 10 mar 2025, 00:22
autor: Benita
Języki są zainstalowane, wybieram też tradycyjny chiński, ale program jest martwy.
Próbowałam też na alfabecie łacińskim, jest tak samo, więc to nie kwestia brakujących pakietów językowych.

Jest opcja dodania zdjęcia... i dodaję zdjęcie przez tę opcję.

OCRFeeder próbowałam, ale tam nie ma opcji zdjęć, tak samo z Tesseract Gui, tylko pdf.

Zastanawiam się, czy do lios można dodać pakiet chiński? Znalazłam w sieci tylko jak dodać język polski, ale nie próbowałam, bo nie jest mi potrzebny.
Liosem udało mi się sczytać łacińskie znaki, ale zdjęcie trzeba obrócić w poprzek, inaczej nie sczyta.

Re: program obraz na tekst

: 10 mar 2025, 17:03
autor: kobrawerde
Ja tak dla sportu :-) przetestowałem kilka programów tzw nakładek GUI pod program OCR tesseract i powiem wam że niektóre naprawdę poprawnie pracują i ...tu moje subiektywne zdanie że na dzień dzisiejszy mogę spokojnie dla celów domowych zrezygnować z tzw profesjonalnych programów tego typu np. wspomnianym abbyy finereader itd
Testowałem tylko język polski i wszystko poprawnie i bardzo szybko zostało odczytane / zinterpretowane i w przypadku tych programów zapisane do schowka. Testowałem np prog. dpScreenOCR i NormCap
https://danpla.github.io/dpscreenocr/en/ https://github.com/dynobo/normcap
Działają one bardzo podobnie musimy zainstalować w systemie program tesseract + jakiś język np polski

Kod: Zaznacz cały

sudo apt install tesseract-ocr
sudo apt install tesseract-ocr-pol
lub skompilować wersję 5.5 ze źródła github (jak ja) więcej : https://tesseract-ocr.github.io/tessdoc/Compiling.html
po skompilowaniu efekt czyli wszystkie pliki podmieniłem w systemie (kopiuj wklej jako root) i jest OK

Kod: Zaznacz cały

#tesseract --version
tesseract 5.5.0
 leptonica-1.82.0
  libgif 5.1.9 : libjpeg 8d (libjpeg-turbo 2.1.1) : libpng 1.6.37 : libtiff 4.3.0 : zlib 1.2.11 : libwebp 1.2.2 : libopenjp2 2.4.0
 Found AVX512BW
 Found AVX512F
 Found AVX512VNNI
 Found AVX2
 Found AVX
 Found FMA
 Found SSE4.1
 Found OpenMP 201511
 Found libarchive 3.6.0 zlib/1.2.11 liblzma/5.2.5 bz2lib/1.0.8 liblz4/1.9.3 libzstd/1.4.8
 Found libcurl/7.81.0 OpenSSL/3.0.2 zlib/1.2.11 brotli/1.0.9 zstd/1.4.8 libidn2/2.3.2 libpsl/0.21.0 (+libidn2/2.3.2) libssh/0.9.6/openssl/zlib nghttp2/1.43.0 librtmp/2.3 OpenLDAP/2.5.18

np w programie dpScreenOCR podajemy skrót klawiaturowy u mnie : spacja (space)...którym zaznaczamy punkt okienka do zaznaczania tekstu do przeskanowania (zielona kropka ) przeciągamy i drugi klik spacji zamyka okienko ( czerwona kropka) i uruchamia program OCR tesseract do przeskanowania i zapisania wyniku do schowka. Możemy także utworzyć sobie skrypt który poglądowo wyświetli na końcu wynik na pulpicie czy jest OK.
Nazwa skryptu dowolna a zawartość :

Kod: Zaznacz cały

#!/bin/sh
notify-send "Translation" "$(trans -b "$1")"
nadajemy praw. do uruch.

Kod: Zaznacz cały

chmod +x /ścieżka_do_skryptu 
i podajemy w programie : uruchom plik wykonywalny
uwaga w najnowszym cinnamon-ie usługa notify jest uszkodzona więc to nie działa

ObrazekObrazek
W prog. NormCap jest podobnie z tym że program uruchamiany jest na całym pulpicie zaznaczamy tekst tylko myszką i już program automatycznie skanuje i zapisuje do schowka. Na pulpicie jest ikonka koła zębatego z dodatkowymi opcjami prog. np. doinstalowania języków itd. Nie polecam prog. gImageReader -a (GTK) choć wygląda bardziej profesjonalnie ma dodatkowe opcje korekty graficznej zeskanowanego zdjęcia ...efekty są marne i trzeba się namęczyć żeby uzyskać podobny efekt jak od przysłowiowego strzału w prog. przytaczanych wcześniej i to bez żadnych korekt graficznych i poprawy zdjęć :-)
No chyba że coś sknociłem z konfiguracją tegoż gImageReader ...ale wątpię. Może ktoś przetestuje jeszcze gImageReader -a
więcej:
https://github.com/manisandro/gImageReader

Re: program obraz na tekst

: 11 mar 2025, 18:40
autor: kobrawerde
Znalazłem program który w grafice zbliżony jest do gImageReader -a (GTK) i działa bardzo dobrze czyli jak : dpScreenOCR / NormCap
to program VietOCR więcej: https://vietocr.sourceforge.net/
skaner nie działa ale to szczegół bo na linux-ie mamy xsane (developer twierdzi że nie może skompilować jsane 64bit dla linuxa i dlatego usunie opcję skanowania z przyszłych programów)
efekt:
Obrazek
Są pewne problemy z instalacją np. języka z podpowiedzi trzeba czasem utworzyć folder z zawartością :tessdata np w ścieżce:
/usr/share/tesseract-ocr .... może być tylko :5 a program wskazuje na : 4.00 ( można utworzyć 4.00 i skopiować folder tessdata z : 5)
dodatkowa trzeba w systemie zainstalować wine (winehq-stable) pod swój system z oficjalnego howto: https://gitlab.winehq.org/wine/wine/-/w ... ian-Ubuntu
a potem doinstalować Microsoft Visual C++ (przez wine !) https://learn.microsoft.com/en-us/cpp/w ... w=msvc-170 ( wersja 64bit - https://aka.ms/vs/17/release/vc_redist.x64.exe )
Także z instalacją leptonica w systemie ja kompilowałem ze źródła ostatnią wersję : 1.85.0 ... https://github.com/danbloomberg/leptonica/releases
według tego : https://stackoverflow.com/questions/296 ... dlinkerror

Re: program obraz na tekst

: 11 mar 2025, 20:18
autor: TECUMSEH12
W Kubuntu można zainstalować coś takiego - Kylin scanner -> https://ubuntukylin.com/applications/97-en.html
Cóż, to chyba chiński wymysł ale piszą że może rozpoznawać tekst.
Kiedyś zainstalowałem (do skanowania obrazków) ale, że słabo kumam angielski (program w tej wersji), długo nie zagościł.

Re: program obraz na tekst

: 12 mar 2025, 14:52
autor: witsu
Z ciekawości zainstalowałęm gimageReader i spisał się całkiem dobrze. Bez problemu zamienił obraz na tekst. Próbowałem zarówno z plikami jpg, jak i pdf. Rózna też była jakość materiału. Za każdym razem wynik był poprawny. Osobiście nie przekreślałbym tego programu.

Obrazek

Re: program obraz na tekst

: 12 mar 2025, 17:17
autor: kobrawerde
Dzięki za test ...czyli pewnie coś w konfiguracji gimageReader - a sknociłem może ścieżki do poszczególnych wersji tesseract-a. Muszę to sprawdzić bo wydaje mi się to dziwne.

Re: program obraz na tekst

: 12 mar 2025, 19:19
autor: TECUMSEH12
Fajnie panowie, że cieszycie się własnym szczęściem ale problem nie rozwiązany.
Tu chodzi o egzotyczny język, chiński a nie znaczki łacińskie.

Re: program obraz na tekst

: 12 mar 2025, 20:04
autor: kobrawerde
To fakt :-) ..ale to raczej musi przetestować zainteresowana osoba bo jak wynika z tego wątku to raczej w ogóle nie można było uruchomić programu OCR / tesseract a jak widać można i niby działa nawet poprawnie jednak jak widać z polskim / angielskim tekstem
dajcie jakiś plik png / jpg z chińskim to po testujemy

Kod: Zaznacz cały

sudo apt-get install tesseract-ocr-chi-sim
- uproszczony

Kod: Zaznacz cały

sudo apt-get install tesseract-ocr-chi-tra
- tradycyjny
W translatorze zmieniłem jakiś polski tekst na chiński tradycyjny i zrobiłem screen-a którego testowałem.
U mnie prog. VietOCR który super działa z polskim tekstem poległ i wyświetlił tylko kwadraciki :razz:
O dziwo prog. dpScreenOCR chyba zrobił to poprawnie także NormCap
Obrazek
to wynik z NormCap-a (systemowy schowek)
............

Kod: Zaznacz cały

最 強 的 底 物 刺 激 劑
胰島 素 分 泌 的 是 葡萄 糖 。 在 她 的 影響 下 胰島 素 分 泌 分 為 兩 個 階段 , 首 先
部 分 已 經 合成 並 準備 生 產
在 刺激 的 影響 下 分 裂 , 然 後
有 些 是 在 應 對 的 第 二 階段 新 出 現 的 分 泌 。 氮 基 酸 和 脂肪 酸 的 消耗
昌 肪 組 織 較 少 刺激 胰島 素 的 分 沙
............
sory ale dla mnie to tylko "ślaczki" więc nie powiem czy to poprawne działanie i czy nie ma błędów :mrgreen:

Re: program obraz na tekst

: 22 mar 2025, 13:19
autor: kobrawerde
Program troszkę stary ale też daję radę i poprawnie działa z językiem polskim oczywiście to kolejna nakładka / GUI pod tesseract : Lios
Przy prog. tesseract podstawą jest skan przynajmniej z rozdzielczością 300dpi ...jeśli dalej brak poprawności to raczej oznacza 100% winę nakładki GUI na ten program.

Kod: Zaznacz cały

sudo apt install lios
Obrazek
Albo najprościej via terminal (tesseract 5) ale dla całego pliku / skanu bez możliwości wyboru zaznaczania tekstu.

Kod: Zaznacz cały

tesseract /home/kris/Desktop/1.png output --oem 1 -l pol
/home/kris/Desktop/1.png - ścieżka do pliku (png/jpeg itd)
output - nazwa pliku tekstowego (.txt) z ocr
--oem 1 -metoda ocr dla tesseract 5 ( u mnie działa także bez tej opcji )
-l - język dla ocr