program obraz na tekst

Tylko tematy nie mieszczące się powyżej.
Benita
Sędziwy Jeż
Sędziwy Jeż
Posty: 80
Rejestracja: 01 mar 2016, 15:18
Wersja Ubuntu: 20.04

program obraz na tekst

Post autor: Benita »

Czy jest jakiś dobry program na ubuntu, który potrafi sczytać tekst ze zdjęcia, tak aby dało się to wkleić do pliku tekstowego?
Tekst na zdjęciach to chiński tradycyjny. Nie nadążam z zapisywaniem podczas i robię zdjęcia slajdów podczas zajęć.
Do tej pory korzystałam z darmowych stron, ale ostatnio prawie wszystkie wprowadziły limity...
W centrum oprogramowania ubuntu pobrałam: OCR Feeder, gimageReader i jakieś dwa image to text. Ale żaden z nich nie działa. W dwu nie ma opcji azjatyckich znaków, są ograniczone do angielskiego tylko. :confused:
Bardzo proszę o pomoc, bo przepisywanie zabiera strasznie dużo czasu....
Awatar użytkownika
kobrawerde
Gibki Gibbon
Gibki Gibbon
Posty: 2200
Rejestracja: 10 wrz 2006, 16:00
Płeć: Mężczyzna
Wersja Ubuntu: 22.04
Środowisko graficzne: Cinnamon
Architektura: x86_64
Kontakt:

Re: program obraz na tekst

Post autor: kobrawerde »

Chyba na linux-a nie znajdziesz takowego... tzn dobrze działającego. Jak lata temu szukałem alternatywy dla Windowsowego abbyy finereader -a ale nic godnego polecenia nie znalazłem :-( ... a ten wspomniany abbyy finereader to faktycznie niezły "kozak" :mrgreen:
Choć można znaleźć info że jakaś wersja była pod linux-a jednak nie testowałem .. i nawet coś znalazłem ale czy to będzie działać ? czy to może jakaś staroć lub.... pirat ?
https://archive.org/details/abbyy-finer ... 12.4.7.948
Serwer: LinuxMint/Ubuntu 22.04/HWE kernel/Vsftpd/Kodi/Jellyfin/iptv-dvbt2/etc.
CPU: Intel N100 / RAM: 32GB DDR5
Storage: Lexar NM620 2TB M.2 - (x2)
Mobo: MiniPC (Topton X6C )
Laptop: Lenovo Legion 5 Pro 16ITH6H /Ram32GB/ssd500GB/ssd1TB
Benita
Sędziwy Jeż
Sędziwy Jeż
Posty: 80
Rejestracja: 01 mar 2016, 15:18
Wersja Ubuntu: 20.04

Re: program obraz na tekst

Post autor: Benita »

To chyba jednak pirat... :evil: Trzeba rejestrować, podać nr seryjny??? :confused:
Pierwszy raz coś tak dziwnego widzę. :confused:
Ale faktycznie program ma dobra opinię użytkowników na innych systemach.
Naprawdę nic na linuxa nie ma??? Jak to możlwe? W przypadku innych programów jest tyle lepszych alternatyw... :cry:
TECUMSEH12
Sędziwy Jeż
Sędziwy Jeż
Posty: 99
Rejestracja: 02 cze 2014, 13:29
Płeć: Mężczyzna
Wersja Ubuntu: inny OS
Środowisko graficzne: KDE Plasma
Architektura: x86_64

Re: program obraz na tekst

Post autor: TECUMSEH12 »

Anarchia w samym środku mojej głowy
Mój mózg pracuje niezależnie
I nikt mi nie może zakazać myślenia
Anarchia w głowie to początek wyzwolenia
Benita
Sędziwy Jeż
Sędziwy Jeż
Posty: 80
Rejestracja: 01 mar 2016, 15:18
Wersja Ubuntu: 20.04

Re: program obraz na tekst

Post autor: Benita »

Zainstalowałam ten program YAGF, tradycyjne znaki są, ale .... nic z tego nie wyszło. Klikałam już we wszystkie opcje w programie i nie wyciągnęło żadnego tekstu ze zdjęć.
Próbowałam też z polskim tekstem, jest tak samo.
Patrząc na stronę projektu, powinno wyciągnąć pismo automatycznie, po kliknięciu w ikonkę ABC, ale u mnie jest ta opcja zablokowana, można dodać tylko zdjęcie, ustawić język i zaznaczyć obszar na zdjęciu.
Chyba że coś źle robię?

Wcześniej też tak samo było z programem lios.
TECUMSEH12
Sędziwy Jeż
Sędziwy Jeż
Posty: 99
Rejestracja: 02 cze 2014, 13:29
Płeć: Mężczyzna
Wersja Ubuntu: inny OS
Środowisko graficzne: KDE Plasma
Architektura: x86_64

Re: program obraz na tekst

Post autor: TECUMSEH12 »

Trzeba dodać (zainstalować) https://github.com/tesseract-ocr/tesseract

Pokazuje, że obsługuje tradycyjny chiński.

Tylko nie wiem jak ze zdjęciami.

Jak wcześniej bawiłem się w ocerowanie tekstu, to robiłem skan książki, poprawiałem programem scan tailor i dopiero wczytywałem w YGFA, bądź OCRFeeder, bądź Tesseract Gui.
Anarchia w samym środku mojej głowy
Mój mózg pracuje niezależnie
I nikt mi nie może zakazać myślenia
Anarchia w głowie to początek wyzwolenia
Benita
Sędziwy Jeż
Sędziwy Jeż
Posty: 80
Rejestracja: 01 mar 2016, 15:18
Wersja Ubuntu: 20.04

Re: program obraz na tekst

Post autor: Benita »

Języki są zainstalowane, wybieram też tradycyjny chiński, ale program jest martwy.
Próbowałam też na alfabecie łacińskim, jest tak samo, więc to nie kwestia brakujących pakietów językowych.

Jest opcja dodania zdjęcia... i dodaję zdjęcie przez tę opcję.

OCRFeeder próbowałam, ale tam nie ma opcji zdjęć, tak samo z Tesseract Gui, tylko pdf.

Zastanawiam się, czy do lios można dodać pakiet chiński? Znalazłam w sieci tylko jak dodać język polski, ale nie próbowałam, bo nie jest mi potrzebny.
Liosem udało mi się sczytać łacińskie znaki, ale zdjęcie trzeba obrócić w poprzek, inaczej nie sczyta.
Awatar użytkownika
kobrawerde
Gibki Gibbon
Gibki Gibbon
Posty: 2200
Rejestracja: 10 wrz 2006, 16:00
Płeć: Mężczyzna
Wersja Ubuntu: 22.04
Środowisko graficzne: Cinnamon
Architektura: x86_64
Kontakt:

Re: program obraz na tekst

Post autor: kobrawerde »

Ja tak dla sportu :-) przetestowałem kilka programów tzw nakładek GUI pod program OCR tesseract i powiem wam że niektóre naprawdę poprawnie pracują i ...tu moje subiektywne zdanie że na dzień dzisiejszy mogę spokojnie dla celów domowych zrezygnować z tzw profesjonalnych programów tego typu np. wspomnianym abbyy finereader itd
Testowałem tylko język polski i wszystko poprawnie i bardzo szybko zostało odczytane / zinterpretowane i w przypadku tych programów zapisane do schowka. Testowałem np prog. dpScreenOCR i NormCap
https://danpla.github.io/dpscreenocr/en/ https://github.com/dynobo/normcap
Działają one bardzo podobnie musimy zainstalować w systemie program tesseract + jakiś język np polski

Kod: Zaznacz cały

sudo apt install tesseract-ocr
sudo apt install tesseract-ocr-pol
lub skompilować wersję 5.5 ze źródła github (jak ja) więcej : https://tesseract-ocr.github.io/tessdoc/Compiling.html
po skompilowaniu efekt czyli wszystkie pliki podmieniłem w systemie (kopiuj wklej jako root) i jest OK

Kod: Zaznacz cały

#tesseract --version
tesseract 5.5.0
 leptonica-1.82.0
  libgif 5.1.9 : libjpeg 8d (libjpeg-turbo 2.1.1) : libpng 1.6.37 : libtiff 4.3.0 : zlib 1.2.11 : libwebp 1.2.2 : libopenjp2 2.4.0
 Found AVX512BW
 Found AVX512F
 Found AVX512VNNI
 Found AVX2
 Found AVX
 Found FMA
 Found SSE4.1
 Found OpenMP 201511
 Found libarchive 3.6.0 zlib/1.2.11 liblzma/5.2.5 bz2lib/1.0.8 liblz4/1.9.3 libzstd/1.4.8
 Found libcurl/7.81.0 OpenSSL/3.0.2 zlib/1.2.11 brotli/1.0.9 zstd/1.4.8 libidn2/2.3.2 libpsl/0.21.0 (+libidn2/2.3.2) libssh/0.9.6/openssl/zlib nghttp2/1.43.0 librtmp/2.3 OpenLDAP/2.5.18

np w programie dpScreenOCR podajemy skrót klawiaturowy u mnie : spacja (space)...którym zaznaczamy punkt okienka do zaznaczania tekstu do przeskanowania (zielona kropka ) przeciągamy i drugi klik spacji zamyka okienko ( czerwona kropka) i uruchamia program OCR tesseract do przeskanowania i zapisania wyniku do schowka. Możemy także utworzyć sobie skrypt który poglądowo wyświetli na końcu wynik na pulpicie czy jest OK.
Nazwa skryptu dowolna a zawartość :

Kod: Zaznacz cały

#!/bin/sh
notify-send "Translation" "$(trans -b "$1")"
nadajemy praw. do uruch.

Kod: Zaznacz cały

chmod +x /ścieżka_do_skryptu 
i podajemy w programie : uruchom plik wykonywalny
uwaga w najnowszym cinnamon-ie usługa notify jest uszkodzona więc to nie działa

ObrazekObrazek
W prog. NormCap jest podobnie z tym że program uruchamiany jest na całym pulpicie zaznaczamy tekst tylko myszką i już program automatycznie skanuje i zapisuje do schowka. Na pulpicie jest ikonka koła zębatego z dodatkowymi opcjami prog. np. doinstalowania języków itd. Nie polecam prog. gImageReader -a (GTK) choć wygląda bardziej profesjonalnie ma dodatkowe opcje korekty graficznej zeskanowanego zdjęcia ...efekty są marne i trzeba się namęczyć żeby uzyskać podobny efekt jak od przysłowiowego strzału w prog. przytaczanych wcześniej i to bez żadnych korekt graficznych i poprawy zdjęć :-)
No chyba że coś sknociłem z konfiguracją tegoż gImageReader ...ale wątpię. Może ktoś przetestuje jeszcze gImageReader -a
więcej:
https://github.com/manisandro/gImageReader
Ostatnio zmieniony 16 mar 2025, 15:51 przez kobrawerde, łącznie zmieniany 1 raz.
Serwer: LinuxMint/Ubuntu 22.04/HWE kernel/Vsftpd/Kodi/Jellyfin/iptv-dvbt2/etc.
CPU: Intel N100 / RAM: 32GB DDR5
Storage: Lexar NM620 2TB M.2 - (x2)
Mobo: MiniPC (Topton X6C )
Laptop: Lenovo Legion 5 Pro 16ITH6H /Ram32GB/ssd500GB/ssd1TB
Awatar użytkownika
kobrawerde
Gibki Gibbon
Gibki Gibbon
Posty: 2200
Rejestracja: 10 wrz 2006, 16:00
Płeć: Mężczyzna
Wersja Ubuntu: 22.04
Środowisko graficzne: Cinnamon
Architektura: x86_64
Kontakt:

Re: program obraz na tekst

Post autor: kobrawerde »

Znalazłem program który w grafice zbliżony jest do gImageReader -a (GTK) i działa bardzo dobrze czyli jak : dpScreenOCR / NormCap
to program VietOCR więcej: https://vietocr.sourceforge.net/
skaner nie działa ale to szczegół bo na linux-ie mamy xsane (developer twierdzi że nie może skompilować jsane 64bit dla linuxa i dlatego usunie opcję skanowania z przyszłych programów)
efekt:
Obrazek
Są pewne problemy z instalacją np. języka z podpowiedzi trzeba czasem utworzyć folder z zawartością :tessdata np w ścieżce:
/usr/share/tesseract-ocr .... może być tylko :5 a program wskazuje na : 4.00 ( można utworzyć 4.00 i skopiować folder tessdata z : 5)
dodatkowa trzeba w systemie zainstalować wine (winehq-stable) pod swój system z oficjalnego howto: https://gitlab.winehq.org/wine/wine/-/w ... ian-Ubuntu
a potem doinstalować Microsoft Visual C++ (przez wine !) https://learn.microsoft.com/en-us/cpp/w ... w=msvc-170 ( wersja 64bit - https://aka.ms/vs/17/release/vc_redist.x64.exe )
Także z instalacją leptonica w systemie ja kompilowałem ze źródła ostatnią wersję : 1.85.0 ... https://github.com/danbloomberg/leptonica/releases
według tego : https://stackoverflow.com/questions/296 ... dlinkerror
Ostatnio zmieniony 16 mar 2025, 10:55 przez kobrawerde, łącznie zmieniany 5 razy.
Serwer: LinuxMint/Ubuntu 22.04/HWE kernel/Vsftpd/Kodi/Jellyfin/iptv-dvbt2/etc.
CPU: Intel N100 / RAM: 32GB DDR5
Storage: Lexar NM620 2TB M.2 - (x2)
Mobo: MiniPC (Topton X6C )
Laptop: Lenovo Legion 5 Pro 16ITH6H /Ram32GB/ssd500GB/ssd1TB
TECUMSEH12
Sędziwy Jeż
Sędziwy Jeż
Posty: 99
Rejestracja: 02 cze 2014, 13:29
Płeć: Mężczyzna
Wersja Ubuntu: inny OS
Środowisko graficzne: KDE Plasma
Architektura: x86_64

Re: program obraz na tekst

Post autor: TECUMSEH12 »

W Kubuntu można zainstalować coś takiego - Kylin scanner -> https://ubuntukylin.com/applications/97-en.html
Cóż, to chyba chiński wymysł ale piszą że może rozpoznawać tekst.
Kiedyś zainstalowałem (do skanowania obrazków) ale, że słabo kumam angielski (program w tej wersji), długo nie zagościł.
Anarchia w samym środku mojej głowy
Mój mózg pracuje niezależnie
I nikt mi nie może zakazać myślenia
Anarchia w głowie to początek wyzwolenia
Awatar użytkownika
witsu
Sędziwy Jeż
Sędziwy Jeż
Posty: 42
Rejestracja: 29 gru 2020, 14:38
Płeć: Mężczyzna
Wersja Ubuntu: 24.04
Środowisko graficzne: Cinnamon
Architektura: x86_64

Re: program obraz na tekst

Post autor: witsu »

Z ciekawości zainstalowałęm gimageReader i spisał się całkiem dobrze. Bez problemu zamienił obraz na tekst. Próbowałem zarówno z plikami jpg, jak i pdf. Rózna też była jakość materiału. Za każdym razem wynik był poprawny. Osobiście nie przekreślałbym tego programu.

Obrazek
Awatar użytkownika
kobrawerde
Gibki Gibbon
Gibki Gibbon
Posty: 2200
Rejestracja: 10 wrz 2006, 16:00
Płeć: Mężczyzna
Wersja Ubuntu: 22.04
Środowisko graficzne: Cinnamon
Architektura: x86_64
Kontakt:

Re: program obraz na tekst

Post autor: kobrawerde »

Dzięki za test ...czyli pewnie coś w konfiguracji gimageReader - a sknociłem może ścieżki do poszczególnych wersji tesseract-a. Muszę to sprawdzić bo wydaje mi się to dziwne.
Serwer: LinuxMint/Ubuntu 22.04/HWE kernel/Vsftpd/Kodi/Jellyfin/iptv-dvbt2/etc.
CPU: Intel N100 / RAM: 32GB DDR5
Storage: Lexar NM620 2TB M.2 - (x2)
Mobo: MiniPC (Topton X6C )
Laptop: Lenovo Legion 5 Pro 16ITH6H /Ram32GB/ssd500GB/ssd1TB
TECUMSEH12
Sędziwy Jeż
Sędziwy Jeż
Posty: 99
Rejestracja: 02 cze 2014, 13:29
Płeć: Mężczyzna
Wersja Ubuntu: inny OS
Środowisko graficzne: KDE Plasma
Architektura: x86_64

Re: program obraz na tekst

Post autor: TECUMSEH12 »

Fajnie panowie, że cieszycie się własnym szczęściem ale problem nie rozwiązany.
Tu chodzi o egzotyczny język, chiński a nie znaczki łacińskie.
Anarchia w samym środku mojej głowy
Mój mózg pracuje niezależnie
I nikt mi nie może zakazać myślenia
Anarchia w głowie to początek wyzwolenia
Awatar użytkownika
kobrawerde
Gibki Gibbon
Gibki Gibbon
Posty: 2200
Rejestracja: 10 wrz 2006, 16:00
Płeć: Mężczyzna
Wersja Ubuntu: 22.04
Środowisko graficzne: Cinnamon
Architektura: x86_64
Kontakt:

Re: program obraz na tekst

Post autor: kobrawerde »

To fakt :-) ..ale to raczej musi przetestować zainteresowana osoba bo jak wynika z tego wątku to raczej w ogóle nie można było uruchomić programu OCR / tesseract a jak widać można i niby działa nawet poprawnie jednak jak widać z polskim / angielskim tekstem
dajcie jakiś plik png / jpg z chińskim to po testujemy

Kod: Zaznacz cały

sudo apt-get install tesseract-ocr-chi-sim
- uproszczony

Kod: Zaznacz cały

sudo apt-get install tesseract-ocr-chi-tra
- tradycyjny
W translatorze zmieniłem jakiś polski tekst na chiński tradycyjny i zrobiłem screen-a którego testowałem.
U mnie prog. VietOCR który super działa z polskim tekstem poległ i wyświetlił tylko kwadraciki :razz:
O dziwo prog. dpScreenOCR chyba zrobił to poprawnie także NormCap
Obrazek
to wynik z NormCap-a (systemowy schowek)
............

Kod: Zaznacz cały

最 強 的 底 物 刺 激 劑
胰島 素 分 泌 的 是 葡萄 糖 。 在 她 的 影響 下 胰島 素 分 泌 分 為 兩 個 階段 , 首 先
部 分 已 經 合成 並 準備 生 產
在 刺激 的 影響 下 分 裂 , 然 後
有 些 是 在 應 對 的 第 二 階段 新 出 現 的 分 泌 。 氮 基 酸 和 脂肪 酸 的 消耗
昌 肪 組 織 較 少 刺激 胰島 素 的 分 沙
............
sory ale dla mnie to tylko "ślaczki" więc nie powiem czy to poprawne działanie i czy nie ma błędów :mrgreen:
Serwer: LinuxMint/Ubuntu 22.04/HWE kernel/Vsftpd/Kodi/Jellyfin/iptv-dvbt2/etc.
CPU: Intel N100 / RAM: 32GB DDR5
Storage: Lexar NM620 2TB M.2 - (x2)
Mobo: MiniPC (Topton X6C )
Laptop: Lenovo Legion 5 Pro 16ITH6H /Ram32GB/ssd500GB/ssd1TB
Awatar użytkownika
kobrawerde
Gibki Gibbon
Gibki Gibbon
Posty: 2200
Rejestracja: 10 wrz 2006, 16:00
Płeć: Mężczyzna
Wersja Ubuntu: 22.04
Środowisko graficzne: Cinnamon
Architektura: x86_64
Kontakt:

Re: program obraz na tekst

Post autor: kobrawerde »

Program troszkę stary ale też daję radę i poprawnie działa z językiem polskim oczywiście to kolejna nakładka / GUI pod tesseract : Lios
Przy prog. tesseract podstawą jest skan przynajmniej z rozdzielczością 300dpi ...jeśli dalej brak poprawności to raczej oznacza 100% winę nakładki GUI na ten program.

Kod: Zaznacz cały

sudo apt install lios
Obrazek
Albo najprościej via terminal (tesseract 5) ale dla całego pliku / skanu bez możliwości wyboru zaznaczania tekstu.

Kod: Zaznacz cały

tesseract /home/kris/Desktop/1.png output --oem 1 -l pol
/home/kris/Desktop/1.png - ścieżka do pliku (png/jpeg itd)
output - nazwa pliku tekstowego (.txt) z ocr
--oem 1 -metoda ocr dla tesseract 5 ( u mnie działa także bez tej opcji )
-l - język dla ocr
Serwer: LinuxMint/Ubuntu 22.04/HWE kernel/Vsftpd/Kodi/Jellyfin/iptv-dvbt2/etc.
CPU: Intel N100 / RAM: 32GB DDR5
Storage: Lexar NM620 2TB M.2 - (x2)
Mobo: MiniPC (Topton X6C )
Laptop: Lenovo Legion 5 Pro 16ITH6H /Ram32GB/ssd500GB/ssd1TB
ODPOWIEDZ

Wróć do „Inne”

Kto jest online

Użytkownicy przeglądający to forum: Obecnie na forum nie ma żadnego zarejestrowanego użytkownika i 8 gości