Ja tak dla sportu

przetestowałem kilka programów tzw nakładek GUI pod program
OCR tesseract i powiem wam że niektóre naprawdę poprawnie pracują i ...tu moje subiektywne zdanie że na dzień dzisiejszy mogę spokojnie dla celów domowych zrezygnować z tzw profesjonalnych programów tego typu np. wspomnianym
abbyy finereader itd
Testowałem tylko język polski i wszystko poprawnie i bardzo szybko zostało odczytane / zinterpretowane i w przypadku tych programów zapisane do schowka. Testowałem np prog.
dpScreenOCR i
NormCap
https://danpla.github.io/dpscreenocr/en/ https://github.com/dynobo/normcap
Działają one bardzo podobnie musimy zainstalować w systemie program tesseract + jakiś język np polski
Kod: Zaznacz cały
sudo apt install tesseract-ocr
sudo apt install tesseract-ocr-pol
lub skompilować wersję 5.5 ze źródła github (jak ja) więcej :
https://tesseract-ocr.github.io/tessdoc/Compiling.html
po skompilowaniu efekt czyli wszystkie pliki podmieniłem w systemie (kopiuj wklej jako root) i jest OK
Kod: Zaznacz cały
#tesseract --version
tesseract 5.5.0
leptonica-1.82.0
libgif 5.1.9 : libjpeg 8d (libjpeg-turbo 2.1.1) : libpng 1.6.37 : libtiff 4.3.0 : zlib 1.2.11 : libwebp 1.2.2 : libopenjp2 2.4.0
Found AVX512BW
Found AVX512F
Found AVX512VNNI
Found AVX2
Found AVX
Found FMA
Found SSE4.1
Found OpenMP 201511
Found libarchive 3.6.0 zlib/1.2.11 liblzma/5.2.5 bz2lib/1.0.8 liblz4/1.9.3 libzstd/1.4.8
Found libcurl/7.81.0 OpenSSL/3.0.2 zlib/1.2.11 brotli/1.0.9 zstd/1.4.8 libidn2/2.3.2 libpsl/0.21.0 (+libidn2/2.3.2) libssh/0.9.6/openssl/zlib nghttp2/1.43.0 librtmp/2.3 OpenLDAP/2.5.18
np w programie dpScreenOCR podajemy skrót klawiaturowy u mnie : spacja (space)...którym zaznaczamy punkt okienka do zaznaczania tekstu do przeskanowania (zielona kropka ) przeciągamy i drugi klik spacji zamyka okienko ( czerwona kropka) i uruchamia program OCR tesseract do przeskanowania i zapisania wyniku do schowka. Możemy także utworzyć sobie skrypt który poglądowo wyświetli na końcu wynik na pulpicie czy jest OK.
Nazwa skryptu dowolna a zawartość :
Kod: Zaznacz cały
#!/bin/sh
notify-send "Translation" "$(trans -b "$1")"
nadajemy praw. do uruch.
i podajemy w programie : uruchom plik wykonywalny
uwaga w najnowszym cinnamon-ie usługa notify jest uszkodzona więc to nie działa


W prog. NormCap jest podobnie z tym że program uruchamiany jest na całym pulpicie zaznaczamy tekst tylko myszką i już program automatycznie skanuje i zapisuje do schowka. Na pulpicie jest ikonka koła zębatego z dodatkowymi opcjami prog. np. doinstalowania języków itd. Nie polecam prog.
gImageReader -a (GTK) choć wygląda bardziej profesjonalnie ma dodatkowe opcje korekty graficznej zeskanowanego zdjęcia ...efekty są marne i trzeba się namęczyć żeby uzyskać podobny efekt jak od przysłowiowego strzału w prog. przytaczanych wcześniej i to bez żadnych korekt graficznych i poprawy zdjęć

No chyba że coś sknociłem z konfiguracją tegoż gImageReader ...ale wątpię. Może ktoś przetestuje jeszcze gImageReader -a
więcej:
https://github.com/manisandro/gImageReader
Serwer: LinuxMint/Ubuntu 22.04/HWE kernel/Vsftpd/Kodi/Jellyfin/iptv-dvbt2/etc.
CPU: Intel N100 / RAM: 32GB DDR5
Storage: Lexar NM620 2TB M.2 - (x2)
Mobo: MiniPC (Topton X6C )
Laptop: Lenovo Legion 5 Pro 16ITH6H /Ram32GB/ssd500GB/ssd1TB