Voľné OCR nástroje na extrahovanie textu z obrázkov - najlepšie z
Ak hľadáte extrahovanie textu z obrázka, je potrebné použiť nástroj OCR. Optické nástroje na rozpoznávanie znakov (OCR) môžu skenovanie a extrahovanie textu z obrázkov a umožňuje vykonať všetky požadované zmeny.
V tomto príspevku uvádzam zoznam najlepšie voľné nástroje OCR dostupné pre rôzne platformy. Na účely testovania som zmenil formátovanie niekoľkých textových odsekov na pomerne zložité ručne písané písmo a urobil snímku obrazovky. Skúsil som aj normálny text, ale tieto nástroje vytvorili dokonalé výsledky.
Obmedzenie OCR
Pred vstupom do nástrojov OCR je dôležité pochopiť, čo môže OCR urobiť pre vás a aké sú jej obmedzenia.
Ak je text v obraze je rozmazané alebo nie je v zaostrení, potom OCR skenovanie nebude fungovať správne a výsledky nebudú príjemné vôbec. Platí to aj pre obrázky so slabým bleskom a akýmkoľvek iným druhom skreslenia. V takom prípade extrahovaný text bude väčšinou pozostávať z náhodných znakov.
Tiež by som to mal spomenúť strojový aj ručne písaný text je možné extrahovať pomocou technológie OCR. Hoci presnosť ručne písaného textu nemusí byť tak vysoká ako text generovaný strojom.
Existujú aj viaceré typy OCR metódy používané týmito nástrojmi a tak presnosť extrahovaného textu závisí aj od použitej metódy.
OCR Nástroje Windows
FreeOCR
FreeOCR je určite najjednoduchší voľný nástroj OCR na použitie, ktorý ponúka aj príjemné výsledky. Môže otvorte súbory PDF, spravujte obrázok, vyberte miesto v obraze že chcete skenovať a dokonca priamo skenovať dokumenty pomocou skenera. Zaujímavé je, že cskenovanie viacstranových dokumentov súčasne, a môžete skenovať aj text vo viacerých jazykoch.
Stiahnite si FreeOCR
OCR do programu Word
Ako naznačuje názov, OCR do programu Word umožňuje extrahovať text z obrázkov a potom export text do súboru slov. Hoci to neudelalo dobrú prácu pri extrakcii textu z testovacieho obrázku, ktorý používam, ale keď som to trochu použil ľahko čitateľný text robila ešte lepšiu prácu ako vyššie uvedený nástroj FreeOCR.
Stiahnite si OCR do programu Word
Microsoft OneNote
Ak máte balík Microsoft Office, už máte nainštalovaný Microsoft OneNote. V opačnom prípade môžete tiež Stiahnite si ju samostatne zadarmo. Služba OneNote vám tiež umožňuje skenovať obrázky vo vašich poznámkach a získavať tak text. Stačí kliknúť pravým tlačidlom na obrázok a vybrať “Kopírovať text z obrázka”. Text sa skopíruje do schránky a môžete ho prilepiť kdekoľvek.
Stiahnite si Microsoft OneNote
Nástroje online OCR
Online OCR zadarmo
Bezplatný online nástroj OCR vám umožňuje extrahovať text do 46 jazykov a výsledky môžete získať ako súbor slov alebo jednoduchý text. Výsledky neboli ani zlé a mohli by byť dokonale upravené. Budete sa musieť zaregistrovať, ak chcete získať prístup k všetkým jazykom a veľkým obrazom OCR.
Voľné OCR
Bezplatné OCR je tiež dobrým nástrojom, ak má obrázok menší ako limit veľkosti 6 MB. to podporuje až 29 jazykov a výsledky skenovania OCR boli celkom dobré.
Skenovanie OCR na Disku Google
Disk Google má aj zabudovaný systém OCR na extrahovanie textu z obrázkov. Ak je textový obrázok na Disku Google, kliknite naň pravým tlačidlom a vyberte Google Dokumenty z Otvorený s Ponuka.
Obraz bude otvoriť v Dokumentoch Google ako nový dokument a extrahovaný text bude pod ním. Podľa mojich skúseností spôsobil skenovanie OCR na Google Drive mnoho pravopisných chýb, ale na rozdiel od iných nástrojov OCR bolo menej náhodných znakov. Môžeš Prečítajte si viac o nej z nášho príspevku tu.
Rozšírenia OCR Chrome
Ak je obrázok, z ktorého chcete extrahovať text, nájdený online, môžete v prehliadači Google Chrome použiť nejaké praktické rozšírenia OCR.
Copyfish
Copyfish vám umožní vyberte akúkoľvek oblasť vo vašom prehliadači a skenujte a používajte jeho technológiu OCR. Zaujímavé je, že Copyfish preskočí všetky slová, ktoré nerozumie úplne a len ukazuje ten, ktorý perfektne vytiahne alebo aspoň sa veľmi blíži. Zobrazí sa naskenované slovo v oranžovej farbe.
Projekt Naptha
Veľmi cool rozšírenie, ktoré automaticky upravuje všetky obrázky na webových stránkach a môžete ich vybrať na kopírovanie textu. Nenašiel som príponu, aby fungoval v malom texte v obraze, ale to pracoval dokonale na veľkom rozlíšení s niekoľkými problémami s formátovaním.
OCR Linux Tools
Tesseract OCR
Toto je open source OCR technológie ktoré používajú mnohé nástroje OCR, vrátane FreeOCR, o ktorých som sa na začiatku zmienil. V súčasnosti ho spravuje spoločnosť Google a ponúka spoľahlivú extrakciu textu.
Stiahnuť Tesseract OCR
klinový
Cuneiform je tiež spoľahlivý open source OCR nástroj, ktorý pracuje pre používateľov systému Linux. A je známe lepšie pracovať pre ručne písaný text v porovnaní s inými nástrojmi OCR.
Nemal som šancu vyskúšať tieto nástroje v systéme Linux, ale tu je rýchly porovnanie týchto nástrojov OCR aby som vám dal predstavu.
Stiahnuť Cuneiform
OCR mobilné nástroje
Textová víla
Textová rozprávka je jedným z najpopulárnejších OCR aplikácií pre Android, ktorý je úplne zadarmo a nezobrazuje žiadne reklamy. Má a spoľahlivý editor na úpravu textu aj obrazu a môžete získať text až do 50 jazykov.
Stiahnite si Text Fairy for Android
Google Keep
Populárna aplikácia na zaznamenávanie poznámok od spoločnosti Google má aj vstavaný nástroj OCR. Stačí importovať obrázok do poznámky a klepnúť na s tromi bodkami Ponuka. Z ponuky vyberte Uchopte text obrázka a služba Google Keep začne skenovať. Po skenovaní sa text zobrazí priamo v poznámke.
S Google udržať výsledky boli naozaj úžasné pre môj test obrázok a to extrahoval text s presnosťou nad 90%. Musím sa pokúsiť povedať.
Stiahnuť aplikáciu Google Keep pre Android | iOS
OCR v angličtine
Veľmi dobrý nástroj OCR pre používateľov iOS, ktorý je úplne zadarmo a ponúka spoľahlivú presnosť pri extrakcii textu. Hoci obsahuje reklamy, ale môžete si ich kúpiť pro verziu bez reklamy.
Stiahnite si anglický OCR pre iOS
zhrnutie
Malo by sa pamätať na to, že obraz, ktorý som použil na testovanie, bol veľmi zložitý, a preto tieto nástroje buď úplne zlyhali, alebo výsledky neboli dokonalé. Vo väčšine prípadov sa nebudete musieť zaoberať takými komplexnými textovými obrázkami a vaše výsledky by mali byť dobré.
Služba Google Keep ukázala najlepšie výsledky testovacieho obrazu Použil som, ale to neznamená, že je to najlepšie, pretože stále závisí od typu obrazu a metódy OCR.
Ja budem tiež odporúčame, aby ste si pozreli platený softvér OCR Abbyy Finereader ak vyššie uvedené nefunguje pre vás. Je to komerčný softvér, ktorý je oveľa výkonnejší ako ktorýkoľvek z týchto bezplatných nástrojov. Najlepšie zo všetkých, môžete vyskúšať svoju bezplatnú skúšobnú verziu, aby ste zistili, či funguje dobre pre textový obrazový súbor alebo nie.