Ako extrahovať text zo snímok pomocou príkazového riadka
Je ľahké prečítať obrázok a vytiahnuť text sami. ale dynamicky ťahaním textu z fotografie je trochu tvrdší a našťastie, imgclip ponúka pomerne jednoduché riešenie.
toto nástroj príkazového riadku beží v termináli pre Mac, Windows a Linux. Jednoducho berie argument pre obrazový súbor spolu s jazykom vráti text skopírovať do schránky.
Môžete nainštalovať celú knižnicu pomocou npm a je to a celkom jednoduchá inštalácia. Vec je len niekoľko KB veľké a je dodávaný s súborom JS, ktorý môžete prehliadať na GitHub.
Imgclip používa Tesseract.js knižnica pre automatizáciu spracovania obrazu a ťahanie textu cez OCR. Je to jedna z najmocnejších knižníc OCR k dnešnému dňu a je to úplne otvorený zdroj, podobne ako imgclip.
Myslím, že ma najviac ohromuje kvalita a rýchlosť tohto nástroja. Naozaj to funguje vytiahnuť presný text a je to jeden z najjednoduchších nástrojov na použitie.
Príkaz imgclip by mal byť spustiť priamo v termináli, nasleduje relatívna cesta k obrázku. Môžete tiež pridať štyri možnosti na koniec prispôsobiť výstup.
-hod
,--Pomoc
: informácie o využití výstupov-V
,--verzia
: zobrazuje číslo verzie-l
,--lang
: výstup textu jazyka v obraze-p
,--vytlačiť
: vytlačí text na obrázku (namiesto kopírovania do schránky)
Od tohto písania, Tesseract podporuje 65 jazykov s viac na ceste. Kód, ktorý pripojíte k --lang
tag by mal byť akýkoľvek kód, ktorý sa používa v tých súboroch Tesseract.
Napríklad, -l eng
bude vyhľadávať obrázok pre Anglický text, zatiaľ čo -l jpn
bude hľadať Japonský text a môžete dokonca bežať -l jpn_vert
hľadať vertikálne orientovaný japonský text.
Vzhľadom k tomu, že imgclip závisí ťažko na Tesserakte, máte v podstate k dispozícii celú knižnicu.
na začať, navštívte stránku GitHub a stiahnite lokálnu kópiu alebo ju nainštalujte do konkrétneho adresára pomocou npm. Potom môžete spustiť nástroj v termináli ako aplikácia analyzovať akýkoľvek požadovaný obrázok.
Ak chcete vidieť imgclip v akcii, pozrite si toto krátke video vytvorené ako demo imgclip.