Tesseract.js prináša preklad obrázkov do prehliadačov

Preklad OCR stále nie je dokonalý, ale v ostatných rokoch sa dramaticky zlepšil. Vedením cesty je Tesseract prekladový motor v súčasnosti otvorené C++.

Aj keď je to neuveriteľná knižnica, je to obmedzené na softvér. Našťastie niekto vytvoril prístav Tesseract do jazyka JavaScript, ktorý sa nazýva Tesseract.js. to podporuje až 60 jazykov a hoci to určite nie je dokonalé, robí to dobre.

Inštalácia a nastavenie je vietor, kde môžete zamerať na akýkoľvek prvok obrázka na stránke a spustite Tesseract.recognize () Funkcie. Môže to mať akýkoľvek typ obrazu a bude to automaticky komprimovať a prekladať priamo v prehliadači.

Môžete sa dostať oveľa komplikovanejšie, ale krása je ako môžete spustiť OCR s jedným riadkom kódu.

Pozrite sa na vstupnú stránku Tesseract.js, ak chcete vidieť živé ukážky. To funguje priamo v prehliadači, kde môžete drag & drop akýkoľvek naskenovaný obrázok textu pre automatické prekladanie OCR.

Tento príklad môžete stiahnuť aj lokálne prostredníctvom stránky GitHub alebo si môžete vytvoriť vlastnú aplikáciu tak, že skript Tesseract.js začnete priamo z CDN.

Najjednoduchší príklad kódu vyzerá takto: myImage je priamy odkaz na prvok obrázka HTML:

 Tesseract.recognize (myImage) .then (funkcia (výsledok) console.log (výsledok));

V obidvoch prípadoch je táto knižnica veľmi užitočná na to, aby ste sa mohli pohybovať pomocou OCR na webe. Je to ďaleko od dokonalosti, ale je to tiež najlepším zdrojom pre webových vývojárov, ktorí chcú dynamickú funkčnosť OCR na stránke.

Ak sa chcete dozvedieť viac, navštívte stránku Tesseract.js GitHub, kde si môžete pozrieť živé ukážky a prezrieť si online dokumentáciu.