Optiline märgituvastus ehk lühidalt OCR töötab skaneerides pilti pikslite kaupa pildilt pikslite kaupa funktsioone, mis sarnanevad märgikomplektidega, millele seda treeniti. Kapoti all kasutame piltidest teksti väljavõtmiseks Google'i välja töötatud avatud lähtekoodiga optilise tähemärgi tuvastamise algoritmi Tesseract. PDF-failide jaoks kasutame Mozilla PDF-i sõelumise teeki, mis sobib suurepäraselt PDF-is tähemärkide sõelumiseks mikrosekundites. Mõlemad tarkvarad on tipptasemel ja skannivad pilte tekstisarnaste funktsioonide jaoks plokkide kaupa.
Enamasti kasutatakse pilti tekstiks, et säästa aega pika pildi või pikkade PDF-ide, näiteks raamatute, teisendamisel tekstiks. Seejärel saate teksti hõlpsalt redigeerida, kasutades veebipõhist tekstiredaktorit või võrguühenduseta rakendust, näiteks Microsoft Word. Teksti automatiseeritud eraldamiseks saate fotosid, kaarte ja tekstidokumente ära tunda.
Ärge veetke tunde trükkimise ja trükivigade parandamise teel. Säästke aega tõhusa optilise märkide tuvastamise rakendusega. See on kiire ja lihtne alternatiiv skannerile või digikaamerale.
Tarkvara töötab otse teie brauseris või meie teenustes kiiresti ja tõhusalt. Me ei salvesta teie teavet, ei jaga teie andmeid ega installi tarkvara. Veebipõhine PDF-failide teisendamine ei vaja installimist, et teksti PDF-failidest eraldada.
Optilist märgituvastust on igapäevaelus kasutatud erinevates kohtades. Numbrimärgi skannerid kasutavad seda teemaksude registreerimiseks, arvestuse pidamiseks ja piletite jaoks. Telefonid kasutavad rühmitamiseks mõne pildi iseloomustamiseks optilist märgituvastust. Autod kasutavad optilist märgituvastust, et tuvastada informatiivseid märke teel ja anda juhtidele muid teadmisi. Mõnes seadmes kasutatakse isegi tõlkega optilist märgituvastust, mis aitab prillidel iga päev märke ja teksti tõlkida.
Mida kõrgem kvaliteet, seda tõenäolisem on teie PDF-i või teksti edukas lugemine.
Mida pikem on tekst, seda raskem on muundajal teksti ära tunda. Kiiremate tulemuste saavutamiseks on palju parem kasutada väiksemaid tekstikoguseid.
Pilt tekstist tuvastamise tarkvara pole täiuslik. Kontrollige pärast teksti kindlasti veel kord ja veenduge, et see oleks loetav.
Meie pilt tekstiks tarkvara töötab teie arvutis. Mida parem arvuti teil on, seda kiiremini saate tulemusi.
Kui teil pole head käekirja, võib õnnestumise protsent olla madalam. Ridad ja lahtrid võivad rakenduse segadusse ajada, kuna tarkvara võib need kogemata tekstina ära tunda.
Parimate tulemuste saamiseks veenduge, et teie pilt oleks võimalikult vähe segadust tekitav. Segadus võib olla imelik kuju, erinevad värvid, erinevad sümbolid või muud asjad, mis võivad tarkvara segadusse ajada.
Mõnel juhul võiksite pildifailidest teksti välja võtta. Teie pildi failivorming pole oluline, saate hõlpsasti teisendada JPG-, PNG-, TIF- ja muudest vormingutest. Ettekannetele, loengutele või kohtumistele keskendumiseks on tavaliselt lihtsam lihtsalt slaidiseansist või esitlusest kiire foto teha ja keskenduda esineja kuulamisele. Objekti märgi äratundmise või pildi kasutamine tekstis muudab selle palju lihtsamaks. Samuti saate skannida artikleid, dokumente, kviitungeid, arveid ja kõiki paberimajandust. Neid dokumenditüüpe saab sageli hõlpsasti PDF -vormingus salvestada, mis sobib ideaalselt PDF -i tekstiks. Teine lihtne lahendus on teha lehelt ekraanipilt, tavaliselt PNG- või JPG -pilt, ja kasutada seda ekraanipilti pildilt teksti saamiseks.
Usume, et igaüks peaks saama kasutada tehnoloogilisi vajadusi. Meie viis selle saavutamiseks on lihtsate rakenduste loomine, mida saab kasutada erinevates keeltes. Kuigi meie põhirõhk on keelel põhinevad rakendused, töötame välja tööriistu igapäevaseks kasutamiseks. Kas teil on idee rakenduse kohta, mis võib olla kasulik paljudes muudes keeltes peale inglise keele? Pöörduge julgelt meie poole, me tahaksime sinust kuulda!