Optisk tegngenkendelse, eller kort sagt OCR, fungerer ved strategisk at scanne et billede pixel for pixel for funktioner, der ligner tegnsæt, det blev trænet i. Under hætten bruger vi Tesseract, en open source optisk tegngenkendelsesalgoritme udviklet af Google, til at udtrække tekst fra billeder. Til PDF-filer bruger vi Mozilla PDF-parseringsbiblioteket, som er fremragende til at parsere tegn i en PDF i mikrosekunder. Begge software er banebrydende og scanner billeder blok for blok for tekstlignende funktioner.
Mest almindeligt bruges billede til tekst til at spare tid på at konvertere et langt billede eller lange PDF-filer, såsom bøger, til tekst. Du kan derefter let redigere teksten bagefter ved hjælp af en online teksteditor eller en offline applikation som Microsoft Word. Du kan genkende fotos, kort og tekstdokumenter for hurtigt at udtrække teksten på en automatisk måde.
Brug ikke timer på at genindtaste og rette typografiske fejl. Spar tid med en effektiv applikation til optisk tegngenkendelse. Dette er et hurtigt og nemt alternativ til en scanner eller et digitalt kamera.
Softwaren kører lige i din browser eller i vores tjenester, hurtigt og effektivt. Vi gemmer ikke dine oplysninger, deler dine data eller installerer nogen software. Online konvertering af PDF til tekst kræver ingen installation for at udtrække tekst fra PDF-filer.
Optisk karaktergenkendelse er blevet brugt på en række steder til brug i hverdagen. Nummerpladescannere bruger det til at registrere vejafgifter, føre poster og til billetter. Telefoner bruger optisk tegngenkendelse for at hjælpe med at karakterisere nogle billeder til gruppering. Biler bruger optisk tegngenkendelse til at genkende informative tegn på vejen og give chauffører anden indsigt. Nogle enheder bruger endda optisk tegngenkendelse parret med oversættelse for at hjælpe med at oversætte hver dag tegn og tekst på dine briller.
Jo højere kvalitet, jo mere sandsynligt er det, at din PDF eller tekst læses med succes.
Jo længere teksten er, desto vanskeligere er det for konverteren at genkende tekst. Det er meget bedre at bruge mindre mængder tekst for at opnå de hurtigste resultater.
Billede til tekstgenkendelsessoftware er ikke perfekt. Sørg for at dobbelttjekke teksten bagefter og sørg for, at den er læsbar.
Vores billed til tekst-software kører på din computer. Jo bedre computer du har til rådighed, jo hurtigere får du resultater.
Hvis du ikke har god håndskrift, kan succesraten muligvis være lavere. Linjer og kasser kan forvirre applikationen, fordi softwaren muligvis ved et uheld genkender dem som tekst.
For at få de bedste resultater skal du sørge for, at dit billede har mindst mulig rod. Rod kan være underlige former, forskellige farver, forskellige symboler eller andre ting, der kan forvirre softwaren.
I nogle tilfælde vil du måske udtrække tekst fra billedfiler. Filformatet på dit billede er ikke vigtigt, du kan nemt konvertere fra JPG, PNG, TIF og andre formater. For at fokusere på præsentationer, foredrag eller møder er det normalt lettere at bare tage et hurtigt billede af diasshowet eller præsentationen og fokusere på at lytte til højttaleren. Brug af genstandsgenkendelse eller billede til tekst gør dette meget lettere. Du kan også scanne artikler, dokumenter, kvitteringer, fakturaer og ethvert papirarbejde. Disse dokumenttyper gemmes ofte let i PDF -format, perfekt til PDF til tekst. En anden let løsning er at tage et skærmbillede af en side, typisk et PNG- eller JPG -billede, og bruge det skærmbillede til at hente tekst fra billedet.
Vi mener, at enhver skal være i stand til at bruge teknologiske fornødenheder. Vores måde at få det til at ske er ved at opbygge enkle applikationer, der kan bruges på en række forskellige sprog. Selvom vores hovedfokus er sprogbaserede applikationer, er vi i færd med at opbygge værktøjer til daglig brugssager. Har du en idé til et program, der kan være nyttigt på mange andre sprog end engelsk? Du er velkommen til at kontakte os, vi vil meget gerne høre fra dig!