Google åbnede API til OCR
Webtjenester / / December 24, 2019
Ja, de arbejder i Google Books helt sikkert bringe gode resultater, kan vi begynde at høste. Og nu skal jeg fortælle dig hvordan.
Scannede dokumenter ikke altid kræve en forvandling i selve teksten. Men nogle gange vil hun ikke få nogen aftale igen, og en elektronisk kopi af noget og ikke. Selvfølgelig kan du bruge nogle billige program OCR, går med scanneren, eller endda købe det (ikke stjæle dig) FineReader. Men den gratis desktop OCR-softwaren kører også fordi nu teksterne er i stigende grad at blive fotograferet, ikke scannet.
For at downloade nogen billeder (jpeg, png, gif) med tekstgenkendelse til efterfølgende Google API og åbnede i Google Dokumenter. Nu kan du uploade billeder til et dokumentbibliotek, og Google-serveren vil omdanne det til tekst.
Der er også et program eksempel, der illustrerer, hvordan API:
Men du bør programmørerne tænke på at skabe deres eget interface til disse funktioner. For eksempel - har du scanninger af bøger i PNG? Dette er en perversion, er det ikke? Så der har du det kort i hånden - skrive en ansøgning, der indlæses teksten side for side, ikke overtræder de grænser og forbinder hele belastningen i en enkelt tekst.
Men husk, der er begrænsninger i API'en, og de vigtigste af dem, forekommer det mig - noget, der er anerkendt kun latin, så snart det. Også skal man være omhyggelig med karakter højde er ikke mindre end 10 pixels, og den samlede størrelse af billedet ikke overstiger 10 megapixel.