ABBYY FineReader Express 8.4: genkende tekst fra enhver kilde på flue (fordeling kode afsluttet)
Makradar Af Teknologi / / December 19, 2019
Digitalt indhold, og elektroniske versioner af dokumenter omgiver os på alle sider. Papir i vores liv er næsten ingen plads tilbage. Aviser og magasiner har flyttet ind i online-format af bogen vi læser på e-ink-læser eller tablet, har almindelige breve erstattet e-mail og sms. Men nogle gange er vi nødt til at pille med de første papirer for at få dem en elektronisk kopi. Her kommer vi til ved hjælp af særlige programmer, der bruger OCR-teknologi til OCR tekst (Optical Character Recognition). Den mest berømte af disse er uden tvivl ABBYYFineReader. Du kan bruge den til at konvertere papirdokumenter til redigerbare formater, og gemme PDF til søgbar tekst. Og i dag har vi en stor mulighed for at lære mere om det.
* * *
For Mac-computere, ABBYY tilbyder kun FineReader Express, har den dog den nødvendige funktionalitet. De vigtigste elementer i ABBYY FineReader Express er en anerkendelse nøjagtighed og layout fastholdelse, støtte til mange sprog (171 sprog til de tre sprog i en dokument), transformationen og oprettelsen af PDF (PDF konvertering til redigerbare formater), redaktør for manuelle mærkning områder (tekst, tabel, billede) og en enkel, brugervenlig grænseflade program.
første kig
FineReader Express opererer vindue er ganske minimalistisk, der findes kun de mest nødvendige ting. Sidepanelet indeholder skitser tilføjet sider og på isntrumentov knapperne med rullelisterne for at vælge sprog og output-fil. Der stadig er konverteringen og zoom-knappen. Ellers interface svarer til en hurtig express-version, som satsning på automatisk udførelse af operationer med et minimum af konfiguration og brugerdeltagelse.
Bestå prøverne
Efter lanceringen FineReader møder os et kompakt vindue med et udvalg af scenarie. Her bliver vi bedt om at vælge den fange kilde: scanner, fax, eller læse fra en fil. Det er også tilrådeligt at angive et dokument sprog (eller sprog, hvis mere end én) - det vil bidrage til at forbedre anerkendelsen nøjagtigheden af det originale dokument. Tja, faktisk output-filformatet, alt er simpelt - vælg baseret på typen af papiret dokument.
Scanner ved hånden jeg ikke har, men det er endnu bedre - ved hjælp som kilden til billedet lavet med hjælp af iPhone, jeg kompliceret opgave at genkende tekst. Som et eksempel på teksten, jeg tog en af de bøger af sin kone, samt et eksempel på bordet - nogle gamle arbejderkvarter film sending iPhone. Nå, lad os komme i gang.
Hver side med tekst
I mangel af en scanner jeg bare gjorde en bog turn billeder - foto normal rumbelysning, ingen stativ, og andre tweaks. Her er den oprindelige:
Lad os se, hvad det kan gøre med FineReader. Vi angiver, at vi ønsker at trække sig ud af foto tekst, angive, hvilket sprog som russisk, og starte processen.
Til sin kredit, skal ansøgningen siges, at hele teksten blev defineret, herunder et uheld kom til at bøje den tilstødende side. Et stykke af den tabel, som jeg specifikt tilbage i rammen, defineret som den forventede billede. Men det er ikke skræmmende, fordi vi manuelt kan ændre det domæne, skal du angive dens type (hvis programmet ikke er indstillet korrekt), og fjern marken, anerkendelse af, der er påkrævet. Alle manipulationer tog mig mindre end et minut, men i sidste ende fik jeg her er en ganske acceptabelt resultat:
Efter en kort korrekturlæsning og redigeringer dokumentet er klar. Jeg tror, det er et godt resultat for sådan en hurtig, næsten automatisk anerkendelse proces.
genkende bord
Som en eksperimentel tabel tjener uhøjtidelig lovforslag, som også blev filmet på iPhone. Der er allerede i brug Ukrainsk (sammen med kontrol sprogstøtte), som også er godt for vores erfaring. At vælge et nyt script (⌘N) Angiv kilden - læses fra en fil, sproget - ukrainsk, og fil output - tabel.
Programmet tænker i et par sekunder, og her har vi resultatet:
Med bordet programmet ikke håndteres så godt, men det er mere eller mindre acceptabelt i princippet til teksten i definitionen, medmindre dette skyldes afslutte de celler, der ikke var i det oprindelige dokument. Der bliver nødt til at pille lidt længere tid at få den endelige form af kortet dokument, men det er nemmere end at skrive et skilt med hånden fra bunden.
Gem til PDF
Når du gemmer til PDF, programmet desværre ikke forbedrer det originale billede (kontrast, lysstyrke), og det er placeret i PDF-dokumentet, som er. Men den mindre, søgeteksten er til stede, og det er godt.
resultere
Ligesom ethvert værktøj, FineReader har sine fordele og ulemper. De stærke punkter, ud over de nævnte karakteristika producenten, er, at OCR tabeller og fungerer ganske godt, og konvertere til PDF, som lovet, støtter Search tekst. Ulempen er manglen på muligheder og meget sparsomme midler til manuelt at styre processen. Men dette er delvist berettiget, at det er en udtrykkelig version, og det virker automatisk.
Koder til FineReader Express program vandt Gregory Ushar og Nikolai Blinov. Tillykke! Tjek dine private beskeder, koder sendt.