Rozpoznávání textu je velmi výhodná funkce. Už nemusíte přepisovat velké množství knih a článků. Pro učitele, studenty a výzkumné pracovníky jsou takové softwarové aplikace skutečným darem. Zvažte různé aplikace a určete, který program rozpoznat text z obrázku je nejlepší.
Jak to funguje
Optické rozpoznávání znaků (OCR) je schopnost převádět text z grafického zobrazení (fotografie, skenování, pdf) do běžného formátu. Převedený text lze upravovat.
Každý rastrový obrázek se skládá z teček. Software pro rozpoznávání vybírá písmena na obrázku a převádí je do textu. Analýza struktury dokumentu. Textové bloky jsou zvýrazněny. Pak jsou vytvořeny řádky, které jsou rozděleny na slova a pak na symboly. Každá postava je porovnána se vzory. Po kterých hypotézách jsou postaveny jaký druh symbolu. Na jejich základě software analyzuje různé možnosti pro rozdělení řádků na slova a slova na znaky. Počet takových hypotéz je obrovský. Nakonec se program rozhodne a dá text.
Přehled softwaru
Obvykle lze všechny aplikace rozdělit do tří kategorií:
- Zaplaceno.
- Zdarma.
- Online služby.
Podívejme se na několik možností z každé sekce..
Placené a bezplatné programy
OCR CuneiForm
Zdarma program pro rozpoznávání naskenovaného textu, který si můžete stáhnout zde.
Stáhněte si OCR CuneiForm
Aplikace byla vyvinuta v roce 1993 společností Cognitive Technologies. Jednou z jeho hlavních funkcí v té době byla schopnost rozpoznat směs ruského a anglického jazyka. V roce 2009 byla přidána větev, která umožňuje rozpoznat směs dalších jazyků. Softwarový produkt byl dodán se skenery a MFP od předních výrobců: Hewlet-Pachard, Epson, Xerox atd. Poslední verze byla vydána v roce 2009..
Po stažení a instalaci se pokusíme text rozpoznat. Vezměte si například tento článek..
Programové rozhraní je jednoduché, menu v ruštině.
Klikněte na ikonu složky a načtěte obrázek. Stiskněte rozpoznávací tlačítko.
Výsledek není působivý. Barevný text nebyl rozpoznán.
Přes domnělé použití různých slovníků byla angličtina špatně uznána..
Obecně lze ideální fotografii převést do symbolů, ale čím nižší je kvalita původního obrázku, tím nižší je výsledek..
Je třeba poznamenat, že se jedná o jediný rusifikovaný program pro rozpoznávání textu pro skenování, který lze legálně stáhnout zdarma. Všichni ostatní mají nejlepší zkušební verzi zdarma..
Ridioc
Program pro rozpoznávání textu z fotografie nebo ze skeneru s volným obdobím 30 dní. Stáhněte si zde.
Stáhněte si RiDoc
Aplikace má dobrou funkčnost a dostupné rozhraní. Chcete-li obrázek stáhnout, klikněte na tlačítko „Otevřít“.
Poté klikněte na tlačítko „Rozpoznat“.
Výsledkem je konečný výsledek. Lze jej otevřít v aplikaci Word nebo OpenOffice..
Zde je výsledek.
Také není dokonalý, ale mnohem více než v předchozím případě.
Můžete také vodotisk nebo přilepit několik obrázků..
Readris
Placený softwarový produkt se zkušební verzí navrženou pro 100 stránek nebo 10 dní. Zde si můžete stáhnout program pro skener pro rozpoznávání textu z oficiálních stránek.
Stáhněte si ReadIris
Developer - belgická společnost IRIS, založená v roce 1986. Hlavní specializace - technologie a produkty pro inteligentní rozpoznávání dokumentů.
Program převede obrázek, soubor PDF nebo naskenovaný dokument do plně upravitelného textového souboru. Extrahuje text z vašich dokumentů při zachování rozložení zdrojového souboru. Má následující funkce:
- převádět soubory Word, Excel a PowerPoint na indexované soubory PDF;
- převod dokumentů pomocí kontextové nabídky;
- indikátor kvality pro dovážené dokumenty;
- automatická detekce skenerů;
- modul pro korekci perspektivy.
Rozhraní programu je Russified (indikováno během instalace) a je celkem jednoduché.
Klikněte na tlačítko „Ze souboru“ a vyberte náš obrázek. Program jej automaticky rozdělil do dvou bloků.
Pro rozpoznání klikněte na tlačítko "Otevřít" a určete cestu k obrázku. Formát je označen řádkem výše..
Výsledek překonal všechna očekávání. Dokonce i známka byla zachována.
Dokument můžete odeslat poštou nebo do cloudu. Chcete-li to provést, klikněte na výše uvedený seznam a vyberte. Ve výchozím nastavení je soubor uložen.
Tento program stojí asi 6000 rublů.
ABBYY FineReader
Nejslavnější a nejoblíbenější program. Stáhněte si zkušební verzi zde..
Stáhněte si ABBYY FineReader
Placené náklady 6990 s. Ruský vývoj v roce 1993 je stále považován za jeden z nejlepších na světě. Klíčové vlastnosti:
- Rozpoznávání tabulek a grafů, matematické vzorce.
- Procházet a procházet pdf.
- Tvorba a přímá editace pdf.
- Práce s digitálním podpisem.
- Porovnání dokumentů.
- Přidat komentáře.
Program má mnoho funkcí. Rozhraní je Russified a přístupné.
Po kliknutí na tlačítko „Otevřít“ a po výběru obrázku začne jeho automatické rozdělení do bloků.
Chcete-li zahájit proces, klikněte na odpovídající tlačítko.
Poté zbývá zvolit, v jakém formátu se má dokument uložit, a určit složku, do které se má dokument uložit.
Pojďme otevřít výsledek. Jak vidíte, uznání bylo perfektní.
Znovu porovnejte s ReadIris.
První možnost (Finereader) fungovala bezchybně. Proto snad dáme tomuto programu dlaň. Jsou srovnatelné v ceně, takže rozdíl 600-700 rublů nehraje zvláštní roli.
Rozpoznávat text pomocí fotografie online
IMGonline
Online zpracování obrazu. Stránka představuje nástroje:
- Komprese a změna velikosti obrázků
- Oříznout, oříznout
- Vložené zpracování metadat
- Efekty
- Vylepšení
- Definování barevné palety pro obrázek
- Získání pozadí
- Stanovení procenta podobnosti atd..
Pohodlný web, který poskytuje mnoho možností zpracování obrazu. Rozhraní je jednoduché a přímé..
Nabízí dva programy. Porovnejte. Stáhněte soubor a klikněte na „OK“.
Poté klikněte na odkaz.
Výsledek není šťastný.
Zkusíme druhý program.
Také pochybné.
Nastavit další jazyk.
Zkontrolujte výsledek.
Trochu lepší, ale zdaleka perfektní.
img2txt
Program pro rozpoznávání textu z fotografií online neumožňuje skenování.
Stránka funguje již od roku 2014. Vývojáři neplánují jiné služby než stávající.
Vyberte soubor a klikněte na „Stáhnout“. Poté klikněte na „Zahájit rozpoznávání“.
Výsledek také zdaleka není dokonalý..
Convertio
Dostatečně velký placený portál, kde můžete využít následující funkce:
- Převod videa, zvuku, obrázků.
- Převod PDF do Word, Excel, PowerPoint.
- Rozdělit PDF.
- Komprimujte PDF, png atd..
Princip činnosti je naprosto podobný, ale existuje více nastavení. Obrázky lze přetáhnout.
Můžete určit několik jazyků a typ dokumentu, do kterého se výsledek uloží..
Neregistrovaní uživatelé mají k rozpoznání pouze 10 stránek.
Po kliknutí na captcha vyberte „Převést“.
Klikněte na stáhnout.
Výsledek překonal všechna očekávání..
Ukázalo se, že jednoduché online služby mají možnost vysoce kvalitního rozpoznávání. V této nominaci je tedy Convertio prohlášen za jasného vítěze. Ale, jako každý vynikající produkt, je to zaplaceno.
Takže jsme se podívali na různé nástroje pro rozpoznávání textu. Ukázalo se, že ti zdarma mohou pomoci, ale kvalita zůstává až na par. Takže pokud neustále potřebujete překládat text z tisku do elektronické, musíte rozvětvit.
Přeji vám krásný den!