Salve ragazzi, avrei bisogno di un consiglio per un software Ocr affidabile, serve a mia sorella che deve iniziare a lavorare per la tesi. Consigli?![]()
![]()
"Credo nel potere del riso e delle lacrime come antidoto all'odio e al terrore." C. Chaplin
Always looking at the sky...
http://www.nuance.de/omnipage/
OmniPage 15, die Basisversion der weltweit meistverkauften OCR-Software, ist der einfachste Weg, Ihre Papierdokumente und PDF-Dateien in bearbeitbare PC-Dokumente zu verwandeln. Leistungsstarke neue OCR-Funktionen, verbesserte Layoutanalyse und intuitive Bearbeitungswerkzeuge machen es möglich, Papier- und PDF-Dokumente in bearbeitbare, originalgetreue Dateien zu konvertieren – komplett mit Text, Tabellen und Grafiken.
Gli Italiani perdono le guerre come se fossero partite di calcio e le partite di calcio come se fossero guerre. W.Churchill
Federico Rubagotti
MeteoNetwork
Presumo sia un giudizio positivo.Originariamente Scritto da fedex
![]()
"Credo nel potere del riso e delle lacrime come antidoto all'odio e al terrore." C. Chaplin
Always looking at the sky...
http://sourceforge.net/projects/tesseract-ocr
Da P.I.: http://punto-informatico.it/p.aspx?id=1632194&r=PI
Google rilascia un OCR open source
BigG ha preso il codice di un vecchio motore di riconoscimento ottico dei caratteri e ne ha fatto un progetto aperto. Il programma è limitato ma il colosso ha promesso di portarlo ai livelli degli OCR commerciali
Mountain View (USA) - Google ha aggiunto alla propria ragguardevole collezione di software gratuiti un'applicazione, chiamata Tesseract, per il riconoscimento ottico dei caratteri (OCR). Si tratta di un programma utilizzabile per convertire il testo contenuto in un'immagine, tipicamente ottenuta per mezzo di uno scanner, in caratteri comprensibili ad un elaboratore di testi.
Il motore alla base di Tesseract è stato originariamente creato da HP, che a partire dal 1995 ne ha però cessato lo sviluppo: questo nonostante all'epoca fosse considerato uno dei migliori software OCR del momento. Circa due anni fa HP ne ha donato il codice alla University of Nevada di Las Vegas (UNLV), che da allora è impegnata a correggerne i bug. Da alcuni mesi Google ha assunto il patrocinio dell'iniziativa facendone un progetto open source ed ora afferma che il programma "è sufficientemente stabile per essere ripubblicato come open source".
Tesseract soffre però ancora di alcune importanti limitazioni: la prima è il supporto della sola lingua inglese (niente correttore ortografico italiano, per intendersi); la seconda è l'incapacitÃ* di conservare il layout delle pagine (come colonne e tabelle); la terza è la scarsa capacitÃ* di riconoscere testi stampati su fogli grigi o a colori (in altre parole, dÃ* il massimo solo con il classico testo nero su bianco). Su stessa ammissione di Google, Tesseract è di gran lunga meno accurato dei migliori pacchetti di OCR oggi in commercio.
Va del resto considerato che, sebbene gli sviluppatori della UNLV abbiano rattoppato il codice qui e lÃ*, la tecnologia alla base di Tesseract è rimasta sostanzialmente la stessa di dieci anni fa.
Google afferma però che Tesseract "è assai più accurato di qualsiasi OCR open source in circolazione"", inoltre la sua licenza permette a chiunque di migliorarlo ed integrarlo in altre applicazioni: il che non è poco.
La grande G ha promesso che continuerÃ* a occuparsi di questo software, e a tal scopo sta assumendo esperti in tecnologie legate a quella OCR.
Che Google sia interessata all'OCR non sorprende: BigG sta facendo grande uso di questa tecnologia per la digitalizzazione dei libri (vedi Google Book Search), inoltre, come motore di ricerca, è particolarmente interessata ad accelerare la transizione di tutto lo scibile umano verso formati digitali indicizzabili dai propri spider.
Attualmente Tesseract è disponibile solo sotto forma di codice sorgente, scaricabile da questa pagina di SourceForge.net.
Io usai quello in dotazione nella suite di Microsoft Office. Non so se sia peggio o meglio degli altri. Comunque troppi sbattimenti, per il lavoro che dovevo fare, non me ne dava.
I modelli fanno e disfanno. I santoni del web cianciano.
*
Always looking at the sky
*
OmniPage funziona benone![]()
Vi ringrazio e vi segnalo anche Fine Reader 4.0 liberamente e legalmente scaricabile da qui http://www.ilsoftware.it/articoli.asp?ID=2904, che ad una prima prova si è comportato egregiamente.![]()
"Credo nel potere del riso e delle lacrime come antidoto all'odio e al terrore." C. Chaplin
Always looking at the sky...
Segnalibri