Google lancia in beta un sistema OCR per Documents. Per ora tale funzionalità risulta utilizzabile solo tramite le API di Documents (per una demo), ma ovviamente l'aspettativa è che venga inserito presto nel pacchetto strumenti disponibili via Web.
C'è da dire che il sistema abbisogna ancora di sviluppo prima di essere rilasciato, si segnalano, infatti, parecchie imprecisioni nel riconoscimento ed anche una certa lentezza nell'esaminare il documento. Le immagini che per ora vengono gestite sono JPG, PNG e GIF fino a 10MB di grandezza.
Oltre, chiaramente, al riconoscimento ed alla trasformazione in testo degli scritti, le API consentono anche di tradurre il documento nelle varie lingue supportate da Google Translate.
In realtà Google sponsorizza lo sviluppo di un OCR open-source - OCRopus - ma non è chiaro se è questo progetto ad essere utilizzato per quest'applicazione.
La notizia di per se è interessante in quanto in giro non ci sono molti sistemi OCR free ((Il più affidabile è probabilmente ABBYY FineReader Online anche se limitato a 10 pagine al giorno.)) ed il fatto che Google abbia iniziato a lavorare su una cosa del genere, promette bene per il futuro.
0 commenti:
Posta un commento