OCR: la rivoluzione nella lettura dei documenti

ocr-rivoluzione-lettura-documenti

Il riconoscimento ottico dei caratteri o OCR (acronimo di Optical Character Recognition) è una tecnologia che ha rivoluzionato il processo di gestione dei documenti in molti settori come quello legale, bancario, educativo, sanitario, finanziario e governativo.

Questa tecnologia consente alle aziende di risparmiare tempo e denaro, aiutandole nelle sfide odierne come la digitalizzazione e la dematerializzazione dei documenti cartacei negli uffici. 

Il mercato globale dell’OCR è in grande crescita: si prevede infatti che le dimensioni di questo mercato raggiungeranno e supereranno i 30 milioni di dollari a livello globale entro il 2030.

 

Breve storia dei sistemi OCR

Un primo sviluppo di questa tecnologia risale agli inizi del 1900: Fournier D’Albe inventò l’Optofono, uno strumento in grado di convertire caratteri in suoni per le persone non vedenti. Nel 1912, Emmanuel Goldberg progettò invece una macchina in grado di convertire il testo scritto a macchina in segnali morse per la trasmissione telegrafica.

A partire dagli anni ‘40 diverse aziende statunitensi lavorarono per sviluppare “macchine da lettura” per non vedenti. Nel 1974 Ray Kurzweil sviluppò il software OCR denominato omni-font, in grado di riconoscere il testo scritto in qualsiasi tipo di carattere. Era un dispositivo di apprendimento automatico per non vedenti e ipovedenti, una macchina di lettura in grado di leggere il testo ad alta voce. 

L’OCR diventò popolare agli inizi degli anni ’90 quando alcuni giornali cominciarono la propria digitalizzazione grazie all’utilizzo di nuove e migliorate tecnologie. Prima che la tecnologia OCR fosse disponibile, l’unica opzione per digitalizzare i documenti era digitare manualmente il testo. Non solo questo richiedeva molto tempo, ma spesso portava a imprecisioni e inevitabili errori di battitura.

Oggi i servizi OCR hanno eliminato l’inserimento manuale dei dati, fornendo al contempo accuratezza e precisione. 

 

In che modo funziona un OCR: Pattern Recognition e Feature Detection

Un software OCR estrae e riutilizza dati da documenti scansionati, immagini della fotocamera e pdf. Utilizzando una combinazione di hardware e software, i documenti fisici vengono convertiti in testo leggibile dalla macchina. L’hardware, legge e copia il testo come farebbe uno scanner, il software gestisce l’elaborazione dei dati acquisiti.

Lo scanner acquisisce il documento fisico e, una volta copiate tutte le pagine, il software OCR converte il documento in una mappa di bit (bitmap). A questo punto l’immagine scansionata viene analizzata: le aree scure vengono identificate come caratteri da riconoscere, le aree chiare come sfondo. Le aree scure vengono quindi elaborate per trovare lettere, numeri o simboli.

Il software OCR è in grado di elaborare e identificare caratteri, parole o blocchi di testo in due diversi modi.

Pattern recognition

Usando questo metodo, il computer riconosce l’intero carattere e lo abbina a quelli già memorizzati all’interno del software OCR. Una volta scansionato e ripulito da eventuali imperfezioni, il carattere viene confrontato con gli altri presenti nel database.

La digitalizzazione avviene solamente in caso di una piena corrispondenza tra il carattere scansionato e uno degli elementi del database.

Utilizzato soprattutto negli anni ’60 quando i caratteri disponibili erano molti meno e ogni lettera era facilmente distinguibile dalle altre. Oggi però esistono così tanti tipi di font diversi che il pattern recognition a volte può non essere sufficiente per riconoscere tutti i caratteri.

Feature detection

Con la feature detection i caratteri scansionati vengono scomposti in vari elementi, così da ricavare tratti e caratteristiche salienti e generali. Le lettere vengono riconosciute nel loro insieme, rilevando singoli componenti come linee orizzontali, verticali e diagonali, angoli, punti di incontro delle linee, intersezioni, ecc. 

Una volta rilevate queste informazioni, il software OCR le confronta con i dati presenti nel proprio database: nel caso in cui vengano rilevati elementi simili, il carattere verrà digitalizzato.

I software OCR sfruttano l’Intelligenza Artificiale (AI) anche per implementare metodi più avanzati di riconoscimento intelligente dei caratteri, come l’identificazione di lingue o di stili di scrittura a mano.

 

Come viene utilizzato l’OCR? Alcuni casi d’uso quotidiani

Oggi, molte imprese integrano algoritmi OCR nei propri processi per ottenere numerosi vantaggi e aumentare l’efficienza aziendale.

Semplificando i processi di inserimento e di archiviazione di dati e file è possibile migliorare i flussi di lavoro. Grazie ad un accesso facilitato delle risorse e una migliore gestione dei documenti, i dipendenti così risparmiano tempo e riducono la possibilità di commettere errori.

L’OCR permette di digitalizzare rapidamente grosse moli di documenti cartacei, e per questo trova applicazione in diversi settori come in quello bancario e in quello assicurativo. I documenti vengono digitalizzati, classificati e archiviati in modo efficace, migliorando la sicurezza e prevenendo possibili tentativi di frode. 

La dematerializzazione dei documenti interessa in particolar modo tanto la Pubblica Amministrazione quanto il mondo legale. Gli algoritmi OCR permettono infatti di risparmiare spazio fisico di archiviazione e migliorano la ricercabilità di documenti composti da centinaia (se non migliaia) di pagine. Essendo in formato digitale, questi documenti sono inoltre meno soggetti a furti e distruzione.

La maggior parte degli aeroporti e delle applicazioni di viaggio utilizzano l’OCR: dalla scansione del passaporto al salvataggio dei dati personali quando si prenota un volo o un hotel, dal check-in alla gestione delle spese di viaggio, ci sono centinaia di applicazioni che utilizzano l’OCR e che stanno trasformando il settore del travel e del turismo.

L’OCR è inoltre una tecnologia nascosta che alimenta molti sistemi e servizi della nostra vita quotidiana. Casi d’uso importanti della tecnologia OCR includono l’immissione automatica dei dati, l’assistenza a non vedenti e ipovedenti, la scansione di documenti d’identificazione personali come passaporti, patenti di guida, fatture, estratti conto bancari, biglietti da visita e il riconoscimento automatico delle targhe.

 

Gli algoritmi OCR presenti sulla piattaforma di Klondike permettono di riconoscere e acquisire in modo facile, rapido e automatico informazioni come lettere, numeri e simboli presenti in documenti quali biglietti da visita, contratti, fatture o ordini.

Grazie alle informazioni estratte dai documenti viene creata una versione digitalizzata del documento originale che può essere modificata, elaborata e riutilizzata.

Abbiamo approfondito l’argomento nel nostro articolo dedicato.

Per ottenere maggiori informazioni sul riconoscimento ottico dei caratteri e scoprire tutti i benefici di questa tecnologia, contattaci per una DEMO.

More To Explore

Vuoi automatizzare il tuo Business?

Contattaci e raggiungi il prossimo livello