OCR Scanner riconoscimento

Non sai come utilizzare il forum? Posta qui le tue domande.

Moderatori: Staff, Collaboratori

dinfh
Livello1
Livello1
Messaggi: 29
Iscritto il: venerdì 9 settembre 2016, 17:43
Contatta:

OCR Scanner riconoscimento

Messaggio da dinfh »

Domandona da un milione di dollaroni.
ma esiste un programma che riesce a riconsocere le parole degli atti, per la parte scritta a mano ( a volte con scrittura pessima)

Immagine

So che è impossibile e mi toccherà gestire tutto a mano, ma magari qualcuno ha trovato la pietra filosofale del ricercatore disperato. Almeno per gli indici.

Grazie a tutti

Avatar utente
Matteorm83
Livello2
Livello2
Messaggi: 284
Iscritto il: mercoledì 14 agosto 2019, 22:53
Località: ZELO BUON PERSICO
Contatta:

Re: OCR Scanner riconoscimento

Messaggio da Matteorm83 »

Penso che un algoritmo di intelligenza artificiale per l'analisi di immagini opportunamente progettato e "allenato" potrebbe produrre qualche risultato. Ovviamente, qualunque risultato prodotto andrebbe comunque validato da un umano.
Enea e Lena (Milano) < Matteo (1983 - Roma) < Pietro (1944 - Roma) < Bruno Dino (1914 - Chitignano) < Pietro (1888 - Chitignano) < Pasquale (1853 - Chitignano) < Luigi (1795 Circa - Chitignano) < Niccoló (1762 Circa - Chitignano) < Paolino (?)

dinfh
Livello1
Livello1
Messaggi: 29
Iscritto il: venerdì 9 settembre 2016, 17:43
Contatta:

Re: OCR Scanner riconoscimento

Messaggio da dinfh »

Ve’ certamente. Ma già se fa una parte del lavoro sarebbe un bel risultato. Sapere se esiste qualcosa in commercio da cui partire ?

dinfh
Livello1
Livello1
Messaggi: 29
Iscritto il: venerdì 9 settembre 2016, 17:43
Contatta:

Re: OCR Scanner riconoscimento

Messaggio da dinfh »

ma nessuno vuole approfondire l'argomento ? nessuno sente la necessita' di farsi aiutare da Machine Learning, Algoritmi, AI, etc ?
Riporto: "Proprio per preservare l’immenso patrimonio culturale e digitalizzare i manoscritti di ogni epoca, rendendoli accessibili al pubblico, è nato nel gennaio 2016 il progetto europeo READ (Recognition and Enrichment of Archival Documents) e lo sviluppo della piattaforma Transkribus. Austria, Svizzera, Germania, Grecia, Spagna, Finlandia, Francia e Regno Unito collaborano unite alla realizzazione di un software che, opportunamente istruito, può riconoscere la grafia di un manoscritto e proseguire automaticamente al riconoscimento dei caratteri. Ad oggi con un margine d’errore fino al 3,5% circa." ... ed aggiungo ..."Non solo. Siamo tutti chiamati a dare un contributo, partecipando attivamente alle trascrizioni.
Il motore che sta dietro a questa tecnologia viene continuamente affinato, imparando anche dai propri errori. Quindi, più manoscritti vengono inseriti ed elaborati nel sistema, maggiore sarà la capacità di elaborazione e la percentuale di riconoscimento corretto.
" cit. (https://www.webnauta.it/wordpress/trans ... noscritti/).

Nei prossimi giorni e con la clausura forzata che viviamo di questi tempi, spero di approfondire un po' di piu'. Chiunque voglia seguirmi ed aiutarmi (a comprendere e migliorare) e' benvenuto.
Dino :o

dennisangemi02
Livello1
Livello1
Messaggi: 127
Iscritto il: mercoledì 2 gennaio 2019, 22:09
Località: Regalbuto | Catania
Contatta:

Re: OCR Scanner riconoscimento

Messaggio da dennisangemi02 »

Sono super interessato e ti ringrazio per questo link spettacolare che non avevo ancora trovato. Lo proverò presto, puoi contattarmi anche in privato se vuoi (potremmo scambiarci consigli/dritte)

Avatar utente
Matteorm83
Livello2
Livello2
Messaggi: 284
Iscritto il: mercoledì 14 agosto 2019, 22:53
Località: ZELO BUON PERSICO
Contatta:

Re: OCR Scanner riconoscimento

Messaggio da Matteorm83 »

Ragazzi,
Bisogna iniziare a smanettarci subito, anche perché istruire l'AI con testi giá trascritti richiederá del tempo! Peccato che a questa collaborazione non partecipi nessuna realtá italiana.
Enea e Lena (Milano) < Matteo (1983 - Roma) < Pietro (1944 - Roma) < Bruno Dino (1914 - Chitignano) < Pietro (1888 - Chitignano) < Pasquale (1853 - Chitignano) < Luigi (1795 Circa - Chitignano) < Niccoló (1762 Circa - Chitignano) < Paolino (?)

dennisangemi02
Livello1
Livello1
Messaggi: 127
Iscritto il: mercoledì 2 gennaio 2019, 22:09
Località: Regalbuto | Catania
Contatta:

Re: OCR Scanner riconoscimento

Messaggio da dennisangemi02 »

Matteorm83 ha scritto:
lunedì 23 novembre 2020, 22:23
Peccato che a questa collaborazione non partecipi nessuna realtá italiana.
Sono d'accordo sul cominciare a lavorare subito ma pare che ci siano due enti italiani che collaborano con il progetto transkribus https://readcoop.eu/members/ : Fondazione Banco di Napoli e Max-Planck Gesellschaft zur Förderung der Wissenschaften e.V.

dinfh
Livello1
Livello1
Messaggi: 29
Iscritto il: venerdì 9 settembre 2016, 17:43
Contatta:

Re: OCR Scanner riconoscimento

Messaggio da dinfh »

nel provo a vedere come funziona il tutto e come si puo' collaborare. approccio pratico. vi aggiorno non appena riesco a dedicarci il tempo necessario. per adesso loggato e scaricato il programma.

Avatar utente
Jfk105
Livello2
Livello2
Messaggi: 466
Iscritto il: sabato 9 settembre 2017, 0:00
Contatta:

Re: OCR Scanner riconoscimento

Messaggio da Jfk105 »

nel provo a vedere come funziona il tutto e come si può collaborare. approccio pratico. vi aggiorno non appena riesco a dedicarci il tempo necessario. per adesso loggato e scaricato il programma.
Ciao ho scaricato anch'io il programma e anche l'app di scansione DocScan sullo smartphone (non ho la tenda che mostrano però, eh ehe eh)...
Mi sono autenticato e ho provato a caricare un documento (non scansionato ma upload direttamente dal pc).
Al momento non c'è la lingua italiana tra quelle che usano ma, va beh, proviamo lo stesso :)
PURTROPPO a me il programma Transkribus su Windows non parte (credo sia un problema con Java ma non posso smanettare troppo poichè è il pc che uso per lavoro, ho provato anche con il batch allegato e da riga di comando ma non c'è verso...).
Quindi al momento sono fermo al mio documento caricato ma che mi dice che occorre (in inglese) "eseguire un'analisi del file" ma visto che il programma in locale non mi funziona qui mi sono fermato...
Devo dire che è tutto molto poco spiegato (per nulla, direi) e quindi anche un po' ostico...
Ciao,J
ps: Cmq è davvero un bel progetto
Io (1968) – Ugo (1937) – Amleto Enrico (1907) – Ugo Luigi (1873) – Giuseppe Antonio (1832) – G.Battista (1796) – Adamo Cesare (1772) – Sante Cesare Melchiorre (1749) – G.Battista (1726) – Cesare (1669) – Giovanni (1630-1633) - Pietro (1600-1616)

dinfh
Livello1
Livello1
Messaggi: 29
Iscritto il: venerdì 9 settembre 2016, 17:43
Contatta:

Re: OCR Scanner riconoscimento

Messaggio da dinfh »

Proseguo nel lavoro, con lentezza, ma mi sono un po' perso. Provo a scrivere ai signori del sito per avere assistenza

dinfh
Livello1
Livello1
Messaggi: 29
Iscritto il: venerdì 9 settembre 2016, 17:43
Contatta:

Re: OCR Scanner riconoscimento

Messaggio da dinfh »

Il lavoro prosegue, anche se molto lentamente. Mi hanno autorizzato ad iniziare un modello apposito per la scrittura dei miei archivi. Ho provato ad applicare il modello ai testi scritti e devo dire che ha un ottimo livello di accuratezza. Certo siamo ancora lontani dalla perfezione, ma l'algoritmo funziona così: va per curva di esperienza ed adattamento.

dinfh
Livello1
Livello1
Messaggi: 29
Iscritto il: venerdì 9 settembre 2016, 17:43
Contatta:

Re: OCR Scanner riconoscimento

Messaggio da dinfh »

... volevo aggiungere una foto del lavoro, ma non mi ricordo come si fa

dinfh
Livello1
Livello1
Messaggi: 29
Iscritto il: venerdì 9 settembre 2016, 17:43
Contatta:

Re: OCR Scanner riconoscimento

Messaggio da dinfh »

Immagine

Avatar utente
Matteorm83
Livello2
Livello2
Messaggi: 284
Iscritto il: mercoledì 14 agosto 2019, 22:53
Località: ZELO BUON PERSICO
Contatta:

Re: OCR Scanner riconoscimento

Messaggio da Matteorm83 »

Mi sembra un ottimo risultato! Io non ho ancora avuto tempo di mettermici ma ho grandi aspettative. Ho una domanda: funziona bene anche nel caso di manoscritti elaborati a piú mani? Ad esempio ho degli atti di 15/20 pagine dove compaiono 3 o 4 calligrafie differenti.
Enea e Lena (Milano) < Matteo (1983 - Roma) < Pietro (1944 - Roma) < Bruno Dino (1914 - Chitignano) < Pietro (1888 - Chitignano) < Pasquale (1853 - Chitignano) < Luigi (1795 Circa - Chitignano) < Niccoló (1762 Circa - Chitignano) < Paolino (?)

Avatar utente
Jfk105
Livello2
Livello2
Messaggi: 466
Iscritto il: sabato 9 settembre 2017, 0:00
Contatta:

Re: OCR Scanner riconoscimento

Messaggio da Jfk105 »

@Dinfh
Il lavoro prosegue, anche se molto lentamente. Mi hanno autorizzato ad iniziare un modello apposito per la scrittura dei miei archivi. Ho provato ad applicare il modello ai testi scritti e devo dire che ha un ottimo livello di accuratezza. Certo siamo ancora lontani dalla perfezione, ma l'algoritmo funziona così: va per curva di esperienza ed adattamento.
Ciao scusa ma da dove lo usi? pc? Che versione hai? (Windows, intendo)
Perchè a me proprio non funziona su Windows 10, tu come hai proceduto per l'installazione? Siccome ho letto che volevi contattare il loro supporto, ti hanno dato per caso una sorta di procedura / di guida?
Grazie mille
Ciao
J
ps se hai un walkthrough oppure un link dove seguire passo passo il setup te ne sarei grato :)
Io (1968) – Ugo (1937) – Amleto Enrico (1907) – Ugo Luigi (1873) – Giuseppe Antonio (1832) – G.Battista (1796) – Adamo Cesare (1772) – Sante Cesare Melchiorre (1749) – G.Battista (1726) – Cesare (1669) – Giovanni (1630-1633) - Pietro (1600-1616)

Rispondi

Chi c’è in linea

Visitano il forum: Nessuno e 12 ospiti