{"id":139,"date":"2024-06-22T15:14:00","date_gmt":"2024-06-22T15:14:00","guid":{"rendered":"https:\/\/vocinelvento.it\/?page_id=139"},"modified":"2026-02-27T10:38:30","modified_gmt":"2026-02-27T10:38:30","slug":"il-progetto-voci-nel-vento","status":"publish","type":"page","link":"https:\/\/vocinelvento.it\/?page_id=139","title":{"rendered":"Tecnologie"},"content":{"rendered":"\n<p>Il progetto, finanziato dalla regione Emilia Romagna, propone la generazione computazionalmente assistita di contenuti per preservare e promuovere il ricco patrimonio di identit\u00e0 culturali e tradizioni locali. <\/p>\n\n\n\n<p>In un&#8217;epoca caratterizzata dalla globalizzazione, \u00e8 fondamentale proteggere le radici culturali dei territori e tutelare le diversit\u00e0 etnografiche. La creazione di contenuti tematici etnografico-territoriali tramite soluzioni innovative contribuisce alla valorizzazione del patrimonio culturale e alla promozione turistica sostenibile.<\/p>\n\n\n\n<p>Il progetto pone una forte enfasi sul coinvolgimento attivo delle comunit\u00e0 locali. Le persone interessate che vivono nelle aree coinvolte sono parte integrante del processo di raccolta di dati e informazioni, garantendo un approccio partecipativo e inclusivo. Le loro voci, storie e testimonianze abilitano la creazione di contenuti contestuali, autentici e rappresentativi. A questo riguardo, cerchiamo il coinvolgimento di organizzazioni che operino nelle case di riposo, per il recupero di contenuti dalla memoria di diretti protagonisti e anziani che abbiano storie da raccontare. Questo materiale, o meglio la sua rielaborazione, sar\u00e0 impiegata nel processo di restituzione, sotto forma di contenuti orchestrati prodotti dai modelli generativi.<\/p>\n\n\n\n<p>Gli obiettivi sono molteplici: tutela delle tradizioni, promozione turistica sostenibile, coinvolgimento innovativo delle comunit\u00e0. Si vuole creare un ponte tra il passato e il futuro, utilizzando la tecnologia per raccogliere, preservare e diffondere le &#8220;voci&#8221; delle tradizioni locali tramite il &#8220;vento&#8221; digitale.<\/p>\n\n\n\n<p>L&#8217;analisi e l&#8217;esplorazione delle fonti disponibili, soprattutto gi\u00e0 in qualche modo digitalizzate \u00e8 stata una delle prime attivit\u00e0 intraprese. In merito abbiamo studiato la estrazione dati da una importante opera romagnola, il <a href=\"https:\/\/vocinelvento.it\/?page_id=198\" data-type=\"page\" data-id=\"198\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">vocabolario di Libero Ercolani<\/mark><\/strong><\/a>, del 1977.<\/p>\n\n\n\n<p>I componenti principali delle infrastrutture in corso di sviluppo per il progetto sono:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Questo sito (<a href=\"http:\/\/www.vocinelvento.it\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">www.vocinelvento.it<\/mark><\/strong><\/a>) che descrive l&#8217;iniziativa<br><\/li>\n\n\n\n<li>Il portale di contribuzione (<a href=\"https:\/\/portal.vocinelvento.it\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">portal.vocinelvento.it<\/mark><\/strong><\/a>) in cui si possono caricare registrazioni audio\/video, immagini, testi, componimenti e poesie inerenti ai territori e alle tradizioni della romagna. Il portale consente contribuzioni a seguito di registrazione. I contributori possono autorizzare o meno la pubblicazione di quanto inviato. Il materiale raccolto andr\u00e0 ad arricchire la disponibilit\u00e0 di materiali digitali relativi alla romagna, e potr\u00e0 essere utilizzato per il training dei modelli di artificial intelligence, aumentando le funzionalit\u00e0 generative disponibili.<br><\/li>\n\n\n\n<li>Il sistema di <em>web-scraping<\/em>. Si tratta di un software che periodicamente esplora il web alla ricerca di materiali inerenti alla romagna, ricercando i nomi dei nostri paesi, e recuperando immagini, documenti, filmati utilizzando una selezione di query di ricerca. I dati raccolti sono archiviati in copia singola, concorrono a produrre playlist, e arricchiscono la base dati utilizzata per il training.<br><\/li>\n\n\n\n<li>Il <em>ful\u00e8sta<\/em> (o <a href=\"https:\/\/en.wikipedia.org\/wiki\/Robert_Louis_Stevenson\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">tusitala<\/mark><\/strong><\/a>): generatore di storie. E&#8217; un software linguistico che compone semplici storie utilizzando le parti del discorso e le parole del dialetto romagnolo, impiegante liste di termini in forme prestrutturate. Le strutture generate, inzialmente semplici, possono essere complessificate tramite modelli di arricchimento e contestualizzazione. <br><\/li>\n\n\n\n<li>Il sistema di <em>text processing<\/em>. I testi raccolti dal web-scraper e dalle fonti disponibili online pubblicamente accessibili pi\u00f9 autorevoli e curate concorrono a costruire dei dizionari di parole dialettali romagnole. Al momento stiamo lavorando con 3 distinti dizionari: ravennate-forlivese, cesenate, santarcangiolese-savignanese, date le fonti che al momento siamo riusciti a reperire.<br><\/li>\n\n\n\n<li>Il sistema di POS (<em>Parts of Speech<\/em>) labeling. Nella analisi di una frase, questo strumento consente di attribuire a ciascuna parola il suo ruolo. Ad esempio un sostantivo pu\u00f2 essere il soggetto e un pronome pu\u00f2 essere l&#8217;oggetto. Il verbo va etichettato in base alla sua forma, al tempo e al modo. <a href=\"https:\/\/vocinelvento.it\/?page_id=183\" data-type=\"page\" data-id=\"183\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">Vogliamo che il lavoro che svolgiamo sia riutilizzabile da altri<\/mark><\/strong><\/a>, e stiamo studiando l&#8217;adozione di un tool di tagging gi\u00e0 esistente, ma ne esistono tanti, e con vari gradi di funzionalit\u00e0. (help!). <br><\/li>\n\n\n\n<li>Il <em>tokenizer<\/em>. Questo \u00e8 un componente chiave per la messa a punto di un modello linguistico. Il problema \u00e8 che per una lingua con moderate fonti scritte disponibili (e per giunta poco standardizzate come ortografia) la realizzazione di questo componente from-scratch non \u00e8 semplice.<br>&#8211; abbiamo deciso di utilizzare la libreria <a href=\"https:\/\/spacy.io\/\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">spaCy<\/mark><\/strong><\/a><br>&#8211; ci serve supporto tecnico linguistico\/fonetico, per l&#8217;isolamento dei fonemi e per l&#8217;algoritmo di sillabazione (help!)<br><\/li>\n\n\n\n<li>Il <em>generatore di immagini<\/em>. Un modello generativo addestrato con le immagini dei luoghi recuperate dallo scraper genera immagini originali che hanno affinit\u00e0 con i nostri luoghi e i nostri monumenti. Il modulo base generer\u00e0 contestualizzazioni grafiche di tipo fotorealistico, architettonicamente e geotopograficamente famigliari con i luoghi romagnoli. Contiamo anche di realizzare uno specifico modulo del generatore di immagini potr\u00e0 specificamente generare disegni da colorare, contestualizzati su temi, arredi e oggetti della cultura romagnola, da utilizzarsi in famiglia e a scuola, ma sopratutto nell&#8217;interazione tra nipoti e nonni.<br><\/li>\n\n\n\n<li>Il <em>sistema di analisi audio<\/em>. A partire da letture vocali di testi noti preanalizzati a livello fonetico, si potr\u00e0 costituire un catalogo fonetico che consenta poi di generare vocalizzazioni corrispondenti ai fonemi osservati e classificati. Sulla base di un campionario di registrazioni di testi noti e annotati sufficientemente rilevante il software potr\u00e0 parlare, leggendo frasi nuove, e generando corrispondenti trascrizioni fonetiche che potranno essere sottoposte a revisione e correzione, in un processo iterativo che progressivamente aumenter\u00e0 la qualit\u00e0 del parlato sintetizzato.<br><\/li>\n\n\n\n<li>Diversi modelli AI:<br>&#8211; per la generazione di immagini: modello base <a href=\"https:\/\/stability.ai\/\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">stable diffusion<\/mark><\/strong><\/a> con componenti architettoniche, arricchito con layer <a href=\"https:\/\/arxiv.org\/pdf\/2106.09685\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">LoRA <\/mark><\/strong><\/a>(Low Rank Adaptation) da noi addestrato<br>&#8211; per le funzioni OCR volte all&#8217;acquisizione di fonti storiche da libri e dizionari: modello <a href=\"https:\/\/en.wikipedia.org\/wiki\/Long_short-term_memory\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">LSTM <\/mark><\/strong><\/a>addestrato su font <a href=\"http:\/\/www.identifont.com\/find?similar=Excelsior&amp;q=Go\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">Excelsior <\/mark><\/strong><\/a>del dizionario Libero Ercolani per uso con <a href=\"https:\/\/tesseract-ocr.github.io\/\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">tesseract <\/mark><\/strong><\/a>engine (in corso di sviluppo).<br>&#8211; per le componenti linguistiche generative: modello <a href=\"https:\/\/spacy.io\/\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">spaCy <\/mark><\/strong><\/a>per il sentence classifier differenziale (italiano\/tedesco\/inglese) con base dati proveniente da univ tedesca di <a href=\"https:\/\/corpora.uni-leipzig.de\/en\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">Leipzig<\/mark><\/strong><\/a>, oltre a un modello statistico da noi sviluppato (bag of words), in progressivo arricchimento.<br>&#8211; per le componenti linguistiche generative: modello ancora da individuare, probabilmente svilupperemo un LoRA on top di un modello generico multilingua open source, che utilizzi lo stesso tokenizer selezionato<br>&#8211; per la sintesi TTS (Text to speech): libreria <a href=\"https:\/\/github.com\/rhasspy\/piper\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">PIPER<\/mark><\/strong><\/a>, attrezzata con modello fonematico classico, e con componenti neurali, orientato a funzionalit\u00e0 base.<br>&#8211; per l&#8217;analisi fonetica da registrazioni audio: modello da identificare e selezionare: verosimilmente un modello adatto a Low-Resource-Languages (vedi <a href=\"https:\/\/www.keyreply.com\/blog\/conversational-ai-low-resource-languages\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">risorsa documentale<\/mark><\/strong><\/a>)<br><\/li>\n<\/ol>\n\n\n\n<p class=\"has-text-align-center\">&#8211;<\/p>\n\n\n\n<p><strong>Usare la AI per conservazione della cultura e della lingua<\/strong><\/p>\n\n\n\n<p>Gli strumenti dell&#8217;informatica e dell&#8217;intelligenza artificiale possano supportare nella conservazione e storicizzazione della cultura locale, per poi auspicabilmente rielabolarla in forme nuove sintetizzando contenuti che possano preservare -a tempo indefinito- in una qualche forma <em>certamente non ottimale<\/em>, ma in qualche modo vitale le tracce e le testimonianze che ancora possiamo raccogliere.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p>L&#8217;intelligenza artificiale \u00e8 complicata ed \u00e8 percepita come invasiva e aliena. Ma \u00e8 fondamentale strumento per evolvere libri tradizionali, saperi e competenze antiche altrimenti destinate a inesorabile oblio. <\/p>\n\n\n\n<p>E&#8217; una nuova forma di vita bambina, che sta crescendo, che ha bisogno di imparare e ha bisogno di spessore e saggezza, che possono venire solo da fonti sufficientemente profonde e antiche.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p>(Contenuti in corso di preparazione)<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p><\/p>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Il progetto, finanziato dalla regione Emilia Romagna, propone la generazione computazionalmente assistita di contenuti per preservare e promuovere il ricco patrimonio di identit\u00e0 culturali e tradizioni locali. In un&#8217;epoca caratterizzata dalla globalizzazione, \u00e8 fondamentale proteggere le radici culturali dei territori e tutelare le diversit\u00e0 etnografiche. La creazione di contenuti tematici etnografico-territoriali tramite soluzioni innovative contribuisce [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-139","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/vocinelvento.it\/index.php?rest_route=\/wp\/v2\/pages\/139","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/vocinelvento.it\/index.php?rest_route=\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/vocinelvento.it\/index.php?rest_route=\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/vocinelvento.it\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/vocinelvento.it\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=139"}],"version-history":[{"count":30,"href":"https:\/\/vocinelvento.it\/index.php?rest_route=\/wp\/v2\/pages\/139\/revisions"}],"predecessor-version":[{"id":385,"href":"https:\/\/vocinelvento.it\/index.php?rest_route=\/wp\/v2\/pages\/139\/revisions\/385"}],"wp:attachment":[{"href":"https:\/\/vocinelvento.it\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=139"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}