Progetto

Il progetto Voci nel Vento (11/03/2024 – 31-10/2025) si propone lo studio di funzionalità innovative per il riconoscimento del dialetto romagnolo, con lo sviluppo di un sistema basato su tecnologie di intelligenza artificiale, in grado di riconoscere e generare contenuti contestuali, allo scopo essere utilizzato come strumento utile alla conservazione dell’identità culturale locale e alla promozione di iniziative turistica.

Il nucleo tecnologico del progetto consiste nell’utilizzo di tecnologie legate alla messa in opera e al successivo addestramento specifico di grandi modelli linguistici (LLM), cioè sistemi in grado di elaborare e generare il linguaggio naturale e quindi permettere la creazione automatica di contenuti.

La possibilità di ottenere questo risultato si basa sulle attività di selezioni preliminari di fonti nella lingua di destinazione, in questo caso il dialetto romagnolo, che necessita di diverse fasi di elaborazione per ottenere testi digitalizzati e poi successivamente utilizzarli per l’addestramento finalizzato (fine tuning) dei modelli linguistici.

La gestione delle fonti, la selezione dei contenuti, il loro trattamento e utilizzo a scopo di training, sono state una notevole sfida che ha coinvolto non solo aspetti tecnici legati all’informatica, ma alla linguistica, alla etnologia, allo studio dei caratteri e specificamente al trattamento dei caratteri speciali e dei segni diacritici, molto usati nei dialetti per rendere i suoni particolari spesso utilizzati nel parlato.

La sperimentazione ha riguardato sia il trattamento di fonti tratte da scritti da autori locali più o meno noti, sia già digitalizzati che in formato di stampa, poi processato per estrarne i contenuti, che l’utilizzo di testi specificamente scritti per il progetto per istruire il sistema, quindi sia in italiano che in romagnolo, per arricchire la base dati (dataset) per il training specifico.

Progetto finanziato dall’Unione Europea – Fondo Europeo di Sviluppo Regionale (FESR) e dalla Regione Emilia‑Romagna.