{"id":183,"date":"2024-06-25T09:40:52","date_gmt":"2024-06-25T09:40:52","guid":{"rendered":"https:\/\/vocinelvento.it\/?page_id=183"},"modified":"2024-10-01T15:33:02","modified_gmt":"2024-10-01T15:33:02","slug":"approccio-linguistico","status":"publish","type":"page","link":"https:\/\/vocinelvento.it\/?page_id=183","title":{"rendered":"Approccio linguistico"},"content":{"rendered":"\n<p>Nella definizione dei moduli operativi per la analisi delle fonti, abbiamo deciso di adottare metodologie per quanto possibili standard e aperte, che impieghino gli strumenti della moderna <a href=\"https:\/\/en.wikipedia.org\/wiki\/Computational_linguistics\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">linguistica computazionale<\/mark><\/strong><\/a>.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p>Esito di questo approccio potr\u00e0 essere una migliore evoluzione, sulla base dell&#8217;aggiornamento dei componenti costitutivi, nonch\u00e8 migliore scalabilit\u00e0, e possibilit\u00e0 di <em>porting <\/em>su altri contesti linguistici minoritari di cui l&#8217;italia \u00e8 particolarmente ricca.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p>Un percorso per quanto possibile standardizzato e coerente con le ricerche accademiche si basa su solide basi scientifiche, e consente di fruire del lavoro compiuto da altri in attivit\u00e0 di classificazione linguistica, sedimentando materiale linguistico standardizzato che aumenta il <em>digital language support rating<\/em> per la lingua romagnola, (&#8220;<a href=\"https:\/\/iso639-3.sil.org\/code\/rgn\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">rgn<\/mark><\/strong><\/a>&#8221; nel sistema di classificazione ISO 639-3), al momento classificato come &#8220;emerging&#8221;.<\/p>\n\n\n\n<p>Il Romagnol [rgn] \u00e8 una lingua riconducibile alla famiglia delle lingue indoeuropee, secondo la seguente gerarchia<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">Indo-European<br>  Italic<br>    Latino-Faliscan<br>      Romance<br>        Italo-Western<br>          Western Romance<br>            Gallo-Romance<br>              Gallo-Italic<br>                Emilian\u2013Romagnol<br>                  Romagnol<\/pre>\n\n\n\n<p> In merito alle classificazioni linguistiche, si vedano anche:<\/p>\n\n\n\n<p>la <strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">pagina relativa alla lingua romagnola di Ethnologue<\/mark><\/strong>, languages of the world, <\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>la pagina <mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\"><strong>Romagnol di glottolog roma1328<\/strong><\/mark>  <\/li>\n\n\n\n<li>la <strong><a href=\"https:\/\/en.wikipedia.org\/wiki\/Romagnol\"><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">pagina di wikipedia<\/mark><\/a><\/strong><\/li>\n\n\n\n<li>la pagina <a href=\"https:\/\/lexibank.clld.org\/languages\/saenkoromance-ravennateromagnol\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">lexibank<\/mark><\/strong><\/a> che contiene anche una serie di termini con le relative espressioni fonetiche in IPA, tratte dalla <a href=\"https:\/\/github.com\/lexibank\/saenkoromance\/releases\/tag\/v1.1\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">classificazione di Mikhail Saenko (2015)<\/mark><\/strong><\/a> <a href=\"https:\/\/doi.org\/10.5281\/zenodo.13163492\"><img decoding=\"async\" src=\"https:\/\/camo.githubusercontent.com\/48a513ffe399d39b9e019afdb299f3abd45f281016c448ddd364c8d8e948ba26\/68747470733a2f2f7a656e6f646f2e6f72672f62616467652f444f492f31302e353238312f7a656e6f646f2e31333136333439322e737667\" alt=\"DOI\"><\/a> (per le rappresentazioni dei caratteri IPA, pu\u00f2 essere utile installare il font DOULOS SIL o il font CHARIS SIL)<\/li>\n\n\n\n<li><\/li>\n<\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"835\" src=\"https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/rgn-endangered-language-1024x835.png\" alt=\"\" class=\"wp-image-193\" srcset=\"https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/rgn-endangered-language-1024x835.png 1024w, https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/rgn-endangered-language-300x244.png 300w, https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/rgn-endangered-language-768x626.png 768w, https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/rgn-endangered-language-1536x1252.png 1536w, https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/rgn-endangered-language.png 1951w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p><\/p>\n\n\n\n<p>Tra gli approcci di riferimento adottati vi \u00e8 quello del dipartimento di linguistica dell&#8217;universit\u00e0 tedesca di Leipzig, che mantiene una <a href=\"https:\/\/www.wortschatz.uni-leipzig.de\/en\/download\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">corpora collection<\/mark> <\/strong><\/a>di testi in oltre 200 lingue, con liste di parole, identificativi POS (parts of speech), e classificazioni con i relativi identificatori universali (UD17 pos tags), come definiti in <a href=\"https:\/\/universaldependencies.org\/\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">universaldependencies.org<\/mark><\/strong><\/a><\/p>\n\n\n\n<p>Abbiamo considerato di utilizzare quanto disponibile su <a href=\"https:\/\/www.corpusitaliano.it\/\"><strong><mark style=\"background-color:rgba(0, 0, 0, 0);color:#8e3510\" class=\"has-inline-color\">corpusitaliano.it<\/mark><\/strong><\/a> ma questo progetto appare non aggiornato dal 2012.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter size-large is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"734\" height=\"1024\" src=\"https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/pos_universaldependencies_org-734x1024.png\" alt=\"\" class=\"wp-image-184\" style=\"width:507px;height:auto\" srcset=\"https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/pos_universaldependencies_org-734x1024.png 734w, https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/pos_universaldependencies_org-215x300.png 215w, https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/pos_universaldependencies_org-768x1072.png 768w, https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/pos_universaldependencies_org.png 837w\" sizes=\"auto, (max-width: 734px) 100vw, 734px\" \/><\/figure>\n\n\n\n<p><\/p>\n\n\n\n<p>Al termine del nostro lavoro, vorremmo contribuire i risultati a questi e ad altri repository globali, per aumentare il materiale disponibile, e consentire approfondimenti e ulteriori sviluppi dell&#8217;analisi linguistica da parte di altri studiosi.<\/p>\n\n\n\n<p>Il lavoro da svolgere consiste nel classificazione delle parti del discorso nelle frasi in lingua romagnola. Per questo stiamo sviluppando strumenti di labeling, basati su linguaggio python.<\/p>\n\n\n\n<p>Le componenti gi\u00e0 etichettate e classificate, vengono apprese, e si procede in via progressiva e incrementale.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p>La seguente immagine illustra il modello dati che adottiamo, sulla base dello standard dell&#8217;univ. di Leipzig.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"692\" src=\"https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/leipzig_tables-1024x692.png\" alt=\"\" class=\"wp-image-195\" srcset=\"https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/leipzig_tables-1024x692.png 1024w, https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/leipzig_tables-300x203.png 300w, https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/leipzig_tables-768x519.png 768w, https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/leipzig_tables-1536x1038.png 1536w, https:\/\/vocinelvento.it\/wp-content\/uploads\/2024\/06\/leipzig_tables-2048x1385.png 2048w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p><\/p>\n\n\n\n<p><\/p>\n\n\n\n<p>( pagina in corso di lavorazione )<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Nella definizione dei moduli operativi per la analisi delle fonti, abbiamo deciso di adottare metodologie per quanto possibili standard e aperte, che impieghino gli strumenti della moderna linguistica computazionale. Esito di questo approccio potr\u00e0 essere una migliore evoluzione, sulla base dell&#8217;aggiornamento dei componenti costitutivi, nonch\u00e8 migliore scalabilit\u00e0, e possibilit\u00e0 di porting su altri contesti linguistici [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-183","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/vocinelvento.it\/index.php?rest_route=\/wp\/v2\/pages\/183","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/vocinelvento.it\/index.php?rest_route=\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/vocinelvento.it\/index.php?rest_route=\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/vocinelvento.it\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/vocinelvento.it\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=183"}],"version-history":[{"count":14,"href":"https:\/\/vocinelvento.it\/index.php?rest_route=\/wp\/v2\/pages\/183\/revisions"}],"predecessor-version":[{"id":366,"href":"https:\/\/vocinelvento.it\/index.php?rest_route=\/wp\/v2\/pages\/183\/revisions\/366"}],"wp:attachment":[{"href":"https:\/\/vocinelvento.it\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=183"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}