SINTESA

SINTESA

CARATTERI E STRUTTURE FONETICHE, FONOLOGICHE E PROSODICHE DELLA LINGUA SARDA. IL SINTETIZZATORE VOCALE SINTESA.

A cura di Riccardo Mura e Maurizio Virdis

Condaghes Edizioni, Cagliari, 2015  –  ISBN 978-88-7356-271-9

Il Libro

SINTESA-1

Indice

Presentazione 7
Il progetto 7
Sa chirca (Francesco Cheratzu) 9
Introduzione. Fonetica e fonematica della lingua sarda (Maurizio Virdis) 13
1. Premessa metodologica (Riccardo Mura) 31
1.1. Quale sardo 31
1.2. Le fasi operative e la metodologia della ricerca 33
1.3. L’ambiente di sviluppo informatico (Massimo Cireddu) 35
2. Foni, fonemi e sillabe (Riccardo Mura) 39
2.1. Vocali 42
2.2. Adeguamento vocalico 48
2.3. Durata dei vocoidi 56
2.4. Consonanti 62 2.5.
Durata dei contoidi 70
2.6. Strutture sillabiche 79
2.7. La trascrizione fonetica per SINTESA 85
2.8. Implementazione informatica (Massimo Cireddu) 88
3. Trascrizione delle parole (Riccardo Mura) 97
3.1. Problemi nella trascrizione fonetica in IPA 98
3.2. Un esempio di fonodizionario sardo 103
3.3. Problemi nella trascrizione fonetica per SINTESA 109
3.4. Un estratto del fonodizionario per SINTESA 116
4. Fonetica sintattica (Riccardo Mura) 123
4.1. Consonanti finali 123
4.2. Consonanti iniziali 133
4.3. Geminazione sintagmatica delle consonanti 138
4.4. Altri fenomeni fonosintattici 145
4.5. Implementazione informatica (Massimo Cireddu) 150
5. Accento e intonazione (Riccardo Mura) 169
5.1. Ritmo e accentazione 170
5.2. La scansione ritmica delle frasi in SINTESA 173
5.3. Intonazione 178
5.4. I modelli intonativi per SINTESA 193
5.5. Implementazione informatica (Massimo Cireddu) 201
6. Collaudo del prototipo (Daniela Boeddu) 215
6.1. Prima fase: pronuncia di parole non indicizzate 215
6.2. Seconda fase: pronuncia di parole indicizzate 217
6.3. Terza fase: pronuncia di frasi indicizzate 222
6.4. Quarta fase: pronuncia di frasi non indicizzate 224
6.5. Quinta fase: retest 227
6.6. Problemi risolti 228
6.7. Problemi noti 229
7. Possibili sviluppi e utilizzi (Roberto Bolognesi) 233
Bibliografia e sitografia 237

Presentazione

di Francersco Cheratzu

IL PROGETTO

I sistemi di sintesi vocale (meglio noti nel settore con l’espressione inglese Text-to-Speech systems, da cui l’acronimo tts) sono delle applicazioni informatiche che riproducono il linguaggio umano a partire da un testo scritto.
Dai primi sintetizzatori elettronici degli anni Sessanta, i sistemi tts
sono notevolmente migliorati e hanno ormai raggiunto un buon livello di verosimiglianza e comprensibilità, anche grazie alla sperimentazione di diverse metodologie di analisi, acquisizione, concatenamento e riproduzione della voce umana.
Attualmente, con l’esponenziale progresso e diffusione dei sistemi
informatici, le applicazioni di sintesi vocale hanno acquisito un’importanza strategica e cominciano a essere utilizzate da un numero sempre maggiore di persone. Basti pensare alle comunicazioni di servizio nel sistema dei trasporti, ai risponditori automatici dei centri di assistenza e ai servizi informativi degli operatori telefonici, ai navigatori gps, ai videogiochi interattivi, ai sintetizzatori musicali, ai siti web e a tutte le applicazioni che consentono di ascoltare un testo (un bollettino, un articolo di giornale, un libro…). Questi sistemi sono poi di grande utilità per le persone ipovedenti, per chi ha difficoltà alla lettura (analfabeti, dislessici, bambini in età prescolare) e per chi è affetto da varie disfunzionalità dell’apparato fonatorio. Inoltre, i sintetizzatori vocali costituiscono la base d’implementazione dei sistemi di riconoscimento vocale, con i quali possono essere integrati per creare sistemi complessi di comunicazione uomo-macchina o tra persone con disfunzionalità comunicative (uomo-macchina-uomo). Combinando un sistema di riconoscimento vocale con un traduttore automatico e un sintetizzatore vocale si realizza un interprete automatico utile per effettuare conferenze, in presenza o a distanza, tra persone di lingue diverse. 

Sa chirca
Su progetu de chirca de base “Caratteri e strutture fonetiche, fonologiche
e prosodiche della lingua sarda” de s’Universidade de Casteddu est unu traballu innovativu meda pro sa limba sarda e ponet impare, fortzes pro sa prima borta in Sardigna, diversas disciplinas linguìsticas e informàticas.
Su fatòrgiu s’est isvilupadu in duos annos – dae su 2013 a su 2015 – e at impignadu, a tìtulu diferente, una deghina de persones. Su risultadu
prus figurosu est chi, pro sa prima borta, unu computer podet faeddare
in sardu partende dae s’iscritura, fintzas si est unu protòtipu. Pro dda
nàrrere in un’àtera manera, como su sardu tenet unu sintetizadore vocale TTS (Text To Speech, est a nàrrere ‘dae su testu a s’allega’) isperimentale chi amus numenadu sintesa (sintetizadore de sa limba sarda). Si podet bìdere, e intèndere, in su giassuhttp://www.sintesa.eu.
Custu no est unu risultadu de pagu contu, ca non sunt meda sas limbas
in su mundu chi tenent ainas de custa genia. Segundu Ethnologue (www.
ethnologue.com), sas limbas classificadas in su mundu sunt prus de sete
mìgia. Sas limbas suportadas cun sintetizadores in sos smartphones sunt
pagu prus o mancu una barantina. Ddo’at però una sèrie de sintetizadores isperimentales e contende cussos mentovados in Wikipedia (in sa pàgina https://en.wikipedia.org/wiki/Comparison_of_speech_synthesizersarribamus a chimbantaghimbe limbas (non semus contende sas variantes de sas limbas prus ispartzinadas in su mundu che a s’inglesu, s’ispagnolu, su portoghesu o su frantzesu). Si abarramus largos e ponimus setanta, podimus afirmare tando chi su sardu faghet parte de s’unu pro chentu de sas limbas de su mundu chi tenent unu sintetizadore vocale.
Amus naradu chi custu est su risultadu prus figurosu, ma ddo’at unu risultadu prus mannu meda chi abarrat “cuadu”: est totu su traballude chirca chi at permìtidu de fabbricare su programma e chi est ispricadu in sos capìtulos chi sighint. Su computer est una màchina complicada meda, ma est semper unu “eletrodomèsticu” chi depet tènnere istrutziones pro funtzionare. Sas istrutziones cherent codificadasin programmas rispetende règulas pretzisas. E custas règulas cherent istudiadas e iscritas in manera unìvoca. Fintzas a immoe, nemos aiat aguantadu un’istùdiu de sa fonètica sarda in unu modu gasi sistemàticu: pro iscrìere sas règulas chi permitint a una màchina de “chistionare” in una limba, sos fenòmenos fonèticos, fonològicos e prosòdicos de cussa limba cherent abrancados in manera cumpleta si nono s’efetu finale no est atzetàbile. Naradu cun àteras paràulas, sa descritzione “bastante cumpleta” de sa limba depet èssere a intro de su computer pro ddi permìtere de furriare sos testos in sonos intellegìbiles e atzetàbiles dae una persone chi connoschet su sardu. Est craru chi su traballu no est perfetu, e no est mancu agabbadu, ca sas limbas sunt sistemas complicados, ma sas fundamentas pro andare a in antis sunt istadas postas. Su progetu est fintzas unu sinnale importante de rinnovamentu de sa linguìstica sarda chi istentat galu a atzetare metodologias innovativas. 

Continua  a Leggere

Introduzione. Fonetica e fonematica della lingua sarda.

di Maurizio Virdis

Il lavoro di ricerca e analisi fonetica relativo e finalizzato alla realizza-Il lavoro di ricerca e analisi fonetica relativo e finalizzato alla realizza-zione del progetto Caratteri e strutture fonetiche, fonologiche e prosodichedella lingua sarda – finanziato dal Dipartimento di Filologia Letteraturae Linguistica dell’Università degli Studi di Cagliari con i fondi dellaRegione Autonoma della Sardegna, Legge Regionale n° 7 del 7 agosto2007 sulla Promozione della ricerca scientifica e dell’innovazione tecnolo-gica in Sardegna – e mirante alla realizzazione del sintetizzatore vocaledella lingua sarda (Sintetizzatore Sardo, o Sintesa, come lo si è volutodenominare) ha portato in luce dati e fenomeni di rilevante impor-tanza nel campo della fonetica della lingua sarda, pur essendosi taleanalisi dovuta, forzatamente, limitare ai dati del parlato di due soliinformatori (M 55 anni e F 16 anni di Scano di Montiferro/Iscanu, OR),che hanno prestato la loro voce per le operazioni di sintesi vocale delsintetizzatore.Si è ora infatti in grado di dire, grazie al preciso e accurato lavo-ro analitico di Riccardo Mura, i cui risultati vengono presentati quidi seguito, qualcosa di più certo nei confronti della durata vocalicae sillabica in Sardo, e delle sue svariate e diversificate realizzazioninelle differenti situazioni contestuali; e inoltre delle diverse realizza-zioni delle consonanti – occlusive in primo luogo, ma non solo – e dellaloro durata: punto nevralgico e finora non pienamente indagato dellafonetica del Sardo. Ma pure si sono raccolti dati sul comportamentodelle vocali medie nei diversi contesti fonosintattici, sia dal punto divista articolatorio (metafonesi e fenomeni affini come dato unifican-te) che da quello della lunghezza. Tutto ciò in modo tale da avere unquadro più preciso dell’aspetto fonetico e fonemico della lingua sarda.Particolarmente innovativo è anche il lavoro sperimentale di analisi erappresentazione dei principali schemi ritmici e intonativi della lingua.Si è indagato inoltre sulla fonosintassi e sui fenomeni di variabilità aessa connessi, nonché sui rapporti, talvolta anche assai complessi, cheintercorrono fra il piano propriamente fonetico e quello fonemico del13Il sintetizzatore vocale SINTESASardo e la loro rappresentazione in una ortografia standardizzata, cheè quella della lsc (Limba Sarda Comuna), che qui si è scelto, e che almomento opera ancora entro un quadro provvisorio e sperimentale, eda meglio definire.Innanzitutto è da sottolineare la ricerca e i risultati analitici riguar-do le consonanti occlusive. Viene ribadita l’assenza di una opposizione /scempia/ ~ /geminata/: le occlusive non-sonore del Sardo risultano es-sere realizzate, da un punto di vista fonetico, come delle semi-geminatecon una lunghezza minore rispetto alle geminate dell’Italiano e ancherispetto alle geminate grafiche del Sardo (quelle cioè che hanno valoreoppositivo e sono rappresentate in grafia: ss, dd, ll, nn, mm). Questa oppo-sizione si verifica semmai nella serie sonora, dove le occlusive si oppon-gono alle approssimanti dello stesso punto di articolazione.Da un punto di vista diacronico, l’opposizione originaria latina /P,T, K/ ~ /PP, TT, KK/, ossia l’opposizione /-continua, -sonora, -lunga/~ /-continua, -sonora, +lunga/, si realizza come /-continua, -sonora/(che in contesto posvocalico si realizza come semi-geminata (semi-lun-ga)) ~ /+continua, +sonora/, vale a dire che si generano le seguentiopposizioni fonematiche: /p/ ~ /β/, /t/ ~ /δ/, /k/~ /ɣ/. Da un puntodi vista sistematico fonemico, a livello sincronico, abbiamo una dop-pia serie consonantica occlusiva (/-continua/): la serie /-sonora/ e laserie /+sonora/: /p, t, k/ e /b, d, ɡ/. Se la serie /-continua, +sonora/ha una corrispondente serie /+continua/, la serie /-continua, -sonora/non ha una serie corrispondente. In altre parole, se la serie delle occlu-sive sonore /b, d, ɡ/ si oppone alla serie delle approssimanti /+conti-nua, +sonora/ /β, δ, ɣ/, la serie occlusiva sorda /p, t, k/ non ha unacontropartita in una serie approssimante /+continua, -sonora/. Un si-stema che apparirebbe dissimmetrico. Sarebbe forse a questo punto ilcaso di fare una specificazione: in realtà potremmo considerare quelleche abbiamo fin qui chiamato approssimanti sonore /β, δ, ɣ/ come re-alizzazione fonetica delle sonore scempie /b, d, ɡ/, mentre quelle cheabbiamo fin qui chiamato occlusive sonore sarebbero delle occlusive(semi-)geminate /bb, dd, ɡɡ/ [bb, dd, ɡɡ]. In tal caso dovremmo dire al-lora che mentre per le sonore abbiamo una opposizione /scempia/ ~ /geminata/, per le non-sonore invece non abbiamo una tale opposizione,dandosi soltanto la serie /p, t, k/ foneticamente realizzata come serie[-sonora, semi-geminata]: [pp, tt, kk], senza che vi sia una corrispettivaserie non-sonora scempia [p, t, k]. Ma dell’opposizione /scempia/ ~ /geminata/ nella serie delle occlusive non-sonore, in Sardo, dovremo frabreve riparlare. Se in queste pagine introduttive ci atteniamo alla pri-14Introduzionema soluzione interpretativa qui proposta del sistema fonematico sardo,cioè a una opposizione /β, δ, ɣ/ ~ /b, d, ɡ/ ([+sonora, +continua] ~[+sonora, -continua]), piuttosto che alla seconda, cioè /b, d, ɡ/ ~ /bb,dd, ɡɡ/ (/+sonora, -lunga/ ~ /+sonora, semi-lunga/), ciò facciamo siaper ragioni di rispetto della tradizione degli studi di fonetica (storica)sarda, sia perché l’opposizione /scempia/ ~ /geminata/ è problematicain Sardo: più che di vere e proprie geminate si tratta di semi-geminate,come abbiamo visto e vedremo ancora. Va aggiunto peraltro che il ren-dimento dell’opposizione /β, δ, ɣ/ ~ /b, d, ɡ/ è in Sardo alquanto basso(prossimo allo zero), mentre più alto rendimento ha l’opposizione /p, t,k/ ~ /β, δ, ɣ/ che è l’esito, nella più gran parte delle parlate sarde, diuna originaria opposizione latina (e/o protoromanza) /pp, tt, kk/ ~ /p,t, k/, per fenomeno di lenizione, che porta le originarie occlusive non-sonore latine /p, t, k/ appunto ad approssimanti sonore /β, δ, ɣ/ (p. es.:ACETUM > [aˈɣeːδu], NEPOTEM > [nɛˈβɔːδɛ]).Tuttavia bisogna vedere le cose da un punto di vista dia-/sin-cro-nico (pan-cronico?), in termini non statici, bensì dinamici: vedere cioè,vicendevolmente, l’evoluzione diacronica dentro la struttura sincronicae, in pari tempo, considerare la sincronia proiettata sullo schermo delladiacronia.Innanzitutto dobbiamo ribadire che l’opposizione fra le consonantiocclusive sonore (foneticamente semi-geminate) e le corrispondenti con-tinue approssimanti sonore è di scarso rendimento: [bb] è in genere il ri-sultato evolutivo, nei dialetti centrosettentrionali, della occlusiva velola-biale sonora latina QṶ, o di imprestiti italiani che presentino la geminata[bb]; e anche [ɡɡ] proviene, per lo più, da imprestiti esogeni ([aɡɡɾaˈδaːɾɛ]‘gradire’, [a ɡɡ atˈtaːɾɛ] ‘schiacciare’). Anche [dd] è il risultato di impresti-ti italiani, o comunque esogeni, o converge, nel sistema sincronico sar-do sottostante, con la retroflessa [ɖɖ] senza che si registri in pratica, alivello fonemico, una opposizione /dd/ ~ /ɖɖ/ 1 , peraltro la tendenzaevolutiva odierna vede sempre più la realizzazione di [ɖɖ] come [dd],con perdita dell’articolazione postalveolare che diventa dentale, il che hacome effetto quello di far aumentare, a livello fonemico, il numero dellecoppie minime in cui si oppongono /dd/ ~ /δ/ (o a /d/, se si preferisce):/ˈbidda/ (‘villa, villaggio’) ~ /ˈbiδa/ (o /ˈbida/, se si vuole – cf. sopra –‘vita’, o anche ‘veduta’), /ˈsiddi/ (‘Siddi’, toponimo e antroponimo)~ /1) In sardo meridionale può trovarsi qualche coppia minima / dd / ~ / ɖɖ/ (ossia an-che /d/ ~ /ɖ/): /dus/ (dus, ‘due’) ~ /(ɖ)ɖus/ (dhus, ‘li’: pronome accusativo atono di3a plurale); /duspiˈɡaus/ (dus pigaus, ‘due presi/matti’) ~ /(ɖ)ɖuspiˈɡaus/ (dhus pigaus,‘li prendiamo’); /addiˈnai/ (a dinai, ‘a/con denaro’) ~ /aɖɖiˈnai/ (a dhi nai, ‘a dirgli’).15Il sintetizzatore vocale SINTESAˈsiδi/ (o /ˈsidi/, ‘sete’), /ˈnudda/ (‘nulla’) ~ /ˈnuδa/ (o /ˈnuda/, ‘nuda’), /ˈpudda/ (‘gallina’) ~ /ˈpuδa/ (o, anche qui, /ˈpuda/ ‘pota’).E non va dimenticato che le consonanti geminate sonore originarielatine in Sardo evolvono in (semi-)geminate non-sonore: ADDUCERE> [batˈtiːɾɛ] (sardo antico batuker); (PRO) QUID DEU > [ˈittɛ] (‘checosa(?)’) e [pɾoˈittɛ] (sardo antico [pɾoitˈteːu] (‘perché’(?)); FRIG(I)DU(> *FRIDDU) > [ˈfɾittu]; HABEAT > *HABBJAT (o forse *HABBUAT,forma analogica costruita sul perfetto HABUIT) > [ˈappa(t)]; it. abba-te > sardo antico [apˈpattɛ]. Ciò fa pensare a una distribuzione dellaforza sulle non-sonore e della lenità sulle sonore, testimoniata da moltipassaggi di occlusiva sonora in approssimante sonora: [abbudˈdaːɾɛ] →[aβudˈdaːɾɛ]; [sa d ˈ d omo] → [saˈdomo]; o magari anche [saɡˈɡaːna] →[saˈɣaːna] (sa gana, ‘la voglia’).Sistematica è invece l’opposizione /-continua, -sonora/ ~ /+con-tinua, +sonora/: si veda per esempio [ˈpikku] (‘piccone’) ~ [ˈpiːɣu](‘prendo’), [ˈkɔkka] (‘oca’) ~ [ˈkɔːɣa] (‘strega’), [ˈfatta] (‘fatta’) ~[ˈfaːδa] (‘fata’), [ˈmuttu] (‘forma strofica, canzonetta’) ~ [ˈmuːδu](‘muto’), [ˈkuppa] (‘(sostegno del) braciere’) ~ [ˈkuːβa] (‘botte’); e, inSardo meridionale, [skɾotʃˈtʃaːi] (‘scortecciare’) ~ [skɾoˈʒaːi] (‘scuoiare,sbucciare’). I foni approssimanti sonori qui sopra riportati provengonoda originarie consonanti latine (o anche antico italiane) occlusive non-sonore scempie in posizione intervocalica. Come è noto questo processodi indebolimento avviene, in Sardo, anche in fonosintassi, ossia al confinedi parola: [ˈpɛːna] (‘pena’) → [saˈβɛːna] (‘la pena’), [ˈtɛˑrˑɾa] (‘terra’) →[saˈδɛˑrˑɾa] (‘la terra’), [ˈkaːzu] (‘cacio, formaggio’) → [suˈɣaːzu] (‘il ca-cio, il formaggio’), [ˈteˑmˑpuzu] (‘tempo’) → [ˌpiˑɣoˈδeˑmˑpuzu] (‘prendotempo’), [pitˈsiˑnˑna] (‘ragazza’) → [ˌbɛllaβitˈsiˑnˑna] (‘bella ragazza’),[ˈkuˑsˑtu] (‘questo’) → [ˌtottuˈɣuˑsˑtu] (‘tutto questo’), [ˈtottu] (‘tutto’)→ [deˈδottu] (‘di tutto’); con effetti anche sulla morfologia, soprattut-to nell’opposizione indicativo presente 3 a singolare ~ imperativo: /ˈpappat ˈkasu/ [ˌpappakˈkaːzu] (‘(egli) mangia cacio’) ~ /ˈpappa ˈkasu/[ˌpappaˈɣaːzu] (‘mangia cacio (tu)’); nell’ind. pres. 3 a sing. la mancatalenizione dell’occlusiva sorda iniziale è ovviamente dovuta alla -T dellaoriginaria finale latina che rimane soggiacente (ammutolita in superfi-cie, ma non caduta nella struttura profonda): PAPPAT CASEUM control’imperativo PAPPA CASEUM (vedi anche, p. es., l’opposizione, qui solofonetica, AD TERRAM > [atˈtɛˑrˑɾa] (con -D latina anche qui ammu-tolita, ma presente in soggiacenza) contro DE TERRA → [dɛˈδɛˑrˑɾa]:secondo la regola per cui:(1) /-C # C-/ → [-CC-]16Introduzioneo meglio(1a) /-C 1 # C 2 -/ → [-C 2 C 2 -].Ossia, una consonante finale di parola si assimila alla consonanteimmediatamente successiva.Tale regola alterna, in Sardo, con la regola per cui:e2(a) /V C (-continua, -sonora) # C (-continua, -sonora) -/ →→ [V C (+continua, +sonora) V C (+continua, +sonora) -](2b) /V C (-continua, -sonora) # V-/ →→ [V C (+continua, +sonora) (V) V-]oppure anche(2c) /V C (-continua, -sonora) # V-/ → [VV].Ossia, una consonante occlusiva non-sonora in fine di parola si leniscee genera una vocale epitetica e la consonante successiva a inizio di parolasi lenisce anch’essa (2a); in particolare, la vocale epitetica insorge davantia pausa dovuta a esitazione o alla normale scansione ritmica dell’enuncia-to (cf. avanti § 4.1.2). Oppure, se la parola successiva inizia per vocale laconsonante finale si lenisce (2b) o, in certe realizzazioni, cade (2c): feno-meno, quest’ultimo (2c), secondo il quale la consonante finale (limitata-mente a questo contesto fonosintattico) vien meno anche in soggiacenza.

… Continua  a Leggere 

SINTESA-1IL PROGETTO (Sardegnacultura RAS)

Condaghes Edizioni, Cagliari, 2015  –  ISBN 978-88-7356-271-9

Annunci

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

w

Connessione a %s...

%d blogger hanno fatto clic su Mi Piace per questo: