Voix
Voix
Voix
Master ATAL
Marie Tahon
MCF, dpt. Informatique
6 novembre 2017
1 Production de la parole
1 Production de la parole
Anatomie
Vibration des cordes vocales
Les résonateurs
Hall
Le relâchement du diaphragme entraîne une expulsion de l’air
(expiration passive), éventuellement aidé par les muscles
expirateurs (expiration forcée).
La forte pression sous les cordes vocales les forcent à s’ouvrir.
L’air en passant crée une force de Bernoulli (augmentation de
la vitesse et baisse de la pression) qui ferme les cordes vocales
Et ainsi de suite, un train de bouffées d’air est envoyé dans le
conduit vocal.
8 / 43 Master ATAL, Traitement de la parole
La fermeture est par convention représentée par la montée positive de gran-
VIBRATION
de amplitude DES CORDES
de la courbe, VOCALES
l’ouverture complète correspond à une intensité
minima et une amplitude nulle (fig. 28, 29).
FIGURE 28 :
Courbes d’ELG
ion graphique
urbe d’onde et
dance avec les
emps du cycle
près Lecluse).
La courbe d’ELG sera faite sur une voyelle tenue dans les mécanismes 1 et 2.
Visualisation
A partir de de lacourbe,
cette vibration descalculer
on peut cordes vocales fondamentale
la fréquence et débit d’air
de laentre
les cordes vocales associé.
voix (inverse de la période).
9 / 43 Master ATAL, Traitement de la parole
VIBRATION DES CORDES VOCALES
Contrairement aux "anches faibles" (trompette, clarinette), les
cordes vocales imposent leur fréquence de vibration et le
conduit vocal ne les influence pas: "anche forte"
Au niveau du larynx, il se produit alors un son de fréquence
fondamentale celle de vibration des cordes vocales qui est
contrôlé uniquement par les muscles du larynx.
Wolfe et al.
L’observation du mouvement des cordes vocales en phonation a débuté à la fin du 19ème siècle
avecMéthodes invasives
l’invention, par M Garcia, du Laryngosope à miroir. (1850). Ce petit miroir, que l’on
place au fond de la gorge, permet
Laryngoscopie d’observer
à miroir (1850)les cordes vocales. Les méthodes se sont ensuite
perfectionnées et les années 80
Fibroscopie souple (1980) ont été l’avènement de méthode de visualisation plus
modernes basées sur l’endoscopie rigide (on introduit une caméra dans la bouche du locuteur
ou duMéthodes
chanteur) ounonsurinvasives
l’endoscopie souple également appelée fibroscopie (on introduit un
endoscopeElectroglottographie
souple dans le nez du locuteur
EGG ou du chanteur).Pour visualiser le mouvement
périodique des cordes vocales plus en détail, on utilise des méthodes basée sur la stroboscopie
et la cinématographie ultrarapide.
Fig3 : Méthode de visualisation du mouvement des cordes vocales (Laryngoscope à miroir, fibroscopie)
[Heinrich]
L’avantage de la fibrosopie est de permettre la visualisation de toute sortes de phonation, en
particulier du chant. Au contraire, avec un endoscope rigide, on ne va pouvoir examiner que
certains types de phonation, en particulier seulement certaines voyelles qu’il est possible de
11 / 43produire avec la langue tirée vers l’extérieur. L’endoscopie
Master ATAL,
rigide Traitement de la
est très invasive parole
mais fait
qui traverse la glotte au cours du temps.
Cependant, cette hypothèse forte n’est pas toujours valide dans certains cas. C’est pourquoi il
ETUDE DES ORGANES PHONATOIRES
est intéressant de trouver des méthodes à la fois non invasives, indirectes mais surtout qui ne
se basent pas sur des modèles, c’est à dire qu’elles ne se basent sure aucune hypothèse
préalable quant au mouvement des cordes vocales.
Méthodes invasives
L’Electroglottographie en est une. Elle permet en effet d’avoir accès au contact entre les
Laryngoscopie à miroir (1850)
cordes vocales sans émettre d’hypothèse.
Le principe est le suivant : Deux électrodes sont attachées sur le cou du chanteur de part et
Fibroscopie souple (1980)
d’autre de la glotte. Elles mesurent une différence de potentiel reliée à la résistance que le
courant reçoit lorsqu’il traverse l’espace entre ces deux électrodes. Si la glotte est fermée, le
Méthodes non invasives
courant va très facilement passer d’une électrode à l’autre. Le signal Egg va donc être très
élevé. Quand la glotte est ouverte, le signal est plus faible, car le courant a plus de difficulté à
Electroglottographie EGG
passer d’une électrode à l’autre.
FERMETURE
EGG
3) Analyse et applications du signal Electroglottographique
Ce signal Egg est très intéressant car il nous permet T0 d’avoir une mesure directe du contact
OUVERTUR
entre les cordes vocales. Le contact correspond au sommet de la courbe verte de la E figure 5,
l’ouverture au contraire au bas de la courbe. On peut également s’intéresser à la dérivée de ce
signal (en bleu), qui permet plutôt de mettre en avantOq desTphénomènes
0 de variations rapides de
contact, en particulier à la fermeture ou à l’ouverture. Ces variations rapides sont repérées par
DEGG
des pics très marqués de ce signal dérivé du signal Egg. Les pics « positifs » très marqués
vont être reliés aux instants de fermeture glottique, c’est à dire les instants où le débit va
commencer à diminuer jusqu’à s’annuler. Les pics « négatifs » moins marqués sont reliés aux
11 / 43 instants d’ouverture glottique,
Fig 8 : Définition duc’est à dire
quotient les instants
ouvert par rapport
Master
où àleladébit vadu
période
ATAL, Traitement
commencer
signal Degg àets’accélérer
de la parole
aux instants d’ouverture
RESONATEURS
Le son source émis par la vibration des cordes vocales va être
modulé par
Le pharynx,
Les cavités nasales,
La cavité buccale,
Les lèvres, les dents et la langue.
Source
Débit d’air Son émis
Pression acoustique
Modélisation
acoustique /a/
Profils réels
/i/ /u/
/e/ /o/
A: /a/
B: /i/
C: /u/
1 Production de la parole
FERMETURE
EGG
T0 OUVERTUR
E
DEGG
Oq T0 pression acoustique
Fig 8 : Définition du quotient ouvert par rapport à la période du signal Degg et aux instants d’ouverture
et de fermeture glottique.
signal électrique
Nous avons fait des mesures en voix chantée, en particulier sur des glissandos. Ci-dessous est
représenté un glissando chanté par un ténor.
∞
X
xe (t) = x (t)δ(t − kTe ) ∞
X
k=−∞ xq (t) = xq (kTe )
∞
X k=−∞
= x (kTe ) ∞
X
k=−∞ = i(k)q
k=−∞
Te période d’échantillonage
δ(t) fonction Dirac q pas de quantification
k∈N i ∈Z
19 / 43 Master ATAL, Traitement de la parole
TRANSFORMÉE DE FOURRIER
Décomposition en série de Fourrier:
1
Tout signal de période T0 = peut se décomposer en une somme
f0
de fonctions sinusoïdales de fréquences fn = nf0 multiples de la
fréquence fondamentale:
+∞
X
x (t) = a0 + (an cos(2πnf0 t) + bn sin(2πnf0 t)) (1)
n=1
1 +∞X n
Xe (f ) = X (f − ) (5)
Te n=−∞ Te
Périodisation du spectre:
Phénomène de recouvrement:
1 P+∞ 1
Xe (f ) = n=−∞
X (f − Tn ) Si B > ⇒ recouvrement.
Te e 2T
haut: spectre en amplitude d’un signal continu
x (t)
Théorème de Shannon:
bas: spectre du signal échantillonné xe (t) à la
Fe > 2B
période T (B = Fmax )
En pratique: on utilise un filtre passe-bas pour supprimer les
fréquences telles que f > F2e avant l’échantillonage.
Un compromis entre:
durée de la fenêtre d’analyse ∆T × ∆f = cte (large bande ou bande étroite)
le type de fenêtre (rectangulaire, Hanning, Haming, etc...)
1 Production de la parole
Exemple du /k/:
extinction du son puis,
impulsion contenant une large bande de fréquence.
signal apériodique (pas de fréquence fondamentale !!)
Exemple du /S/:
signal stationnaire contenant une large bande de fréquence
/S/ très large bande, /s/ bande hautes fréquences
signal apériodique (pas de fréquence fondamentale !!)
Trémor
F, nasale
H, sourde
H, claire
[Farner]
[Sundberg]
[Henrique]
Rire:
Triste,
joyeuse,
agaçée.