Les règles de la synthèse vocale
La fonction TTS (Text To Speech) intégrée à DMC, vous permet de créer vos messages vocaux à partir d’un texte lu par une voix de synthèse féminine.
ATTENTION : A savoir que le nombre maximum de caractères dans une diffusion en synthèse vocale sera de 2000 caractères.
Vous trouverez ci-dessous les règles d’utilisation du « Text To Speech ».
Il est possible de jouer avec la ponctuation, les sigles ou bien en utilisant des balises afin de spécifier certains comportements au moteur de synthèse vocale.
- La Ponctuation
La ponctuation joue un rôle capital dans la prosodie des messages générés. Chaque signe de ponctuation doit obligatoirement être suivi d’un espace.
Le tableau ci-dessous dresse la liste des signes de ponctuations interprétables par le système de TTS et précise leur influence au niveau de l’intonation.
- Les sigles
Il existe plusieurs méthodes pour l’écriture des sigles :
Ecriture en mode abc ou ABC Exemple : cnil ou CNIL sera prononcé : [ cnil ]
Ecriture en mode A B C ou A.B.C. Exemple : C N I L ou C.N.I.L. sera prononcé :
[ c (pause) n (pause) i(pause) l (pause) ]
- Dates et heures
19/08/14 sera prononcé : [ dix neuf août deux mille quatorze ]
12:29 sera prononcé : [ midi vingt neuf ]
12 h 29 sera prononcé [ douze heures vingt neuf ]
- L’écriture phonétique (\phone)
Afin d’obtenir le rendu souhaité, il est possible de forcer le moteur de synthèse vocale en lui fournissant le texte à synthétiser de manière phonétique. Ce résultat est possible de deux façons :
– Ecriture du texte tel qu’il se prononce (en ajoutant des accents ou en changeant l’orthographe du mot). Exemple : « Bienvenue chez Cégétel. »
– En utilisant la balise « \phone ». Celle-ci permet de spécifier le rendu souhaité d’un mot en décrivant sa prononciation via un alphabet phonétique.
Exemple : « Bienvenue chez \phone{s »ei »j »ei »t »ai »l »}. »
Le tableau suivant dresse la liste des 35 codes composant l’alphabet phonétique utilisable dans le système de TTS.
- L’insertion de pauses (\pause)
Il est possible de forcer l’insertion d’une pause dans un texte. La durée de cette pause peut être spécifiée en millisecondes, secondes ou en minutes.
Exemples :
« Bonjour \pause{1000ms} madame … »
« Bonjour \pause{1s} madame… »
« Bonjour \pause{1mn} madame … »
- Modification de la vitesse (\absspeed)
Il est possible de modifier la vitesse d’élocution de la voix, afin de l’augmenter ou d’abaisser le débit grâce à la balise « \speed ». La valeur du « Speed » peut être comprise en valeur absolue entre 30 (très lent) et 300 (très rapide).
L’utilisation de la valeur 100 permet de réinitialiser la vitesse à sa valeur nominale.
Exemple :
« Bonjour \absspeed{130} monsieur \absspeed{80} NAUDIN. »
- Modification du ton (abs\pitch)
Il est possible de modifier le ton de la voix, afin de l’augmenter ou de le baisser. Cela est possible grâce à la balise « \abspitch ». La valeur du « pitch » peut être comprise entre 50 (bas) et 150 (haut).
L’utilisation de la valeur 100 permet de réinitialiser le pitch à sa valeur nominale.
Exemple :
« Bonjour \abspitch{100} monsieur \abspitch{120} NAUDIN. »
- Modification du volume (\absgain)
Il est possible d’augmenter ou d’abaisser le volume de la voix, avec la balise « \absgain ». La valeur du « absgain » peut être comprise entre 0 (silence) et 65535 (très fort).
La valeur par défaut est de 32767.
Exemple :
« Veuillez effectuer \absgain{48000} votre choix \absgain{32767} maintenant. »
NB : Attention, un volume très élevé réduit sensiblement la qualité de la voix de synthèse.
Article précédentArticle suivant