Diffusion Multi Canal

Les règles de la synthèse vocale

7 minutes de lecture imprimer

La fonction TTS (Text To Speech) intégrée à DMC, vous permet de créer vos messages vocaux à partir d’un texte lu par une voix de synthèse féminine.

ATTENTION : A savoir que le nombre maximum de caractères dans une diffusion en synthèse vocale sera de 2000 caractères.

Vous trouverez ci-dessous les règles d’utilisation du « Text To Speech ».

Il est possible de jouer avec la ponctuation, les sigles ou bien en utilisant des balises afin de spécifier certains comportements au moteur de synthèse vocale.

  • La Ponctuation

La ponctuation joue un rôle capital dans la prosodie des messages générés. Chaque signe de ponctuation doit obligatoirement être suivi d’un espace.

Le tableau ci-dessous dresse la liste des signes de ponctuations interprétables par le système de TTS et précise leur influence au niveau de l’intonation.

  •  Les sigles

Il existe plusieurs méthodes pour l’écriture des sigles :
Ecriture en mode abc ou ABC Exemple : cnil ou CNIL sera prononcé : [ cnil ]
Ecriture en mode A B C ou A.B.C. Exemple : C N I L ou C.N.I.L.  sera prononcé :
[ c (pause) n (pause) i(pause)  l (pause) ]

  • Dates et heures

19/08/14 sera prononcé : [ dix neuf août deux mille quatorze ]

12:29 sera prononcé : [ midi vingt neuf ]

12 h 29 sera prononcé [ douze heures vingt neuf ]

  • L’écriture phonétique (\phone)

Afin d’obtenir le rendu souhaité, il est possible de forcer le moteur de synthèse vocale en lui fournissant le texte à synthétiser de manière phonétique. Ce résultat est possible de deux façons :

– Ecriture du texte tel qu’il se prononce (en ajoutant des accents ou en changeant l’orthographe du mot). Exemple : « Bienvenue chez Cégétel. »

– En utilisant la balise « \phone ». Celle-ci permet de spécifier le rendu souhaité d’un mot en décrivant sa prononciation via un alphabet phonétique.
Exemple : « Bienvenue chez \phone{s »ei »j »ei »t »ai »l »}. »

Le tableau suivant dresse la liste des 35 codes composant l’alphabet phonétique utilisable dans le système de TTS.

  • L’insertion de pauses (\pause)

Il est possible de forcer l’insertion d’une pause dans un texte. La durée de cette pause peut être spécifiée en millisecondes, secondes ou en minutes.

Exemples :
« Bonjour \pause{1000ms} madame … »
« Bonjour \pause{1s} madame… »
« Bonjour \pause{1mn} madame … »

  • Modification de la vitesse (\absspeed)

Il est possible de modifier la vitesse d’élocution de la voix, afin de l’augmenter ou d’abaisser le débit grâce à la balise « \speed ». La valeur du « Speed » peut être comprise en valeur absolue entre 30 (très lent) et 300 (très rapide).
L’utilisation de la valeur 100 permet de réinitialiser la vitesse à sa valeur nominale.

Exemple :
« Bonjour \absspeed{130} monsieur \absspeed{80} NAUDIN. »

  • Modification du ton (abs\pitch)

Il est possible de modifier le ton de la voix, afin de l’augmenter ou de le baisser. Cela est possible grâce à la balise « \abspitch ». La valeur du « pitch » peut être comprise entre 50 (bas) et 150 (haut).
L’utilisation de la valeur 100 permet de réinitialiser le pitch à sa valeur nominale.

Exemple :
« Bonjour \abspitch{100} monsieur \abspitch{120} NAUDIN. »

  • Modification du volume (\absgain)

Il est possible d’augmenter ou d’abaisser le volume de la voix, avec la balise « \absgain ». La valeur du « absgain » peut être comprise entre 0 (silence) et 65535 (très fort).
La valeur par défaut est de 32767.

Exemple :
« Veuillez effectuer \absgain{48000} votre choix \absgain{32767} maintenant. »

NB : Attention, un volume très élevé réduit sensiblement la qualité de la voix de synthèse.

Ces informations vous ont-elles aidé ?


Mounia

Est chargée de clientèle au Support Fonctionnel de SFR Business.