Deuxièmes Journées Perception Sonore 2012

10 et 11 décembre 2012

CNRS Laboratoire de Mécanique et d'Acoustique

31, Chemin Joseph Aiguier

13009 Marseille


Dépendance à la langue des critères objectifs de mesure de la qualité de parole dans les réseaux radio-mobiles.


Nader MECHERGUI, Sonia LARBI, Mériem JAÏDANE, Faten BEN ALI

Unité de recherche Signaux et Systèmes U2S, Dép. Technologies de l’Information et des Communications, Ecole Nationale d’Ingénieurs de Tunis (ENIT), BP37 - Le Belvédère - 1002 Tunis.

L’entreprise Tunisiana, premier opérateur de téléphonie mobile privé tunisien, a observé des anomalies lors des mesures de la qualité de parole sur son réseau, mesures de supervision réalisées avec un système de mesure supposé conforme à la recommandation P.862 de l’UIT-T. L’algorithme de mesure en question (SLQ) fournit des notes objectives de qualité de parole jugées par l’opérateur comme non représentative de la qualité réellement perçue. Ce constat est d’autant plus intrigant que ces anomalies ne se manifestent que lorsque la séquence-test envoyée sur le réseau est en langue arabe. Les mesures obtenues par ce système dans le cas des langues française et anglaise sont normales. Notre première approche a consisté à vérifier puis à mettre en évidence cette problématique. Pour cela, nous avons comparé l’algorithme SLQ utilisé par l’opérateur avec celui défini par la norme P.862 de l’UIT, PESQ. Ces deux algorithmes donnent des notes d’opinion moyenne (MOS : Mean Opinion Score) pour chaque séquence-test qui sont entre 1 (mauvaise qualité globale) et 5 (excellente qualité globale). Un mapping entre ces notes pour différentes langues a montré qu’il y a une bonne corrélation entre les notes des deux algorithmes pour les tests avec des séquences en français et en anglais, par contre une sur/sous estimation des notes entre les deux algorithmes est très clairement identifiable dans le cas de la langue arabe. Dans une deuxième approche pour l’analyse de cette dépendance à la langue, nous avons étudié l’influence de la stationnarité du signal sur les algorithmes de mesure de la qualité de parole par le biais d’indices de non stationnarité (par analyse temps-fréquence) avec pour objectif d’explorer l’importance de la taille de la fenêtre d’analyse du signal, durant laquelle ces algorithmes supposent la stationnarité, mais en même temps pour évaluer le lien entre cette hypothèse de stationnarité et la langue du signal de parole analysé. Une première analyse, effectuée avec des signaux académiques, a révélé une certaine variabilité des notes MOS pour des signaux de stationnarité différente. La deuxième analyse, avec des séquences de parole de langues différentes, a été effectuée pour déterminer la taille de fenêtre d’analyse la mieux adaptée pour chaque langue. Cette analyse nous a ainsi permis de retrouver de manière argumentée qu'une taille de 20ms convenait pour la majorité des langues considérées, mais que certaines langues devraient être segmentées avec des tailles de fenêtres variables ; 2 tailles semblent convenir pour l'ensemble des langues testées. Des mesures subjectives suivant la norme P.800 et P.830 de l’UIT ont aussi été effectuées avec 20 sujets sur 47 séquences en arabe dégradées par des conditions réseau radio-mobile réelles. Le mapping des notes MOS subjectives versus les notes MOS objectives a permis de conclure que les notes de PESQ étaient bien corrélées avec les notes subjectives alors que les notes de SLQ présentaient une certaine défaillance dans le cas de la langue arabe. Pour valider ce résultat, une comparaison doit être faite avec une base de données plus exhaustive.