Deuxièmes Journées Perception Sonore 2012

10 et 11 décembre 2012

CNRS Laboratoire de Mécanique et d'Acoustique

31, Chemin Joseph Aiguier

13009 Marseille


Du flou audio au pop-out audiovisuel.


Tifanie BOUCHARA1,2, Brian FG KATZ2, et Christian JACQUEMIN1,3

1 Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (LIMSI), CNRS UPR 3251, B.P. 133, 91403 Orsay Cedex.
2 Laboratoire d'Informatique Paris Descartes (LIPADE), Université Paris Descartes, 45 rue des Saints Pères, 75270 Paris Cedex 06.
3 Université Paris Sud, Orsay.

Peu d’études se sont intéressées aux tâches de recherche sonore qui consistent à retrouver une source sonore cible parmi plusieurs sources concurrentes. Notre étude concerne les processus perceptifs et attentionnels impliqués dans ce type de recherche. Nous introduisons également la notion de recherche multimodale pour laquelle plusieurs objets multimédia sont présentés en même temps, à la fois par leur composante visuelle et leur composante sonore. Nous nous intéressons alors au phénomène de « pop-out » par lequel certains attributs perceptifs, dits préattentifs, augmentent tellement la saillance d’un objet qu’il attire automatiquement l’attention. Par exemple, il a été montré en vision qu’un objet net attire l’attention au milieu d’objets flous. Nous avons étendu cette notion de flou aux modalités auditives et audiovisuelles par analogie. Une série d’expériences perceptives a été menées pour d’une part comparer l’effet obtenu de pop-out audio à celui du pop-out visuel, puis pour évaluer d’autre part l’apport d’une combinaison de flous audio et visuel dans une recherche multimodale. Dans ces expériences, les participants devaient retrouver un mot cible (écrit et/ou parlé) parmi six mots simultanés. Les résultats ont confirmé que les deux flous, audio et visuels, permettent d’attirer l’attention vers une cible nette alors mise en avant si les distracteurs sont flous. Les processus de recherche et d’identification sont alors accélérés quand l’indice de netteté correspond à la cible, mais ralentis quand il s’agit d’un distracteur, révélant ainsi un phénomène de guidage involontaire. De plus, le flou audiovisuel, c’est-à-dire la combinaison redondante des flous audio et visuel, s’est révélé efficace pour guider la recherche d’une cible audiovisuelle. Cela est d’autant plus intéressant que les résultats ont montré des temps de recherche plus courts en audiovisuel qu’en visuel ou en audio seul. L’ajout de l’information sonore améliore donc les performances par rapport à une recherche jusqu’alors seulement visuelle.