APPRENTISSAGE DE DICTIONNAIRE POUR LA DESCRIPTION ET LA SEPARATION DE SIGNAUX SONORES Sylvain Lesage - slesage(at)irisa.fr 2ème année de thèse IRISA En traitement du signal, afin d'extraire les informations concernant la fréquence d'un signal, on utilise classiquement la transformée de Fourier. En découpant le signal en trames recouvrantes, et en effectuant la transformée de Fourier discrète de ces trames, on obtient le spectrogramme qui représente l'évolution du contenu spectral au cours du temps. La transformée de Fourier d'une trame peut être vue comme une combinaison linéaire de cosinus purs. Le "Sparse Coding" (décomposition parcimonieuse) vise à adapter la transformation, en cherchant les "bouts de signaux" (atomes) les plus fréquents dans le signal. Le signal est alors la superposition de seulement quelques atomes, qui ont un sens physique réel. Le nombre d'atomes sous-jacents au signal n'ayant pas de raison d'être limité à la dimension d'une trame, une extension consiste à estimer un ensemble d'atomes plus grand que la dimension, que l'on appelle dictionnaire redondant. La transformation n'est alors plus unique, et on choisit la decomposition la plus parcimonieuse (qui active le moins d'atomes). On présentera ici l'intérêt d'un tel formalisme pour l'analyse de signaux, le codage, et son adaptation pour la séparation de sources sonores.