Modeling high-dimensional audio sequences with recurrent neural network

- 14:00 - Yoshua Bengio - Événements

Soutenance de thèse de Nicolas BOULANGER-LEWANDOWSKI, Département d'informatique et de recherche opérationnelle.

Date : vendredi 18 juillet 2014

Heure : 14 h 00

Endroit : salle 3195, Pavillon André-Aisenstadt, 2920 chemin de la Tour

Résumé :

Cette thèse étudie des modèles de séquences de haute dimension basés sur des réseaux de neurones récurrents (RNN) et leur application à la musique et à la parole. Bien qu'en principe les RNN puissent représenter les dépendances à long terme et la dynamique temporelle complexe propres aux séquences d'intérêt comme la vidéo, l'audio et la langue naturelle, ceux-ci n'ont pas été utilisés à leur plein potentiel depuis leur introduction par Rumelhart et al. (1986a) en raison de la difficulté de les entraîner efficacement par descente de gradient. Récemment, l'application fructueuse de l'optimisation Hessian-free et d'autres techniques d'entraînement avancées ont entraîné la recrudescence de leur utilisation dans plusieurs systèmes de l'état de l'art. Le travail de cette thèse prend part à ce développement.

Jury :

  • Président-rapporteur : Aaron Courville
  • Directeur de recherche : Yoshua Bengio
  • Co-directeur de recherche : Pascal Vincent
  • Membre du jury : Guy Lapalme
  • Examinateur externe : Benjamin Schrauwen ; Universiteit Gent, Belgique
  • Représentant du doyen de la faculté : Pierre Jolicoeur ; dépt de psychologie
Partager :
  • Envoyer
  • Imprimer
Mots clés :
  • soutenance de thèse
  • réseaux de neurones
  • apprentissage automatique