Propositions de stages (niveaux M1, M2)

Natural language features extraction / Extraction de traits spécifiques du signal de parole mise à jour décembre 2015

Analyse et modélisation de la prise en charge de patients traumatisés graves mise à jour décembre 2015


Extraction de traits spécifiques du signal de parole / Natural language features extraction

Responsable de stage : Jean-Pierre Nadal

Lieu du stage : Laboratoire de Physique Statistique, ENS (UMR8550 CNRS, ENS, UPMC, Paris Diderot), Paris
Contact : nadal"at"lps.ens.fr

Co-encadrant : Judit Gervain, Laboratoire Psychologie de la Perception (UMR 8242 CNRS-Paris Descartes)

Rémunération du stagiaire selon la réglementation en vigueur.

Projet ANR 2015-2019 « SpeechCode » : encodage neuronal et perceptif du signal de la parole.

Presentation (French version below):

Speech has long been regarded as a special auditory signal (e.g. “Speech is special”, Liberman et al. 1967). The current project seeks to understand why, by investigating the link between speech perception, language acquisition and basic auditory perception. Recent advances in the understanding of the neural coding and information processing properties of the mammalian auditory system make the time ripe for such a rethinking of the classical questions of speech perception and language acquisition. Indeed, the speech signal encoded by the auditory system serves as the input for language learning. Importantly, auditory processing transforms this signal by organizing it into different representational patterns. The aim of the current project is to analyze and characterize speech and other speech-like signals in terms of computational and mathematical principles of neural coding and information processing in the auditory system in order to understand how and why speech is different from other auditory signals (e.g. animal vocalizations etc.). ICA-type and machine learning techniques (e.g. deep neural networks) will be used to identify features that discriminate speech from other sounds and speech in one language from speech in other languages. The project will thus consist of the development and application of such algorithms to existing recordings of speech and other speech-like signals.

Candidates are required to have a good knowledge of relevant signal processing and/or machine learning algorithms.

Intitulé : Extraction de traits spécifiques du signal de parole

Présentation :

La parole a longtemps été considérée comme un signal sonore spécial (e.g. “Speech is special”, Liberman et al. 1967). Le but de ce projet est de comprendre pourquoi. Pour ce faire, le projet étudiera les liens entre la perception de la parole, le traitement du langage et la perception auditive de bas niveau. Des avancées récentes dans la compréhension de l’encodage neuronal et du traitement de l’information dans le système auditif des mammifères offrent une nouvelle perspective sur les questions classiques de la perception de la parole et de l’acquisition du langage. En effet, l’input à l’acquisition du langage est la parole encodée par le système auditif. Or, cet encodage auditif organise la parole en diverses unités et représentations. Ce projet a pour objectif d’analyser la parole et d’autres stimuli sonores selon les principes computationnels er mathématiques de l’encodage neuronal et du traitement de l’information dans le système auditif afin de comprendre comment et pourquoi la parole est différente des autres stimuli sonores (p. ex. des vocalisations d’animaux). En particulier, le projet utilisera des algorithmes de type ICA et de l’apprentissage machine (p. ex. deep neural networks) pour identifier des traits et des propriétés qui permettent de discriminer la parole des autres signaux et la parole en une langue spécifique de la parole en d’autres langues. Le projet consistera donc à développer et à appliquer ces algorithmes à des enregistrements de parole et d’autres stimuli sonores.

Une très bonne maîtrise des techniques du traitement du signal et/ou de l’apprentissage machine est donc nécessaire pour mener à bien ce projet.


Analyse et modélisation de la prise en charge de patients traumatisés graves

L’objectif de ce stage est de modéliser de manière innovante des décisions et évènements observés lors de la prise en charge de patients traumatisés graves. Le but est d’apporter une aide à la décision dans les prises de décisions initiales : si une sous-estimation de la gravité peut être dramatique pour le patient, une surestimation conduit à mobiliser toute une équipe médicale, ce qui peut avoir des conséquences graves pour d’autres patients du fait de l’augmentation du temps d’attente.

Le travail d’analyse et de modélisation s’appuiera sur des données issues d'un registre de patients traumatisés graves, constitué par la réunion de registres de plusieurs centres en Ile de France. A ce jour plus de 6000 patients et les détails de leur prise en charge sont recensés dans cette base. La base de données dispose d'une autorisation CNIL et du CCTIRS, ainsi d'un avis du Comité de la Protection des Personnes de l’UPMC.

Le stagiaire travaillera en interaction étroite avec les encadrants, tout en disposant d’une grande liberté d’initiative dans le choix des outils informatiques et mathématiques.

Contact : nadal"at"lps.ens.fr

Jean-Pierre Nadal
Directeur de recherche au CNRS & Directeur d’études à l’EHESS
Laboratoire de Physique Statistique (LPS, UMR CNRS-ENS-UPMC-Univ. Paris Diderot)
Centre d’Analyse et de Mathématique Sociales (CAMS, UMR CNRS-EHESS)
&
Tobias Gauss
Anesthésiste-Réanimateur
Unité de Réanimation Chirurgicale Polyvalente - Hôpital Beaujon, APHP
Hôpitaux Universitaires Paris Nord Val de Seine, Clichy
&
Pauline Pérez
Interne des Hôpitaux
Université René Descartes - Paris 5