Semestre 3

2 parcours possibles :

  • parcours « Apprentissage et Fouille de Données » (AFD)
  • parcours « Apprentissage et Traitement Automatique des Langues » (ATAL). Ce parcours est réalisé conjointement avec l’Université de Nantes
Obligatoire
Option

Unité d’enseignement

Objectifs pédagogiques

Parcours AFD Parcours ATAL

Cours

TD

TP

ECTS

Anglais Les objectifs de ce module sont de préparer au TOEIC et de faire acquérir le vocabulaire d’anglais spécifique de base. Le cours repose sur des exercices écrits et oraux principalement à partir de la presse écrite et audiovisuelle anglaise/américaine. Elle inclut l’organisation d’un TOEIC blanc, puis le passage du TOEIC en fin de semestre. 30 3
Connaissance de l’environnement professionnel Ce module aborde les droits et devoirs des salariés et des employeurs dans l’entreprise. Les aspects juridiques de la création d’entreprise sont présentés. 30 3
Représentation des connaissances Ce cours présente quelques techniques avancées de modélisation et de résolution de problèmes utilisées en intelligence artificielle. On abordera successivement les problèmes de satisfaction de contraintes, la planification (au travers de la génération de plans d’actions), l’apprentissage symbolique automatique et la modélisation par agents. 8 16 16 3,5 / 2
Apprentissage automatique (Deep Learning) Ce module fait suite au module “Apprentissage Automatique” de première année et aborde notamment l’apprentissage par Réseaux de Neurones profonds. 19 2 19 3,5
Fouille de données Ce module présente différents outils utilisés en fouille de données et s’intéresse autant aux aspects mathématiques et algorithmiques qu’à la mise en pratique de ces outils. Les méthodes supervisées et non supervisées sont abordées. 14 8 18 3
Architectures pour big data Ce module aborde les architectures logicielles spécialisées pour la fouille de grandes masses de données. 6 6 18 3
Test logiciel Ce module aborde les outils et méthodes professionnels pour le test logiciel 12 4 9 2
Conception et développement logiciel Ce module est l’occasion de concevoir et développer un logiciel complet, à partir de la rédaction du cahier des charges jusqu’à la présentation collective du résultat. 100 3
Ingénierie des systèmes interactifs pour l’éducation Ce module présente quelques méthodes et outils logiciels pour l’enseignement et la transmission des connaissances.
– Scénarisation pédagogique
– Jeux sérieux pour l’apprentissage
– Analyse de traces d’utilisateurs
12 20 3
Traitement automatique de la langue Présenter les méthodes d’apprentissage automatique utilisées actuellement et former les étudiants à l’utilisation des méthodes actuelles en apprentissage automatique. 30 3
Algorithmique et alignement de chaînes Connaissance et acquisition des principales techniques de recherche de motifs dans les textes de grande taille. Connaissance et acquisition des algorithmes associés et de leur complexité. Comparaison des avantages/inconvénients des techniques présentées, en fonction du contexte d’utilisation. Connaissances des principaux algorithmes d’alignement bilingue à partir de corpus. 10.5 10.5 2.7 2,5
Modélisation du langage statistique et symbolique Savoir mettre en oeuvre et maîtriser différents modèles de langages tant du point de vue de sa définition (puissance d’un modèle), de son utilisation effective (prédiction, lissage) que de son acquisition (apprentissage). 16 5.3 2.7 2,5
Apprentissage automatique en langues Ce module permet d’approfondir les méthodes d’apprentissage automatique actuellement utilisées pour traiter des données linguistiques. 9.3 9.3 5.4 3
Fouille de textes Savoir mettre en oeuvre et maîtriser une chaîne complète de fouille de données sur diverses tâches spécifiques à la fouille de textes : de la constitution pertinente du corpus à l’analyse argumentée des résultats en passant par la maîtrise des prétraitements et des algorithmes spécifiques au texte. 16 8 3
Corpus Corpus :

  1. metadonnées
  2. critères de sélection des textes et
  3. normes linguistiques d’annotation.
12 1
Multilinguisme Appréhender la complexité de la traduction automatique, de la traduction assistée par ordinateur et de son évaluation. Comprendre la topologie des modèles de traduction automatique (statistique et neuronale). Comprendre les modèles de la traduction assistée par ordinateur. Mettre en œuvre les méthodes étudiées sur des applications simples avec des outils open source 16 8 2.5
Traitement de la parole Connaître les spécificités de la parole comme support du langage naturel. Connaître les différents traitements informatiques qui ont pour cible la parole.
Codage de la parole : PCM, loi mu, loi A, container (format WAV et autres), compression psychoacoustique (MP3 et autres).
Notions de théorie de l’information, entropie, entropie conditionnelle, information mutuelle.
Notions de traitement du signal audio : définition d’un son, calcul et interprétation d’un spectre sonore (transformation de Fourier, transformation cosinus discrète), calcul et interprétation d’un spectrogramme, cepstre, bancs de filtres, extraction de la fréquence fondamentale.
Phonétique et Phonologie : phonèmes, phones, voyelles, consonnes, coarticulation, prosodie.
Mots et unités sous-lexicales : parole continue et segmentation en mots, phonétisation automatique, liaisons, assimilations.
Focus sur les informations non linguistiques portées par la parole : émotions, langue, identité, âge, sexe, pathologie.
Modélisation : modélisation acoustique pour la reconnaissance de la parole (HMM/GMM et HMM/DNN), modélisation du locuteur, modélisation des langues. Introduction à l’analyse factorielle, description de l’algorithme espérance/maximisation (EM), …
16 8 2.5
Reconnaissance multimodale Maitrise du développement d’un système de reconnaissance d’écriture.
Maitrise du développement d’un système de transcription.
Maitrise du développement d’un système de reconnaissance du locuteur.
Reconnaissance de l’écriture, de la parole et du locuteur.
24 12 3
Insertion professionnelle Savoir gérer un projet logiciel intégrant plusieurs plusieurs niveaux de participants (client, développeur, designer, …).
Savoir esquisser un modèle économique à partir d’un logiciel ou d’une innovation. Pouvoir présenter son idée ou son modèle économique dans un temps contraint.
5.3 13.5 5.3 2
Conférences Ouverture à des problématiques connexes.
Connaître les métiers en lien avec le Master ATAL.
Découverte du tissu industriel et des problématiques de recherche du domaine.
Interventions d’industriels, chercheurs et développeurs, partage d’expérience, description des problématiques en lien avec le traitement du langage
24 0

Semestre 4

 

Unité d’enseignement

Objectifs pédagogiques

Cours

TD

TP

ECTS

Au choix

  • Stage en entreprise ou
  • Stage de recherche
Un stage obligatoire de 6 mois minimum s’effectue à partir du mois de mars. Le stage se fait en entreprise ou en laboratoire de recherche. Il s’agit souvent d’un stage de pré-embauche (environ 80 % de contrats de travail signés à l’issue du stage). L’étudiant cherche son stage. Il dispose pour cela d’un ensemble d’outils : site web spécifique au Master, offres ciblées, base des anciens stages, salon du stage en octobre, interventions d’entreprises au cours du premier semestre). L’évaluation se fait sur rapport écrit et soutenance orale. 6 mois 30