• Informatique / Bureautique / Big data / Cybersécurité

Apprentissage statistique : modélisation descriptive et introduction aux réseaux de neurones

Apprentissage statistique : modélisation descriptive et introduction aux réseaux de neurones
Unité d'enseignement

Détails

Infos générales

Code
RCP208

Présentation

Objectifs

Ce cours donne des éléments de base de l'analyse des données et de la modélisation descriptive, ainsi que des principes à mettre en œuvre pour traiter des applications réelles. Une introduction à la modélisation décisionnelle avec des réseaux de neurones est également présentée. L'analyse des données et la modélisation descriptive aident à comprendre les données empiriques issues de phénomènes naturels, économiques ou socio-culturels. Cette compréhension facilite la mise en œuvre de méthodes performantes de construction de modèles décisionnels.
Les méthodes abordées ont de très nombreuses applications dans des domaines aussi divers que l'assurance qualité, les enquêtes d'opinion, le marketing, la gestion de la relation client, la climatologie, la sécurité, etc.
L'enseignement adopte une approche pragmatique, les séances de travaux pratiques permettant la mise en œuvre systématique des méthodes présentées.
Les unités d'enseignement RCP209 « Apprentissage statistique : modélisation décisionnelle et apprentissage profond », RCP211 « Intelligence artificielle avancée » et RCP217 « Intelligence artificielle pour des données multimédia » sont des suites recommandées de RCP208.

Intitulé officiel

Apprentissage statistique : modélisation descriptive et introduction aux réseaux de neurones

Programme

Durée et organisation

L’année est organisée en 2 semestres : semestre 1 (S1) d’octobre à février/mars et semestre 2 (S2) de février/mars à juin.

Parcours diplômant

Le cursus est proposé selon une programmation permettant d’optimiser la durée de la formation, compatible avec une activité professionnelle.

Unités d’enseignement « à la carte »

Vous avez toute liberté pour effectuer votre choix parmi l’ensemble des unités d’enseignement (UE) qui vous sont proposées.

Cours à distance via Internet :

Autoformation avec accompagnement par un enseignant(e) (en individuel ou collectif). Utilisation de supports numériques (documents pdf, documents sonorisés, vidéos interactives, quiz d’autoévaluation...) et échanges en classes virtuelles par visioconférence (en direct ou en différé), messagerie, forums, chat...
 

Méthodes mobilisées

Pédagogie qui combine apports académiques, études de cas basées sur des pratiques professionnelles et expérience des élèves.
Équipe pédagogique constituée pour partie de professionnels. Un espace numérique de formation (ENF) est utilisé tout au long du cursus.
 

Modalités d’évaluation

Chaque unité (UE/US, UA) fait l’objet d’une évaluation organisée en accord avec l’Établissement public (certificateur) dans le cadre d’un règlement national des examens.
 

Accessibilité public handicapé

Nos formations sont accessibles aux publics en situation de handicap. Un référent Cnam est dédié à l’accompagnement de toute personne en situation de handicap : Contactez le référent.
 

Modalités et délais d’accès

Les inscriptions se déroulent dès le mois de mai pour les formations qui débutent en octobre (semestre 1) et dès novembre pour les formations qui débutent en février (semestre 2).

Contenu de la formation

Les thèmes abordés dans les séances de cours et de travaux pratiques (TP) sont :

  • Applications, nature des problèmes de modélisation et spécificités des données.
  • Analyse des données, réduction de dimension : méthodes factorielles.
  • Réduction non-linéaire de dimension : UMAP, t-SNE.
  • Sélection de variables.
  • Classification automatique : k-moyennes, DBSCAN.
  • Estimation de densités : noyaux, modèles de mélange.
  • Imputation des données manquantes.
  • Réseaux de neurones multi-couches : architectures, capacités d'approximation, apprentissage et régularisation, explicabilité.

Chaque séance de cours est suivie d'une séance de TP permettant de mettre en œuvre les méthodes présentées.
Les TP sont réalisés en utilisant principalement la plateforme Scikit-learn. Une introduction rapide au langage Python, à NumPy, à matplotlib et à Scikit-learn est prévue lors des premières séances de TP.

Unités d'enseignement

  • Apprentissage statistique : modélisation descriptive et introduction aux réseaux de neurones
    À distance / Partiellement à distance Février à Juin 50 heures 6 crédits

Organisation

Modalités d'inscription