Cours MA-STA201


Equipe enseignante 2021-2022

Cours: Christine Keribin
Chargés de TD:    Jérémie Capitao-Miniconi, Olivier Coudray, Guillermo Durand, Zacharie Naulet, Christine Keribin

Contenu

La modélisation statistique permet de définir un modèle stochastique pour expliquer ou prédire un phénomène à partir de données observées en quantifiant l'accord du modèle avec les données. C'est une discipline transverse qui se rencontre dans des domaines variés tels que : l'assurance, la fiabilité, l'agro-alimentaire, la biologie, l'environnement, l'énergie ...

Ce cours fait suite au cours MA101 (ENSTA) ou d'un cours de L3 dans lequel les principes de base de la statistique inférentielle ont été étudiés: estimateur, tests, intervalle de confiance dans les cas classiques d'inférence paramétrique.

Le cours STA201  illustrera le cadre de la modélisation statistique en développant la théorie de l'estimation par maximum de vraisemblance et le modèle linéaire.

L'enseignement comporte une part de travaux dirigés sur ordinateurs qui permettent de transformer le savoir théorique en une pratique de la modélisation de données réelles et de l'estimation de modèles avec un logiciel (logiciel R, cf ci-dessous pour y accéder à l'ensta ou l'installer sur vote ordinateur personnel).

Objectifs

Être capable, en utilisant les bases théoriques de la modélisation statistique, de :

Evaluation

Moyenne pondérée d'une note d'une note de projet (1/2) et d'une note d'examen (1/2)

L'examen aura lieu le 21 octobre 2021, 9h à 10h30. Il pourra comporter des questions théoriques et des questions d'interprétation de résultats. Le poly est autorisé. Prévoir également une calculette.
Pour préparer l'examen: relire le cours, refaire les TDs et TPs, savoir interpréter les procédures statistiques.

La note de l'épreuve de rattrapage (un examen sur table de 3h, même modalités que l'examen de première session ou oral suivant le nombre), s'il y a lieu, remplacera la note du module.

Documents

Poly

N'hésitez pas à me contacter pour toute notion du cours ou des TDs sur lequelles vous souhaitez des éclaircissements.

DESCRIPTION
DOCUMENTS
Séance 1
Cours (1h30): Introduction, et rappels: modèle statistique, estimateurs, tests et Ics
TD (1h30): Exercices de révision
Transparents Cours1
Enoncé
Corrigé
Séance 2: EMV
enoncé
Séance 3: Tests

Séance 4: ICs, Vecteurs Gaussiens 

Séance 5: modèle linéaire

Séance 6: test dans le modèle linéaire

Examen (21 octobre)  (1h30 à 2h).
 Après l'examen, vos chargé.e.s de TDs  seront disponibles dans vos salles de TDs respectives pour répondre à d'éventuelles questions sur le projet
Projet à rendre pour le 4 novembre 18h00.


Le logiciel R

R est  installé sur les ordinateurs de l'ENSTA. Pour y accéder, taper les commandes suivantes dans une invite de commande
useensta rstudio
usediam r
rstudio &
Vous pouvez également faire une installation sur votre ordinateur personnel:
Il est possible de faire un notebook R sans installation: https://rnotebook.io/
Pour vous préparer:
énoncé
crabes.data
commandes pour démarrer
un exemple Rmarkdown
corrigé

Bibliographie