Cours MA-STA201

La première séance (10 septembre) sera composée d'un cours de 9:00 à 10:30 et d'un TP de 10:45 à 12:15. Tous auront lieu en visio via une activité collaborate de ecampus. Il est impératif d'avoir préalablement installé R et RStudio, voir section correspondante.


Equipe enseignante 2020-2021

Cours: Christine Keribin
Chargés de TD:    Olivier Coudray, Henri Mermoz Kouye, Zacharie Naulet, Camille Palmier

Contenu

La modélisation statistique permet de définir un modèle stochastique pour expliquer ou prédire un phénomène à partir de données observées en quantifiant l'accord du modèle avec les données. C'est une discipline transverse qui se rencontre dans des domaines variés tels que : l'assurance, la fiabilité, l'agro-alimentaire, la biologie, l'environnement, l'énergie ...

Ce cours fait suite au cours MA101 dans lequel les principes de base de la statistique inférentielle ont été étudiés: estimateur, tests, intervalle de confiance dans les cas classiques d'inférence paramétrique.

Le cours STA201  illustrera le cadre de la modélisation statistique en développant la théorie de l'estimation par maximum de vraisemblance et le modèle linéaire.

L'enseignement comporte une part de travaux dirigés sur ordinateurs qui permettent de transformer le savoir théorique en une pratique de la modélisation de données réelles et de l'estimation de modèles avec un logiciel (logiciel R, cf ci-dessous pour y accéder à l'ensta ou l'installer sur vote ordinateur personnel).

Objectifs

Être capable, en utilisant les bases théoriques de la modélisation statistique, de :

Evaluation

Moyenne pondérée d'une note de CR de TP (1/3) , d'une note de projet (1/3) et d'une note d'examen (1/3)

L'examen aura lieu le 23 octobre 2020, 9h à 10h: QCM. Il pourra comporter des questions théoriques et des questions d'interprétation de résultats. Les documents autorisés dépendront de la tenue en présence ou à distance. Prévoir également une calculette.
Pour préparer l'examen: relire le cours, refaire les TDs et TPs, savoir interpréter les procédures statistiques. Les énoncés des années précédentes seront mis en ligne dans la rubrique documents ci-dessous.

La note de l'épreuve de rattrapage (un examen sur table de 3h, même modalités que l'examen de première session ou oral suivant le nombre), s'il y a lieu, remplacera la note du module.

Documents

Poly  Exercices de révision Corrigé

N'hésitez pas à me contacter pour toute notion du cours ou des TDs sur lequelles vous souhaitez des éclaircissements.

DESCRIPTION
DOCUMENTS
Séance 1
Cours (1h30): Introduction, et rappels: modèle statistique, estimateurs, tests et Ics
TP (1h30): introduction à R
Transparents Cours1
énoncé TP1
crabes.data
commandes pour démarrer
un exemple Rmarkdown
corrigé
Séance 2: EMV
Transparents Cours2
énoncé TD2 
corrigé
Séance 3: Tests
Transparents Cours3
Transparents Cours 3 annotés
énoncé TD3
corrigé
Séance 4: ICs, Vecteurs Gaussiens 
EX4 à rendre en binome pour le 9 octobre 17h au plus tard
les deux membres du binôme doivent appartenir au même groupe de TD.

Transparents Cours4
énoncé TD4
corrigé

corrigé Ex4
Séance 5: modèle linéaire
Transparents Cours5
énoncé TD5
données
commandes pour démarrer
corrigé pdf,
corrigé commandes 
Séance 6: test dans le modèle linéaire
Transparents Cours6
énoncé TD6
corrigé
corrigé commandes
Examen (23 octobre)  QCM (1h).
 Après l'examen, vos chargé.e.s de TDs  seront disponibles dans vos salles de TDs respectives pour répondre à d'éventuelles questions sur le projet
Projet à rendre pour le 4 novembre 18h00.


Le logiciel R

R est  installé sur les ordinateurs de l'ENSTA. Pour y accéder, taper les commandes suivantes dans une invite de commande
useensta rstudio
usediam r
rstudio &
Vous pouvez également faire une installation sur votre ordinateur personnel:
Il est possible de faire un notebook R sans installation: https://rnotebook.io/

Bibliographie