$ \newcommand{\cE}{{\cal E}} \newcommand{\cP}{{\cal P}} \newcommand{\cB}{{\cal B}} \newcommand{\cG}{{\cal G}} \newcommand{\cH}{{\cal H}} \newcommand{\cN}{{\cal N}} \newcommand{\cU}{{\cal U}} \newcommand{\N}{\mathbb{N}} \newcommand{\E}{\mathrm{E}} \newcommand{\R}{\mathbb{R}} \newcommand{\P}{\mathrm{P}} \newcommand{\1}{\mathbb{1}} \newcommand{\Var}{\mathrm{Var}} \newcommand{\Cov}{\mathrm{Cov}} \newcommand{\esp}{\thinspace} \newcommand{\tr}{{}^t \negthinspace} $

Exercice bonus pour le second contrôle-bis du 13/06

À rendre pour le 13 juin, le jour du contrôle.

Note : il n'y aura pas d'applications du TCL dans le contrôle.
C'est pourquoi j'en propose une ici.

On modélise la durée de vie d'une pile (dans un appareil photo par exemple) en mois par une loi exponentielle de paramètre $\lambda$.
On suppose qu'une pile défectueuse est immédiatement détectée et remplacée.

  1. La pile d'un appareil a été changée $41$ fois en (exactement) $7$ ans, et il faut encore la changer. Déduisez-en une estimation de $\lambda$ à l'aide de la loi des grands nombres.
    On choisira cette valeur pour les applications numériques.
  2. On s'intéresse maintenant à un autre appareil identique, utilisant des piles similaires. Déterminez la probabilité (exacte) que $52$ piles suffisent sur une durée de $10$ ans.

    Indication : une somme de lois Gamma suit une loi Gamma (passer par les fonctions caractéristiques) ; cas particulier d'une loi Gamma avec $\alpha = 1$ ? (cf. cours 2).
    Vous aurez besoin d'un logiciel comme R, Python ou MATLAB (...etc) ou d'une table.
  3. Décrivez comment le théorème central limite (TCL en abrégé) peut être appliqué dans cette situation. Quel est son intérêt (en général) ?
  4. Que donne l'approximation de la probabilité calculée en 1. par application du TCL ?
  5. Répondez à nouveau aux questions 1. et 3. avec cette fois 4 piles en 1 an. Commentez.
  6. Donnez la probabilité d'avoir besoin d'exactement 33 piles en 5 ans, puis calculez-en une approximation à l'aide du TCL.


Corrigé (commandes du logiciel R proposées pour les calculs) :

  1. Notons $X_i$ la variable aléatoire (VA) égale à la durée (en mois) de la $i^{eme}$ pile ; alors on observe $\sum_{i=1}^{42} X_i = 7 \times 12 = 84$. Les $X_i$ étant iid. de variance finie (égale à $\frac{1}{\lambda^2}$), la loi des grands nombres nous dit que $\frac{1}{n} \sum_{i=1}^{n} X_i$ converge vers $\E[X_i] = \frac{1}{\lambda}$. On en déduit une approximation de $\lambda$ par $\frac{n}{\sum_{i=1}^{n} X_i}$, et l'application numérique donne $\lambda \simeq \frac{42}{84} = 0.5$.
  2. La somme de $n$ VAs iid. de loi $\cE(\lambda)$ suit une loi Gamma de paramètres $(n, \lambda)$ (fonctions caractéristiques, ou google...). En notant $S_{52} = \sum_{i=1}^{52} X_i$ on en déduit la probabilité demandée : $$\P(S_{52} \geq 10 \times 12) = 1 - \P(S_{52} < 120) = 1 - F_{\Gamma(52,0.5)} \simeq 13.5\% \, ,$$ avec $F_{\Gamma(n,\lambda)}$ la fonction de répartition de la loi $\Gamma(n,\lambda)$.
    En R : 1 - pgamma(120, 52, 0.5)
  3. On dispose d'une somme de $n$ VAs iid. admettant un moment d'ordre 2 : Le TCL permet alors d'approximer la loi de cette somme par une gaussienne - l'approximation étant d'autant meilleure que $n$ est grand, sa qualité étant mesurée par exemple par l'inégalité de Berry-Essen. Cette substitution permet en général d'effectuer des calculs plus facilement sans perdre trop en précision.

    Concrètement, pour calculer $\P(S_n \in [a,b[)$ avec $[a,b[$ un intervalle de $\R$ par exemple, on écrit $$\begin{aligned} \P(S_n \in [a,b[) &= \P\left(\frac{S_n - n \mu}{\sigma \sqrt{n}} \in \left[ \frac{a - n \mu}{\sigma \sqrt{n}}, \frac{b - n \mu}{\sigma \sqrt{n}} \right] \right)\\ &\simeq \Phi\left(\frac{b - n \mu}{\sigma \sqrt{n}}\right) - \Phi\left(\frac{a - n \mu}{\sigma \sqrt{n}}\right) \end{aligned}$$ avec $(\mu, \sigma^2)$ moyenne et variance de $X_1$ et $\Phi$ fonction de répartition de la loi $\cN(0,1)$ (normale centrée réduite), qui est la loi asymptotique de $\frac{S_n - n \mu}{\sigma \sqrt{n}}$.
  4. On applique la formule déterminée ci-dessus avec $a = 10 \times 12$ et $b = +\infty$ : $$\P(S_{52} \in [120,+\infty[) \simeq 1 - \Phi\left(\frac{120 - 52 / 0.5}{(1/0.5) \times \sqrt{52}}\right) \simeq 13.4\% \, .$$ L'approximation est excellente.
    En R : 1 - pnorm( (120 - 52 / 0.5) / ((1/0.5) * sqrt(52)) )
  5. On a cette fois $n=4$ et on cherche $\P(S_4 \geq 1 \times 12)$. Les calculs sont identiques, et l'on trouve successivement : $$\P(S_4 \geq 12) = 1 - F_{\Gamma(4,0.5)} \simeq 15.1\% \, ,$$ $$\P(S_4 \in [12,+\infty[) \simeq 1 - \Phi\left(\frac{12 - 4 / 0.5}{(1/0.5) \times \sqrt{4}}\right) = 1 - \Phi(1) \simeq 15.9\% \, .$$ L'approximation est assez nettement moins bonne qu'avec $n=52$, mais reste très raisonnable (écart en dessous d'un quinzième, de l'ordre de $6\%$). C'est plutôt surprenant - inattendu - car $n=4$ est vraiment très bas !
    En R : 1 - pgamma(12, 4, 0.5) puis 1 - pnorm(1)
  6. Pour utiliser exactement $33$ piles en $5$ ans, il faut utiliser d'abord $32$ piles en moins de $5$ ans, puis que la $33^{eme}$ pile dure au-delà des $5$ ans. Nous sommes donc dans la situation d'un couple de VAs $(X,Y)$ de lois respectives $\Gamma(32,\lambda)$ et $\cE(\lambda)$, dont on cherche à intégrer la densité (jointe) sur le domaine $X < 5 \times 12 \cap Y \geq 60 - X$. Cette densité jointe s'écrit comme le produit des densités de $X$ et $Y$ car elles sont indépendantes : $$f_{X,Y}(x,y) = \frac{x^{n-1}}{(n-1)!} \lambda^n e^{-\lambda x} \times \lambda e^{-\lambda y} \, ,$$ avec $(n,\lambda) = (32, 0.5)$. Le calcul peut alors s'effectuer : $$\begin{aligned} \P(X < 60 \cap Y \geq 60 - X) &= \frac{\lambda^{n+1}}{(n-1)!} \int_{x=0}^{60} x^{n-1} e^{-\lambda x} \left( \int_{y=60-x}^{+\infty} e^{-\lambda y} dy \right) dx\\ &= \frac{\lambda^n}{(n-1)!} \int_{x=0}^{60} x^{n-1} e^{-\lambda x} e^{-\lambda(60-x)} dx\\ &= \frac{\lambda^n}{(n-1)!} e^{-60\lambda} \int_{x=0}^{60} x^{n-1} dx\\ &= \frac{(60\lambda)^n}{n!} e^{-60\lambda} \simeq 6.6\% \, . \end{aligned}$$ Cette probabilité n'est autre que $\P(Z = n)$ avec $Z$ suivant la loi $\cP(60\lambda)$. En effet, le nombre de piles utilisées à l'instant $t$ suit un processus de Poisson de paramètre $\lambda$ (voir par exemple la page Wikipedia ou ce document, définition 5). Avec les notations de ces notes de cours la probabilité recherchée s'écrit $\P(N_{60} = n)$, ce qui donne directement le résultat. On peut conclure la première partie de la question.

    Reste à évaluer une approximation de cette probabilité à l'aide du TCL. Pour cela on écrit comme précédemment $S_{32} \sim \cN(n / \lambda, n / \lambda^2)$, puis $$\begin{aligned} \P(X < 60 \cap Y \geq 60 - X) &\simeq \int_{x=0}^{60} \int_{y=60-x}^{+\infty} \frac{\lambda}{\sqrt{2\pi n}} \text{exp}\left(\frac{-(\lambda x - n)^2}{2n}\right) \lambda e^{-\lambda y} dx dy\\ &= \frac{\lambda^2}{\sqrt{2\pi n}} \int_{x=0}^{60} \text{exp}\left(\frac{-(\lambda x - n)^2}{2n}\right) \left( \int_{y=60-x}^{+\infty} e^{-\lambda y} dy \right) dx\\ &= \frac{\lambda}{\sqrt{2\pi n}} \text{exp}\left(-60\lambda - \frac{n}{2}\right) \int_{x=0}^{60} \text{exp}\left(- \frac{\lambda^2 x^2}{2n} + 2\lambda x\right) dx\\ &= \frac{\lambda e^{-60\lambda - n/2}}{\sqrt{2\pi n}} \int_{x=0}^{60} \text{exp}\left(-\left(\frac{\lambda x}{\sqrt{2n}} - \sqrt{2n}\right)^2 + 2n\right) dx\\ &= \frac{\lambda e^{-60\lambda + 3n/2}}{\sqrt{2\pi n}} \int_{u=-2\sqrt{n}}^{\frac{60\lambda}{n}-2\sqrt{n}} \frac{\sqrt{n}}{\lambda} e^{-u^2/2} du\\ &= \frac{e^{-60\lambda + 3n/2}}{\sqrt{2\pi}} \left[ \Phi\left(\frac{60\lambda}{\sqrt{n}}\right) - \Phi(-2\sqrt{n}) \right] \simeq 4.8\% \, , \end{aligned}$$ avec le changement de variables $\frac{u}{\sqrt{2}} = \frac{\lambda x}{\sqrt{2n}} - \sqrt{2n}$.
    L'approximation est assez mauvaise et on constate que dans ce cas précis elle mène à des calculs plus complexes : conclusion, il ne faut pas appliquer le TCL aveuglément :-)
    En R : lambda=0.5 ; n=32 ; a=-2*sqrt(n) ; b=60*lambda/(sqrt(n)) - 2*sqrt(n) ; exp(-60*lambda+3*n/2)/(lambda*sqrt(2*pi)) * (pnorm(b) - pnorm(a))