\documentclass[10pt]{article} \usepackage[french]{babel} \usepackage[utf8]{inputenc} \usepackage[T1]{fontenc} \usepackage{fvextra, csquotes} \usepackage{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage[version=4]{mhchem} \usepackage{stmaryrd} \usepackage{bbold} \usepackage{graphicx} \usepackage[export]{adjustbox} \graphicspath{ {./images/} } \title{Conception : HEC Paris - ESCP BS } \author{} \date{} \begin{document} \maketitle \section*{OPTION SCIENTIFIQUE} \section*{MATHÉMATIQUES II} Lundi 9 mai 2022, de 8 h. à 12 h. \begin{displayquote} La présentation, la lisibilité, l'orthographe, la qualité de la rédaction, la clarté et la précision des raisonnements entreront pour une part importante dans l'appréciation des copies.\\ Les candidats sont invités à encadrer dans la mesure du possible les résultats de leurs calculs.\\ Aucun document n'est autorisé. L'utilisation de toute calculatrice et de tout matériel électronique est interdite. Seule l'utilisation d'une règle graduée est autorisée.\\ Si au cours de l'épreuve, un candidat repère ce qui lui semble être une erreur d'énoncé, il la signalera sur sa copie et poursuivra sa composition en expliquant les raisons des initiatives qu'il sera amené à prendre. \end{displayquote} Dans ce problème, toutes les variables aléatoires sont supposées définies sur un même espace probabilisé ( \(\Omega, \mathcal{A}, \mathbb{P}\) ). Si \(X\) est une variable aléatoire, on note respectivement \(\mathbf{E}(X)\) et \(\operatorname{Var}(X)\) son espérance et sa variance, sous réserve d'existence. Le but de ce problème est de mettre en évidence quelques résultats asymptotiques liés au modèle du collectionneur de vignettes. Dans chaque paquet de céréales se trouve une vignette et il y a en tout des vignettes de \(n\) types différents, où \(n\) est un entier supérieur ou égal à 1 . Chacun des \(n\) types de vignettes se retrouve avec la même fréquence dans les paquets de céréales. Une collection est alors complète lorsqu'elle comporte \(n\) vignettes de types différents. On modélise le nombre total de paquets de céréales qu'il est nécessaire d'acheter pour obtenir la collection complète de \(n\) vignettes de types différents par la variable aléatoire notée \(C_{n}\). On pose par convention \(C_{0}=0\) et pour tout \(i \in \llbracket 1, n \rrbracket\), on note \(C_{i}\) le nombre d'achats de paquets de céréales nécessaires pour obtenir \(i\) vignettes de types différents. De même, pour tout \(i \in \llbracket 1, n \rrbracket\), on pose \(X_{i}=C_{i}-C_{i-1}\), qui représente le nombre d'achats supplémentaires de paquets de céréales qu'il est nécessaire d'effectuer pour obtenir une nouvelle vignette d'un type différent des ( \(i-1\) ) vignettes de types différents déjà obtenues. Par convention, on pose \(X_{1}=C_{1}=1\). On suppose que les variables aléatoires \(X_{1}, \ldots, X_{n}\) sont mutuellement indépendantes. Enfin, on pose : \[ V_{n}=\frac{C_{n}}{n}-\ln (n) . \] \section*{- Questions préliminaires -} \begin{enumerate} \item (a) Montrer que : \end{enumerate} \[ C_{n}=X_{1}+\cdots+X_{n}=\sum_{i=1}^{n} X_{i} . \] (b) Justifier que pour tout \(i \in \llbracket 1, n \rrbracket\), la variable aléatoire \(X_{i}\) suit la loi géométrique \(\mathcal{G}\left(\frac{n-i+1}{n}\right)\). \section*{- Partie I -} Pour tout entier \(n \geq 1\), on pose : \[ H_{n}=\sum_{k=1}^{n} \frac{1}{k} \quad, \quad S_{n}=\sum_{k=1}^{n} \frac{1}{k^{2}} \] Nous allons démontrer la convergence de la suite \(\left(S_{n}\right)_{n \geq 1}\) et déterminer une valeur approchée de sa limite \(S\).\\ 2. (a) Montrer que pour tout entier \(k \geq 2\), on a l'encadrement : \[ \frac{1}{k}-\frac{1}{k+1} \leq \frac{1}{k^{2}} \leq \frac{1}{k-1}-\frac{1}{k} \] (b) Montrer que pour tout entier \(n \geq 2\), on a : \[ \frac{3}{2}-\frac{1}{n+1} \leq S_{n} \leq 2-\frac{1}{n} \] (c) Montrer que la suite \(\left(S_{n}\right)_{n \geq 1}\) est convergente et donner un encadrement de sa limite \(S\).\\ (d) Montrer que pour tout entier \(n \geq 1\), on a l'encadrement : \[ \frac{1}{n+1} \leq S-S_{n} \leq \frac{1}{n} \] (e) En déduire un programme Scilab qui permet d'obtenir une valeur approchée de \(S\) à \(10^{-7}\)-près.\\ 3. Pour tout entier \(n \geq 1\), on pose \(u_{n}=H_{n}-\ln (n)\).\\ (a) Montrer que pour tout entier \(n \geq 1\), on a l'encadrement : \[ \frac{1}{n+1} \leq \ln \left(\frac{n+1}{n}\right) \leq \frac{1}{n} \] (b) Montrer que pour tout entier \(n \geq 1\), on a : \(0 \leq u_{n} \leq 1\).\\ (c) Montrer que la suite \(\left(u_{n}\right)_{n \geq 1}\) converge vers une certaine limite \(\gamma \in[0,1]\).\\ 4. Justifier l'existence de l'espérance de \(C_{n}\) et montrer que \(\mathbf{E}\left(C_{n}\right)=n H_{n}\).\\ 5. Justifier l'existence de la variance de \(C_{n}\) et exprimer \(\operatorname{Var}\left(C_{n}\right)\) en fonction de \(n, S_{n}\) et \(H_{n}\).\\ 6. (a) Montrer que pour tout réel \(a>0\), on a : \[ \mathbb{P}\left(\left|C_{n}-n H_{n}\right| \geq a n\right) \leq \frac{S}{a^{2}} \] (b) Montrer que pour tout réel \(c>1\), on a : \[ \mathbb{P}\left(\left|\frac{C_{n}}{n}-\ln (n)\right| \geq c\right) \leq \frac{S}{(c-1)^{2}} \] (c) Pour cette question, on suppose que \(n=10^{6}\). On donne l'approximation \(\ln (n) \approx 13.816\).\\ Montrer que : \[ \mathbb{P}\left(\frac{C_{n}}{n} \in[7.81,19.92]\right) \geq 0.92 . \] \section*{- Partie II -} \begin{enumerate} \setcounter{enumi}{6} \item Soient \(T_{1}, \ldots, T_{n}, n\) variables aléatoires mutuellement indépendantes de même loi exponentielle \(\mathcal{E}(1)\). On pose: \end{enumerate} \[ M_{n}=\max _{1 \leq i \leq n} T_{i} \] Montrer que \(M_{n}\) suit la loi de densité \(f_{n}\) donnée par : \[ \forall x \in \mathbb{R}, \quad f_{n}(x)= \begin{cases}n \mathrm{e}^{-x}\left(1-\mathrm{e}^{-x}\right)^{n-1} & \text { si } x>0 \\ 0 & \text { si } x \leq 0\end{cases} \] \begin{enumerate} \setcounter{enumi}{7} \item (a) Soit \(Z\) une variable aléatoire de loi exponentielle \(\mathcal{E}(n+1)\) et indépendante de \(M_{n}\). On note \(g\) la densité de la loi de \(Z\) qui est nulle sur \(]-\infty, 0\) ] et continue sur \(] 0,+\infty[\). Montrer que pour tout \(x>0\) et tout \(t \in] 0, x[\), on a : \end{enumerate} \[ f_{n}(t) g(x-t)=(n+1) \mathrm{e}^{-(n+1) x} n \mathrm{e}^{t}\left(\mathrm{e}^{t}-1\right)^{n-1} \] (b) Soit \(\left(Z_{i}\right)_{i \geq 1}\) une suite de variables aléatoires mutuellement indépendantes telle que pour tout entier \(i \geq 1, Z_{i}\) est de loi exponentielle \(\mathcal{E}(i)\).\\ Montrer que pour tout entier \(n \geq 1\), la variable aléatoire \(\sum_{i=1}^{n} Z_{i}\) suit la loi de densité \(f_{n}\).\\ 9. On définit la fonction \(f: \mathbb{R} \rightarrow \mathbb{R}_{+}\)par : \[ \forall x \in \mathbb{R}, \quad f(x)=\mathrm{e}^{-x} \mathrm{e}^{-\mathrm{e}^{-x}} \] Montrer que \(f\) est une densité de probabilité sur \(\mathbb{R}\). La loi de densité \(f\) est appelée loi de Gumbel.\\ 10. (a) Soit \(\left(Z_{i}\right)_{i \geq 1}\) la suite de variables aléatoires introduite précédemment. On pose \(W_{n}=\sum_{i=1}^{n} Z_{i}-\ln (n)\). Montrer que la fonction de répartition \(F_{W_{n}}\) de \(W_{n}\) est donnée par : \[ \forall x \in \mathbb{R}, \quad F_{W_{n}}(x)= \begin{cases}\left(1-\frac{\mathrm{e}^{-x}}{n}\right)^{n} & \text { si } x>-\ln (n) \\ 0 & \text { si } x \leq-\ln (n)\end{cases} \] (b) Montrer que la suite de variables aléatoires \(\left(W_{n}\right)_{n \geq 1}\) converge en loi vers une variable aléatoire de loi de Gumbel.\\ 11. (a) On rappelle qu'en Scilab l'instruction grand( 1,1, 'geom', p ) permet la simulation d'une variable aléatoire suivant la loi géométrique de paramètre \(p\).\\ Écrire une fonction d'en-tête function \(\mathrm{y}=\operatorname{simulV}(\mathrm{n})\) qui pour un entier \(n\) fourni en entrée, renvoie une simulation de la variable aléatoire \(V_{n}\) définie en introduction de ce problème.\\ (b) À la suite de la fonction simulV, écrire un programme Scilab qui construit un vecteur-ligne V contenant 1000 simulations indépendantes de la variable aléatoire \(V_{n}\) pour un certain entier \(n\) entré par l'utilisateur.\\ (c) On complète ce programme par le code suivant : \begin{verbatim} histplot(20,V) function y=f(x) y=exp(-x)*exp(-exp(-x)) endfunction absc=linspace(-1,10,100) fplot2d(absc,f) \end{verbatim} On obtient les sorties graphiques suivantes en exécutant le programme pour \(n=5, n=10\) puis \(n=50\) :\\ \includegraphics[max width=\textwidth, alt={}, center]{0d52445a-6651-4d93-ab69-f80b824c943b-4_577_778_294_157}\\ \includegraphics[max width=\textwidth, alt={}, center]{0d52445a-6651-4d93-ab69-f80b824c943b-4_570_766_296_1096}\\ \includegraphics[max width=\textwidth, alt={}, center]{0d52445a-6651-4d93-ab69-f80b824c943b-4_572_766_991_630} Que peut-on observer sur ces figures ? Quelle conjecture peut-on en déduire pour la suite \(\left(V_{n}\right)_{n \geq 1}\) ?\\ 12. Soit \(p \in] 0,1\) [ et soit \(U\) une variable aléatoire de loi exponentielle \(\mathcal{E}(p)\). On pose \(\alpha=-\frac{p}{\ln (1-p)}\). Montrer que la variable aléatoire \(V=\lfloor\alpha U\rfloor+1\) est de loi géométrique \(\mathcal{G}(p)\).\\ On rappelle que \(\lfloor t\rfloor\) désigne la partie entière du réel \(t\).\\ 13. (a) Montrer que la variable aléatoire \(V-\alpha U\) est à valeurs dans \([0,1]\). En déduire que \(\operatorname{Var}(V-\alpha U) \leq 1\).\\ (b) Soit \(X\) et \(Y\) deux variables aléatoires admettant un moment d'ordre 2. Justifier l'existence de la covariance \(\operatorname{Cov}(X, Y)\) puis montrer que : \[ \operatorname{Var}(X+Y) \leq 2(\operatorname{Var}(X)+\operatorname{Var}(Y)) \] On pourra calculer \(\operatorname{Var}(X+Y)\) et \(\operatorname{Var}(X-Y)\).\\ (c) En déduire que : \[ \operatorname{Var}(V-U) \leq 2+2 \frac{(1-\alpha)^{2}}{p^{2}} \] \begin{enumerate} \setcounter{enumi}{13} \item Dans cette question, on suppose que \(n \geq 2\). \end{enumerate} Soient \(Y_{1}, \ldots, Y_{n}, n\) variables aléatoires mutuellement indépendantes telles que pour tout \(i \in \llbracket 1, n \rrbracket, Y_{i}\) suit la loi exponentielle \(\mathcal{E}\left(\frac{n-i+1}{n}\right)\).\\ On pose \(\alpha_{1}=0, X_{1}^{\prime}=1\) et pour tout \(i \in \llbracket 2, n \rrbracket, \alpha_{i}=-\frac{n-i+1}{n} \times \frac{1}{\ln \left(\frac{i-1}{n}\right)}\) et \(X_{i}^{\prime}=\left\lfloor\alpha_{i} Y_{i}\right\rfloor+1\). De plus, on pose : \(W_{n}^{\prime}=\frac{Y_{1}+\cdots+Y_{n}}{n}-\ln (n)\) et \(V_{n}^{\prime}=\frac{X_{1}^{\prime}+\cdots+X_{n}^{\prime}}{n}-\ln (n)\).\\ (a) Montrer que : \[ \operatorname{Var}\left(V_{n}^{\prime}-W_{n}^{\prime}\right) \leq \frac{1}{n^{2}}+\frac{2}{n^{2}} \sum_{i=2}^{n}\left[\left(\frac{n}{n-i+1}\right)^{2}\left(1-\alpha_{i}\right)^{2}+1\right] . \] (b) i. Montrer que la fonction \(\phi:] 0,1[\rightarrow \mathbb{R}\) définie par : \[ \forall z \in] 0,1\left[, \quad \phi(z)=\frac{1}{(1-z)^{2}}\left(1+\frac{1-z}{\ln (z)}\right)^{2}\right. \] peut être prolongée en une fonction continue sur le segment \([0,1]\).\\ ii. En déduire qu'il existe un réel \(A>0\) tel que: \[ \lim _{n \rightarrow \infty} \frac{1}{n} \sum_{i=2}^{n}\left(\frac{n}{n-i+1}\right)^{2}\left(1-\alpha_{i}\right)^{2}=A . \] (c) Montrer que la suite de variables aléatoires \(\left(V_{n}^{\prime}-W_{n}^{\prime}\right)_{n \geq 2}\) converge en probabilité vers 0 .\\ (d) Montrer que la suite de variables aléatoires \(\left(V_{n}^{\prime}\right)_{n \geq 2}\) converge en loi vers une variable aléatoire de loi de Gumbel.\\ (e) On donne les valeurs numériques suivantes : \(\mathrm{e}^{-\mathrm{e}^{-x}} \approx 0.96\) si \(x=3.20\) et \(\mathrm{e}^{-\mathrm{e}^{-x}} \approx 0.04\) si \(x=-1.17\). Lorsque \(n=10^{6}\), montrer que : \[ \mathbb{P}\left(\frac{C_{n}}{n} \in[12.65,17.02]\right) \approx 0.92 . \] Comparer avec le résultat de la première partie et commenter. \section*{- Partie III -} Dans cette partie, on suppose que \(n \geq 2\). On suppose de plus que les vignettes sont numérotées de 1 à \(n\).\\ Pour tout \(i \in \llbracket 1, n \rrbracket\) et tout entier \(m \geq 1\), on note \(A_{i, m}\) la variable aléatoire donnant le nombre de vignettes numérotées \(i\) obtenues dans les \(m\) premiers paquets de céréales achetés.\\ 15. (a) Justifier que pour tout \(i \in \llbracket 1, n \rrbracket\), la variable aléatoire \(A_{i, m}\) suit la loi binomiale \(\mathcal{B}\left(m, \frac{1}{n}\right)\).\\ (b) Calculer la covariance \(\operatorname{Cov}\left(A_{1, m}, m-A_{1, m}\right)\).\\ (c) À l'aide d'un raisonnement par l'absurde, en déduire que les variables aléatoires \(A_{1, m}, \ldots, A_{n, m}\) ne sont pas mutuellement indépendantes.\\ 16. (a) Montrer que si \(\left(E_{i}\right)_{i \geq 1}\) est une famille d'événements, alors pour tout entier \(r \geq 1\) : \[ \mathbb{P}\left(\bigcup_{i=1}^{r} E_{i}\right) \leq \sum_{i=1}^{r} \mathbb{P}\left(E_{i}\right) . \] (b) Montrer que : \[ \mathbb{P}\left(C_{n}>m\right) \leq n\left(1-\frac{1}{n}\right)^{m} \leq n \mathrm{e}^{-\frac{m}{n}} . \] (c) Soit \(c\) un réel strictement positif. Montrer qu'on a la majoration : \[ \mathbb{P}\left(C_{n}>c n \ln (n)\right) \leq n^{1-c} . \] (d) Montrer que pour tout réel \(x>-\ln (n)\), on a : \[ \mathbb{P}\left(V_{n}>x\right) \leq \mathrm{e}^{-x} \] Dans la suite de cette partie, on introduit un modèle légèrement différent : le nombre \(N\) de paquets achetés est décrit par une variable aléatoire \(N\) de loi de Poisson \(\mathcal{P}(\lambda)\) avec \(\lambda>0\). On cherche à calculer la probabilité de compléter, à partir des \(N\) vignettes obtenues, la collection de vignettes. On suppose toujours que les vignettes sont numérotées de 1 à \(n\). On note \(\widetilde{A}_{i}\) la variable aléatoire donnant le nombre de vignettes numérotées \(i\) obtenues dans les \(N\) paquets de céréales achetés.\\ 17. (a) Soit \(p \in \mathbb{N}^{*}\). Justifier que pour tout \(i \in \llbracket 1, n \rrbracket\), la loi conditionnelle du couple ( \(\widetilde{A}_{i}, N\) ) conditionnée par l'événement \([N=p]\) est la loi binomiale \(\mathcal{B}\left(p, \frac{1}{n}\right)\) et en déduire que la variable aléatoire \(\widetilde{A}_{i}\) suit une loi de Poisson dont on déterminera le paramètre.\\ (b) Montrer que pour tout \(n\)-uplet \(\left(k_{1}, \ldots, k_{n}\right)\) avec \(k_{i} \in \mathbb{N}\) et \(k_{1}+\cdots+k_{n}=p\), on a: \[ \mathbb{P}_{[N=p]}\left(\left[\widetilde{A}_{1}=k_{1}\right] \cap \cdots \cap\left[\widetilde{A}_{n}=k_{n}\right]\right)=\frac{p!}{k_{1}!\cdots k_{n}!} \frac{1}{n^{p}} \] (c) Montrer que pour tout \(n\)-uplet \(\left(k_{1}, \ldots, k_{n}\right)\) avec \(k_{i} \in \mathbb{N}\), on a: \[ \mathbb{P}\left(\left[\widetilde{A}_{1}=k_{1}\right] \cap \cdots \cap\left[\widetilde{A}_{n}=k_{n}\right]\right)=\prod_{i=1}^{n} \frac{\mathrm{e}^{-\frac{\lambda}{n}}\left(\frac{\lambda}{n}\right)^{k_{i}}}{k_{i}!} \] (d) Montrer que les variables aléatoires \(\widetilde{A}_{1}, \ldots, \widetilde{A}_{n}\) sont mutuellement indépendantes. Commenter en comparant avec le résultat de la question 15.(c).\\ 18. Soit \(D_{n}\) l'événement « à l'issue des \(N\) achats de paquets de céréales, la collection de vignettes est complète ». Montrer que : \[ \mathbb{P}\left(D_{n}\right)=\left(1-\mathrm{e}^{-\frac{\lambda}{n}}\right)^{n} \] On admet le résultat suivant : pour tout \(p \in \mathbb{N}^{*}\), on a \(\mathbb{P}_{[N=p]}\left(D_{n}\right)=\mathbb{P}\left(C_{n} \leq p\right)\).\\ 19. (a) Montrer que : \[ \mathbb{P}\left(D_{n}\right)=\sum_{p=0}^{\infty} \mathbb{P}\left(C_{n} \leq p\right) \mathbb{P}(N=p) \] (b) On suppose maintenant que \(\lambda>1\). Soit \(a \in] \sqrt{\lambda}, \lambda\left[\right.\). On pose \(k_{1}=\lfloor\lambda-a\rfloor\) et \(k_{2}=\lfloor\lambda+a\rfloor+1\).\\ Montrer que : \[ \sum_{p=k_{1}}^{k_{2}} \mathbb{P}(N=p) \geq 1-\frac{\lambda}{a^{2}} \] (c) Montrer l'encadrement : \[ \mathbb{P}\left(C_{n} \leq k_{1}\right)\left(1-\frac{\lambda}{a^{2}}\right) \leq \mathbb{P}\left(D_{n}\right) \leq \mathbb{P}\left(C_{n} \leq k_{2}\right)+\frac{\lambda}{a^{2}} \] \begin{enumerate} \setcounter{enumi}{19} \item (a) Soit \(\left(c_{n}\right)_{n \geq 1}\) une suite convergente de nombres réels. \end{enumerate} Montrer que pour tout entier \(n\) suffisamment grand, on a l'encadrement : \[ \mathbb{P}\left(V_{n} \leq c_{n}-\frac{1}{n^{1 / 3}}-\frac{1}{n}\right)\left(1-\frac{\ln (n)+c_{n}}{n^{1 / 3}}\right) \leq\left(1-\frac{\mathrm{e}^{-c_{n}}}{n}\right)^{n} \leq \mathbb{P}\left(V_{n} \leq c_{n}+\frac{1}{n^{1 / 3}}+\frac{1}{n}\right)+\frac{\ln (n)+c_{n}}{n^{1 / 3}} . \] On pourra appliquer la question précédente avec \(\lambda=n \ln (n)+c_{n} n\) et a \(=n^{2 / 3}\).\\ (b) Retrouver alors la convergence en loi de la suite \(\left(V_{n}\right)_{n \geq 1}\) vers une variable aléatoire de loi de Gumbel. \end{document}