Toutes les variables aléatoires qui apparaissent dans ce problème sont supposées définies sur un même espace probabilisé $(\Omega,{\cal A},P)$.
On note $F_Z$ la fonction de répartition d'une variable aléatoire $Z$ et, si cette variable aléatoire admet une densité, on note $f_Z$ une densité de $Z$.
Sous réserve d'existence, on note $E(Z)$ et $V(Z)$ respectivement, l'espérance et la variance d'une variable aléatoire réelle $Z$, et $Cov(Z_1,Z_2)$ la covariance de deux variables aléatoires $Z_1$ et $Z_2$.
La fonction exponentielle est notée $exp$ et la partie entière d'un réel $x$ est notée $[x]$.
On admet les résultats suivants :
dans tous le problème, on considère une variable aléatoire $X$ de fonction de répartition $F_X$ et admettant une densité $f_X$.
Les solutions éventuelles de l'équation $F_X(x)=\frac{1}{2}$ s'appellent les médianes théoriques de $X$.
Pour $n$ entier de $\mathbb N^*$, on considère un $n$-échantillon $(X_1,X_2,\dots,X_n)$ i.i.d. (indépendant, identiquement distribué) de la loi de $X$ et on définit la variable aléatoire : $\bar X_n=\frac{1}{n}\sum_{k=1}^nX_k$ qui est la moyenne empirique de l'échantillon $(X_1,X_2,\dots,X_n)$.
On admet l'existence de variables aléatoires à densité $Y_1,Y_2,\dots,Y_n$ telles que, pour tout $\omega$ de $\Omega$, les réels $Y_1(\omega),Y_2(\omega),\dots,Y_n(\omega)$ constituent un réarrangement par ordre croissant des réels $X_1(\omega),X_2(\omega),\dots,X_n(\omega)$, de telle sorte que, pour tout $\omega$ de $\Omega$ : $Y_1(\omega)\leq Y_2(\omega)\leq\dots\leq Y_n(\omega)$.
En particulier, $Y_1=\inf(X_1,X_2,\dots,X_n)$ et $Y_n=\sup(X_1,X_2,\dots,X_n)$. Plus généralement, pour tout $k$ de $[\![1,n]\!]$, il existe une fonction $\psi_k$ définie et continue sur $\mathbb R^n$ à valeurs réelles, telle que $Y_k=\psi(X_1,X_2,\dots,X_n)$. Si $n$ est un entier impair ($n=2l+1$, avec $l\in\mathbb N$), alors la variable aléatoire $Y_{l+1}$ est appelée la médiane empirique de l'échantillon $(X_1,X_2,\dots,X_n)$.
La partie II du problème est indépendante de la partie I.
Pour tout réel $x$ et tout entier $k$ de $[\![1,n]\!]$, on note $J_k(x)$ la variable aléatoire de Bernouilli définie par : $$J_k(x)= \begin{cases} & 1\text{ si }[X_k\leq x]\text{ est réalisé}\\ & 0\text{ si }[X_k> x]\text{ est réalisé} \end{cases}\text{; on pose }S_n(x)=\sum_{k=1}^nJ_k(x)$$
1. a) Montrer que les fonctions $f_{Y_1}$ et $f_{Y_n}$ définies pour tout $x$ réel par : $f_{Y_1}=n(1-F_X(x))^{n-1}f_X(x)$ et $f_{Y_n}(x)=n\left(F_X(x)\right)^{n-1}f_X(x)$, sont des densités de $Y_1$ et $Y_n$ respectivment.
$f_X\geq 0$ et comme $0\leq F_X\leq 1$ on a $1-F_X\geq 0$ donc $f_{Y_1}\geq 0$. Enfin $f_X$ étant la dérivée de $F_X$, on remarque qu'une primitive de $f_{Y_1}$ est $(1-F_X)^n$. Connaissant une primitive et utilisant les propriétés de la fonction de répartition, on montre facilement que $\int_{-\infty}^{+\infty}f_{y_1}(t)dt=1$. On raisonne de même pour $f_{Y_n}$.
b) Quelle est la loi de probabilité de la variable aléatoire $S_n(x)$?
$S_n(x)$ est une somme de variables élatoires de Bernouilli indépendantes de paramètre $P(X\leq x)$ donc $S_n(x)$ suit une loi binomiale ${\cal B}(n,P(X\leq x))$.
c) Justifier l'égalité entre évènements suivante : $[Y_k\leq x]=[S_n(x)\geq k]$.
$Y_k\leq x$ est équivalent à $Y_1\leq Y_2\leq\dots\leq Y_k\leq x$ car les $Y_i$ sont ordonnés. Cette dernière affirmation est équivalente à $[J_1=1]\cap[J_2=1]\cap\dots\cap[J_k=1]$ par définition des $J_i$, ce qui est encore équivalent à $S_n\geq k$ par définition de $S_n$.
d) Etablir la relation : pour tout $x$ réel, $F_{Y_k}(x)=\sum_{j=k}^n\begin{pmatrix}n\\ j\end{pmatrix}(F_X(x))^j(1-F_X(x))^{n-j}$.
On revient à la définition de la fonction de répartition $F_{Y_k}(x)=P(Y_k\leq x)$, or d'après c), cette dernière vaut $F_{Y_k}(x)=P(S_n\geq x)$. Enfin comme $S_n$ suit une loi binomiale de proba $P(X\leq x)=F_X(x)$, légalité suit.
e) En déduire que pour tout $k$ de $[\![1,n]\!]$, la fonction $f_{Y_k}$ définie pour tout $x$ réel par : $$f_{Y_k}(x)=k\begin{pmatrix}n\\ k\end{pmatrix}(F_X(x))^{k-1}(1-F_X(x))^{n-k}f_X(x)$$ est une densité de $Y_k$.
Il suffit de dériver l'équation obtenue en c).
f) Montrer que si $X$ admet un moment d'ordre $r$ ($r\in\mathbb N^*$), alors pour tout $k$ de $[\![1,n]\!]$, $Y_k$ admet un moment d'ordre $r$.
Comme $F_X$ est compris entre 0 et 1, on a l'inégalité suivante : $$|x|^rf_{Y_k}(x)\leq k\begin{pmatrix}n\\ k\end{pmatrix}f_X(x).$$ Or $X$ admettant un moment d'ordre $r$ donc l'intégrale $\int_{\mathbb R}|x|^rf_X(x)dx$ converge et donc par comparaison l'intégrale $\int_{\mathbb R}|x|^rf_{Y_k}(x)dx$ converge également, c'est-à-dire que $Y_k$ a un moment d'ordre $r$.
Exemple. dans les questions 2 à 4, on suppose que la fonction de répartition $F_X$ est donnée par : $$F_X(x)=\begin{cases} & 1-\frac{1}{\sqrt{x}}\text{ si }x\geq 1\\ & 0\text{ si }x<\! 1 \end{cases}$$
2. a) Tracer la courbe représentative de $F_X$ dans le plan rapporté à un repère orthonormé.
Préciser la demi tangente à droite au point d'abscisse $x=1$.
On trouve $y=\frac{1}{2}(x-1)$.
Justifier que $X$ est une variable aléatoire à densité et préciser une densité $f_X$ de $X$.
$F_X$ est continue, croissante et $\lim_{x\to-\infty}F_X(x)=0$ et $\lim_{x\to+\infty}F_X(x)=1$ donc $X$ admet une densité. Une densité de $X$ est alors : $$f_X(x)=\begin{cases}&\frac{1}{2x^{3/2}}\text{ si }x\geq 1\\&0\text{ si }x<\!1\end{cases}$$
b) Montrer que $X$ n'admet aucun moment.
On observe que pour $x\geq 1$, $|x|^rf_X(x)=\frac{1}{x^{3/2-r}}$, or par Riemann $\int_1^{+\infty}\frac{1}{x^{3/2-r}}dx$ diverge pour $r\in\mathbb N^*$.
c) Etablir l'unicité de la médiane théorique $M$ de $X$. Calculer $M$.
L'existence et l'unicité vient du fait que $F_X$ est strictement croissante sur $[1,+\infty[$ combiné avec le théorème de la bijection. En résolvant $F_X(x)=\frac{1}{2}$, on trouve $M=4$.
d) Expliciter, pour tout $k$ de $[\![1,n]\!]$ et pour tout $x$ réel, l'expression $f_{Y_k}(x)$ d'une densité de $Y_k$.
En déduire un équivalent de $f_{Y_k}(x)$ lorsque $x$ tend vers $+\infty$.
D'après 1.e), on a : $$f_{Y_k}(x)=\begin{cases}& 0\text{ si }x<\! 1\\ &k\begin{pmatrix}n\\ k\end{pmatrix}\left(1-\frac{1}{\sqrt{x}}\right)^{k-1}\frac{1}{x^{(n-k)/2}}\text{ si }x\geq 1\end{cases}$$ On en déduit que $f_{Y_k}(x)\underset{x\to+\infty}{\sim}k\begin{pmatrix}n\\ k\end{pmatrix}\frac{1}{x^{(n-k)/2}}$.
3. On suppose dans cette question que $n\geq 3$.
a) Montrer que pour tout $k$ de $[\![1,n-2]\!]$, $Y_k$ admet une espérance.
Grâce à l'équivalent de la question précédente, on a $|x|f_{Y_k}(x)\underset{x\to+\infty}{\sim}k\begin{pmatrix}n\\ k\end{pmatrix}\frac{1}{x^{(n-k+2)/2}}$ et on conclut facilement en utilisant Riemann (et $k\in[\![1,n-2]\!]$) et le critère d'équivalence que l'intégrale $\int_{-\infty}^{+\infty}|x|f_{Y_k}(x)dx$ converge. D'où l'existence d'une espérance.
b) En justifiant l'emploi du changement de variable $t=\frac{1}{\sqrt{x}}$, établir pour tout $k$ de $[\![1,n-2]\!]$, la formule : $E(Y_k)=k\begin{pmatrix}n\\ k\end{pmatrix}\int_0^1t^{n-k-2}(1-t)^{k-1}dt$.
On a $$E(Y_k)=\int_{-\infty}^{+\infty}xf_{Y_k}(x)dx=k\begin{pmatrix}n\\ k\end{pmatrix}\int_1^{+\infty}\left(1-\frac{1}{\sqrt{x}}\right)^{k-1}\frac{x}{x^{(n-k)/2}}dx.$$ Or le changement de variable $t=\frac{1}{\sqrt{x}}$ est continu, strictement décroissant sur $[1,+\infty[$ donc on est réalisable pour cette intégrale généralisée. En effectuant ce changement, on trouve le résulta demandé.
c) Pour tout couple $(r,s)$ de $(\mathbb N^*)^2$, on pose : $I_{r,s}=\int_0^1t^{r-1}(1-t)^{s-1}dt$.
Montrer que pour tout couple $(r,s)$ de $(\mathbb N^*)^2$, on a : $I_{r,s}=\frac{(r-1)!(s-1)!}{(r+s-1)!}$.
En effectuant une intégration par parties, on obtient la relation de récurrence suivante : $$I_{r,s}=\left[\frac{1}{r}t^{r}(1-t)^s\right]_0^1-\int_0^1\frac{1}{r}t^{r}(-s)(1-t)^{s-2}dt=\frac{s}{r}I_{r+1,s-1}.$$ Si on rétirère $s$ fois cette relation on obtient : $$I_{r,s}=\frac{s(s-1)\dots 1}{r(r+1)\dots(r+s)}I_{r+s,0}=\frac{s!1.2\dots(r-1)r}{1.2\dots(r-1)r(r+1)\dots(r+s)}I_{r+s,0}=\frac{r!s!}{(r+s)!}I_{r+s,0}.$$ Enfin un petit calcul d'intégrale nous donne $I_{r+s,0}=1$.
d) En déduire l'expression de $E(Y_k)$ pour tout $k$ de $[\![1,n-2]\!]$.
$$E(Y_k)=k\begin{pmatrix}n\\ k\end{pmatrix}I_{n-k-1,k}=k\begin{pmatrix}n\\ k\end{pmatrix}\frac{(n-k-2)!(k-1)!}{(n-2)!}=\frac{n!(n-k-2)!}{(n-k)!(n-2)!}=\frac{n(n-1)}{(n-k)(n-k-1)}.$$
e) On suppose que $n$ est impair et supérieur ou égal à 5, et on pose $n=2l+1$. Justifier la définition de la médiane empirique $Y_{l+1}$ d'un échantillon, et établir l'égalité : $E(Y_{l+1})=4+\frac{6}{l-1}$. Commenter.
Pour un échantillon donné $X_1,\dots,X_{2l+1}$, $Y_{l_1}$ est le $X$ qui admet autant d'élément plus grands et plus petit que lui. Il s'agit donc bien de la médiane de l'échantillon.
Le calcul de l'espérance est une simple application de la formule de la question précédente.
On observe que lorsque la taille $2n+1$ de l'échantillon tend vers l'infini, l'espérance de la médiane empirique tend vers $4$ qui est l'espérence de la moyenne théorique. On s'attend à ce que $Y_{l+1}$ soit un bon candidat pour estimer la médiane.
4. On pose pour tout $n$ de $\mathbb N^*$ : $Z_n=\frac{1}{n^2}\sup(X_1,X_2,\dots,X_n)=\frac{Y_n}{n^2}$.
a) Calculer pour tout $x$ réel, $F_{Z_n}(x)$.
On observe d'abord que : $$F_{Z_n}(x)=P(X_1\leq n^2x,\dots,X_n\leq n^2x).$$ Or par indépendance des $X_i$ et le fait qu'ils suivent la même distribution $X$, on a : $$F_{Z_n}(x)=P(X\leq n^2x)^n=F_X(n^2 x)^n= \begin{cases}\left(1-\frac{1}{n\sqrt{x}}\right)^n\text{ si }x\geq 1\\ 0\text{ si }x<\!1\end{cases}.$$
b) On définit la fonction $\varphi_Z$ par : $\varphi_Z(x)=\begin{cases}&\exp\left(-\frac{1}{\sqrt{x}}\right)\text{ si }x>0\\ & 0\text{ si }x\leq 0\end{cases}.$
Montrer que $\varphi_Z$ est la fonction de répartition d'une variable aléatoire $Z$ à densité.
On a clairement $\lim_{x\to+\infty}\varphi_Z(x)=1$, $\lim_{x\to-\infty}\varphi_Z(x)=0$, que $\varphi_Z$ est croissante et dérivable sur $]-\infty,0[$ et $]0,+\infty[$. Le seul point peut-être délicat est la continuité en 0. Or on a clairement $\lim_{x\to 0^-}\varphi_Z(x)=\lim_{x\to 0^+}\varphi_Z(x)=\varphi(0)=0$ donc la continuité suit.
c) (attention le sujet comporte une erreur!) Montrer que la suite de variables aléatoires $(Z_n)_{n\in\mathbb N^*}$ converge en loi vers $Z$.
Le sujet contient une erreur car $F_{Z_n}$ converge vers la fonction de répartition : $$\varphi_Z(x)=\begin{cases}&\exp\left(-\frac{1}{\sqrt{x}}\right)\text{ si }x>1\\ & 0\text{ si }x\leq 1\end{cases}.$$ Pour le voir, on observe que pour $x\geq 1$, $F_{Z_n}(x)=\exp\left(n\ln\left(1-\frac{1}{n\sqrt{x}}\right)\right)\underset{n\to+\infty}{\sim}\exp\left(n\frac{1}{n\sqrt{x}}\right)=\exp\left(\frac{1}{\sqrt{x}}\right).$
Pour afficher le fil des commentaires : Commentaires.
Pour poster un commentaire ou obtenir de l'aide : c'est ici!
L'insertion de formules suit la syntaxe LATEX. Toute formule doit être encadrée par des dollars : $\bf{\$formule\$}$. Par exemple $\bf{\$ u\_n \$}$ sera interprétée comme une formule et donnera $\bf{u_n}$. Voici quelques exemples pour ceux qui ne sont pas habitués :
Contacter l'auteur du site : frederic.millet @ math-sup.fr