Partie II. Transport optimal dans une situation déterministe
Dans toute cette partie, dsigne un entier supérieur ou égal à 2.
On considère N réels d_1,d_2,\dots,d_N (appelés points de départ) et N réels a_1,a_2,\dots,a_N (appelés points d'arrivée) vérifiant d_1<\! d_2<\! \dots<\! d_N et a_1<\! a_2<\! \dots<\! a_N.
On pose : D=\{d_1,d_2,\dots,d_N\} et A=\{a_1,a_2,\dots,a_N \}.
8.a) Montrer que pour tout couple (k,l)\in[\![1,N]\!]^2, on a : d_ka_k\geq d_ka_l+d_la_k-d_la_l.
Afficher
Référence programme : I-3.
Si k\geq l alors d_l-d_k\leq 0 et a_l-a_k\leq 0, par conséquent (d_l-d_k)(a_l-a_k)\geq 0. De la même manière on montre que si k\leq l on a aussi (d_l-d_k)(a_l-a_k)\geq 0. Donc dans tous les cas on a (d_l-d_k)(a_l-a_k)\geq 0. Il ne reste plus qu'à développer cette dernière inégalité et organiser pour trouver l'inégalité recherchée.
b) En déduire à l'aide d'une double sommation que pour tout N-uplet (p_1,p_2,\dots,p_N)\in\mathbb R_+^N tel que \sum_{k=1}^Np_k=1, on a :
\sum_{k=1}^Np_kd_ka_k\geq\left(\sum_{k=1}^Np_kd_k\right)\times\left(\sum_{k=1}^Np_ka_k\right)\ (1)
Afficher
Référence programme : I-1,3.
On multiplie l'inégalité de la question précédente par p_kp_l puis on double somme sur k et l. Grâce au fait que \sum_{k=1}^Np_k=1, on a :
\begin{align}
&\sum_{k=1}^N\sum_{l=1}^Np_kp_ld_ka_k\geq \sum_{k=1}^N\sum_{l=1}^Np_kp_l(d_ka_l+d_la_k-d_la_l)\\
&\Longleftrightarrow \sum_{l=1}^Np_l \sum_{k=1}^Np_kd_ka_k\sum_{k=1}^Np_kd_k\geq \sum_{k=1}^Np_kd_k\sum_{l=1}^Np_la_l+\sum_{k=1}^Np_ka_k\sum_{l=1}^Np_ld_l-\sum_{k=1}^Np_k\sum_{l=1}^Np_ld_la_l\\
&\Longleftrightarrow \sum_{k=1}^Np_kd_ka_k\geq \sum_{k=1}^Np_kd_k\sum_{l=1}^Np_la_l+\sum_{k=1}^Np_ka_k\sum_{l=1}^Np_ld_l-\sum_{l=1}^Np_ld_la_l.
\end{align}
Il ne reste plus qu'à réorganiser et à changer le noms des indices de sommation pour obtenir le résultat recherché.
9. Soit t\in{\cal E}_N. On réordonne la liste (t(1),t(2),\dots,t(N)) selon les valeurs croissantes et on note alors (\hat t(1),\hat t(2),\dots,\hat t(N)) la liste ordonnée obtenue. On a donc \hat t(1)\leq\hat t(2)\leq\dots\leq\hat t(N).
a) Justifier pour tout n\in[\![1,N]\!], l'inégalité : \sum_{k=n}^Na_{t(k)}\leq\sum_{k=n}^Na_{\hat t(k)}.
Afficher
Références programme : I-1,3.
On observe que si on prend la somme des p plus grand éléments parmi une liste donnée, cette somme sera plus grande qu'une somme quelconque d'autres éléments. Ici, comme (a_1,\dots,a_N) est ordonée et que (\hat t(1),\dots,\hat t(N)) aussi, \sum_{k=n}^Na_{\hat t(k)} est donc la somme des N-n+1 plus grand éléments de (a_{t(1)},\dots,a_{t(N)}) ce qui justifie l'inégalité.
b) On pose d_0=0. Justifier l'égalité : \sum_{n=1}^Nd_na_{t(n)}=\sum_{n=1}^N\left((d_n-d_{n-1})\sum_{k=n}^Na_{t(k)}\right).
Afficher
Référence programme : I-1.
On a
\begin{align}
\sum_{n=1}^N\left((d_n-d_{n-1})\sum_{k=n}^Na_{t(k)}\right)&= \sum_{n=1}^Nd_n\sum_{k=n}^Na_{t(k)}-\sum_{n=1}^Nd_{n-1}\sum_{k=n}^Na_{t(k)}\\
&=\sum_{n=1}^Nd_n\sum_{k=n}^Na_{t(k)}-\sum_{n=0}^{N-1}d_{n}\sum_{k=n+1}^{N}a_{t(k)}\text{ (par changement d'indice)}\\
&=d_Na_N+\sum_{n=1}^{N-1}d_n\sum_{k=n}^Na_{t(k)}-\sum_{n=1}^{N-1}d_{n}\sum_{k=n+1}^{N}a_{t(k)}\text{ (on rapelle que }d_0=0)\\
&=d_Na_N+\sum_{n=1}^{N-1}d_n\left(\sum_{k=n}^Na_{t(k)}-\sum_{k=n+1}^{N}a_{t(k)}\right)\\
&=d_Na_N+\sum_{n=1}^{N-1}d_na_{t(n)}\\
&=\sum_{n=1}^{N}d_na_{t(n)}
\end{align}
c) Etablir l'inégalité : \sum_{n=1}^Nd_na_{t(n)}\leq\sum_{n=1}^Nd_na_{\hat t(n)}\ (2).
Afficher
Références programme : I-1,3.
Puisque les d_n sont strictements ordonnés, on a (d_n-d_{n-1})>0, par conséquent d'après 9.a), on a (d_n-d_{n-1})\sum_{k=n}^Na_{t(k)}\leq (d_n-d_{n-1})\sum_{k=n}^Na_{\hat t(k)}. Il suit alors par 9.b)
\sum_{n=1}^Nd_na_{t(n)}=\sum_{n=1}^N\left((d_n-d_{n-1})\sum_{k=n}^Na_{t(k)}\right)\leq \sum_{n=1}^N\left((d_n-d_{n-1})\sum_{k=n}^Na_{\hat t(k)}\right)=\sum_{n=1}^Nd_na_{\hat t(n)},
et le résultat est prouvé.
On appelle programme de transport, toute bijection T de D sur A, et coût d'un programme de transport T, la somme c(T) définie par : c(T)=\sum_{k=1}^N(d_k-T(d_k))^2.
10. Soit \hat T le programme de transport défini par : pour tout k\in[\![1,N]\!],\ \hat T(d_k)=a_k.
Déduire des questions précédentes que le programme \hat T est optimal, c'est à dire que pour tout programme de transport T, on a : c(T)\geq c(\hat T).
Afficher
Références programme : I-1,3,4.
D'abord on développe :
c(T)=\sum_{k=1}^N(d_k-T(d_k))^2=\sum_{k=1}^Nd_k^2-2\sum_{k=1}^Nd_kT(d_k)+\sum_{k=1}^N(T(d_k))^2.
T étant une bijection et l'ordre ne comptant pas dans la sommation de \sum_{k=1}^NT(d_k), nous avons :
\sum_{k=1}^N(T(d_k))^2=\sum_{k=1}^Na_k^2=\sum_{k=1}^N(\hat T(d_k))^2.
D'autre part, T étant une bijection, le n-uplet (T(d_1),\dots,T(d_n)) peut être représenté à l'aide des notations du dessus (a_{t(1)},\dots,a_{t(n)}) et le n-uplet (\hat T(d_1),\dots,\hat T(d_n)) par (a_{\hat t(1)},\dots,a_{\hat t(n)}), de sorte que 9.c) nous donne l'inégalité suivante :
\sum_{k=1}^Nd_kT(d_k)=\sum_{k=1}^Nd_ka_{t(k)}\leq \sum_{k=1}^Nd_ka_{\hat t(k)}=\sum_{k=1}^Nd_k\hat T(d_k).
On a finalement :
c(T)=\sum_{k=1}^Nd_k^2-2\sum_{k=1}^Nd_kT(d_k)+\sum_{k=1}^N(T(d_k))^2\geq \sum_{k=1}^Nd_k^2-2\sum_{k=1}^Nd_k\hat T(d_k)+\sum_{k=1}^N(\hat T(d_k))^2=c(\hat T),
d'où le résultat.
11. Interprétation probabiliste des inégalités (1) et (2).
Soit h une application croissante de \mathbb R dans \mathbb R.
a) En utilisant l'inégalité (1), établir pour toute variable aléatoire discrète X ne prenant qu'un nombre fini de valeurs, l'inégalité : E(Xh(X))\geq E(X)E(h(X)).
Afficher
Référence programme : I-3.
Si on note a_1,\dots,a_n les valeurs distinctes prises par X et qu'on les suppose ordonnée dans l'ordre croissant (donc strictement croissant car les a_i sont distincts), on se trouve dans le champs d'application de (1). D'autre part si on note, d_i=h(a_i), comme h est croissante, les d_i sont également ordonnée dans l'ordre croissant. On observe en reprenant la démonstration de (1) que l'inégalité reste vraie en supposant un ordre large des d_i, c'est à dire d_1\leq\dots\leq d_n. Donc notre choix des d_i est encore dans le champs d'application de (1). Enfin si on pose p_i=P(X_i=a_i), on a bien \sum_{k=1}^np_i=1 et on est encore bien dans le champs d'application de (1). On a enfin avec le théorème de transfert et (1) que :
\begin{align}
E(Xh(X))&=\sum_{k=1}^na_kh(a_k)P(X=a_k)\\
&=\sum_{k=1}^na_kd_kp_k\\
&\geq\left(\sum_{k=1}^np_kd_k\right)\left(\sum_{k=1}^np_ka_k\right)\\
&=\left(\sum_{k=1}^nh(a_k)P(X=a_k)\right)\left(\sum_{k=1}^na_kP(X=a_k)\right)\\
&=E(h(X))E(X)
,\end{align}
ce qui prouve le résultat.
b) Que peut-on en déduire pour le coefficient de corrélation linéaire de X et h(X) lorsque les variances de X et h(X) sont strictement positives?
Afficher
Référence programme : VII-21.
Les variances de X et h(X) existent donc le coefficient de corrélation linéaire est bien défini. D'après 11.a) :
\rho(X,h(X))=\frac{Cov(X,h(X))}{\sqrt{V(X)V(h(X))}}=\frac{E(Xh(X))-E(X)E(h(X))}{\sqrt{V(X)V(h(X))}}\geq 0,
donc le coefficient de corélation linéaire est positif.
c) En utilisant l'inégalité (2), montrer que si X est une variable aléatoire discrète suivant la loi uniforme sur [\![1,N]\!] et t un élément de {\cal E}_N, on a : E(h(X)t(X))\leq E(h(X)\hat t(X)).
Afficher
Référence programme : VII-6.
Par la formule de transfert
E(h(X)t(X))=\sum_{k=1}^Nh(k)t(k)\frac{1}{N}=\frac{1}{N}\sum_{k=1}^Nh(k)t(k).
Si on pose d_k=h(k), par croissance de h, on observe que les d_k sont ordonnés par ordre croissants. En reprenant la preuve de (2), on observe que l'inégalité reste vraie si on suppose les d_k ordonnés au sens large, par conséquent les d_k posés précédemments sont dans le cadre d'application de (2). D'autre part si on pose a_{t(n)}=t(k), on a d'après (2) :
E(h(X)t(X))=\frac{1}{N}\sum_{k=1}^Nh(k)t(k)=\frac{1}{N}\sum_{k=1}^Nd_ka_{t(k)}\leq \frac{1}{N}\sum_{k=1}^Nd_ka_{\hat t(k)}=\frac{1}{N}\sum_{k=1}^Nh(k)\hat t(k)=E(h(X)\hat t(X)),
d'où le résultat.


Pour afficher le fil des commentaires : Commentaires.
Pour poster un commentaire ou obtenir de l'aide : c'est ici!
Formulaire
L'insertion de formules suit la syntaxe LATEX. Toute formule doit être encadrée par des dollars : \bf{\$formule\$}. Par exemple \bf{\$ u\_n \$} sera interprétée comme une formule et donnera \bf{u_n}. Voici quelques exemples pour ceux qui ne sont pas habitués :
- Indice bas u_n : u_n
- Indice haut X^p : X^p
- Multi-indices A_{1,2}^{pq} : A_{1,2}^{pq}
- Intégrales \int_a^b f(t)dt : \int_a^b f(t)dt
- Somme \sum_{i=1}^n u_i : \sum_{i=1}^n u_i
- Pour les lettres greques, il suffit de connaître leur noms, \alpha donn \alpha, \beta donne \beta, etc.
- Et pour les lettres greques majuscules, il suffit de mettre la première lettre en majuscule : \Gamma donne \Gamma, \Sigma donne \Sigma etc.