Soit X une variable aléatoire d’espérance E(X) et de variance V(X).
On pose Mn la variable aléatoire moyenne d’un échantillon de taille n de X ; autrement
dit, Mn=n1i=1∑nXi, où les variables Xi sont indépendantes et de même loi de probabilité (celle de X).
Alors, pour tout réel a strictement positif, P(∣Mn−E(X)∣⩾a)⩽na2V(X).
Cette inégalité est appelée l’inégalité de concentration.
Rappel
Un échantillon de taille n de X est la donnée de n variables aléatoires indépendantes X1, … , Xn, suivant toutes la même loi de probabilité, qui est celle de X.
On effectue n lancers successifs supposés indépendants d’une pièce équilibrée.
On associe à chaque tirage i la variable aléatoire Xi, prenant comme valeur 0 si on
obtient face et 1 si on obtient pile.
On pose Sn=X1+…+Xn la variable aléatoire donnant le nombre de piles obtenu.
On pose Mn=nSn.
On a, pour tout i∈{1;…;n}, E(Xi)=21 et V(Xi)=41.
Pour n=10000, l’inégalité de concentration donne
P(∣∣∣∣∣Mn−21∣∣∣∣∣⩾0,01)⩽10000×0,01241 donc P(∣∣∣∣∣Mn−21∣∣∣∣∣⩾0,01)⩽41.
Ainsi, pour 10000 lancers, la probabilité que la proportion de pile obtenue s’écarte de plus d’un centième de 21 est inférieure à 41.
Application et méthode - 3
Énoncé
On reprend l’exemple précédent. On souhaite que l’écart entre la proportion de pile obtenue et 21 soit inférieur ou égal à 0,01.
Quelle est la valeur minimale de n pour que le risque d’erreur soit inférieur ou égal à 5 % ?
B
Loi faible des grands nombres
Propriété
Soit (Xn) un échantillon d’une variable aléatoire.
On pose Mn=n1k=1∑nXk.
Alors, pour tout réel a strictement positif, n→+∞limP(∣Mn−E(X)∣⩾a)=0.
Remarque
Il existe une propriété similaire, dite loi forte des grands nombres, qui dépasse le cadre de ce cours.
DÉMONSTRATION
On applique l’inégalité de concentration à la variable aléatoire Mn. 0⩽P(∣Mn−E(X)∣⩾a)⩽na2V(X). Puisque n→+∞limn1=0, on a n→+∞limna2V(X)=0 donc,
d’après le théorème des gendarmes, n→+∞limP(∣Mn−E(X)∣⩾a)=0.
Application et méthode - 4
Énoncé
On considère une urne contenant cinq boules noires et trois boules blanches. On souhaite estimer la probabilité d’obtenir au moins six boules noires sur un ensemble de dix tirages avec remise.
Pour simuler cette expérience plusieurs fois, Adrien a écrit un programme avec Python.
En effectuant 100000 épreuves de dix tirages, il obtient une proportion p≈0,6943.
Sachant que la variance est 2,344, déterminer la probabilité de se tromper de plus d’un centième.
Utilisation des cookies
Lors de votre navigation sur ce site, des cookies nécessaires au bon fonctionnement et exemptés de consentement sont déposés.