AgregTP3Scilab2017 2018
AgregTP3Scilab2017 2018
AgregTP3Scilab2017 2018
1
Université de Rouen – Agrégation externe de Mathématiques – Préparation à l’épreuve de modélisation 2017-2018
Définition 4 Avec les notations précédentes, pour p ∈]0; 1[, on définit le quantile empirique
d’ordre p de l’échantillon (X1 , . . . , Xn ) comme étant qn,p = X([np]+1) ([.] est la partie entière).
Propriétés des quantiles empiriques.
1. Si la loi µ possède un unique quantile d’ordre p ∈]0; 1[, qp = F (−1) (p), alors
p.s.
qn,p −−→ qp .
En terme statistique, qp,n est un estimateur fortement consistant de qp . C’est une consé-
quence du Théorème de Glivencko-Cantelli (voir aussi une autre preuve et d’autres
hypothèses au Théorème 8.13 [? , p.93].
2. Sous des hypothèses plus fortes (existence d’une densité f par rapport à la mesure de
Lebesgue pour la loi µ , et non-annulation de la densité au voisinage du quantile qp ,
on a aussi la normalité asymptotique de qp,n :
√
L p(1 − p)
n (qn,p − qp ) −−→ N 0, 2 .
f (qp )
L’Exercice 16 du polycopié Théorèmes limite en probabilités et statistiques
fournit un exemple de ce résultat (cas de la médiane d’une loi uniforme). La preuve
générale (plus difficile, pouvant être omise) peut être trouvée dans [? ].
2
Université de Rouen – Agrégation externe de Mathématiques – Préparation à l’épreuve de modélisation 2017-2018
Méthode 1. Pour comparer la loi d’un échantillon avec une loi théorique, on peut illus-
trer le Théorème de Glivencko-Cantelli : on superpose sur un même graphique la fonction
de répartition empirique du n−échantillon simulé (commande plot2d2), et la fonction de
répartition théorique de la loi sous-jacente.
//Simulation
n=100;
X=grand(1,n,’nor’,0,1);
//Tracé
scf(1)
clf
plot2d2(XX,(1:n)/n)
xset("line style",2)
xset("thickness",2)
plot2d(XX,FX,style=5)
xtitle(’Convergence de la FDR empirique...
d’’un échantillon de loi N(0,1)’)
legend([’FDR Empirique’;’FDR Theorique’])
3
Université de Rouen – Agrégation externe de Mathématiques – Préparation à l’épreuve de modélisation 2017-2018
L’aire totale de l’histogramme vaut 1, autrement dit, l’histogramme est une densité de pro-
babilité.
Méthode 2 - lois discrètes. Pour illustrer la qualité d’un n−échantillon de loi discrète, on
peut donc représenter le diagramme en bâtons associé, et superposer les “bâtons” de la loi
théorique sous-jacente à l’aide de la fonction plot2d3 de Scilab : ceci revient à superposer
fréquences empiriques dans l’échantillon et fréquences théoriques.
Exemple. Le code suivant permet de tirer un échantillon de loi binomiale B(20, 0.4) et de
représenter les fréquences empiriques obtenues en les comparant aux fréquences théoriques
de la loi B(20, 0.4).
4
Université de Rouen – Agrégation externe de Mathématiques – Préparation à l’épreuve de modélisation 2017-2018
//Simulation
n=200;
X=grand(1,n,’bin’,20,0.4);
//Tracé
scf(2)
clf
plot2d3(0:20,FreqEmp)
xset("thickness",2)
xset("line style",2)
plot2d3((0:20)+0.2,FreqTheo,style=5)
xtitle(’Convergence des fréquences,...
empiriques vers les fréquences,...
théoriques loi B(20,0.4)’)
legend([’Freq. Empiriques’;...
’Freq. Theoriques’])
3.2 Cas d’une loi absolument continue par rapport à la mesure de Le-
besgue sur R
Supposons que µ ait une densité f par rapport à la mesure de Lebesgue sur R, et notons
[a; b] son support. On choisit alors souvent une partition de [a; b] en intervalles de même
longueur hn : C = (C1 , . . . , Crn ). On obtient cette fois un “vrai” histogramme aussi appelé
éventuellement diagramme en barres,
rn
1 X
Hn,C (x) =
b Nj 1Cj (x), x ∈ R.
nhn
j=1
On choisit généralement une largeur hn d’intervalle qui tend vers 0 quand n tend vers ∞.
Remarque : en terme statistique, on dira que la fonction H b n,C est un estimateur non pa-
ramétrique de la densité f . Son principal défaut est de ne pas être lui-même régulier quand
parfois la densité à estimer l’est : H
b n,C n’est même pas continu. Une façon de résoudre le
problème consiste à lisser les histogrammes en définissant des estimateurs plus généraux, les
estimateurs à noyaux (voir exemple de texte de modélisation).
Méthode 2 - lois continues. Pour illustrer la qualité d’un n−échantillon de loi continue,
on peut donc représenter un histogramme associé, et superposer la densité de la loi théorique
5
Université de Rouen – Agrégation externe de Mathématiques – Préparation à l’épreuve de modélisation 2017-2018
//Simulation xset("thickness",2)
n=10000; plot2d(vect_x,densite_theo,style=5)
X=grand(1,n,’nor’,0,1);
//Tracé
scf(3)
clf
subplot(131)
histplot(5,X)
xset("thickness",2)
plot2d(vect_x,densite_theo,style=5)
subplot(132)
histplot(20,X)
xset("thickness",2)
plot2d(vect_x,densite_theo,style=5)
xtitle(’Histogrammes normalisés,...
d’’un échantillon N(0,1)’)
subplot(133)
histplot(100,X)
Pour effectuer une telle représentation, on peut commencer par implémenter une fonction
permettant de calculer le quantile empirique d’ordre p d’un échantillon X.
function y=Quantile_emp(X,p)
// X=echantillon, p=vecteur à composantes dans ]0,1]
//retourne les quantiles d’ordre p de X
n=length(X);
XX=gsort(X,’g’,’i’);
y=XX(n*p)
6
Université de Rouen – Agrégation externe de Mathématiques – Préparation à l’épreuve de modélisation 2017-2018
endfunction
Exemple. Le code suivant permet de tirer un échantillon de loi N (0, 1) et de comparer les
quantiles empiriques et théoriques.
exec(’Quantile_emp’)
//Simulation
n=1000;
X=grand(1,n,’nor’,0,1);
//Tracé
scf(4)
clf
plot2d(q_theo, q_emp, style=-1)
plot2d(q_theo,q_theo,style=5)
xtitle(’Quantiles théoriques versus,...
empiriques d’’un échantillon N(0,1)’)
7
Université de Rouen – Agrégation externe de Mathématiques – Préparation à l’épreuve de modélisation 2017-2018
espérance (et la calculer), mais pas de moment d’ordre 2. Illustrer le fait que dans ce
√ P
cas il n’y a pas convergence en loi de la suite ( n( ni=1 Xi /n − E[X1 ]))n vers une
variable de loi gaussienne. On admettra pour l’instant (jusqu’au TP suivant !), que si
U suit la loi U[0;1] , alors U −1/a suit la loi de Pareto de paramètre a.
Exercice 3 Une autre convergence en loi. Soit (Un )n≥1 une suite de variables aléatoires i.i.d
de loi U[0;1] . Soit Vn = n mini=1,...,n Ui , pour n ≥ 1.
1. Montrer que la suite (Vn )n≥1 converge en loi vers une variable de loi exponentielle de
paramètre 1.
2. Illustrer numériquement cette convergence.