Stats Inf
Stats Inf
Stats Inf
Statistiques inferentielles
Statistiques inferentielles
1. Introduction vocabulaire
Pour e tudier une population statistique, on a recours a` deux methodes :
la methode exhaustive (ou recensement ) : on examine chacun des e lements de la population. En general, cette
methode est jugee trop longue.
la methode des sondages : on nexamine quune partie de la population pour essayer den d e duire des
informations sur la totalite de la population. Cette methode comprend deux parties :
le chantillonage qui permet de passer de la population totale a` une partie seulement de cette population
(le chantillon).
lestimation qui permet dinduire, a` partir des resultats observes sur lechantillon, des informations sur la
population totale.
Nous ne nous preoccuperons pas ici des probl`emes concernant lechantillonage. Notre propos sera seulement dexaminer deux methodes differentes destimation.
2. Principe de la theorie
On consid`ere une population P deffectif N. On suppose que, pour le caract`ere observe, la moyenne de P est m alors
que son e cart-type est . Ce sont ces deux valeurs que nous voudrions retrouver a` partir des e chantillons.
Supposons donc maintenant que nous disposons de k e chantillons de P, chacun dentre eux e tant deffectif n. On note
E1 E2 Ek ces k e chantillons, de moyennes respectives x1 x2 xk , et decart-type respectifs 1 2 k .
Lensemble X = x1 x2 xk est une serie statistique deffectif k, serie que lon appelle distribution des
moyennes. La theorie montre alors que
E X = m
et
X =
De plus, pour n 30, la variable aleatoire X suit approximativement une loi normale N m
la variable aleatoire
. Autrement dit,
X m
3. Estimation ponctuelle
Connaissant la moyenne x et lecart-type dun e chantillon de taille n, il sagit destimer la moyenne m, lecart-type
et la variance 2 de la population totale.
Pour la moyenne, lestimation ponctuelle est la methode nave qui consiste a` confondre la mesure sur lechantillon
avec la moyenne de la population totale. On dira que x est une estimation ponctuelle de la moyenne m .
Pour la variance et lecart type, on admettra que :
donc :
n
n 1
n
est une estimation ponctuelle de lecart-type
n 1
Dans le cas o`u, pour une population compl`ete, cest une frequence p que lon cherche a` estimer a` partir de la frequence
f observee sur un e chantillon, on bros`ede comme pour une moyenne. Plus precisement, lestimation ponctuelle est
la methode qui consiste a` confondre la mesure sur lechantillon avec la mesure de la population totale. Si f est la
frequence, sur lechantillon, du caract`ere observe, on dira que f est une estimation ponctuelle de la fre quence p .
Statistiques inferentielles
Echantillon
n x
Population
On prel`eve au hasard, et avec remise, une succession dechantillons de meme effectif n dont on calcule les moyennes
respectives : x1 pour le premier, x2 pour le deuxi`eme, et ainsi de suite.
Notons maintenant X la variable aleatoire qui associe a` un e chantillon Ei sa moyenne xi . La variable X prend donc
successivement les valeurs x1 , x2 ,
Pour finir, on suppose e galement que les conditions sont reunies pour pouvoir
n
X m suit la loi normale N (0 1). On aura alors, pour tout t
T =
0,
P( t
t) = 2(t) 1
On a 2(t) 1 = 0 95
(t) = 0 975. Avec la table donnee dans le formulaire, on voit que cette valeur est
obtenue pour t = 1 96. On a donc
n
(X m) 1 96 = 0 95
P 1 96
(X m) 1 96
= 0 95
n
n
P m 1 96
X m + 1 96
= 0 95
n
n
P 1 96
Autrement dit, avant de prelever un e chantillon de taille n dans la population, il y a 95% de chances pour que cet
e chantillon ait une moyenne entre
m 1 96
et
m + 1 96
n
n
Comme m est inconnu, on se sert des resultats precedents pour encadrer m :
P X 1 96
m
P X 1 96
P X + 1 96
= 0 95
n
96
= 0 95
n
96
= 0 95
n
X + 1 96
X 1
X + 1
Ainsi, avant de prelever un e chantillon de taille n dans la population, il y a 95% de chances pour la moyenne x de
cet e chantillon verifie
x 1 96
m x + 1 96
n
n
En revanche, apr`es le prel`evement, il ny a plus de probabilite a` envisgager : il est vrai ou faux que la moyenne m se
Statistiques inferentielles
Lintervalle
x t
x+t
n
n
Echantillon
p : inconnue
n f
Population
On se place dans le cas o`u lon peut considerer que la variable F qui, a` tout e chantillon aleatoire de taille n fixee,
associe la frequance de cet e chantillon possedant la propriete fixee, suit la loi normale N p p(1 p) n .
Un raisonnement et des calculs analoguent a` ceux du paragraphe precedent nous donnent alors le resultat suivant :
Lintervalle
f t
f (1 f )
f +t
n 1
f (1 f )
n 1
Statistiques inferentielles
Nombre de pi`eces
(en grammes)
[745 755 [
[755 765 [
[765 775 [
10
[775 785 [
11
[785 795 [
[795 805 [
p 780 h
780 + h = 0 95
784 08 = 0 95
Ainsi, en supposant que m = 780, on sait, avant de prelever un e chantillon aleatoire de taille 36, que lon a 95% de
chances que sa moyenne soit dans lintervalle [775 92 ; 784 08].
Autrement dit, si H0 est vraie, il ny a que 5% de chances de prelever un e chantillon aleatoire de taille 36 dont la
moyenne soit inferieure a` 775 92 ou superieure a` 784 08.
Si x
Statistiques inferentielles
Region critique
Region critique
0, 95
775, 92
780
784, 08
On accepte H0
Si H0 est vraie, on prend donc le risque de se tromper dans 5% des cas en rejetant a` tord H0 . On definit ainsi une region
critique au seuil = 5%.
Le seuil est la probabilite de rejeter H0 alors que H0 est vraie. Il correspond a` lerreur de premi`ere esp`ece.
En general, on fixe a priori la valeur de (ici e gal a` 0 05).
Dans lexemple qui nous occupe, on a x = 774 7 pour lechantillon considere. On a x 775 92 et on rejette lhypoth`ese
H0 . Au seuil de 5%, on consid`ere que les 500 pi`eces de la population nont pas une moyenne de 780 g et on refuse la
livraison.
Region critique
0, 99
774, 62
780
785, 38
On accepte H0
Mais, en acceptant H0 au seuil de 1%, on court un second risque : celui daccepter H0 alors que H0 est fausse : cest
lerreur de seconde esp`ece, dont la probabilite est notee .
En general, lorque la taille n de lechantillon est fixee, on a qui diminue lorsque augmente, et reciproquement. Le
seule facon de diminuer en meme temps et est daugmenter n, ce qui nest pas toujours possible.
En fait, la plupart du temps, les erreurs des deux types nont pas la meme importance, et on essaie de limiter la plus
grave.
Statistiques inferentielles
7.6 - Resume
En general, les questions faisant intervenir un test de validite dhypoth`ese peuvent e tre resolues en adoptant le plan
suivant :
1. Construction du test
a ) Choix de lhypoth`ese nulle H0 et de lhypoth`ese alternative H1 .
b ) Determination de la region critique a` un seuil donne.
c ) Enonc
e de la r`egle de decision : si un param`etre du ou des e chantillon(s) est dans la region critique, on rejette
H0 , sinon on laccepte.
2. Utilisation du test
Nombre de pi`eces
[745 755 [
[755 765 [
12
[765 775 [
16
[775 785 [
11
[785 795 [
[795 805 [
La masse moyenne des pi`eces de lechantillon est de 779 6 alors que lechantillon de 36 pi`eces provenant du premier
fournisseur a pour moyenne 774 7 g.
La difference de 4 9 entre ces moyennes provient-elle dune difference entre les productions des deux fournisseurs ou
du choix des e chantillons ?
Autrement dit, comment construire et utiliser un test permettant de decider, a` partir des e chantillons ci-dessus, sil y a
une difference significative, au seuil de 5%, entre les moyennes des masses des pi`eces livrees par les deux fournisseurs ?
mA : inconnue
A = 12 5
nA = 36
x A = 774 7
A = 12 36
mB : inconnue
B = 12 1
Echantillon
nB = 50
x B = 779 6
B = 11 99
Echantillon
Population A
Population B
Soit X A (resp X B ) la variable aleatoire qui, a` tout e chantillon de taille nA = 36 (resp nB = 50) prelevbe aleatoirement et
avec remise dans la population A (resp B), associe la moyenne des masses de pi`eces de lechantillon.
Statistiques inferentielles
Par definition, la variable aleatoire D = X B X B associe a` tout e chantillon de taille 36 ainsi preleve dans la population A
et a` tout e chantillon ainsi preleve dans lma population B la difference des moyennes de lechantillon B et de lechantillon
A.
On suppose que les variables X A et X B sont independantes.
Alors D = X B X A suit une loi normale et
E(D) = E X B X A = E X B E X A = mB mA
V (D) = V X B X A = V X B + V X A =
2B 2A
+
nB nA
2B 2A
+
nB nA
Region critique
Region critique
0, 95
-5, 29
5, 29
On accepte H0
Enonc
e de la r`egle de decision
On prel`eve avec remise un e chantillon aleatoire de taille nA = 30 de la population A et on calcule sa moyenne x A ;
on fait de meme pour la population B avec nB = 50. On pose d = x B x A .
si d [ 5 29 ; 5 29] on accepte H0 .
si d [ 5 29 ; 5 29] on rejette H0 et on accepte H1 .
Statistiques inferentielles
9. Un dernier exemple
9.1 - Definition du probl`eme
Toujours avec les donneees precedentes, comment construire et utiliser un test permettant de decider, a` partir des
memes e chantillons, si la moyenne des masses des pi`eces livrees par le fournisseur B est significativement superieure,
au seuil de 5%, a` celle du fournisseur A ?
Region critique
0, 95
4, 44
Enonc
e de la r`egle de decision
On prel`eve avec remise un e chantillon aleatoire de taille nA = 30 de la population A et on calcule sa moyenne x A ;
on fait de meme pour la population B avec nB = 50. On pose d = x B x A .
si d 4 44 on accepte H0 .
si d 4 44 on rejette H0 et on accepte H1 .
Statistiques inferentielles
Exercices
Exercice 1 : Introduction aux intervalles de confiance
1. Soit X une variable aleatoire suivant la loi normale centree reduite N (0 1).
b ) On approche Y par une variable aleatoire Y1 qui suit une loi de Poisson P (). Quelle est la valeur du param`etre
?
Calculer la probabilite que lechantillon preleve contienne exactement 10 bouchons defectueux.
3. En vue du controle de reglage de la machine, on prel`eve reguli`erement dans la production des e chantillons de
100 bouchons.
On appelle X la variable aleatoire qui, a` chaque e chantillon de 100 bouchons, associe le diam`etre moyen des
bouchons de cet e chantillon.
Lorsque la machine est bien reglee, X suit la loi normale de param`etres m et = 10 (on rappelle que m = 22
et = 0 025).
a ) Determiner le reel a tel que P(22 a X 22 + a) = 0 95.
b ) Sur un e chantillon de 100 bouchons, on a les resultats suivants (les mesures des diam`etres e tant reparties en
classe damplitude 0 02 mm) :
Classes de diam`etres
effectif correspondant
27
30
24
En supposant que tous les bouchons dune classe ont pour diam`etre la valeur centrale de cette classe, donner
la moyenne et lecart-type de cette serie (aucune justification demandee; resultats arrondis a` lordre 10 4 ).
9
Statistiques inferentielles
En utilisant la question precedente, peut-on accepter au seuil de risque 5%, lhypoth`ese selon laquelle la
machine est bien reglee ?
Exercice 3 : Des glaces ! bts mai, 1995
Une fabrique de desserts glaces dispose dune chane automatisee pour remplir et emballer des cones de glace.
Partie A
Chaque cone est rempli avec de la glace a` la vanille. On designe par X la variable aleatoire qui, a` chaque cone, associe
la masse (exprimee en grammes) de glace quil contient. On suppose que X suit la loi normale de param e` tres m = 100
et .
2. Un cone est considere comme bon lorsque la masse de glace quil contient appartient a` lintervalle [95 ; 105].
est bon soit e gale a` 0 95
Determiner la valeur du param`etre telle que la probabilite de levenement le cone
(on donnera le resultat avec deux decimales).
Partie B
Les cones de glace sont emballes individuellement puis conditionnes en lots de 2 000 pour la vente en gros.
On consid`ere que la probabilite quun cone presente un defaut quelconque avant son conditionnement en gros est e gale
a` 0 000 5.
On nomme Z la variable aleatoire qui, a` chaque lot de 2 000 cones preleves au hasard dans la production, associe le
nombre de cones defectueux presents dans le lot.
1. Quelle est la loi suivie par Z ?
2. On admet que la loi de Z peut e tre approchee par une loi de Poisson.
On suppose que X suit une loi normale de moyenne 100 et decart-type 0 25.
1. Calculer la probabilite quune tige prelevee au hasard dans la production soit conforme pour la longueur.
2. Determiner le nombre reel h positif tel que :
p(100 h
100 + h) = 0 95
Statistiques inferentielles
2. Calculer la probabilite que, dans un tel prel`evement, au plus deux tiges ne soient pas conformes pour la longueur.
3. On consid`ere que la loi suivie par Y peut-etre approchee par une loi de Poisson. Determiner le param`etre de
cette loi de Poisson.
4. On designe par Z une variable aleatoire suivant la loi de Poisson de param`etre o`u a la valeur obtenue au 4.
Calculer p(Z = 2) et p(Z 2).
C - Intervalle de confiance.
Dans cette question, on sinteresse au diam`etre des tiges, exprime en millim`etres.
On prel`eve au hasard et avec remise un e chantillon de 50 tiges dans la production dun journee.
Soit D la variable aleatoire qui, a` tout e chantillon de 50 tiges prelevees au hasard et avec remise dans la production
dun journee, associe la moyenne des diam`etres des tiges de cet e chantillon.
On suppose que D suit une loi normale de moyenne inconnue et decart-type 50 avec = 0 19.
Pour lechantillon preleve, la moyenne obtenue, arrondie a` 10 2 , est x = 9 99.
` partir des informations portant sur cet e chantillon, donner une estimation ponctuelle de la moyenne des tiges
1. A
produites dans cette journee.
2. Determiner un intervalle de confiance centre sur x de la moyenne des diam`etres des tiges produites pendant la
journee consideree, avec le coefficient de confiance de 95%.
3. On consid`ere laffirmation suivante : la moyenne est obligatoirement dans lintervalle de confiance
obtenue a` la question 2. .
Est-elle vraie ? (on ne demande pas de justification.)
Exercice 5 : Des pi`eces en serie , bts mai, session 1997
Une entreprise fabrique en serie des pi`eces dont le diam`etre, mesure en millim`etres, definit une variable aleatoire D.
On admet que cette variable aleatoire D suit la loi normale de moyenne m et decart type .
1. Estimation de m et :
a ) Un e chantillon de 100 pi`eces est preleve au hasard dans la production. Les mesures des diam`etres des pi`eces
de cet e chantillon son regroupees dans le tableau suivant :
Mesures des
diam`etres (en mm)
[4 0; 4 2[
[4 2; 4 4[
[4 4; 4 6[
[4 6; 4 8[
[4 8; 5 0[
effectif
24
41
25
En faisant lhypoth`ese que, pour chaque classe, les valeurs mesurees sont e gales a` celle du centre de la classe,
calculer, a` 10 2 pr`es, la moyenne d et lecart type s de cet e chantillon.
En deduire lestimation ponctuelle de fournie par cet e chantillon.
b ) On appelle D la variable aleatoire qui, a` chaque e chantillon de 100 pi`eces, associe la moyenne des diam`etres
des pi`eces de lechantillon.
On rappelle que D suit la loi normale de moyenne m et decart type 10.
Determiner un intervalle de confiance de la moyenne m de D au seuil de confiance de 95%.
2. Dans cette question, on admet que la production comporte 5 % de pi`eces inutilisables.
Statistiques inferentielles
Statistiques inferentielles
Lhypoth`ese nulle est H0 : = 90. Dans ce cas la livraison est dite conforme pour le diam`etre.
Lhypoth`ese alternative est H1 : = 90.
Le seuil de signification du test est fixe a` 0 05.
1. Enoncer
la r`egle de decision permettant dutiliser ce test en admettant, sous lhypoth`ese nulle H0 , le resultat
suivant qui na pas a` e tre demontre :
p(89 967
X2
90 033) = 0 95
2. On prel`eve un e chantillon de 100 rondelles dans la livraison et on observe que, pour cet e chantillon, la moyenne
des diam`etres est x = 90 02.
Peut-on, au seuil de 5%, conclure que la livraison est conforme pour le diam`etre ?
Exercice 7 : Variation du coefficient de confiance
la moyenne du nombre de camions en panne chaque jour, suit la loi normale N ( s n). On prend pour valeur
lestimation ponctuelle obtenue au 2..
Determiner un intervalle de confiance de la moyenne de la population avec le coefficient de confiance 95%.
Exercice 9 : Recherche de leffectif dun e chantillon
Sur une portion de route o`u la vitesse des vehicules est limitee a` 90 km/h, on effectue un contro le des vitesses avecun
instrument de mesure de grande precision.
On mesure la vitesse (en km/h) dun vehicule sur vingt et on obtient les resultats suivants pour un e chantillon de
100 vehicules que lon assimile a` un e chantillon obtenu par prel`evement aleatoire avec remise :
Vitesse (en km/h)
Effectif
[75 80 [
[80 85 [
10
[85 90 [
20
[90 95 [
36
[95 100 [
15
[100 105 [
[105 110 [
13
Statistiques inferentielles
1. En supposant que les valeurs observees sont celles du centre de la classe, calculer, a` 10 2 pr`es, la moyenne x et
lecart-type des vitesses pour cet e chantillon.
` partir des resultats obtenus pour cet e chantillon, proposer une estimation ponctuelle de la moyenne et de
2. A
lecart-type s des vitesses des 2 000 vehicules de la population observee.
3. On suppose que la variable aleatoire X qui, a` tout e chantillon de taille n = 100
obtenu comme precedemment,
associe la moyenne des vitesses de lechantillon, suit la loi normale N ( n). On prend pour valeur de s
lestimation ponctuelle obtenue au 2..
Determiner un intervalle de confiance de la vitesse moyenne de la population avec le coefficient de confiance
99%.
4. Quelle dot e tre la taille minimale n de lechantillon pour connatre, avec le coefficient de confiance 95% la vitesse
moyenne de la population a` 0 5 km h pr`es ?
Exercice 10 : Longueur des pi`eces (test bilateral)
Dans un atelier, une machine fabrique des pi`eces en grande serie ; on sinteresse a` leur longueur mesuree en cm. On
admet que la variable aleatoire X qui, a` chaque pi`ece tiree au hasard dansla production associe sa longueur, suit une
loi normale de moyenne m et decart-type = 0 14.
Afin de controler le fait que la moyenne m des longueurs des pi`eces produites est 150, on se propose de construire un
test dhypoth`ese.
On prel`eve des e chantillons aleatoires de 49 pi`eces (chaque e chantillon e tant obtenu par tirage avec remise).
` chaque e chantillon ainsi defini, on associe la moyenne x des longueurs des 49 pi`eces ; on definit ainsi une variable
A
aleatoire X.
Lhypoth`ese nulle est H0 : m = 150 ; lhypoth`ese alternative est H1 : m = 150.
Le suil de signification du test est fixe a` 0 05.
3. Enoncer
la r`egle de decision permettant dutiliser ce test.
4. La moyenne observee sur un e chantillon de 49 pi`eces est x = 149 9. Que peut-on en conclure au seuil de
signification 5% quant a` la qualite des pi`eces produites ?
Exercice 11 : Il e tait un petit navire
Les toles constituant les ponts dun paquebot subissent des deformations lors des operations dassemblage par soudure.
Les toles doivent e tre redressees ; cette operation necessite de nombreuses heures de travail.
1. Lors dune construction, on rel`eve les durees necessaires au redressage dun e chantillon representatif de 50 toles.
Les resultats obtenus sont resumes dans le tableau suivant :
xi
[0, 10[
[10, 20[
[20, 30[
[30, 40[
[40, 50[
[50, 60[
[60, 70[
ni
20
12
a ) Determiner un intervalle de confiance contenant, avec 95% de certitude, la moyenne m, en supposant que
la variable aleatoire qui, a` tout e chantillon de 50 toles prelevees au hasard,
associe la duree moyenne du
redressage pour une tole de cet e chantillon, suit la loi normale N (m n) o`u n = 50.
b ) Quelle devrait e tre la taille de lechantillon a` e tudier pour que lamplitude de lintervalle de confiance de la
moyenne soit 3 heures avec une probabilite de 0 95 ?
14
Statistiques inferentielles
3. Construire un test permettant daccepter ou de refuser, au seuil de 5%, lhypoth e` se selon laquelle la duree
necessaire au redressage dune tole est en moyenne de 40 heures.
Utiliser ce test avec lechantillon de lenonce.
4. Meme question avec le seuil de signification de 1%.
Exercice 12 : Statistiques inferentielles : un probl`eme de synth`ese. Bts Maintenance industrielle, 1996
Partie I
La variable aleatoire X qui, a` chaque moteur tire au hasard dans la production, associe sa duree de vie moyenne
exprimee en heures, suit la loi normale de moyenne 400 et decart type 40.
1. Un moteur est declare non commercialisable si sa duree de vie est inferieure a` 318 heures. Calculer, a` 10 4 pr`es
la probabilite p quun moteur preleve au hasard dans la production ne soit pas commercialisable.
2. On admet que p = 0 02. Soit Y la variable aleatoire qui, a` tout lot de 50 moteurs, associe le nombre de moteurs
non commercialisables. La production est assez importante pour que lon puisse assimiler le pr e l`evement de
50 moteurs a` un prel`evement aleatoire avec remise.
a ) Quelle est la loi suivie par Y ? Justifier la reponse et donner ses param`etres.
b ) Calculer a` 10 3 pr`es la probabilite de levenement : il y a au plus trois moteurs non commercialisables .
Partie II
La filiale MAT prel`eve un e chantillon de taille 100 sur la production dun jour et mesure la duree de vie, en heures,
des moteurs. Les resultats obtenus sont les suivants :
duree de vie
[300 340[
[340 380[
[380 420[
[420 460[
[460 500[
Effectifs
21
48
16
1. En faisant lhypoth`ese que les valeurs mesurees sont celles du centre de classe, calculer, a` 10 2 pr`es, la moyenne
m1 et lecart type 1 de cette serie statistique.
La filiale MATIC, dans des conditions similaires, contro le un e chantillon de taille 100 et obtient pour resultats
m2 = 406 8 et 2 = 40 5.
2. On designe par X1 la variable aleatoire qui, a` chaque e chantillon de 100 moteurs preleves au hasard par la filiale
MAT, associe sa moyenne, et par X2 la variable aleatoire qui, a` chaque e chantillon de 100 moteurs preleves au
hasard par la filiale MATIC, associe sa moyenne.
Tous les e chantillons consideres sont assimiles a` des e chantillons preleves avec remise.
On suppose que les variables aleatoires X1 , X2 , D = X1 X2 suivent des lois normales de moyennes respectives
M1 , M2 , M1 M2 inconnues, et on estime lecart type de D par
D =
21 + 22
100
b ) Enoncer
la r`egle de decision du test.
c ) Utiliser ce test avec les deux e chantillons de lenonce et conclure.
15
Statistiques inferentielles
pr`es.
Une entreprise fabrique des plaquettes dont la longueur et la largeur sont mesurees en mm.
Partie A
Sur un e chantillon de 100 plaquettes, on a mesure la longueur de chaque plaquette et obtenu le tableau suivant :
Longueur
[35 37[
[37 39[
[39 41[
[41 43[
[43 45[
effectif
25
50
20
1. On veut calculer une valeur approchee de la moyenne m et de lecart type s de lechantillon. Pour cela, on fait
comme si toutes les observations dune classe e taient situees au centre de la classe. Calculer m et s. Compte tenu
de lerreur de methode induite par lapproximation precedente, les resultats seront donnes a` 10 1 pr`es.
2. On suppose que la variable aleatoire L qui a` chaque plaquette associe sa longueur suit une loi normale de moyenne
et decart type 1 6.
a ) Donner une estimation ponctuelle de .
b ) Determiner un intervalle de confiance a` 95% de centre sur la valeur obtenue precedemment.
Partie B
On suppose dans cette partie que L suit une loi normale de moyenne 40 et decart type 1 6 et que la largeur suit une
loi normale de moyenne 25 et decart type 1 2.
1. On tire une plaquette au hasard dans la production.
a ) Quelle est la probabilite dobtenir une longueur comprise entre 37 et 43 mm ?
Partie C
La probabilite dobtenir une plaquette qui soit rejetee est e gale a` 0 07.
On appelle X la variable aleatoire qui a` un lot de 100 plaquettes extraites de la fabrication associe le nombre de
plaquettes rejetees contenues dans ce lot.
1. Quelle est la loi de probabilite suivie par X ? Preciser ses param`etres et son esperance mathematique.
2. En admettant que la loi de X peut e tre approchee par une loi de Poisson, preciser son param`etre.
Quelle est alors la probabilite dobtenir strictement moins de 10 plaquettes rejetees dans un lot de 100 plaquettes ?
Exercice 14 : Des paquets de farine, bts MAI, 1993
Une machine est chargee de conditionner des paquets de farine. La masse M dun paquet est une variable al e atoire qui
suit une loi normale decart-type constant = 30, et dont la moyenne m peut-etre modifiee. Un paquet est refuse si sa
masse est inferieure a` 995 grammes.
1. On suppose que la moyenne m est e gale a` 1 000.
16
Statistiques inferentielles
b ) Calculer la probabilite de levenement B : un vehicule tire au hasard dans le parc a, au plus, deux
sinistres pendant lannee consideree .
des sinistres
3. Etude du cout
Dans ce qui suit, on sinteresse au cout dune certaine categorie de sinistres survenus dans lentreprise pendant
lannee consideree.
On consid`ere la variable aleatoire C qui, a` chaque sinistre tire au hasard parmi les sinistres de cette categorie,
associe son cout en euros.
On suppose que C suit la loi normale de moyenne 1 200 et decart type 200.
Calculer la probabilite quun sinistre tire au hasard parmi les sinistres de ce type cou te entre 1 000 euros et
1 500 euros.
4. La question ci-dessous doit e tre traitee par les candidats de toutes les spe cialites de BTS du
groupement B, a` lexception du BTS Maintenance et exploitation des mate riels aeronautiques.
On consid`ere un e chantillon de 100 vehicules preleves au hasard dans le parc de vehicules mis en service depuis
6 mois. Ce parc contient suffisamment de vehicules pour quon puisse assimiler ce tirage a` un tirage avec remise.
On constate que 91 vehicules de cet e chantillon nont pas eu de sinistre.
a ) Donner une estimation ponctuelle du pourcentage p de vehicules de ce parc qui nont pas eu de sinistre
6 mois apr`es leur mise en service.
b ) Soit F la variable aleatoire qui a` tout e chantillon de 100 vehicules preleves au hasard et avec remise dans ce
parc, associe le pourcentage de vehicules qui nont pas eu de sinistre 6 mois apr`es leur mise en service.
On suppose que F suit la loi normale
p(1 p)
N p
100
o`u p est le pourcentage inconnu de vehicules du parc qui nont pas eu de sinistre 6 mois apr`es leur mise en
service.
Determiner un intervalle de confiance du pourcentage p avec le coefficient de confiance 95%.
17
Statistiques inferentielles
Effectif : ni
1 345
508
228
78
35
yi = ln ni
b ) Determiner, a` laide dune calculatrice, une e quation de la droite de regression de y en x sous la forme
y = ax + b
o`u a et b sont a` arrondir a` 10 2 .
` laide de lequation precedente, estimer le nombre de vehicules ayant eu six sinistres pendant leur premi`ere
c) A
annee de mise en circulation.
Exercice 16 : Une chane dembouteillage, bts mai, mai 2003
Les quatres questions de cet exercice sont inde pendantes
Dans une usine du secteur de lagroalimentaire, une
machine a` embouteiller est alimentee par un reservoir
deau et par une file dapprovisionnement en bouteilles
Rservoir
vides, selon le schema ci-contre.
Lexercice consiste en une e tude statistique du bon
fonctionnement de ce syst`eme.
File dentre
File de sortie
Machine
1. Defaut dapprovisionnement
On consid`ere quil y a defaut dapprovisionnement :
soit lorsque la file dentree des bouteilles est vide,
soit lorsque le reservoir est vide.
On tire au hasard un jour ouvrable dans une annee. On note A levenement : la file dattente est vide au
moins une fois dans la journee et B levenement : le reservoir est vide au moins une fois dans la
journee .
On suppose que les e venements A et B sont independants et une e tude statistique a montre que
p(A) = 0 04
et
p(B) = 0 02
Statistiques inferentielles
a ) p(X 2);
b ) la probabilite de levenement la machine a au plus quatre pannes pendant la pe riode de 100 jours
consecutifs ;
c ) le plus petit entier n tel que : p(X n) 0 99.
Dans tout ce qui suit, les volumes sont exprime s en litres et tous les resultats approches sont a` arrondir
a` 10 3 .
3. Qualite de lembouteillage a` la sortie
On designe par Y la variable aleatoire qui, a` toute bouteille prise au hasard dans la production dune heure, associe
le volume deau quelle contient. On admet que, lorsque la machine est bien reglee, Y suit la loi normale de
moyenne 1 5 et decart-type 0 01.
Une bouteille deau est conforme aux normes de lentreprise lorsquelle contient entre 1 47 et 1 53 litre deau.
Calculer la probabilite quune bouteille satisfasse a` la norme.
4. Fiabilite dune machine a` embouteiller
On sinteresse a` une machine a` embouteiller prelevee au hasard dans le parc des machines sur le point detre
livrees par le constructeur.
On designe par T la variable aleatoire qui, a` toute machine prelevee au hasard dans le parc, asssocie sa duree de
vie avant une defaillance.
On note p(T t) la probabilite quune machine prelevee au hasard dans le parc nait pas de defaillance avant
linstant t, exprime en jours.
On suppose que p(T t) = e 0 005t .
a ) Calculer la probabilite quune machine prelevee au hasard dans le parc fonctionne plus de 200 jours sans
panne.
b ) Determiner t pour que la probabilite quune machine prelevee au hasard dans le parc fonctionne plus de t
jours, soit e gale a` 0 8. Arrondir a` lentier par defaut.
19