Statistique Appliquee 1

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 20

Statistique Appliquée

au Commerce et à la Gestion
Code classroom 2qm7nnb

I. SALHI
Ecole Nationale de Commerce et de Gestion

September 26, 2024

1 / 20
Objectives ET Prérequis
Objectives
☞ Familiariser avec les concepts et les méthodes de la statistique inférentielle.
☞ Explorer les avantages et les limites des différentes méthodes.
☞ Concrétiser l’utilité de ces outils dans un contexte métier.
☞ Initier au logiciel statistique R.

Prérequis
☞ Statistiques descriptives
☞ Probabilité
☞ Programmation

2 / 20
Plan

1. Motivation

2. Distributions d’échantillonnage

3 / 20
Statistique et Marketing

4 / 20
Statistique et e-Commerce
“We are all about getting the right message, about the right product, at the right
time to our customer — targeted, relevant, and authentic communication is our
primary goal.” VP of Marketing

5 / 20
Statistique et Politique

1
1
https://www.economist.com/interactive/us-2024-election/prediction-model/president/how-
this-works 6 / 20
Statistique et Sport

7 / 20
Statistique et Sport

2
2
https://news.liverpool.ac.uk/2024/06/14/is-it-coming-home-supercomputer-predicts- 8 / 20
Oui la statistique est intéressante, mais comment ça marche?

9 / 20
Des données à une modélisation
Exemple : Packaging A ou packaging B
Pickfua interroge les clients d’Amazon et de Walmart s’ils préfèrent le packaging A
ou B.
a
Plateforme d’études de consommation en ligne

3
3
https://www.pickfu.com/blog/product-packaging-amazon/
10 / 20
Des données à une modélisation
Exemple : Packaging A ou packaging B
☞ Pickfu interroge les clients d’Amazon et de Walmart s’ils préfèrent le
packaging A ou B.
☞ n clients ont répondu au sondage

Clients ID 1 2 3 4 5 6 ...
Réponse A A B A B A ...

☞ Problème métier : choisir le packaging qui se vend le mieux.


☞ Solution : se baser sur les données du sondage pour prendre une décision

11 / 20
Démarche statistique
Codage : on code, par exemple, le choix A par 0 et B par 1.
Clients ID 1 2 3 4 5 6 ...
Réponse 0 0 1 0 1 0 ...

☞ Population : Clients
☞ Variable : Package choisi, qu’on note X , de modalités 0 et 1
☞ Le choix des sondés se fait de manière aléatoire et indépendante les uns des
autres.
☞ C’est une expérience aléatoire et chaque réponse attendue est une variable
aléatoire qu’on note Xi .
☞ On note x1 , x2 , . . . , xn les réalisations de X1 , X2 , ..., Xn
12 / 20
Échantillon Aléaoire

Les mesures sur les individus choisis au hasard sont considérées comme étant les
réalisations d’une suite X1 , . . . , Xn de variables aléatoires.
Définition
On dit qu’une suite X1 , . . . , Xn de variables aléatoires est un échantillon aléatoire
d’une variable aléatoire X si
☞ chaque variable Xi est de même loi que X
☞ X1 , . . . , Xn les variables sont mutuellement indépendantes

13 / 20
Modèle statistique paramétrique

La réponse d’un client choisi au hasard est considérée comme la réalisation d’une
variable aléatoire de loi Bernoulli.
Loi Bernoulli B(p)
On dit que la variable X suit une loi Bernoulli si

P(X = 1) = p et P(X = 0) = 1 − p

où 0 ≤ p ≤ 1 dit paramètre de la loi Bernoulli. On note B(p).

14 / 20
Modèle statistique paramétrique

☞ Dans notre exemple, le paramètre p correspond à la proportion des réponses


en faveur de B qui est inconnu.
☞ Si le nombre des clients est vraiment très grand, les enquêteurs n’ont pas le
temps d’interroger tout le monde et ne peuvent accéder à la vraie valeur de p.

15 / 20
Modèle statistique paramétrique

☞ Dans notre exemple, le paramètre p correspond à la proportion des réponses


en faveur de B qui est inconnu.
☞ Si le nombre des clients est vraiment très grand, les enquêteurs n’ont pas le
temps d’interroger tout le monde et ne peuvent accéder à la vraie valeur de p.
☞ La théorie de l’estimation permet d’approcher p avec un degré de confiance
raisonnable.

16 / 20
Statistique de l’échantillon

Définition
Toute variable aléatoire T , fonction de l’échantillon aléatoire X1 , . . . , Xn , est
appelée statistique de l’échantillon.

Exemples
☞ La variable aléatoire min Xi est une statistique de l’échantillon X1 , . . . , Xn
1≤i≤n
☞ De même la variable max Xi est une statistique de l’échantillon X1 , . . . , Xn
1≤i≤n
☞ La variable log (X1 + X2 + . . . + Xn ) est également une statistique de
l’échantillon X1 , . . . , Xn .

17 / 20
Moyenne empirique
Définition
La moyenne empirique d’un échantillon aléatoire X1 , . . . , Xn est la statistique
suivante : n
1X
X̄n = Xi
n i=1

Propriétés
Soit X1 , . . . , Xn un échantillon aléatoire de la variable parente X .
☞ E (X̄n ) = E (X )
☞ V (X̄n ) = n1 V (X )

Exercice : Vérifier les propriétés précédentes.


18 / 20
Variance empirique

Définition
La variance empirique d’un échantillon aléatoire X1 , . . . , Xn est la statistique
suivante : n
2 1X
Sn = (Xi − X̄n )2
n i=1

Propriétés
Soit X1 , . . . , Xn un échantillon aléatoire de la variable parente X .
☞ E (Sn2 ) = n−1 n
V (X )

19 / 20
Remarques

☞ Il ne faut pas confondre l’échantillon aléatoire X1 , . . . , Xn et les réalisations


x1 , . . . , xn .
☞ X1 , . . . , Xn est une série de variables aléatoires et x1 , . . . , xn sont des valeurs
numériques.

20 / 20

Vous aimerez peut-être aussi