Maths Cnam

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 68

Chapitre 1

Statistiques descriptives
1.1 Introduction
Voici une définition de statistique :
Les statistiques ont pour objet l’étude de populations en général nombreuses : des-
cription de leurs propriétés à l’aide de tableaux, graphiques et traitements numé-
riques (paramètres tels que moyennes, médiane, variance ...). Ce sont les statistiques
descriptives ou déductives
La statistique est d’un point de vue théorique une science, une méthode
et une technique. La statistique comprend : la collecte des données, le
traitement des données collectées, l’interprétation des données et la pré-
sentation afin de rendre les données compréhensibles par tous.
Donnons quelques exemples d’utilisation de la statistique dans divers domaines.
• économie, assurance, finance : prévisions économétriques, analyse de la consom-
mation des ménages, fixation des primes d’assurance et franchises, études
quantitatives de marchés, gestion de portefeuille, évaluation d’actifs financiers,
···
• biologie, médecine : essais thérapeutiques, épidémiologie, dynamique des
populations, analyse du génôme, · · ·
• sciences de la terre : prévisions météorologiques, exploration pétrolière, · · ·
• sciences humaines : enquêtes d’opinion, sondages, études de populations, · · ·
• sciences de l’ingénieur : contrôle de qualité, maîtrise statistique des procé-
dés (méthode « six-sigma »), sûreté de fonctionnement (fiabilité, disponibilité,
sécurité,...), maîtrise des risques industriels, évaluation des performances des
systèmes complexes, · · ·
• sciences de l’information et de la communication : traitement des images
et des signaux, reconnaissance des formes et de la parole, analyse exploratoire
des grandes bases de données, analyse des réseaux de communication, · · ·

1
• physique : mécanique statistique, théorie cinétique des gaz, · · ·
Dans ce cours nous nous intéresserons à un type de statistique en particulier : celle
qui n’étudie qu’un caractère ou qu’une variable à la fois ; on parle alors de statistique
unidimensionnelle ou de statistique à une seule variable.
Définition 1. Une étude statistique unidimensionnelle porte sur une caractéristique
bien définie que l’on désigne par caractère ou variable et qui est présente chez
chacun des éléments ou individus d’un ensemble donné appelé population.
Par exemple la population peut être les étudiants d’une classe et le caractère peut être
les notes à l’examen de fin d’année.
On distingue deux types de caractères.
Définition 2. Une variable, ou caractère, statistique est dite qualitative si ses valeurs
s’expriment de façon littérale ou par un codage sur lequel les opérations arithmé-
tiques n’ont pas de sens.
Par exemple le sexe des personnes interrogées, le numéro de leur département de
naissances (bien que cela soit des nombres et que les opérations arithmétiques usuelles
soient valides, il n’y a aucun sens à considérer la somme de numéro de département
ou la moyenne de ces numéros ; il s’agit ici d’un codage), leur situation familiale, la
mention recalé, passable, assez bien, bien et très bien que peut avoir un étudiant à un
examen.
Dans ce dernier exemple on dit que le caractère est ordinal car on peut tout de même
ordonner les valeurs du caractères. Dans les autres exemples, on parle de caractère,
ou variable, nominale (ne sont décrit que par leur nom).
Définition 3. Une variable, ou caractère, statistique est dite quantitative si ses va-
leurs sont des nombres sur lesquels les opérations arithmétiques ont un sens. Elle
peut être de deux formes :
• Discrète : si elle ne prend qu’un nombre fini de valeur. Ces valeurs sont appelées
des modalités.
• Continue : si elle prend ses valeurs dans un intervalle. Ces intervalles sont appe-
lées des classes.
Définition 4. Une série statistique est l’ensemble des modalités ou classes corres-
pondant à tous les individus de la population considérée.

1.2 Série statistique à caractère discret


Dans la suite de ce chapitre, on fixe une série statistique à caractère discret S. Cela
signifie que S est un ensemble fini de nombres réels. Il existe donc des nombres
αi ∈ R tel que S = {α1 , α2 , · · · , αn }
On note k le nombre de modalité différente et x1 , x2 , ..., xk ces différentes modalités
ordonnées dans l’ordre permettant au mieux d’observer la série (dans la plupart des
cas c’est dans l’ordre croissant).
Pour illustrer les définitions et notions nous utiliserons l’exemple suivant jusqu’à la
fin du chapitre :
• La population étudiée est un groupe de TD de 30 étudiants.
• Le caractère étudié est les résultats obtenus à l’examen de mathématiques. Les
notes, sur 20, sont les suivantes :

12 11 7 10 9 3
12 15 8 8 14 11
7 2 0 18 11 14
16 11 9 12 11 11
15 10 15 7 14 10

Le nombre de modalité différente est de 13 ( k = 13 tandis que n = 30) et les


différentes modalités sont x1 = 0, x2 = 2, x3 = 3, x4 = 7, x5 = 8, x6 = 9, x7 = 10,
x8 = 11, x9 = 12, x10 = 14, x11 = 15, x12 = 16, x13 = 18. A noter que toute
modalité est une valeur mais toute valeur n’est pas une modalité. Par exemple 12 est
une valeur et aussi une modalité mais 17 est une valeur sans être une modalité ; 17
est une valeur pour le caractère (une note) mais n’est pas une modalité de la série
statistique car aucun des xi ne vaut 17.

1.2.1 Effectif et fréquence


Définition 5. Le nombre d’élément de la série S est appelé l’effectif total de la série
statistique S.
Définition 6. Soit xi une modalité de la série statistique S. Le nombre ni de répétition
de xi dans la série S est appelé l’effectif de xi .
Dans la pratique, on représente ces résultats dans un tableau :

Caractères x1 x2 · · · xk
Effectifs n1 n2 · · · nk

Dans notre exemple, l’effectif total vaut 30 et les effectifs sont :

Notes 0 2 3 7 8 9 10 11 12 14 15 16 18
Effectifs 1 1 1 3 2 2 3 6 3 3 3 1 1
Par construction on a la proposition suivante.

Proprosition. Notons ni l’effectif de la modalité xi .


k
X
n= ni
i=1

On vérifie en effet que dans notre exemple

1 + 1 + 1 + 3 + 2 + 2 + 3 + 6 + 3 + 3 + 3 + 1 + 1 = 30.

Définition 7. Soit xi une modalité de la série statistique S. On appelle fréquence


relative à la modalité xi le rapport de l’effectif de la modalité xi avec l’effectif total.
ni
fi :=
n
Naturellement puisque la somme des effectifs vaut l’effectif total, la somme des fré-
quence, vaut 1 :
k
X
fi = 1
i=1
Ce dernier résultat montre en fait que la somme des pi = 100fi fait 100 et donc que
les pi décrivent le pourcentage de l’effectif total ayant xi pour caractère. On complète
alors le tableau :

Caractères x1 x2 · · · xk
Effectifs n1 n2 · · · nk
Fréquences f1 f2 · · · fk
Pourcentages p1 p2 · · · pk
Ce qui donne dans notre exemple :
Notes 0 2 3 7 8 9 10 11 12 14 15 16 18
Effectifs 1 1 1 3 2 2 3 6 3 3 3 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1
Fréquences 30 30 30 10 15 15 10 5 10 10 10 30 30
10 10 10 20 20 10 10
Pourcentages 3% 3% 3% 10% 3% 3%
10% 20% 10% 10% 10% 3% 3%
On interprète cela en observant, par exemple, que 20% des étudiants ont obtenu un
11/20 à leur examen.
Définition 8. L’effectif cumulé croissant (resp. décroissant) pour la modalité xi est
la somme des effectifs des modalités qui lui sont inférieures (resp. supérieures).
i
X
Ni = nj
j=1
k
X
Ni0

resp. = nj
j=i

k
X
On observe en particulier que Nk (resp. N10 ) = nj = n (l’effectif total). On com-
j=1
plète le tableau :

Caractères x1 x2 ··· xk
Effectifs n1 n2 ··· nk
Effectifs cumulés croissants n1 n1 + n2 · · · n1 + · · · + nk
Effectifs cumulés décroissants n1 + · · · + nk n2 + · · · + nk · · · nk

Avec notre exemple :

Notes 0 2 3 7 8 9 10 11 12 14 15 16 18
Effectifs 1 1 1 3 2 2 3 6 3 3 3 1 1
Effectifs cumulés croissants 1 2 3 6 8 10 13 19 22 25 28 29 30
Effectifs cumulés décroissant 30 29 28 27 24 22 20 17 11 8 5 2 1

On peut interpréter ces résultats en observant, par exemple, que 10 étudiants ont
obtenu une note strictement inférieure à 10.

Définition 9. La fréquence cumulée croissante (resp. décroissante) pour la modalité


xi est la somme des fréquences qui lui sont inférieures (resp. supérieures).
i
X
Fi = fj
j=1
k
X 
resp. Ni = fj
j=i
En générale on considèrera davantage les pourcentages que les fréquences en posant
Xi Xk
0
Pi = pj (resp. Pi = pj ).
j=1 j=i
On les représente de même dans le tableau ce qui donne dans notre exemple :

Notes 0 2 3 7 8 9 10 11 12 14 15 16 18
Effectifs 1 1 1 3 2 2 3 6 3 3 3 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1
Fréquences 30 30 30 10 15 15 10 5 10 10 10 30 30
10 10 10 20 20 10 10
Pourcentages 3 % 3 % 3 % 10% 3 % 3 % 10% 20% 10% 10% 10% 3 % 3 %

Effectifs cumulés
1 2 3 6 8 10 13 19 22 25 28 29 30
croissants

Fréquences cumulés 1 1 1 1 4 1 13 19 11 5 14 29
30 15 10 5 15 3 30 30 15 6 15 30 1
croissantes

Pourcentages cumu- 10 20 80 100 130 190 220 250 280 290


lés croissants 3 % 3 % 10% 20% 3 % 3 % 3 % 3 % 3 % 3 % 3 % 3 % 100%

Effectifs cumulés dé-


30 29 28 27 24 22 20 17 11 8 5 2 1
croissant

Fréquences cumulés 29 14 5 23 7 3 2 3 1 1 1 1
1 30 15 6 30 10 5 5 10 5 10 15 30
décroissantes

Pourcentages cumu- 290 280 220 200 170 110 80 50 20 10


100% 3 % 3 % 90% 80% 3 % 3 % 3 % 3 % 3 % 3 % 3 % 3 %
lés décroissants

On interprète cela en observant, par exemple, que 80% des étudiants on obtenu une
note supérieur ou égale à 8.

1.2.2 Représentation des données


Il existe plusieurs manières de représenter une série statistique à caractère discret.
Nous en proposons quelques unes :
n o
Diagramme en bâtons. On trace les segments (xi , ni ); (xi , 0) où les xi
i∈[[1;k]]
désignent les modalités et ni les effectifs associés. En général les hauteurs des
bâtons sont proportionnelles aux effectifs ( ou aux fréquences ).
Avec notre exemple cela donne :
6
Effectifs
3
2
1
0 2 3 7 8 9 10 11 12 14 15 16 18
Notes

Diagramme en tuyau d’orgue. On procède comme le diagramme en bâtons à ceci


près que l’on dessine des rectangles pour chaque modalité ; pour ne pas confondre
avec les histogrammes (dont nous parlerons plus loin) on marque un espace
entre chaque rectangle. Pour mieux illustrer la statistique, on peut indiquer les
effectifs au dessus des rectangles. En général les hauteurs des rectangles sont
proportionnelles aux effectifs ( ou aux fréquences ).
Dans notre exemple cela donne :

6
6
Effectifs

4 3 3 3 3 3
2 2
2 1 1 1 1 1
0
0 2 3 7 8 9 10 11 12 14 15 16 18
Notes

Diagramme circulaire. Pour chaque modalité xi , on détermine l’angle en degré


360
correspondant par la formule ϑi = ni où n désigne l’effectif total et ni
n
l’effectif de la modalité xi .
Puisque la somme des ϑi vaut 360 chaque angles correspond à une partie d’un
disque. On représente alors ces angles dans un disque en indiquant à quelle
modalité correspond l’angle.
Dans notre exemple, on commence tout d’abord à déterminer les angles, en
arrondissant à l’unité (et en s’arrangeant pour la somme des angles fasses bien
360 degrés).

Notes 0 2 3 7 8 9 10 11 12 14 15 16 18
Effectifs 1 1 1 3 2 2 3 6 3 3 3 1 1
Angles 12 12 12 36 24 24 36 72 36 36 36 12 12
Le diagramme circulaire correspondant est alors :
9 8
7
10
24 24 3
36
36
12 2
12 0
12
72 12 18
11 12

36 16
36 36
15
12
14

1.2.3 Caractéristiques de position


Le mode. Le mode de S est la modalité avec le plus grand effectif.
Dans notre exemple le mode vaut 11.
La moyenne. La moyenne de S, notée S, est définie par la formule
k
1X
S= ni xi
n i=1

où les ni désignent l’effectif de la modalité xi et n l’effectif total.


Dire qu’une statistique a S pour moyenne s’interprète en observant que c’est
comme si tous les individus de la population étudiée avaient pour modalité S.
313
Dans notre exemple, la moyenne vaut = 10.43
30
La médiane. La médiane est la modalité qui sépare la série en deux sous série de
même effectif.
n
Soit i2 ∈ [[1; k]] l’indice tel que Ni2 −1 < 6 Ni2 où n désigne l’effectif total
2
et Ni l’effectif cumulé croissant de la modalité xi .
La modalité xi2 est appelé la médiane de la série S et est notée Me.
Il se peut que la médiane soit exactement entre deux modalités ; dans ce cas,
on définit la médiane comme étant la valeur moyenne de ces deux modalités.
Plus précisemment : Pour déterminer la médiane, on utilise les effectifs cumu-
lés croissants et
• lorsque l’effectif total n est un nombre impair, la médiane est la valeur
n+1
prise par le ième modalité. C’est-à-dire
2
Me = x n + 1 .
2
• lorsque l’effectif totaln est un nombre pair, la médiane est la valeur prise
n n
par la moyenne des ième et + 1 ième modalités. C’est-à-dire
2 2
x n2 + x n2 +1
Me = .
2
x15 + x16
Dans notre exemple n = 30 est paire, donc la médiane Me = . On
2
n
cherche dans le tableau le premier effectif cumulé supérieur ou égal à = 15.
2
On trouve 19 qui l’effectif de la modalité 11, par conséquent le dernier 11
occupe le 19ième rang. On en déduit que x15 = 11 et x16 = 11, d’où la médiane
11 + 11
Me = = 11. Cela s’interprète en observant que environ (c’est en
2
effet une approximation car plusieurs individu peuvent avoir la modalité de la
médiane) la moitié des étudiants ont obtenus une note inférieur à 11 et l’autre
moitié supérieur à 11.
Les quantiles. La médiane sépare l’effectif en deux. On peut généraliser cette dé-
composition en remplaçant 2 par un autre nombre.

Définition 10. Soient α un entier naturel strictement plus que 1 et q ∈ [[1; α −


1]]. Le q ième quantile d’ordre α est la modalité xiq dont l’indice est tel que
n
Niq −1 6 6 Niq où n désigne l’effectif total et Ni l’effectif cumulé croissant
α
de la modalité xi .

Dans la pratique trois quantiles sont étudiés :


La médiane. C’est le premier quantile d’ordre 2.
Les quartiles. On choisit de séparer l’effectif en quatre (α = 4). Il y a dans
ce cas trois quantiles Q1 , Q2 et Q3 appélés les quartiles de la série. Le
second quartile est la médiane.
La recherche de premier quartile Q1 nommé premier quartile et le troi-
sième quartile Q3 nommé troisième quartile d’une série se fait de la
même façon que celle de la médiane.
boîte à moustache : On représente généralement les quartiles dans un dia-
gramme en boîte (également appelé boîte à moustache) :
sur un axe représentant les modalités, on trace un rectangle dont deux des
cotés opposés marquent respectivement le premier et le dernier quartile.
On marque aussi la médiane.

Construction du diagramme en boite.

Axe : modalités
min Q1 M e Q3 max de la série

Revenons à notre exemple :


– Calcul de Q1 :
n
Dans notre exemple n = 30, on calcule = 7, 5 qui n’est pas un entier,
4
donc le premier quartile est situé au rang 8 : Q1 = x8 . On cherche dans
le tableau le premier effectif cumulé supérieur ou égal à 8. 8 est l’effectif
de la modalité 8, par conséquent x8 = 8 = Q1 . Cela s’interprète en
observant que environ (c’est en effet une approximation car plusieurs
individu peuvent avoir la modalité de la médiane) 25% des étudiants ont
obtenus une note inférieure à 8 et donc 75% des étudiants ont obtenus
une note supérieure à 8.
– Calcul de Q1 :
n
on calcule 3 = 22, 5 qui n’est pas un entier, donc le troisième quartile
4
est situé au rang 23 : Q3 = x23 . On cherche dans le tableau le premier
effectif cumulé supérieur ou égal à 23. On trouve dans le tableau 25, qui
est l’effectif de la modalité 14, par conséquent le dernier 14 occupe le
rang 25. En se servant du tableau des effectifs cumulés croissants on a
x23 = 14 = Q3 . Cela s’interprète en observant que environ (c’est en effet
une approximation car plusieurs individu peuvent avoir la modalité de la
médiane) 75% des étudiants ont obtenus une note inférieure à 14 et donc
25% des étudiants ont obtenus une note supérieure à 14.
Les déciles. On choisit de séparer l’effectif en dix (α = 10). Il y a dans ce cas
neuf quantiles d’ordre 10 D1 , D2 , D3 , D4 , D5 , D6 , D7 , D8 et D9 appélés
les déciles de la série. Le calcul des déciles se fait de la même manière
aue celle de la médiane, on peut aussi remarquer que le cinquième décile
D5 est la médiane de la série.
n
Calculons D1 dans notre exemple. On calcule = 3 qui est un nombre
10
x3 + x4 3+7
entier, donc D1 = = = 5. Il y a 10% des étudiants ont
2 2
obtenus une note inférieure à 5 et donc 90% des étudiants ont obtenus
une note supérieure à 5.

1.2.4 Caractéristiques de dispersion


L’étendue. • L’étendue etS d’une série statistique S est la différence entre le plus
grande modalité et la plus petite.

etS = max(xi |xi ∈ S) − min(xi |xi ∈ S).

L’étendue permet de mesurer si la série statistique est concentrée autour de sa


moyenne ou plutôt dispersée : plus l’étendue est petite plus la série est concen-
tré autour de sa moyenne et inversement.
Dans notre exemple l’étendue est de 18. Cette série est donc dispersée autour
de sa moyenne.
L’intervalle inter-quartile. Dans notre exemple, l’étendue de 18 nous indique que
la série statistique est dispersée autour sa moyenne. L’intervalle inter-quartile
permet de savoir s’il y a plus de modalité au dessus de la moyenne ou en
dessous.
• L’intervalle inter-quartile d’une série statistique est l’intervalle [Q1 , Q3 ]. Il
contient 50% des observations.
• L’l’écart inter-quartile d’une série statistique est la différence entre le troi-
sième et le premier quartile : IQ = Q3 − Q1 .
La variance et l’écart-type. Pour mieux observer la dispersion des modalités, on
calcul l’écart-type. On va étudier les écarts entre chaque modalité avec la
moyenne.
• La variance d’une série statistique S est le nombre
k
1X
vS = ni (xi − S)2
n i=1

Dans la pratique on calcul la variance à l’aide de la formule suivante.


Soit S une série statistique. Considérons S 2 la série ou toutes les modalités
sont mis au carré. Alors
k
!
2 1 X 2
vS = S 2 − S = ni x2i − S
n i=1
En effet :
k
1X
vS = ni (xi − S)2
n i=1
k
1X 2
= ni (x2i − 2xi S + S )
n i=1
k k k
1X 1X 1X 2
= ni x2i − ni 2xi S + ni S
n i=1 n i=1 n i=1
k k k
1X 1X 21 X
= ni x2i − 2S ni xi + S ni
n i=1 n i=1 n i=1
k
1X 2
= ni x2i − 2SS + S
n i=1
k
1X 2
= ni x2i − S .
n i=1

Pour renormaliser cette donnée (le passage au carré), on considère plus sou-
vent l’écart-type.

L’écart-type d’une série statistique est définie comme la racine carrée de la va-
riance : √
σs = vs

1.3 Série statistique à caractère continue


En général, les deux raisons principales qui peuvent amener à considérer comme
continue une variable sont le grand nombre d’observation distinctes (trop grand pour
une étude discrète) ou le caractère sensible d’une variable (salaire, age d’une femme,
etc).
Dans ce chapitre on fixe une série statistique à caractère continue S. On note k le
nombre de classe et chaque classe sera noté [bi ; bi+1 [ (les intervalles pouvant être
fermés ou ouverts ; la seule règle à respecter est qu’une valeur ne peut être considérée
que dans une seule classe).
Pour illustrer les notions de ce chapitre, dans l’exemple 1 nous considèrerons l’age
des 121 employés d’une entreprise

26 22 41 43 18 31 34 28 26 21 44
52 60 62 34 38 23 31 40 58 60 33
33 26 28 30 29 29 29 29 33 35 33
26 42 24 22 44 41 47 30 49 32 37
26 51 28 55 52 61 47 22 19 27 25
Exemple 1 : 35 33 25 34 43 42 41 30 29 27 51
52 31 32 29 25 21 31 41 21 31 51
32 22 42 52 23 44 50 51 29 29 29
28 27 29 35 43 49 57 57 57 31 33
33 48 49 22 18 19 20 21 22 23 23
23 19 44 55 33 48 28 42 54 25 29

Le nombre de modalité étant grand, on choisit une étude continue. On représente


alors les données dans un tableau.

Classe [18 ;23[ [23 ;28[ [28 ;33[ [33 ;38[ [38 ;43[ [43 ;48[ [48 ;53[ [53 ;58[ [58 ;63[
Effectif 16 18 28 15 10 9 14 6 5

1.3.1 Liens avec le cas discret


Définition 11. Soit S une série statistique à caractère continue.
• La borne inférieure de la classe [bi ; bi+1 [ est bi .
• La borne supérieure de la classe [bi ; bi+1 [ est bi+1 .
bi + bi+1
• Le centre de classe de [bi ; bi+1 [ est ci = .
2
• L’amplitude de la classe [bi ; bi+1 [ est ai = bi+1 − bi .

Dans la pratique, on complète le tableau en rajoutant le centre des classes.

Classe [18 ;23[ [23 ;28[ [28 ;33[ [33 ;38[ [38 ;43[ [43 ;48[ [48 ;53[ [53 ;58[ [58 ;63[
Centre des classes 20.5 25.5 30.5 35.5 40.5 45.5 50.5 55.5 60.5
Effectif 16 18 28 15 10 9 14 6 5
Définition 12. La série statistique discrète associé à S est la série dont les modalités
sont les centres de classe et les effectifs correspondant aux classes respectives.

On peut donc appliquer dans ce cadre les définitions d’effectifs, effectif total, effec-
tifs cumulés, fréquences, fréquences cumulées.

1.3.2 Représentations des données


Il existe une représentation propre au caractère continue : l’histogramme.
Chaque classe est représenté par un rectangle dont la base est délimitée par les bornes
correspondante et dont la hauteur est ( proportionnelle à) la densité d’effectif (en
général à l’effectif corrigé).

Définition 13. Soit S une série statistique à caractère continue. La densité d’effectif
de la classe [bi ; bi+1 [ est le rapport entre l’effectif du centre de classe correspondant
par l’amplitude de la classe.
ni
bi+1 − bi
Lors de la réalisation d’un histogramme, il est indispensable de distinguer deux cas.
1. Si les amplitudes de classes sont égales, la hauteur des rectangles correspondra
aux effectifs (ou aux fréquences) des classes.
2. Si les amplitudes sont différentes, afin de constituer l’histogramme, il est né-
cessaire de :
• calculer, pour chaque classe, l’amplitude ai
ni fi
• calculer la densité di = pour un histogramme des effectifs, et di =
ai ai
pour un histogramme des fréquences
• affecter à chaque rectangle une hauteur proportionnelle à la densité di de
la classe correspondante.
Soit min(ai ) l’amplitude minimale de classe, la hauteur est alors appelée
effectif corrigé et notée

ni c = di × min(ai )

cette convention revient à adopter min(ai ) comme unité d’amplitude de


classe. Les classes ayant pour amplitudes min(ai ) sont alors représentées
par des rectangles dont la hauteur est l’effectif. De même, il est possible
de retenir comme hauteur la fréquence corrigée

fi c = di × min(ai ).
Puisque la hauteur d’un rectangle est la densité d’effectif, l’aire d’un rectangle de
ni
l’histogramme, qui est le produit de la hauteur par la longueur bi+1 − bi , est
bi+1 − bi
égale à l’effectif ; ceci permet donc une meilleur illustration de la série étudiée.

Avec notre exemple 1, comme les classes ont la même amplitude, cela donne :
Classe [18 ;23[ [23 ;28[ [28 ;33[ [33 ;38[ [38 ;43[ [43 ;48[ [48 ;53[ [53 ;58[ [58 ;63[
Effectif 16 18 28 15 10 9 14 6 5
hauteur 3, 2cm 3,6 cm 5,6 cm 3 cm 2 cm 1,8 cm 2,8 cm 1,2 cm 1 cm

5.6

3.6
Effectifs

3.2
3
2.8

2
1.8
1.2
1

0
18 23 28 33 38 43 48 53 58 63
Classes

Voici un deuxième exemple dans lequel les amplitudes des classes sont différentes :

Exemple 2 :
Une entreprise a effectué une enquète auprès de son personnel en leur demandant la
distance en km qui sépare l’usine de leur domicile. On a obtenu le tableau statistique
suivant :
Distance (en km ) [0 ;10[ [10 ;20[ [20 ;30[ [30 ;50[ [50 ;100[
Effectif 150 75 50 100 100
Pour construire l’histogramme, on complète le tableau comme suit :
Distance (en km ) [0 ;10[ [10 ;20[ [20 ;30[ [30 ;50[ [50 ;100[
Amplitude 10 10 10 20 50
Effectif 150 75 50 100 100
Ef f ectif
Densité = 15 7,5 5 5 2
Amplitude
Effectif corrigé 150 75 50 50 20
Hauteur de la bande 3 cm 1,5 cm 1 cm 1 cm 0,4 cm

On l’obtient l’histogramme :
Effectifs corrigés

1.5
1

0
0 10 20 30 50 100
Classes

1.3.3 Caractéristiques de position et de dispersion liés au cas dis-


cret
Définition 14.
Classe modale :
La version continue du mode est la classe modale.
La classe modale d’une série continue S est la classe du plus grand effectif.
(en général le plus grand effectif corrigé.)
Dans notre exemple 1, la classe modale est [28; 33[.
De manière équivalente, la classe modale d’une série continue est la classe
correspondant au mode de la série discrète associée.
Moyenne, variance et écart-type. La moyenne (resp. la variance, resp. l’écart-type)
d’une série statistique continue, est la moyenne (resp. la variance, resp. l’écart-
type) de la série statistique discrète associée.
Étendue :
L’étendue de S est la différence entre la plus grande borne supérieur et la plus
petite borne inférieur.
 
etS = max sup([bi ; bi+1 [ i ∈ [[1; k]]) − min inf([bi ; bi+1 [ i ∈ [[1; k]]) .

1.3.4 Médiane et quantiles


Définition 15. Soient α un entier naturel différent de 1 et q ∈ [[1; α − 1]]. La q ième
n
classe-quantile d’ordre α est la classe [biq ; biq +1 [ dont l’indice iq est tel que Niq −1 < 6 Niq
Q
où n désigne l’effectif total et Ni l’effectif cumulé croissant de la classe [bi ; bi+1 [.

Les quantiles se calculent par interpolation linéaire, via les relations suivantes :
On détermine la classe médiane, par exemple [bi−1 , bi [. On sait que l’effectif cumulé
n 1
de la médiane est égale à et sa fréquence cumulée croissante est égale à .
2 2

bi−1 Me bi bi−1 Me bi
n ou 1
ECC(bi−1 ) ECC(bi ) f cc(bi−1 ) f c(bi )
2 2
où ECC(bi−1 ) est l’effectif cumulé croissant de la classe précédant la classe médiale
et ECC(bi ) est l’effectif cumulé croissant de la classe médiane ; f cc(bi−1 ) est la fré-
quence cumulée croissante de la classe précédant la classe médiane et f cc(bi ) est lla
fréquence cumulée croissante de la classe médiane.
L’un des tableaux ci dessus permettent de mémoriser la formule d’interpolation li-
néaire :
Me − bi−1 bi − bi−1
n =
− ECC(bi−1 ) ECC(bi ) − ECC(bi−1 )
2
ou
Me − bi−1 bi − bi−1
=
1 f cc(bi ) − f cc(bi−1 )
− f cc(bi−1 )
2
On obtient des formules similaires pour les premier et deuxième quartiles Q1 et Q3
n 3n 1 3
en remarquant que ECC(Q1 ) = , ECC(Q3 ) = , f cc(Q1 ) = et f cc(Q3 ) = .
4 4 4 4
Avec notre exemple :
Classe [18 ;23[ [23 ;28[ [28 ;33[ [33 ;38[ [38 ;43[ [43 ;48[ [48 ;53[ [53 ;58[ [58 ;63[
Centre des classes 20,5 25,5 30,5 35,5 40,5 45,5 50,5 55,5 60,5
Effectif 16 18 28 15 10 9 14 6 5
Effectif cumulé croissant 16 34 62 76 87 96 110 116 121
Fréquence cumulée croissante 0,132 0,281 0,512 0,628 0,719 0,793 0,909 0,959 1
n 121
= = 60, 5. Donc la classe médiane est [28; 33[ et
2 2
Me − 28 33 − 28
=
60, 5 − 34 62 − 34
Me = 32, 73
Chapitre 2

Probabilité
2.1 Probabilités
2.1.1 Vocabulaire
Evénements Dans une expérience aléatoire, on obtient des résultats élémentaires.
Ces résultats élémentaires sont intéressants à connaître quand ils jouent tous le
même rôle dans l’expérience : quand ils sont équiprobables.
L’ensemble des résultats élémentaires est appelé univers et noté la plupart du
temps Ω.
Avec plusieurs résultats élémentaires on forme des événements.
Ω est appelé événement certain.
Son contraire est noté ∅ et appelé événement impossible.
Des événements sont incompatibles (deux à deux) ou disjoints s’ils ne peuvent
se produire simultanément. Si l’un est réalisé, aucun des autres ne peut l’être.
Attention Ne pas confondre incompatibles (l’un empêche l’autre) et indépendants
(l’un n’influe pas sur l’autre)
Opérations On peut faire certaines opérations sur les événements :
La négation (ou contraire) Ā est réalisé si et seulement si A ne l’est pas. Le
contraire de noir n’est pas blanc.
La réunion symbole ∪ qui est la traduction du ou inclusif (l’un ou l’autre ou
les deux), de au moins voir même de certains et comme : on peut gagner si
l’on a blanc et si l’on a noir
L’intersection symbole ∩ qui est la traduction de et, de tous, de jamais, de
aucun, de à la fois...
La différence A\B est formé des résultats qui sont dans A sans être dans B :
A\B = A ∩ B̄

20
Un système complet d’événements ou parition de l’univers est une famille
d’événements, finie ou dénombrable (indiciable par les entiers) (Ai )i∈I telle
qu’un et un seul de ces événements est réalisé à chaque fois (ils sont incompa-
tibles (deux à deux) et leur réunion est l’événement certain : on est certain que
l’un au moins est réalisé)
Un événement est presque sûr si sa probabilité vaut 1.
Un événement est négligeable si sa probabilité vaut 0.
Attention Un événement ne peut pas être conditionné : on a envie de conditionner
parce que la réalisation de A dépend de de celle de B.
C’est probablement (A ∩ B) qu’il faut écrire. Le conditionnement apparaît
alors tout naturellement lorsque l’on calcule la probabilité via la formule des
probabilité composées : P (A ∩ B) = PB (A) P (B)

2.1.2 Cadre théorique


Pour aller (beaucoup) plus loin dans l’étude des probabilité on doit préciser la nature
mathématique des objets sur lesquels on travaillait naïvement.
L’univers modélise l’ensemble des résultats possibles. C’est un ensemble et c’est
tout. On le note Ω. C’est l’événement certain
Une tribu de Ω sera l’ensemble des événements. On devra pouvoir faire avec ces
événements les opérations nécessaires et trouver comme résultat un événement :
réunion, contraire et intersection.
Tribu T est une tribu de Ω si
• T est un ensemble de parties de Ω. (ensemble d’ensembles) Les éléments
de la tribu sont appelés événements.
• qui contient Ω
• si A ∈ T alors Ā ∈ T (le contraire d’un événement en est un)
• si I est un ensemble fini ou dénombrable (que l’on peut compter avec les
entiers) et (Ai )i∈I une famille d’événements (finie ou dénombrable) alors
[
Ai est un événement. (appartient à T )
i∈I

(T , Ω ) est appelé espace probabilisable


On définit alors la probabilité qui respecte les propriétés de la fréquence statistique.
Probabilité Soit (T , Ω ) un espace probabilisable et P une application de T dans
R+ (P (A) doit être défini pour tout événement A et être positive). P est une
probabilité sur (T , Ω ) si
• P (Ω) = 1
• et si pour toute famille finie ou dénombrable (Ai )i∈I d’événements
! in-
X [
compatibles, la somme de la série P (Ai ) vaut P Ai
i∈I i∈I

Conséquences On en déduit :
• Le contraire de Ω qui est l’événement impossible Ø est un événement est
porte donc bien son nom.
• le contraire d’une réunion est une intersection donc un intersection finie
ou dénombrable d’événements est encore un événement.

2.1.3 Les propriétés


Evénements Il y a quelques traductions à savoir faire :
\ [
Le contraire de ”tous sont” c’est ”au moins un n’est pas” ( Ai = Ai )
i∈I i∈I
Le contraire de ”au moins un est ” c’est ”aucun n’est”
Si A est réalisé alors B est réalisé se traduit par A ⊂ B ; on a alors P (A) ≤
P (B)
Probabilité une probabilité est toujours comprise entre 0 et 1

P (∅) = 0, P (Ω) = 1, P Ā = 1 − P (A)
Si A et B sont incompatibles alors P (A ∪ B) = P (A) + P (B)
P
Si (Ai )i∈N est une famille d’événements incompatibles alors la série i∈N P (Ai )
converge et ! +∞
+∞
[ X
P Ai = P (Ai )
i=0 i=0

Si (Ai )i∈N est une famille croissante (i.e. que ∀i ∈ N Ai ⊂ Ai+1 ; par
exemple A! i =”avoir au moins un pile lors des i premiers lancers”) alors :
+∞
[
P Ai = lim P (An )
n→+∞
i=0
Et si (Ai )i∈N est une famille décroissante (i.e. que ∀i ∈ N Ai+1 ⊂ Ai ; par
exemple A! i =”n’avoir que des piles lors des i premiers lancers”) alors :
+∞
\
P Ai = lim P (An )
n→+∞
i=0
+∞
! n
!
[ [
Si (Ai )i∈N est une famille quelconque, P Ai = lim P Ai
n→+∞
i=0 i=0
P (A\B) = P (A) − P (A ∩ B)
+∞
! n
!
\ \
Si (Ai )i∈N est une famille quelconque, P Ai = lim P Ai
n→+∞
i=0 i=0
Equiprobabilité Quand tous les résultats élémentaires jouent le même rôle, sont
équiprobables, on modélise par la probabilité équiprobable :

|A|
P (A) =
|Ω|

Par exemple, on fait 10 tirages sans remise dans une urne. Si l’on ne sait rien
sur les résultats précédents, à chaque tirage toutes les boules seront équipro-
bables (bien que le contenu de l’urne change à chaque fois)
Au contraire si l’on tire dans une urne ou une autre, sachant dans quelle urne
on tire, les boules de cette urne seront équiprobables. C’est ici la probabilité
conditionnelle qui sera la probabilité équiprobable.

2.1.4 Probabilité conditionnelle, indépendance


Probabilité conditionnelle On définit la probabilité conditionnelle de A sachant B
P (A ∩ B)
et on note PB (A) ou PB (A) = (notée autrefois P (A/B)). Cela
P (B)
conduit à la formule de Bayes.
Mais pour la calculer, c’est la plupart du temps : la probabilité que l’on a
quand on sait que B est réalisé (si la réalisation de B permet de connaître les
conditions expérimentales)
La probabilité conditionnelle est la probabilité qui correspond à la fréquence
statistique quand on restreint a priori l’ensemble des possibles.
• Une probabilité conditionnelle est une probabilité. On retrouve donc les
mêmes règles de calcul en remplaçant partout la probabilité par la proba-
bilité conditonnelle :

PB (Ω) = 1, PB (∅) = 0, PB Ā = 1 − PB (A) . . .
La probabilité conditionnelle intervient naturellement dans la calcul de la pro-
babilité d’une intersection et dans la formule des probabilités totales :
• formule des probabilité composées : P (A ∩ B) = P (A)·PA (B) ou plus
généralement :

P (A1 ∩ A2 ∩ · · · ∩ An ) = P (A1 ) · PA1 (A2 ) · · · · PA1 ∩···∩An−1 (An )

que l’on a intérêt à écrire en respectant l’ordre chronologique de l’expé-


rience pour pouvoir ensuite interpréter le contitonnement.
• Formule des probabilités totales. On l’utilise quand la réalisation d’un
événement A dépend des résultats (Bi )i∈I d’une étape précédentes.
Si (Bi )i∈I est un système complet d’événements alors
X
P (A) = PBi (A) P (Bi ) .
i∈I

N.B. : la série converge et la somme de la série vaut P (A) dans le cas où


l’on a un système complet d’événement infini
N.B. : il faut que P (Bi ) 6= 0 pour que les PBi (A) soit défini ... ce que
l’on ne vérifie jamais. Mais comme PBi (A) est alors multiplié par P (Bi )
qui est nulle, les formules restent exploitables.
• Formule de Bayes enfin qui permet de calculer une probabilité condition-
nelle en inversant l’événement et le conditionnement :
P (A ∩ B) PA (B) P (A)
PB (A) = =
P (B) P (B)

le P (B) du dénominateur étant souvent calculé par la formule des pro-


babilités totales
Indépendance : Deux événements A et B sont indépendants si P (A ∩ B) = P (A) P (B) .
( ce qui peut s’écrire PB (A) = P (A) si P (B) 6= 0 ou PA (B) = P (B) si
P (A) 6= 0).
Une famille (Ai )i∈I d’événements est indépendante si, quand on en prend
n’importe quelle sous-famille finie, la probabilité de leur intersection est le
produit de leurs probabilités.
Cette définition est la modélisation du fait que la réalisation de l’un des événe-
ments ne change pas, n’influe pas, sur la probabilité de réalisation de l’autre.
La plupart du temps, l’indépendance viendra des conditions expérimentales.
(soit explicitement, soit implicitement)
Exemples les exemple type sont :
• une suite de lancers de pièces. Le fait qu’un lancer donne pile ou face
ne change pas la probabilité d’avoir pile ou face à un autre lancer. Les
lancers seront modélisés comme étant indépendants.
• Des tirages avec remise de boules dans une urne seront modélisés indé-
pendants
• Des tirages sans remise seront dépendants. Dans le calcul de probabilité
d’une intersection, (formule des probabilités composées) la probabilité
conditonnelle apparaîtra... le conditionnement qui donnera la composi-
tion de l’urne.
• Par contre si on lance la pièce jusqu’à obtenir pile, on arrête les lancers
dès que l’on a pile. Le fait d’avoir pile à un lancer implique que l’on en
a pas eu avant . Et que l’on aura plus ni pile ni face après. Les lancers ne
sont plus indépendants.
• De même si l’on choisi d’abord une pièce (truquée ou équilibrée) puis
qu’on fait une suite de lancers, les résultats d’un lancé est lié à la pièce
choisie. Donc via la pièce choisie, les résultats des lancers sont liés les
uns aux autres et ne sont pas indépendants. Par contre si la pièce est
connue (sachant que la pièce est truquée) indépendants.

2.2 Variables aléatoires


Les variables aléatoires donnent une valeur pour chaque résultat d’une expérience
aléatoire.
C’est une application de l’ensemble des résultats (Ω ) dans R
On note (X = a) l’ensemble des résultas ω pour lesquels X (ω) = a , de même
b < X ≤ a ...
Et on doit pouvoir définir la probabilité de X < a qui doit donc être un événement.
(ce qui n’est pas toujours vrai pour des univers infinis)
Attention Une variable aléatoire n’est pas un événement. Si on écrit P (X) on est
certain de se tromper
Pour fabriquer un événement, il faut comparer la variable à autre chose (X <
x; X = Y . . . )
Par contre, on peut faire des opérations avec des variables aléatoires pour en
fabriquer de nouvelles.

2.2.1 Cadre théorique


Définition X est une variable aléatoire sur un espace probabilisable (Ω, T ) si X est
une application définie sur Ω et si pour tout réel a, (X ≤ a) apparient à la tribu
(est un événement)

2.2.2 Loi et fonction de répartition


Définition pour une variable aléatoire discrète, la loi de X est la donnée de l’en-
semble des valeurs possibles de X, X (Ω) , et la probabilité que X prenne
chacune de ces valeurs.
Cela peut être donné par une ou plusieurs formules, ou bien les valeurs peuvent
être énumérées dans un tableau.
Caractérisation la loi d’une variable aléatoire discrète est caractérisée par le fait
que chacune des probabilités est positive ou nulle et la somme des probabilités
(ou la somme de la série des probabilité dans le cas discret infini) est égal à 1.
Fonction de répartition La fonction de répartition F d’une variable aléatoire X est
définie par F (x) = P (X ≤ x) pour tout réel x.
On peut retrouver la loi à partir de la fonction de répartition : si X prend les
valeurs x1 < x2 < · · · < xn alors

P (X = xk ) = P (X ≤ xk ) − P (X < xk )
= P (X ≤ xk ) − P (X ≤ xk−1 ) si k − 1 ≥ 1

La première valeur X = x1 joue un rôle particulier et est à traiter a-priori à


part. On peut souvent la réintégrer a-posteriori dans la formule générale.
Et on peut retrouver la fonction de répartition à partir de la loi : si xk ≤ x <
xk+1 alors
k
X
F (x) = P (X ≤ x) = P (X ≤ xk ) = P (X = xi )
i=1

La fonction de répartition est plus facile à obtenir que la loi quand on cherche
la loi du maximum de plusieurs variables aléatoires.
Dire que ”le plus grand est inférieur à x” signifie que ”tous sont inférieurs à
x”.

2.2.3 Espérance et variance


Définition L’espérance d’une variable aléatoire qui ne prend qu’un nombre fini de
valeur est P
:
E (X) = k∈X(Ω) k · P (X = k)
Si X prendPun nombre infini dénombrable de valeur, X n’a une espérance que
si la série k∈X(Ω) k · P (X = k) est absolument convergente. L’espérance de
X est alors la somme de la série (sans
h valeur absolue)
i
La variance de X est V (X) = E (X − E (X)) = E X 2 − E (X)2
2 

Attention Quand la loi de X est donnée par plusieurs formules, il faut décomposer
la somme pour pouvoir substituer la formule à P (X = k)
Calculs Pour calculer l’espérance d’une variable Y ”fabriquée” à partir d’une autre
X, il n’est pas utile de chercher d’abord la loi de Y :
• si Y = f (X)
X
E (Y ) = E (f (X)) = f (k) P (X = k)
k∈X(Ω)

la somme étant celle de la série qui doit être absolument convergente dans
le cas d’un nombre infini dénombrable de valeurs.
• En particulier, on en déduit la linéarité de l’espérance : si a et b sont
des réels (et non pas des variables aléatoires) et X une variable aléatoire
E (aX + b) = aE (X) + b.
X
k 2 P (X = k)

• On trouve aussi (pour le calcul de la variance) que E X 2 =
k∈X(Ω)
(somme de la série si elle est absolument convergente dans le cas discret
infini)
• La variance se calcule plus facilement par V (X) = E X 2 − E (X)2 et

on a pour des réels (pas des variables aléatoires) a et b : V (aX + b) =
a2 V (X)

2.3 Lois usuelles


Quand on a envie d’utiliser une loi usuelle mais que le paramètre qui devrait être un
réel est une variable aléatoire,
(par exemple N le rang du premier pile. On relance N fois la pièce. X le nombre de
pile obtenus)
on obtient d’abord la loi conditionnelle et ensuite la loi par les probabilités totales.

2.3.1 loi uniforme sur [[1,n]]


Modèle on tire au hasard un nombre entier dans l’intervalle [[1, n]] . Ces nombres
sont donc équiprobables. On note X le résultat (résultat d’un dé ou d’une boule
numérotée dans une urne)
Définition X suit une loi uniforme sur [[1, n]] si X (Ω) = [[a, b]] et si pour tout
1
k ∈ [[1, n]] , p (X = k) =
n
n+1 2
L’espérance de X est alors E (X) = et V (X) = n 12−1
2

2.3.2 Loi de Bernouilli


Modèle Elle compte le nombre de succès en une seule expérience (donc 0 ou 1).
Elle vaut 1 en cas de succès et 0 en cas d’échec.
ième
X sont utiles à plusieurs : si Xk indique le succès lors de la k
Elles expérience,
Xk compte le nombre total de succès.
k
Définition X suit une loi de Bernouilli de paramêtre p si X (Ω) = {0, 1} avec
P (X = 1) = p
On a alors E (X) = p et V (X) = p (1 − p)

2.3.3 Loi hypergéométrique


Modèle tirages successifs sans remises ou tirages simultanés parmi des bons et des
mauvais. N le nombre total d’éléments, n le nombre d’éléments prélevés et p
la proportion de bons. On note X le nombre de bons éléments prélevés.
Définition X suit une loi hypergéométrique de paramètres N, n et p si : on note
a = pN (nombre de bons éléments) et b = (1 − p) N (nombre de mauvais
éléments) ! !
a b
k n−k
P (X = k) = !
N
n
avec X (Ω) = [[max (0, n − b) ; min (a, n)]]
(La formule reste vraie en dehors de cet intervalle, les probabilités étant simplement
nulles)
On a E (X) = np

2.3.4 Loi binomiale


Modèle C’est la loi du nombre de succès en n expériences indépendantes qui ont
toutes la même probabilité p de succès.
Définition X suit une loi binomiale si X (Ω) = [[0; n]] et pour tout entier k ∈
!
n
[[0; n]] : P (X = k) = pk (1 − p)n−k
k
On a alors E (X) = np et V (X) = np (1 − p)
Somme une somme de variable aléatoires indépendantes suivants des lois bino-
miales de même probabilité de succès en est encore une de même paramètre
de succès et de premier paramètre (nombre d’expérience) la somme de leurs
premiers paramètres.
2.3.5 Loi géométrique
Modèle C’est la loi du rang du premier succès dans une suite (infinie) d’expériences
indépendantes qui ont toutes la même probabilité p de succès.
S’y ramène le cas où l’on fait des expériences jusqu’au succès et que X est le rang
du premier succès (les tirages ne sont plus indépendants car dès le succès l’ex-
périence s’arrête)
Si le fait de continuer ensuite l’expérience ne change pas le rang du premier
succès, et que l’on a alors les conditions d’une loi géométrique, alors X suivra
également une loi géométrique.
Définition X suit une loi géométrique si X (Ω) = [[1; +∞[[ et pour tout entier
k ∈ [[1; +∞[[ : P (X = k) = (1 − p)k−1 p
1 (1 − p)
On a alors E (X) = et V (X) =
p p2

2.3.6 Loi de Poisson


Modèle Ce n’est pas une loi que l’on rencontre directement. Mais c’est une loi qui
approche la loi Binomiale B (n, p) quand n tend vers +∞ mais que le produit
n · p reste constant = α (ou tend vers cette constante)
C’est la loi qui (empiriquement) modélise bien les fréquentations (nombre de
clients à une caisse dans une journée, nombre d’élèves en ECE1 une année
donnée ...)
Définition X suit une loi de Poisson de paramètre α si X (Ω) = N et pour tout
αk e−α
entier k ∈ N : P (X = k) =
k!
On a alors E (X) = α et V (X) = α
Somme une somme de variable aléatoires indépendantes suivants des lois de Pois-
son en est encore une de paramètre la somme des paramètres
Chapitre 3

Calcul matriciel
Une matrice est un tableau rectangulaire formé de nombres réels. Grâce aux matrices,
on peut par exemple codifier dans un même objet toute l’informa- tion d’un système
d’équations. Nous verrons dans ce chapitre comment effectuer des opérations sur
ces matrices. Nous verrons ensuite comment l’écriture matricielle permet de mieux
appréhender l’étude d’un système d’équations.
Nous en présenterons trois méthodes de résolution :
• la méthode de Gauss-Jordan ;
• en utilisant la matrice inverse ;
• la méthode de Cramer.

3.1 Généralités
Définition 16. • Une matrice A = (aij ) de type m × n est un tableau rectangu-
laire comprenant m lignes et n colonnes formées de nombres réels.
? Les nombres du tableau sont appelés les coefficients de A.
? Le coefficient situé à la i-ème ligne et à la j-ème colonne est noté ai,j .
? Un tel tableau est représenté de la manière suivante :
 
a1,1 a1,2 . . . a1,j . . . a1,n
 
 a2,1 a2,2 . . . a2,j . . . a2,n 
 
 
... ... ... ... ... ...   
A=  ou A = ai,j 1≤i≤m ou ai,j .
 ai,1 ai,2 . . . ai,j . . . ai,n  1≤j≤n
 
 
... ... ... ... ... ... 
 
an,1 an,2 . . . an,j . . . am,n

30
? L’ensemble des matrices à m lignes et n colonnes à coefficients dans R
est noté Mm,n (R).
• Une matrice de type n × n est dite carrée d’ordre n
 
−0, 5 2 1
 2
 √ 
A= 3 7  est une matrice carrée d’ordre 3

 3 
5 0 47

On note Mn (R) au lieu de Mn,n (R) l’ensemble des matrices carrées d’ordre n.
• Dans une matrice carrée, la diagonale formée par les éléments aii s’appelle la
diagonale principale.
• Une matrice de type 1 × n est appelée matrice ligne.
 
A = 1 0 −4 3

• Une matrice de type n × 1 est appelée matrice colonne.


 
1
 
A= 0

−7

• Une matrice carrée de type n × n est appelée matrice identité si aij = 0 pour
tout i 6= j et aii = 1. On la note In .
 
1 ··· 0
. .
.. . . ... 

In =   
0 ··· 1

• Une matrice de type m × n composée uniquement de zéro est appelée matrice


nulle. On la note 0mn !
0 0 0
O23 =
0 0 0
• On dit qu’une matrice carrée A = (aij )1≤i,j≤n est dite :
? triangulaire supérieure si : pour tout i > j, aij = 0
? triangulaire inférieure si : pour tout i < j, aij = 0
Les matrices suivantes sont respectivement diagonale, triangulaire supérieure
et inférieure :
     
1 0 0 2 5 1 9 0 0
     
A= 0 2 0 
 B = 0 −1 7 
  C =  0 −1 0 
 
0 0 −1 0 0 −3 −1 5 −2

• Soit A = (aij ) une matrice de type n × p. On appelle transposée de la matrice


A, la matrice notée t A de type n × m définie par
t
A = (aji )
Si A la matrice de taille n × p
 
a11 a12 . . . a1p
 
 a21 a22 . . . a2p 
A= .
 
.. .. .. 

 . . . 

an1 an2 . . . anp

alors la matrice transposée de A est


 
a a ... an1
 11 21 
 a a ... an2 
t  12 22
A= . .

 .. .. .. 
 . . 

a1p a2p . . . anp
 
! 1 4
1 2 3  
Exemple : si A = alors t A = 
2 5
4 5 6

3 6
Remarques. Deux matrices sont égales si et seulement si elles ont même taille et
mêmes coefficients.

3.2 Somme de deux matrices et produit d’une matrice


par un scalaire
Définition 17. Somme : Si A = (aij ) et B = (bij ) sont deux matrices de même
type, leur somme A + B est la matrice de même type obtenue en addition-
nant les tableaux élément par élément : A + B = (cij ), avec cij = aij + bij .
On définit de même la multiplicationde la matrice A = (aij ) par un nombre λ
la matrice λA de même type que A par : λA = (dij ), avec dij = λaij .
! ! ! ! !
0 1 1 −2 0 3 −5 10 −5 13
Exemple : 3 −5 = + = .
2 1 0 −1 6 3 0 5 6 8
Propriété Soient A, B, C des matrices de types m × n et λ ∈ R alors
A + 0 = A ; A + (−1)A = 0 ( la matrice (−1)A est notée − A)
(A + B) + C = A + (B + C) ; λ(A + B) = λA + λB.
Proprosition. Soient A, B et C trois matrices appartenant à Mn,p (R). Soient α ∈ R
et β ∈ R deux scalaires.
1. A + B = B + A : la somme est commutative,
2. A + (B + C) = (A + B) + C : la somme est associative,
3. A + 0 = A : la matrice nulle est l’élément neutre de l’addition,
4. (α + β)A = αA + βA,
5. α(A + B) = αA + αB.
Propriété. Soient A et B deux matrices de type n × p et λ, µ ∈ R . On a
t
(λA + µB) = λ tA + µ tB

3.3 Produit matriciel


Définition 18. Le produit AB de deux matrices A et B est défini si le nombre de
colonnes de A est égal au nombre de lignes de B.
Si A = (aij ) est une matrice de type m × n et B = (bij ) est une matrice de type
n × p alors le produit AB = (cij ) est la matrice de type m × p définie par :
n
X
cij = aik bkj
k=1

Exemple :
Pour obtenir le coefficient en position (1, 2) on multiplie la ligne 1 par la colonne 2,
 
1
 
  3
1 0 −4 3   = 1 × 1 + 2 × 3 + 0 × 0 + 3 × 3 = 16.
 
0
 
3
Premier piège. Le produit de matrices n’est pas commutatif en général.
En effet, il se peut que AB soit défini mais pas BA, ou que AB et BA soient tous
deux définis mais pas de la même taille. Mais même dans le cas où AB et BA sont
définis et de la même taille, on a en général AB 6= BA.
Exemple.
! ! ! ! ! !
5 1 2 0 14 3 2 0 5 1 10 2
= mais = .
3 −2 4 3 −2 −6 4 3 3 −2 29 −2
Définition 19. Deux matrices carrées d’ordre n commutent lorsque AB = BA.

Deuxième piège. AB = 0 n’implique pas A = 0 ou B = 0.


Il peut arriver que le produit de deux matrices non nulles soit nul. En d’autres termes,
on peut avoir A 6= 0 et B 6= 0 mais AB = 0.
Exemple.
! ! !
0 −1 2 −3 0 0
A= B= et AB = .
0 5 0 0 0 0

Troisième piège. AB = AC n’implique pas B = C. On peut avoir AB = AC et


B 6= C.
Exemple.
! ! ! !
0 −1 4 −1 2 5 −5 −4
A= B= C= et AB = AC = .
0 3 5 4 5 4 15 12
EXERCICE : Dans la liste suivante, déterminer tous les couples de matrices dont
on peut faire le produit, et calculer alors le produit. Déterminer tous les couples de
matrices qui commutent.
 
1 −1    

1 −1
 ! −1 0 3 −5 2 3
1 1    
A= , B = , C= −6 2 6 , D = −8 3 5
 
1 −1 1 1
   
  0 0 2 −4 2 2
1 −1
Proprosition. Si A est une matrice n × p, alors

In · A = A et A · Ip = A.

Propriété. Soient A et A0 deux matrices de type n × p, B et B 0 deux matrices de type


p × q et C une matrice de type q × r.
• Le produit matriciel est associatif, c’est-à-dire (AB)C = A(BC).
• De plus, pour tous réels λ et µ, on a :

(λA)B = λ(AB), A(λB+µB 0 ) = λAB+µAB 0 et(λA+µA0 )B = λAB+µA0 B.

Propriété. Soient A une matrice de type n × p et B une matrice de type p × q. On a


t
(AB) = tB tA

3.4 Puissances d’une matrice


Les puissances d’une matrice carrée d’ordre n, notée A, sont les matrices définies
par
∀p ∈ N, Ap = A × · · · × A
| {z }
p fois

Précisons que, par convention, A0 = In .


Exemples. Toute puissance de la matrice identité In est égale à In .
 
1 0 1
 
Exemple. On cherche à calculer Ap avec A =  0 −1 0 . On calcule A2 , A3 et A4

0 0 2
et on obtient :
     
1 0 3 1 0 7 1 0 15
A2 =  3 2 4 3
     
 0 1 0
 A = A ×A = 0 −1 0
  A = A ×A = 0 1 0  .
 
0 0 4 0 0 8 0 0 16

L’observation
 de ces premières
 puissances permet de penser que la formule est :
1 0 2p − 1
 
Ap = 
 0 (−1)p
0 . Démontrons ce résultat par récurrence.

0 0 2p
Il est vrai pour p = 0 (on trouve l’identité). On le suppose vrai pour un entier p et on
va le démontrer pour p + 1. On a, d’après la définition,
     
p p+1
1 0 2 −1 1 0 1 1 0 2 −1
Ap+1 = Ap ×A = 
     
p × = p+1
0 (−1) 0  0 −1 0 0 (−1) 0  .
   
0 0 2p 0 0 2 0 0 2p+1

Donc la propriété est démontrée.


Exemple (Puissances d’une matrice diagonale). Si D est une matrice diagonale, il est
très facile de calculer ses puissances Dp (par récurrence sur p) :
   
p
α 0 ... ... 0 α 0 ... ... 0
 1   1 
 0 α 0 ... 0   0 αp 0 . . . 0 
2
. .2 .
   
. . . . .  p . . 
D= .. .. .. .. ..  =⇒ D =  .. .. .. .. .. 
   

 0 . . . 0 αn−1 0 
  p
 0 . . . 0 αn−1 0 

   
0 ... ... 0 αn 0 ... ... 0 αnp

Proprosition. Considérons deux matrices A et B d’ordre n telles que A et B com-


mutent. Alors pour tout entier naturel p, on a
p
X
(A + B)p = Ckp Ak B p−k
k=0
3.5 Inverse d’une matrice
Définition 20. Une matrice carrée A est dite inversible s’il existe une matrice B (de
même ordre n), telle que AB = In et BA = In .
La matrice B est notée A−1 et est définie comme l’inverse de A.

En principe il suffit en fait de vérifier une seule des conditions AB = I ou bien


BA = I pour prouver que A est inversible.
Exemple :
On vérifie que :
! ! ! ! ! !
3 5 2 −5 1 0 2 −5 3 5 1 0
= = I2 et = = I2
1 2 −1 3 0 1 −1 3 1 2 0 1
! !
3 5 2 −5
La matrice A = est donc inversible d’inverse A−1 = .
1 2 −1 3
! !
3 0 a b
Exemple. La matrice A = n’est pas inversible. En effet, soit B =
5 0 c d
une matrice quelconque. Alors le produit
! ! !
a b 3 0 3a + 5b 0
BA = =
c d 5 0 3c + 5d 0

ne peut jamais être égal à la matrice identité.


La matrice identité In est inversible. Son inverse n’est autre que In (en effet, In In =
In ).
La matrice nulle 0n n’est jamais inversible, puisque pour toute matrice B, 0n B = 0n .
EXERCICE : On pose :
     
1 −2 4 1 8 7 −1 6 11
     
A=  1 2 −2  , B = 0 −3 −4 , C =  1 −2 −6
    
0 0 1 0 1 1 0 1 1

1. Vérifier que AB = AC.


2. Est-ce que A est inversible ?
Remarque. • Si la matrice A est inversible, la matrice A−1 est inversible d’in-
verse (A−1 )−1 = A.
• Si A est inversible alors t A aussi et (t A)−1 =t (A−1 ).

Propriété. Si A et B sont deux matrices inversibles d’ordre n alors la matrice AB


est inversivle et on a
(AB)−1 = B −1 A−1 .

3.5.1 Détermination de l’inverse d’une matrice à partir d’une


équation polynômiale
D’après ce qui précède, pour trouver l’inverse d’une matrice, il suffit de trouver une
matrice carrée B de d’ordre n telle que AB = In .
Par exemple, il est facile de donner l’inverse d’une matrice dont on a une relation
polynomiale. Soit A une matrice carrée d’ordre n telle que A2 + 2A + 6In = 0n ,
ainsi, A(A + 2In ) = −6In .
Alors la matrice A est inversible, et sa matrice inverse est donnée par
1
A−1 = − (A + 2In )
6
EXERCICE : Soit la matrice :
 
3 −2 −1
 
A = 0 5 1 


0 −4 1
1. Calculer (A − 3I3 )(A − 3I3 ).
2. En déduire que A est inversible et calculer son inverse.

3.5.2 Calcul de l’inverse par la méthode du pivot de Gauss


La méthode du pivot sert également à trouver l’inverse de toute matrice carrée A
d’ordre n.
La méthode pour inverser une matrice A consiste à faire des opérations élémentaires
sur les lignes de la matrice A jusqu’à la transformer en la matrice identité I. On
fait simultanément les mêmes opérations élémentaires en partant de la matrice I. On
aboutit alors à une matrice qui est A−1 .
En pratique, on fait les deux opérations en même temps en adoptant la disposition
suivante : à côté de la matrice A que l’on veut inverser, on rajoute la matrice identité
pour former un tableau (A | I). Sur les lignes de cette matrice augmentée, on effectue
des opérations élémentaires jusqu’à obtenir le tableau (I | B). Et alors B = A−1 .
Ces opérations élémentaires sur les lignes sont :
1. Li ← λLi avec λ 6= 0 : on peut multiplier une ligne par un réel non nul (ou un
élément de R \ {0}).
2. Li ← Li + λLj avec λ ∈ R (et j 6= i) : on peut ajouter à la ligne Li un multiple
d’une autre ligne Lj .
3. Li ↔ Lj : on peut échanger deux lignes.
N’oubliez pas : tout ce que vous faites sur la partie gauche de la matrice augmentée,
vous devez aussi le faire sur la partie droite.
Observons ceci sur un exemple : 
1 2 1
 
Calculons l’inverse de A =   4 0 −1 .

−1 2 2
Voici la matrice augmentée, avec les lignes numérotées :
 
1 2 1 1 0 0 L1
 
(A | I) =   4 0 −1 0 1 0  L2

−1 2 2 0 0 1 L3
On applique la méthode de Gauss pour faire apparaître des 0 sur la première colonne,
d’abord sur la deuxième ligne par l’opération élémentaire L2 ← L2 −4L1 qui conduit
à la matrice augmentée :
 
1 2 1 1 0 0
 
 0 −8 −5 −4 1 0  L2 ←L2 −4L1
 
−1 2 2 0 0 1

Puis un 0 sur la première colonne, à la troisième ligne, avec L3 ← L3 + L1 :


 
1 2 1 1 0 0
 
 0 −8 −5 −4 1 0 
 
0 4 3 1 0 1 L3 ←L3 +L1

On multiplie la ligne L2 afin qu’elle commence par 1 :


 
1 2 1 1 0 0
 
 0 1 5 1 − 1 0  L2 ←− 1 L2
 8 2 8  8

0 4 3 1 0 1

On continue afin de faire apparaître des 0 partout sous la diagonale, et on multiplie


la ligne L3 . Ce qui termine la première partie de la méthode de Gauss :
 
1 2 1 1 0 0
 
 0 1 5 1 −1 0 
 8 2 8 
1 1
0 0 2 −1 2 1 L3 ←L3 −4L2

puis  
1 2 1 1 0 0
 
 0 1 5 1 −1 0 
 8 2 8 
0 0 1 −2 1 2 L3 ←2L3

Il ne reste plus qu’à « remonter » pour faire apparaître des zéros au-dessus de la
diagonale :
 
1 2 1 1 0 0
 
 0 1 0 7 − 3 − 5  L2 ←L2 − 5 L3
 4 4 4  8

0 0 1 −2 1 2
puis  
1 0 0 − 21 1
2
1
2 L1 ←L1 −2L2 −L3
 
3 75 
0 1 0
 −4 −4 
4
0 0 1 −2 1 2
Ainsi l’inverse de A est la matrice obtenue à droite et après avoir factorisé tous les
coefficients par 14 , on a obtenu :
 
−2 2 2
1
A−1 = 

7 −3 −5 
4 
−8 4 8

Pour se rassurer sur ses calculs, on n’oublie pas de vérifier rapidement que AA−1 = I.

3.6 Déterminant
3.6.1 Déterminant d’une matrice d’ordre 2 et 3
Matrice 2 × 2
En dimension 2, le déterminant est très simple à calculer :
!
a b
det = ad − bc.
c d

C’est donc le produit des éléments sur la diagonale principale moins le produit des
éléments sur l’autre diagonale .

3.6.2 Matrice 3 × 3
Soit A ∈ M3 (R) une matrice 3 × 3 :
 
a11 a12 a13
 
a21 a22 a23  .
A= 
a31 a32 a33

Voici la formule pour le déterminant :

det A = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a31 a22 a13 − a32 a23 a11 − a33 a21 a12 .
Il existe un moyen facile de retenir cette formule, c’est la règle de Sarrus : on recopie
les deux premières colonnes à droite de la matrice, puis on additionne les produits
de trois termes en les regroupant selon la direction de la diagonale descendante (à
gauche), et on soustrait ensuite les produits de trois termes regroupés selon la direc-
tion de la diagonale montante (à droite).
 
2 1 0
 
Exemple. Calculons le déterminant de la matrice A =  1 −1 3.

3 2 1
Par la règle de Sarrus :
det A = 2 × (−1) × 1 + 1 × 3 × 3 + 0 × 1 × 2
− 3 × (−1) × 0 − 2 × 3 × 2 − 1 × 1 × 1 = −6.
Attention : cette méthode ne s’applique pas pour les matrices de taille supérieure à 3.
Nous verrons d’autres méthodes qui s’appliquent aux matrices carrées de toute taille
et donc aussi aux matrices 3 × 3.

3.7 Calculs de déterminants


Une des techniques les plus utiles pour calculer un déterminant est le « développe-
ment par rapport à une ligne (ou une colonne) ».

3.7.1 Cofacteur

Définition 21. Soit A = aij ∈ Mn (R) une matrice carrée.
• On note Aij la matrice extraite, obtenue en effaçant la ligne i et la colonne j
de A.
• Le nombre det Aij est un mineur d’ordre n − 1 de la matrice A.
• Le nombre Cij = (−1)i+j det Aij est le cofacteur de A relatif au coefficient
aij .
 
a1,1 ... a1,j−1 a1,j+1 ... a1,n
 . .. .. .. 
 .. . . . 
 
 
ai−1,1 . . . ai−1,j−1 ai−1,j+1 . . . ai−1,n 
Aij =  
ai+1,1 . . . ai+1,j−1 ai+1,j+1 . . . ai+1,n 
 
 . .. .. 
 .. . . 
 
an,1 ... an,j−1 an,j+1 . . . an,n
 
1 2 3
 
Exemple. Soit A =  4 2 1 . Calculons A11 , C11 , A32 , C32 .

0 1 1
 
1 2 3 !
= 2 1 C11 = (−1)1+1 det A11 = +1.
 
A11 =  4 2 1
1 1
 
0 1 1
 
1 2 3 !
1 3
C32 = (−1)3+2 det A32 = (−1) × (−11) = 11.
 
A32 = 
4 2 1 =

4 1
0 1 1
Pour déterminer si Cij = + det Aij ou Cij = − det Aij , on peut se souvenir que l’on
associe des signes en suivant le schéma d’un échiquier :
 
+ − + − ...
 
− + − + . . . 
A=
 

 + − + − . . .
 
.. .. .. ..
. . . .

Donc C11 = + det A11 , C12 = − det A12 , C21 = − det A21 ...

3.7.2 Développement suivant une ligne ou une colonne


Théorème 1 (Développement suivant une ligne ou une colonne). Formule de déve-
loppement par rapport à la ligne i :
n
X n
X
i+j
det A = (−1) aij det Aij = aij Cij
j=1 j=1

Formule de développement par rapport à la colonne j :


n
X n
X
i+j
det A = (−1) aij det Aij = aij Cij
i=1 i=1

Exemple. Retrouvons la formule des déterminants 3 × 3, déjà présentée par la règle


de Sarrus, en développement par rapport à la première ligne.

a a a
11 12 13

a21 a22 a23 = a11 C11 + a12 C12 + a13 C13


a31 a32 a33

a a a a a a
22 23 21 23 21 22
= a11 − a12 + a13
a32 a33 a31 a33 a31 a32
= a11 (a22 a33 − a32 a23 ) − a12 (a21 a33 − a31 a23 )
+ a13 (a21 a32 − a31 a22 )
= a11 a22 a33 − a11 a32 a23 + a12 a31 a23 − a12 a21 a33
+ a13 a21 a32 − a13 a31 a22 .

Astuce : Il convient d’utiliser la définition de déterminant après avoir fait apparaître


sur une même rangée le plus possible de zéro sachant que
• si deux colonnes (resp. deux lignes) sont identiques ou proportionnelles, alors
det(A) = 0 ;
• si on multiplie une colonne (resp. une ligne) par un scalaire λ 6= 0, alors le
déterminant est multiplié par λ ;
• si on échange deux colonnes (resp. deux lignes), alors le déterminant est changé
en son opposé (i.e., le déterminant change de signe) ;
• on ne change pas un déterminant si on ajoute à une colonne (resp. une ligne)
une combinaison linéaire des autres colonnes

Exemple et exercices
Exemple.  
4 0 3 1
 
4 2 1 0 
A=
 

0 3 1 −1
 
1 0 2 3
On choisit de développer par rapport à la seconde colonne (car c’est là qu’il y a le
plus de zéros) :

det A = 0C12 + 2C22 + 3C32 + 0C42


(développement par rapport à la deuxième colonne)

4 3 1 4 3 1


= +2 0 1 −1 − 3 4 1 0

1 2 3 1 2 3
on n’oublie pas les signes des cofacteurs et on recommence

en développant chacun de ces deux déterminants 3 × 3


!
1 −1 3 1 3 1
= +2 +4 − 0 + 1


2 3 2 3 1 −1
(par rapport à la première colonne)
!
3 1 4 1 4 3
−3 −4 + 1 − 0


2 3 1 3 1 2
(par rapport à la deuxième ligne)
 
= +2 + 4 × 5 − 0 + 1 × (−4) − 3 − 4 × 7 + 1 × 11 − 0

= 83
Remarque. Le développement par rapport à une ligne permet de ramener le calcul
d’un déterminant n × n à celui de n déterminants (n − 1) × (n − 1). Par récurrence
descendante, on se ramène ainsi au calcul de n! sous-déterminants, ce qui devient vite
fastidieux. C’est pourquoi le développement par rapport à une ligne ou une colonne
n’est utile pour calculer explicitement un déterminant que si la matrice de départ a
beaucoup de zéros. On commence donc souvent par faire apparaître un maximum
de zéros par des opérations élémentaires sur les lignes et/ou les colonnes qui ne
modifient pas le déterminant, avant de développer le déterminant suivant la ligne ou
la colonne qui a le plus de zéros.
EXERCICE 1. Calculer les déterminants suivants :

1 0 0 1 −1 1 1 1

a b c

1 −1 1 1
0 1 0 0

∆1 = c a b , ∆2 = , ∆3 = ,

1 0 1 1 1 1 −1 1
b c a



2 3 1 1 1 1 1 −1

1 0 3 0 0

10 0 −5 15 a a b 0

0 1 0 3 0
−2 7 3 0 a a 0 b


∆4 = , ∆5 = , ∆6 = a 0 a 0 3


8 14 0 2 c 0 a a


b a 0 a 0
0 −21 1 −1

0 c a a
0 b 0 0 a

Solution :
1. Par la règle de Sarrus :

a b c

∆1 = c a b = a3 + b3 + c3 − 3abc.


b c a

2. On développe par rapport à la seconde ligne qui ne contient qu’un coefficient


non nul et on calcule le déterminant 3 × 3 par la règle de Sarrus :

1 0 0 1

1 0 1

0 1 0 0
∆2 = = +1 1 1 1 = −1.

1 0 1 1



2 1 1
2 3 1 1

3.
L1 −1 1 1 1 −1 1 1 1
L2 1 −1 1 1 L2 ←L2 +L1 0 0 2 2
∆3 = =
L3 1 1 −1 1 L3 ←L3 +L1 0 2 0 2
L4 1 1 1 −1 L4 ←L4 +L1 0 2 2 0
On développe par rapport à la première colonne :

0 2 2
∆3 = (−1) × 2 0 2 = −16
2 2 0
4. Le déterminant est linéaire par rapport à chacune de ses lignes et aussi chacune
de ses colonnes. Par exemple les coefficients de la première ligne sont tous des
multiples de 5 donc

10 0 −5 15 2 0 −1 3


−2 7 3 0 −2 7 3 0

∆4 = =5×


8 14 0 2 8 14 0 2


0 −21 1 −1

0 −21 1 −1

On fait la même chose avec la troisième ligne :



2 0 −1 3


−2 7 3 0
∆4 = 5 × 2 ×


4 7 0 1


0 −21 1 −1

Et enfin les coefficients la premièrere colonne sont des multiples de 2 et ceux


de la troisième colonne sont des multiples de 7 donc :

1 0 −1 3 1 0 −1 3


−1 7 3 0 −1 1 3 0

∆4 = 5 × 2 × 2 × = 5×2×2×7×


2 7 0 1 2 1 0 1


0 −21 1 −1

0 −3 1 −1

Les coefficients sont plus raisonnables ! On fait L2 ← L2 + L1 et L3 ← L3 −


2L1 pour obtenir :

1 0 −1 3

1 2 3
0 1 2 3

∆4 = 140 × = 140 × 1 2 −5 = 140 × 56 = 7840

0 1 2 −5


−3 1 −1
0 −3 1 −1

5.
L1 a a b 0 a a b 0
L2 a a 0 b L2 ←L2 −L1 0 0 −b b
∆5 = =
L3 c 0 a a c 0 a a
L4 0 c a a L4 ←L4 −L3 −c c 0 0
On fait ensuite les opérations suivantes sur les colonnes : C2 ← C2 + C1 et
C3 ← C3 − C4 pour obtenir une dernière ligne facile à développer :

a 2a b 0
2a b 0
0 0 −2b b
∆5 = = +c × 0 −2b b = bc(bc − 4a2 )
c c 0 a
c 0 a
−c 0 0 0

6. On fait d’abord les opérations C1 ← C1 −C3 et C2 ← C2 −C4 et on développe


par rapport à la premièrere ligne :

1 0 3 0 0 −2 0 3 0 0

−2 0 3 0 0 −2 3 0

0 1 0 3 0 0 −2 0 3 0
0 a 0 3 0 0
0 3
∆6 = a 0 a 0 3 = 0 0 a 0 3 = (−2)× +3×


0 0 a 0 b 0 a 0
b a 0 a 0 b 0 0 a 0





b 0 0 a 0 b 0 a
0 b 0 0 a 0 b 0 0 a

Le premier déterminant à calculer se développe par rapport à la deuxième co-


lonne et le second déterminant par rapport à la première colonne :

−2 3 0 −2 3 0

∆6 = (−2) × a × 0 a 0 + 3 × b × 0 0 3 = 4a3 + 27b2


b 0 a b 0 a

3.7.3 Application à l’inverse d’une matrice


Soit A ∈ Mn () une matrice carrée.
Nous lui associons la matrice C des cofacteurs, appelée comatrice, et notée Com(A) :
 
C C · · · C1n
 11 12 
 C C ··· C 
 21 22 2n 
Com(A) = (Cij ) =  . .. .. 
 .. . . 
 
Cn1 Cn2 · · · Cnn

Théorème 2. Une matrice carrée A est inversible si et seulement si son déterminant


est non nul.
1 t
Soit A une matrice carrée inversible. Alors A−1 = Com(A)
det A
 
1 1 0
 
Exemple. Soit A =  0 1 1 . Le calcul donne que det A = 2. La comatrice

1 0 1
Com(A) s’obtient en calculant 9 déterminants 2 × 2 (sans oublier les signes +/−).
On trouve :
   
1 1 −1 1 −1 1

 et donc A−1 =
 1 t 1  
Com(A) =  −1 1 1 Com(A) =  1 1 −1
  det A 2 
1 −1 1 −1 1 1
 
1 1 −1
 
Exemple. Calcul de l’inverse de A = 
−1 1 1 

1 −1 1
1. On calcule la matrice des cofacteurs des éléments de A, appelée comatrice de
A:
 
1 1 −1 1 −1 1
 + − +


 −1 1 1 1 1 −1   
  2 2 0
 1 −1 1 −1
 1 1    
Com(A) =  − + − = 0 2 2
  

 −1 1 1 1 1 −1 
   

 1 −1

1 −1

1 1  2 0 2
+ − +
 

1 1 −1 1 −1 1

2. on transpose la comatrice de A
 
2 0 2
t
 
Com(A) = 
 2 2 0

0 2 2

3. on calcule enfin A−1 :


 
2 0 2
1 t 1
A−1

= Com(A) =  2 2 0
det A 4 
0 2 2
3.8 Systèmes linéaires
3.8.1 Généralités
Définition 22.
• On appelle équation linéaire dans les variables (ou inconnues) x1 , · · · , xp toute
relation de la forme

a1 x1 + · · · + ap xp = b, (1)

où a1 , · · · , ap et b sont des nombres réels donnés.


• Soit n un entier supérieur ou égal à 1. Un système de n équations linéaires à p
inconnues est une liste de n équations linéaires.

La forme générale d ?un système linéaire de n équations à p inconnues est la sui-


vante :



 a11 x1 + a12 x2 + · · · + a1p xp = b1

 a x + a x + ··· + a x

= b2
21 1 22 2 2p p


 ...


 a x + a x + ··· + a x = bn
n1 1 n2 2 np p

Les nombres aij , i = 1, · · · , n, j = 1, · · · , p, sont les coefficients du système. Ce


sont des données. Les nombres bi , i = 1, · · · , n, constituent le second membre du
système et sont également des données.
Il convient de bien observer comment on a rangé le système en lignes (une ligne par
équation) numérotées de 1 à n par l’indice i, et en colonnes : les termes correspondant
à une même inconnue xj sont alignés verticalement les uns sous les autres. L’indice
j varie de 1 à p. Il y a donc p colonnes à gauche des signes d’égalité, plus une
colonne supplémentaire à droite pour le second membre. La notation avec double
indice aij correspond à ce rangement : le premier indice (ici i) est le numéro de ligne
et le second indice (ici j) est le numéro de colonne. Il est extrêmement important de
toujours respecter cette convention.

Définition 23. Une solution du système linéaire est une liste de p nombres réels
(s1 , s2 , · · · , sp ) (un p-uplet) tels que si l’on substitue s1 pour x1 , s2 pour x2 , etc., dans
le système linéaire, on obtient une égalité. L’ ensemble des solutions du système est
l’ensemble de tous ces p-uplets.

Définition 24. On dit que deux systèmes linéaires sont équivalents s ?ils ont le même
ensemble de solutions.
À partir de là, le jeu pour résoudre un système linéaire donné consistera à le trans-
former en un système équivalent dont la résolution sera plus simple que celle du
système de départ. Nous verrons plus loin comment procéder de façon systématique
pour arriver à ce but.

Théorème 3. Un système d’équations linéaires n’a soit aucune solution, soit une
seule solution, soit une infinité de solutions.

Le système linéaire



 a11 x1 + a12 x2 + · · · + a1p xp = b1

 a x + a x + ··· + a x = b

21 1 22 2 2p p 2


 ...


 a x + a x + ··· + a x = b
n1 1 n2 2 np p n

peut s’écrire sous forme matricielle :


     
a . . . a1p x1 b
 11     1 
 a ... a   x2  b 
 21 2p  2 
 =  . .
  
 . . ..
. ..  .. 
 
(Σ)   . .
  
    
an1 . . . anp xp bn
| {z } | {z } | {z }
A X B

On appelle A ∈ Mn,p (R) la matrice des coefficients du système. B ∈ Mn,1 (R) est le
vecteur du second membre. Le vecteur X ∈ Mp,1 (R) est une solution du système si
et seulement si
AX = B.
On dit alors que AX = B est l’écriture matricielle du système (Σ).
Nous savons que :

Théorème 4. Un système d’équations linéaires n’a soit aucune solution, soit une
seule solution, soit une infinité de solutions.

3.8.2 Matrices inversibles et systèmes linéaires


Considérons le cas où le nombre d’équations égale le nombre d’inconnues :
     
a11 . . . a1n x1 b
     1 
 a21 . . . a2n   x2  b 
 2 
 =  . .
   
 .. ..   ..  .. 

 . . 


 . 
  
an1 . . . ann xn bn
| {z } | {z } | {z }
A X B
Alors A ∈ Mn (R) est une matrice carrée et B un vecteur de Mn,1 (R). Pour tout se-
cond membre, nous pouvons utiliser les matrices pour trouver la solution du système
linéaire.

Proprosition. Si la matrice A est inversible, alors la solution du système AX = B


est unique et est : X = A−1 B.
−1 −1

La preuve est juste de vérifier que si X = A B, alors AX = A A B =
AA−1 B = I · B = B. Réciproquement si AX = B, alors nécessairement

X = A−1 B.
Nous verrons bientôt que si la matrice n’est pas inversible, alors soit il n’y a pas de
solution, soit une infinité.

3.8.3 Les matrices élémentaires


Pour calculer l’inverse d’une matrice A, et aussi pour résoudre des systèmes li-
néaires, nous avons utilisé trois opérations élémentaires sur les lignes qui sont :
1. Li ← λLi avec λ 6= 0 : on peut multiplier une ligne par un réel non nul (ou un
élément de R \ {0}).
2. Li ← Li + λLj avec λ ∈ R (et j 6= i) : on peut ajouter à la ligne Li un multiple
d’une autre ligne Lj .
3. Li ↔ Lj : on peut échanger deux lignes.
Nous allons définir trois matrices élémentaires ELi ←λLi , ELi ←Li +λLj , ELi ↔Lj corres-
pondant à ces opérations. Plus précisément, le produit E × A correspondra à l’opé-
ration élémentaire sur A. Voici les définitions accompagnées d’exemples.
1. La matrice ELi ←λLi est la matrice obtenue en multipliant par λ la i-ème ligne
de la matrice identité In , où λ est un nombre réel non nul.
 
1 0 0 0
 
0 5 0 0 
EL2 ←5L2 =
 

0 0 1 0 
 
0 0 0 1
2. La matrice ELi ←Li +λLj est la matrice obtenue en ajoutant λ fois la j-ème ligne
de In à la i-ème ligne de In .
 
1 0 0 0
 
−3 1 0 0
EL2 ←L2 −3L1 = 
 

 0 0 1 0
 
0 0 0 1
3. La matrice ELi ↔Lj est la matrice obtenue en permutant les i-ème et j-ème
lignes de In .
 
1 0 0 0
 
0 0 0 1
EL2 ↔L4 = EL4 ↔L2 = 
 

0 0 1 0
 
0 1 0 0
Les opérations élémentaires sur les lignes sont réversibles, ce qui entraîne l’inversi-
bilité des matrices élémentaires.
Le résultat de la multiplication d’un matrice élémentaire E par A est la matrice
obtenue en effectuant l’opération élémentaire correspondante sur A. Ainsi :
1. La matrice ELi ←λLi × A est la matrice obtenue en multipliant par λ la i-ème
ligne de A.
2. La matrice ELi ←Li +λLj × A est la matrice obtenue en ajoutant λ fois la j-ème
ligne de A à la i-ème ligne de A.
3. La matrice ELi ↔Lj × A est la matrice obtenue en permutant les i-ème et j-ème
lignes de A.
Exemple.
1.      
1 0 0 x1 x2 x3 x1 x2 x3
     
EL2 ← 31 L2 × A =  1  ×  y1 y2 y3  =  1 y1 1 y2 1 y 3 
0
 3   0  3 3 3 
0 0 1 z1 z2 z3 z1 z2 z3
2.
     
1 0 −7 x1 x2 x3 x1 − 7z1 x2 − 7z2 x3 − 7z3
     
EL1 ←L1 −7L3 ×A =   ×  =
0 1 0   y 1 y 2 y 3   y 1
 y2 y3  
0 0 1 z1 z2 z3 z1 z2 z3

3.      
1 0 0 x1 x2 x3 x1 x2 x3
     
EL2 ↔L3 × A = 
 0 0 1 ×  y1 y2 y3  =  z1 z2 z3 
    
0 1 0 z1 z2 z3 y 1 y2 y3

3.8.4 Équivalence à une matrice échelonnée


Définition 25. Deux matrices A et B sont dites équivalentes par lignes si l’une peut
être obtenue à partir de l’autre par une suite d’opérations élémentaires sur les lignes.
On note A ∼ B.

Définition 26. Une matrice est échelonnée si :


• le nombre de zéros commençant une ligne croît strictement ligne par ligne
jusqu’à ce qu’il ne reste plus que des zéros.
Elle est échelonnée réduite si en plus :
• le premier coefficient non nul d’une ligne (non nulle) vaut 1 ;
• et c’est le seul élément non nul de sa colonne.

Exemple d’une matrice échelonnée (à gauche) et échelonnée réduite (à droite) ; les ∗


désignent des coefficients quelconques, les + des coefficients non nuls :
   
+ ∗ ∗ ∗ ∗ ∗ ∗ 1 ∗ 0 0 ∗ ∗ 0
   
0 0 + ∗ ∗ ∗ ∗ 0 0 1 0 ∗ ∗ 0
   
0 0 0 + ∗ ∗ ∗ 0 0 0 1 ∗ ∗ 0
   
   
 0 0 0 0 0 0 + 0 0 0 0 0 0 1
   
   
0 0 0 0 0 0 0 0 0 0 0 0 0 0
   
0 0 0 0 0 0 0 0 0 0 0 0 0 0

Théorème 5. Étant donnée une matrice A ∈ Mn,p (R), il existe une unique matrice
échelonnée réduite U obtenue à partir de A par des opérations élémentaires sur les
lignes.
Ce théorème permet donc de se ramener par des opérations élémentaires à des ma-
trices dont la structure est beaucoup plus simple : les matrices échelonnées réduites.
Démonstration. Nous admettons l’unicité.
L’existence se démontre grâce à l’algorithme de Gauss. L’idée générale consiste à
utiliser des substitutions de lignes pour placer des zéros là où il faut de façon à créer
d’abord une forme échelonnée, puis une forme échelonnée réduite.

Soit A une matrice n × p quelconque.

Partie A. Passage à une forme échelonnée.


Étape A.1. Choix du pivot.
On commence par inspecter la première colonne. Soit elle ne contient que des zéros,
auquel cas on passe directement à l’étape A.3, soit elle contient au moins un terme
non nul. On choisit alors un tel terme, que l’on appelle le pivot. Si c’est le terme a11 ,
on passe directement à l’étape A.2 ; si c’est un terme ai1 avec i 6= 1, on échange les
lignes 1 et i (L1 ↔ Li ) et on passe à l’étape A.2.
Au terme de l’étape A.1, soit la matrice A a sa première colonne nulle (à gauche) ou
bien on obtient une matrice équivalente dont le premier coefficient a011 est non nul (à
droite) :
   
0 a12 · · · a1j · · · a1p a011 a012 · · · a01j · · · a01p
   0 
0 a22 · · · a2j · · · a2p   a21 a022 · · · a0 · · · a02p 
   2j 
 .. .. .
. .
.   .
. .
. .
. .
. 
. . . .   . . . . 
  = A ou   ∼ A.
 0 0 0 0 
0 ai2 · · · aij · · · aip   ai1 ai2 · · · aij · · · aip 
 
. . .. .. 
  . .. .. .. 
 .. .. . .  .. . . . 
   
0 an2 · · · anj · · · anp a0n1 a0n2 · · · a0nj · · · a0np

Étape A.2. Élimination.


On ne touche plus à la ligne 1, et on se sert du pivot a011 pour éliminer tous les
termes a0i1 (avec i ≥ 2) situés sous le pivot. Pour cela, il suffit de remplacer la ligne
0 0
i par elle-même moins aa0i1 × la ligne 1, ceci pour i = 2, . . . , n : L2 ← L2 − aa21
0 L1 ,
11 11
a031
L3 ← L3 − a011 L1 ,. . .
Au terme de l’étape A.2, on a obtenu une matrice de la forme
 
a011 a012 · · · a01j · · · a01p
 
 0 a0022 · · · a00 · · · a002p 
 2j 
 .. .
. .
. .
. 
 . . . . 
  ∼ A.
00 00 00 
 0 ai2 · · · aij · · · aip 

 . .. .. .. 
 .. . . . 
 
0 a00n2 · · · a00nj · · · a00np

Étape A.3. Boucle.


Au début de l’étape A.3, on a obtenu dans tous les cas de figure une matrice de la
forme  
a111 a112 · · · a11j · · · a11p
 
 0 a122 · · · a1 · · · a12p 
 2j 
 .. .
.. .
.. .. 
 . . 
 ∼A
 0 a1i2 · · · a1ij 1 
· · · aip 

 . .. .. .. 
 .. . . . 
 
0 a1n2 · · · a1nj · · · a1np
dont la première colonne est bien celle d’une matrice échelonnée. On va donc conser-
ver cette première colonne. Si a111 6= 0, on conserve aussi la première ligne, et l’on
repart avec l’étape A.1 en l’appliquant cette fois à la sous-matrice (n − 1) × (p − 1)
(ci-dessous à gauche : on « oublie » la première ligne et la première colonne de A) ;
si a111 = 0, on repart avec l’étape A.1 en l’appliquant à la sous-matrice n × (p − 1)
(à droite, on « oublie » la première colonne) :
 
1 1 1
  a 12 · · · a 1j · · · a 1p
a122 · · · a12j · · · a12p  1 
 a22 · · · a1 · · · a12p 
 ... .. .. 
 
2j
. .  
 .. . .


   . .. ..  
 a1 · · · a1 · · · a1   
 i2 ij ip   1 1 1 
 . .. ..   ai2 · · · aij · · · aip 
 .. . .   . .. .. 
   .. . . 
1 1 1
an2 · · · anj · · · anp
 
a1n2 · · · a1nj · · · a1np

Au terme de cette deuxième itération de la boucle, on aura obtenu une matrice de la


forme  
a111 a112 · · · a11j · · · a11p
 

 0 a222 · · · a22j · · · a22p 

 .. .. .. .. 

 . . . .  ∼ A,
2 2 
0 0 · · · aij · · · aip 


 .. .. .. .. 

 . . . . 

2 2
0 0 · · · anj · · · anp
et ainsi de suite.
Comme chaque itération de la boucle travaille sur une matrice qui a une colonne de
moins que la précédente, alors au bout d’au plus p − 1 itérations de la boucle, on aura
obtenu une matrice échelonnée.

Partie B. Passage à une forme échelonnée réduite.


Étape B.1. Homothéties.
On repère le premier élément non nul de chaque ligne non nulle, et on multiplie cette
ligne par l’inverse de cet élément. Exemple : si le premier élément non nul de la ligne
i est α 6= 0, alors on effectue Li ← α1 Li . Ceci crée une matrice échelonnée avec des
1 en position de pivots.
Étape B.2. Élimination.
On élimine les termes situés au-dessus des positions de pivot comme précédemment,
en procédant à partir du bas à droite de la matrice. Ceci ne modifie pas la structure
échelonnée de la matrice en raison de la disposition des zéros dont on part.

Exemple. Soit  
1 2 3 4
 
A=
 0 2 4 6 .

−1 0 1 0
A. Passage à une forme échelonnée.
Première itération de la boucle, étape A.1. Le choix du pivot est tout fait, on garde
a111 = 1.
Première itération de la boucle, étape A.2. On ne fait rien sur la ligne 2 qui contient
déjà un zéro en bonne position et on remplace la ligne 3 par L3 ← L3 + L1 . On
obtient  
1 2 3 4
 
A∼  0 2 4 6 .

0 2 4 4
Deuxième itération de la boucle, étape A.1. Le choix du pivot est tout fait, on garde
a222 = 2.
Deuxième itération de la boucle, étape A.2. On remplace la ligne 3 avec l’opération
L3 ← L3 − L2 . On obtient
 
1 2 3 4
 
A∼  0 2 4 6 .

0 0 0 −2
Cette matrice est échelonnée.
B. Passage à une forme échelonnée réduite.
1
Étape B.1, homothéties. On multiplie la ligne 2 par 2 et la ligne 3 par − 21 et l’on
obtient  
1 2 3 4
 
A∼ 0 1 2 3.
0 0 0 1
Étape B.2, première itération. On ne touche plus à la ligne 3 et on remplace la ligne
2 par L2 ← L2 − 3L3 et L1 ← L1 − 4L3 . On obtient
 
1 2 3 0
 
A∼  0 1 2 0 .

0 0 0 1

Étape B.2, deuxième itération. On ne touche plus à la ligne 2 et on remplace la ligne


1 par L1 ← L1 − 2L2 . On obtient
 
1 0 −1 0
 
A∼  0 1 2 0

0 0 0 1
qui est bien échelonnée et réduite.

3.8.5 Matrices élémentaires et inverse d’une matrice


Théorème 6. Soit A ∈ Mn (R). La matrice A est inversible si et seulement si sa
forme échelonnée réduite est la matrice identité In .
Démonstration. Notons U la forme échelonnée réduite de A. Et notons E le produit
de matrices élémentaires tel que EA = U .
⇐= Si U = In alors EA = In . Ainsi par définition, A est inversible et A−1 = E.
=⇒ Nous allons montrer que si U 6= In , alors A n’est pas inversible.
? Supposons U 6= In . Alors la dernière ligne de U est nulle (sinon il y
aurait un pivot sur chaque ligne donc ce serait In ).
? Cela entraîne que U n’est pas inversible : en effet, pour tout matrice car-
rée V , la dernière ligne de U V est nulle ; on n’aura donc jamais U V = In .
? Alors, A n’est pas inversible non plus : en effet, si A était inversible,
on aurait U = EA et U serait inversible comme produit de matrices
inversibles (E est inversible car c’est un produit de matrices élémentaires
qui sont inversibles).

Remarque. Justifions maintenant notre méthode pour calculer A−1 .


Nous partons de (A|I) pour arriver par des opérations élémentaires sur les lignes à
(I|B). Montrons que B = A−1 . Faire une opération élémentaire signifie multiplier
à gauche par une des matrices élémentaires. Notons E le produit de ces matrices
élémentaires. Dire que l’on arrive à la fin du processus à I signifie EA = I. Donc
A−1 = E. Comme on fait les mêmes opérations sur la partie droite du tableau, alors
on obtient EI = B. Donc B = E. Conséquence : B = A−1 .
Corollaire. Les assertions suivantes sont équivalentes :
(i) La matrice A est inversible.  0
0
(ii) Le système linéaire AX = .. a une unique solution X = ... .
.
0 0
(iii) Pour tout second membre B, le système linéaire AX = B a une unique solu-
tion X.
Démonstration. Nous avons déjà vu (i) =⇒ (ii) et (i) =⇒ (iii).
Nous allons seulement montrer (ii) =⇒ (i). Nous raisonnons par contraposée :
nous allons montrer la proposition équivalente non(i) =⇒ non(ii). Si A n’est
pas inversible, alors sa forme échelonnée réduite U contient un premier zéro sur sa
diagonale, disons à la place `. Alors U à la forme suivante
   
1 0 · · · c1 ∗ · · · ∗ −c1
 0 ... 0
 ..   .. 
 . ··· ∗  
 . 
 
   
 0 0 1 c`−1
 · · · ∗ 

−c`−1 
 
 0 ··· 0 0 ∗ ··· ∗ . On note X =  1 .
   
   
 0 ··· 0 0 ∗ ··· ∗   0 
  

 . . .. . . . ...   . 
 .. .. . · · · 0   .. 
   
0 ··· ··· 0 ∗ 0
Alors X n’est pas le vecteur nul, mais U X est le vecteur nul. Comme A = E −1 U ,
alors AX est le vecteur nul. Nous avons donc trouvé un vecteur non nul X tel que
AX = 0.

3.8.6 Résolution d’un système linéaire par la méthode de Cramer


Le théorème suivant, appelé règle de Cramer, donne une formule explicite pour la so-
lution de certains systèmes d’équations linéaires ayant autant d’équations que d’in-
connues. Considérons le système d’équations linéaires à n équations et n inconnues
suivant : 


 a11 x1 + a12 x2 + · · · + a1n xn = b1

 a x + a x + ··· + a x = b

21 1 22 2 2n n 2


 ...


 a x + a x + ··· + a x = b
n1 1 n2 2 nn n n

Ce système peut aussi s’écrire sous forme matricielle AX = B où


     
a a · · · a1n x b
 11 12   1   1 
 a a ··· a  x  b 
 21 22 2n   2   2 
A= . . .  ∈ Mn (R), X =  .  et B =  .  .
 .. .. ..   ..   .. 
     
an1 an2 · · · ann xn bn
Définissons la matrice Aj ∈ Mn (R) par
 
a . . . a1,j−1 b1 a1,j+1 . . . a1n
 11 
 a ... a
2,j−1 b2 a2,j+1 . . . a2n 

 21
Aj =  . .. .. .. .. 
 .. . . . . 
 
an1 . . . an,j−1 bn an,j+1 . . . ann
Autrement dit, Aj est la matrice obtenue en remplaçant la j-ème colonne de A par le
second membre B. La règle de Cramer va nous permettre de calculer la solution du
système dans le cas où det A 6= 0 en fonction des déterminants des matrices A et Aj .
Théorème 7 (Règle de Cramer). Soit
AX = B
un système de n équations à n inconnues. Supposons que det A 6= 0. Alors l’unique
solution (x1 , x2 , . . . , xn ) du système est donnée par :
det A1 det A2 det An
x1 = x2 = ... xn = .
det A det A det A
Démonstration. Nous avons supposé que det A 6= 0. Donc A est inversible. Alors
X = A−1 B est l’unique solution du système. D’autre part, nous avons vu que A−1 =
1 T 1 T
det A C où C est la comatrice. Donc X = det A C B. En développant,
      
x1 C11 . . . Cn1 b1 C11 b1 + C21 b2 + · · · + Cn1 bn
..  = 1  ...   ...  = 1 
.  ..     .. 
X=   det A  .    det A  . 

xn C1n . . . Cnn bn C1n b1 + C2n b2 + · · · + Cnn bn
C’est-à-dire
C11 b1 + · · · + Cn1 bn C1i b1 + · · · + Cni bn C1n b1 + · · · + Cnn bn
x1 = , xi = , xn =
det A det A det A
Mais b1 C1i + · · · + bn Cni est le développement en cofacteurs de det Ai par rapport à
sa i-ème colonne. Donc
det Ai
xi = ·
det A

Exemple. Résolvons le système suivant :



 x1 + 2x3 = 6


−3x1 + 4x2 + 6x3 = 30


 −x − 2x + 3x = 8.
1 2 3

On a    
1 0 2 6
   
A= −3 4 6 B= 30 

−1 −2 3 8
     
6 0 2 1 6 2 1 0 6
     
A1 = 
 30 4 6 
 A2 = 
 −3 30 6 
 A 3 =  −3 4 30 
 
8 −2 3 −1 8 3 −1 −2 8
et
det A = 44 det A1 = −40 det A2 = 72 det A3 = 152.
La solution est alors
det A1 40 10 det A2 72 18 det A3 152 38
x1 = =− =− x2 = = = x3 = = = ·
det A 44 11 det A 44 11 det A 44 11
La méthode de Cramer n’est pas la méthode la plus efficace pour résoudre un sys-
tème, mais est utile si le système contient des paramètres.
3.8.7 Exercices corrigés
EXERCICE 2. 1. Résoudre de quatre manières différentes le système suivant
(par substitution, par la méthode du pivot de Gauss, en inversant la matrice des
coefficients, par la formule de Cramer) :
(
2x + y = 1
3x + 7y = −2

2. Choisir la méthode qui vous paraît la plus rapide pour résoudre, selon les va-
leurs de a, les systèmes suivants :
( (
ax + y = 2 (a + 1)x + (a − 1)y = 1
(a2 + 1)x + 2ay = 1 (a − 1)x + (a + 1)y = 1

Solution :

1. (a) Par substitution. La première équation s’écrit aussi y = 1 − 2x. On


remplace maintenant y dans la deuxième équation
9
3x + 7y = −2 =⇒ 3x + 7(1 − 2x) = −2 =⇒ 11x = 9 =⇒ x = .
11
9 7
On en déduit y : y = 1 − 2x = 1 − 2 11 = − 11 . La solution de ce système
9 7
est donc le couple ( 11 , − 11 ).
N’oubliez pas de vérifier que votre solution fonctionne !
(b) Par le pivot de Gauss. On garde la ligne L1 et on remplace la ligne L2
par 2L2 − 3L1 :
( (
2x + y = 1 2x + y = 1
⇐⇒
3x + 7y = −2 11y = −7
7
On obtient un système triangulaire : on en déduit y = − 11 et alors la
9
première ligne permet d’obtenir x = 11 .
(c) Par les matrices. En terme matriciel le système s’écrit
! ! !
2 1 x 1
AX = Y avec A = X= Y =
3 7 y −2
On trouve la solution du système en inversant la matrice :
X = A−1 Y.
L’inverse d’une matrice 2 × 2 se calcule ainsi
! !
a b 1 d −b
si A = alors A−1 =
c d ad − bc −c a

a b
Il faut bien sur que le déterminant det A = = ad − bc soit différent

c d
de 0.
Ici on trouve
! ! !
1 7 −1 1 1 9
A−1 = et X = A−1 =
11 −3 2 −2 11 −7

(d) Par les formules de Cramer. Les formules de Cramer pour un système
de deux équations sont les suivantes si le déterminant vérifie ad−bc 6= 0 :

e b a e

(
ax + by = e f d c f
=⇒ x = et y =
cx + dy = f a b

a b


c d c d

Ce qui donne ici :



1 1 2 1


−2 7 9 3 −2 7
x= = et y= =−
2 1 11 2 1 11


3 7 3 7

2. (a) Avant tout on regarde s’il existe une solution unique, c’est le cas si et
seulement si le déterminant est non nul. Pour le premier système le dé-
a 1
terminant est = a2 − 1 donc il y a une unique solution si et


a2 + 1 2a
seulement si a 6= ±1.
Bien sur toutes les méthodes conduisent au même résultat ! Par exemple
par substitution, en écrivant la première ligne y = 2 − ax, la deuxième
ligne devient (a2 + 1)x + 2a(2 − ax) = 1. On en déduit que si a 6= ±1
−2a2 +a−2
alors x = 4a−1
a2 −1 puis y = a2 −1 .
Traitons(maintenant les cas particuliers. Si a = 1 alors le système de-
x + y = 2
vient : Mais on ne peut avoir en même temps x +
2x + 2y = 1
y = 2 et x + y = 21 . Donc il n’y a pas de solution.
(
−x + y = 2
Si a = −1 alors le système devient : et il n’y a pas
2x − 2y = 1
de solution.

a + 1 a − 1
(b) Ici le déterminant est = (a + 1)2 − (a − 1)2 = 4a.

a − 1 a + 1
Si a 6= 0 alors on trouve la solution unique (x, y). Par exemple avec la
formule de Cramer

1 a − 1 a + 1 1


1 a + 1 1 a − 1 1 1
x= = et y = = .
4a 2a 4a 2a
Si a = 0 il n’y a pas de solution.

EXERCICE 3. Trouver les solutions de





 3x + 2z = 0


 3y + z + 3t = 0


 x+y+z+t=0


 2x − y + z − t = 0

Solution :
On commence par simplifier le système :
• on place la ligne L3 en première position pour le pivot de Gauss ;
• on réordonne les variables dans l’ordre : y, t, x, z pour profiter des lignes déjà
simples.



 y + t + x + z = 0


 3y + 3t + z = 0


 −y − t + 2x + z = 0


 3x + 2z = 0
On commence le pivot de Gauss avec les opération L2 ← L2 − 3L1 et L3 ← L3 + L1
pour obtenir : 


 y + t + x + z = 0

− 3x − 2z = 0




 3x + 2z = 0


 3x + 2z = 0
Les 3 dernières lignes sont identiques, on se ramène donc à un système avec 2 équa-
tions et 4 inconnues :
(
y + t + x + z = 0
3x + 2z = 0

3
Nous choisissons x et y comme paramètres, alors z = − x et t = −x − y − z =
2
1
x − y. Les solutions du système sont donc les
2
 
3 1 
x, y, z = − x, t = x − y | x, y ∈ R
2 2
EXERCICE 4. Résoudre les systèmes suivants
  
x + y − z = 0  x + y + 2z = 5  3x − y + 2z = a

 
 

x − y = 0 x − y − z = 1 −x + 2y − 3z = b

 
 

 x + 4y + z = 0 x + z = 3  x + 2y + z = c

Solution :
1. Remarquons que comme le système est homogène (c’est-à -dire les coeffi-
cients du second membre sont nuls) alors (0, 0, 0) est une solution du système.
Voyons s’il y en a d’autres. Nous faisons semblant de ne pas voir que la se-
conde ligne implique x = y et que le système est en fait très simple à résoudre.
Nous allons appliquer le pivot de Gauss en faisant les opérations suivantes sur
les lignes L2 ← L2 − L1 et L3 ← L3 − L1 :
 
x + y − z = 0 x + y − z = 0

 

x − y = 0 ⇐⇒ − 2y + z = 0

 

 x + 4y + z = 0  3y + 2z = 0
On fait maintenant L3 ← 2L3 + 3L2 pour obtenir :

x + y − z = 0


− 2y + z = 0


 7z = 0
En partant de la dernière ligne on trouve z = 0, puis en remontant y = 0, puis
x = 0. Conclusion l’unique solution de ce système est (0, 0, 0).
2. On applique le pivot de Gauss L2 ← L2 − L1 et L3 ← L3 − L1 :
 
 x + y + 2z = 5  x + y + 2z = 5

 

x − y − z = 1 ⇐⇒ − 2y − 3z = −4

 

x + z = 3  − y − z = −2
Puis L3 ← 2L3 − L2 pour obtenir un système équivalent qui est triangulaire
donc facile à résoudre :
 


 x + y + 2z = 5 x = 3


− 2y − 3z = −4 ⇐⇒ y = 2

 

 z = 0  z = 0

On n’oublie pas de vérifier que c’est une solution du système initial.


3. On fait les opérations L2 ← 3L2 + L1 et L3 ← 3L3 − L1 pour obtenir :
 
 3x − y + 2z = a  3x − y + 2z = a

 

−x + 2y − 3z = b ⇐⇒ 5y − 7z = 3b + a

 

 x + 2y + z = c  7y + z = 3c − a
Puis on fait L3 ← 5L3 − 7L2 , ce qui donne un système triangulaire :

 3x − y + 2z = a


5y − 7z = 3b + a


 54z = 5(3c − a) − 7(3b + a)
1
En partant de la fin on en déduit : z = 54 (−12a − 21b + 15c) puis en remontant
cela donne 
1
 x = 18 (8a + 5b − c)


1
y = 18 (−2a + b + 7c)

1

 z =
18 (−4a − 7b + 5c)
Préparation de l’examen
EXERCICE 1. L’entreprise Apex a enquêté 92 commerciaux sur le nombre de kilo-
mètres qu’ils effectuaient par jour pour représenter les produits à vendre. Les résul-
tats sont ceux du tableau ci-contre.

Trajets en Km Nombre de commerciaux


[10,20[ 9
[20,40[ 26
[40,x[ 19
[x,80[ 24
[80,100[ y

Ce document est incomplet car, à la suite d’un incident, certaines valeurs sont illi-
sibles. On décide de les noter provisoirement x et y.
1. Déterminer les éléments suivants : La population – La taille de l’échantillon –
Le caractère et sa nature – Les modalités.
2. Retrouver la valeur manquante y
3. Retrouver la valeur manquante x sachant qu’il est un nombre entier et que le
trajet médian est environ égal à 45, 79 km.
4. Calculer et interpréter le premier et le troisième quartile.
5. Calculer et interpréter l’écart type.

EXERCICE 2. Pour se rendre à son lieu de travail, une personne a le choix entre
quatre lignes de bus : A, B, C et D. La probabilité qu ?elle a de choisir la ligne A
(respectivement B, C) est 1/3 (respectivement 1/4, 1/12) . La probabilité d ?arriver
au travail en retard par la ligne A (respectivement B, C) est 1/20 (respectivement
1/10 , 1/5). Avec la ligne B, la personne n’est jamais en retard.
I. On choisit une personne au hasard.
1. Quelle est la probabilité qu’elle choisisse la ligne D ?
2. Quelle est la probabilité qu’elle arrive en retard à son lieu de travail ?

67
3. Calculer la probabilité que la personne ait choisi la ligne C, sachant qu ?elle
est arrivée en retard.
II. On choisit au hasard des 100 personnes. Soit Y la variable aléatoire prenant pour
valeur le nombre de personnes arrivant en retard au travail.
1. Quelle est la loi de probabilité suivie par la variable aléatoire Y ? Donner son
espérance mathématique et sa variance.
2. Calculer la probabilité qu’il y ait exactement 2 personnes qui arrivent à l’heure
au travail.
3. Par quelle loi peut-on approcher la loi de Y ? Utiliser cette approximation pour
évaluer la probabilité qu’il y ait au plus 4 personnes qui arrivent en retard.

Vous aimerez peut-être aussi