Reduction Important
Reduction Important
Reduction Important
Si λ ∈ k et x ∈ E \{0}, c'est donc la même chose de dire que λ est une valeur propre de vecteur propre
x, ou que x est un vecteur propre associé à la valeur propre λ. Observons que l'endomorphisme f − λ Id
est un exemple de polynôme en f puisqu'il est égal à P (f ) avec P (X) = X − λ. Plus généralement, les
noyaux de polynômes en f donneront des exemples de sous-espaces stables :
1
1.3 Proposition. Soit f un endomorphisme de E et P, Q deux polynômes à coecients dans k.
(1) P (f ) + Q(f ) = (P + Q)(f ).
(2) P (f ) ◦ Q(f ) = Q(f ) ◦ P (f ) = (P Q)(f ).
(3) ker P (f ) et im P (f ) sont des sous-espaces f -stables de E .
Preuve : Notons P = a0 + a1 X + · · · + X d et Q = b0 + b1 X + · · · + be X e . On a :
P (f )+Q(f ) = a0 Id +a1 f +· · ·+f d +b0 Id +b1 f +· · ·+be de = (a0 +b0 ) Id +(a1 +b1 )f +· · · = (P +Q)(f )
ce qui démontre le point (1). Maintenant, rappelons-nous quePd'après les règles de multiplication des
polynômes, le coecient de X l dans le produit P Q est égal à i+j=l ai bj . Par conséquent,
d
X e
X Xd e
X
par dénition de
X
i j i j
P (f ) ◦ Q(f ) = ai f ◦ bj f = ai f ◦ bj f ai f i ,
i=0 j=0 i=0 j=0
d e
bj (f i ◦ f j ) car f i est linéaire,
X X
= ai
i=0 j=0
max(d,e) X
X
= ai bj f k = (P Q)(f ).
l=0 i+j=l
Comme (P Q)(f ) = (QP )(f ), on obtient ainsi le point (2). Pour (3), on note tout d'abord que ker(P (f ))
et im(P (f )) sont des sous-espaces vectoriels, comme tout noyau et image d'un endomorphisme. Le
fait que ces sous-espaces soient f -stables est une conséquence du point (2). En eet, si P (f )(x) = 0,
alors P (f )(f (x)) = f (P (f )(x)) = f (0) = 0 donc ker P (f ) est stable, et si x = P (f )(y), alors f (x) =
f (P (f )(y)) = P (f )(f (y)) donc im P (f ) est stable.
Les propriétés (1) et (2) de la proposition 1.3 disent que l'application linéaire evf : k[X] → L(E)
qui envoie P sur P (f ) est un morphisme d'anneaux unitaires. Nous allons voir maintenant qu'à cause
de ceci, l'arithmétique de l'anneau k[X] (et plus précisément le fait que ce soit un anneau principal) a
des conséquences fortes dans L(E).
Dans la suite, on notera le plus souvent P (f )Q(f ) au lieu de P (f ) ◦ Q(f ).
1.4 Lemme. Soient deux polynômes P et Q tels que P divise Q. Alors ker P (f ) ⊂ ker Q(f ) et im Q(f ) ⊂
im P (f ).
Preuve : Ceci est laissé en exercice. Attention au sens de l'inclusion dans chaque cas !
1.5 Proposition (Lemme des noyaux). Soient E un k -espace vectoriel de dimension nie, f un
endomorphisme de E , et P1 , . . . , Ps des polynômes premiers entre eux. Soit P le produit des Pi . Alors,
on a ker(P (f )) = ker(P1 (f )) ⊕ · · · ⊕ ker(Ps (f )).
Preuve : Pour simplier, nous donnons la démonstration lorsque s = 2. On doit donc montrer que
ker P (f ) = ker P1 (f ) ⊕ ker P2 (f ). Notons d'abord que ker Pi (f ) ⊂ ker P (f ) pour i = 1, 2 d'après le
lemme. Comme P1 et P2 sont premiers entre eux par hypothèse, d'après le théorème de Bézout (voir le
cours sur les anneaux) il existe deux polynômes U1 et U2 tels que U1 P1 + U2 P2 = 1. En évaluant cette
égalité sur l'endomorphisme f , on trouve
U1 (f )P1 (f ) + U2 (f )P2 (f ) = Id . (1)
2
Si x ∈ ker P (f ), posons x1 = (U2 (f )P2 (f ))(x) et x2 = (U1 (f )P1 (f ))(x). Comme P1 (f )P2 (f ) = P (f ),
on a x1 ∈ ker P1 (f ) et x2 ∈ ker P2 (f ). D'après (1), on a x = x1 + x2 ce qui montre que ker P1 (f ) et
ker P2 (f ) engendrent ker P (f ). Par ailleurs, si x ∈ ker P1 (f ) ∩ ker P2 (f ) on a x1 = x2 = 0 d'après leur
dénition, donc x = 0. Ainsi ker P1 (f ) et ker P2 (f ) sont en somme directe.
(1) les sous-espaces propres Eλi sont en somme directe. En particulier s 6 n = dim(E).
(2) Si s = n, les espaces propres Eλi sont des droites et E en est la somme directe.
Preuve : (1) C'est le cas particulier du lemme des noyaux dans lequel Pi = X − λi . Le fait que s 6 n
provient du fait que chaque sous-espace propre est de dimension au moins 1, donc leur somme directe
est de dimension au moins s.
(2) On a n 6 dim(Eλ1 ) + · · · + dim(Eλn ) 6 n donc chaque dimension est égale à 1 et la somme directe
des Eλi est E .
Nous avons vu qu'il existe une application linéaire evf : k[X] → L(E) telle que evf (P ) = P (f ).
Comme k[X] est de dimension innie alors que L(E) est de dimension nie, ce morphisme n'est pas
injectif, donc ker(evf ) 6= {0}.
Cette partie est consacrée à deux polynômes annulateurs importants. Pour dénir le premier, il faut
noter que evf est aussi un morphisme d'anneaux. Ainsi son noyau ker(evf ) est un idéal de k[X], et
comme k[X] est principal cet idéal peut être engendré par un seul élément (voir le cours sur les anneaux
pour plus de détails).
2.3 Exemple. Un endomorphisme est nilpotent si et seulement si son polynôme minimal est de la
forme X d , pour un certain entier d appelé l'indice de nilpotence. Un endomorphisme distinct de 0 et de
l'identité est un projecteur si et seulement si son polynôme minimal est X 2 − X .
Dans cette dénition, on doit voir X comme un scalaire. Ceci signie que si on choisit une base de
E et que l'on note A la matrice de f dans cette base, alors χf (X) est le déterminant de la matrice
X Id −A qui est une matrice à coecients dans le corps de fractions rationnelles k 0 = k(X).
3
2.5 Remarque. Soit n = dim(E). Le polynôme caractéristique est de degré n. Plus précisément, son
terme de plus haut degré est X n et il est en particulier unitaire. Certains auteurs dénissent le polynôme
caractéristique par χf (X) = det(f − X Id), mais alors son coecient dominant est (−1)n ce qui est un
peu moins agréable.
2.6 Lemme. Les racines de χf sont les valeurs propres de f .
Preuve : Un scalaire λ ∈ k est racine de χf si et seulement si det(λ Id −f ) = 0, c'est-à-dire si et
seulement si λ Id −f n'est pas injective. Ceci est la dénit d'une valeur propre.
2.7 Lemme. Soient E un k -espace vectoriel de dimension nie et f ∈ L(E). On considère un sous-
espace vectoriel f -stable F et on note f |F la restriction de f à ce sous-espace. Alors,
(1) µf |F divise µf ,
(2) χf |F divise χf .
Preuve : (1) Notons que pour tout polynôme P , on a P (f )|F = P (f |F ). En particulier µf (f |F ) =
µf (f )|F = 0. Or par dénition de µf |F , tout polynôme qui annule f |F est un multiple de µf |F . On
obtient donc que µf |F divise µf .
(2) Maintenant, soit {e1 , . . . , em } une base de F , G un supplémentaire de F , {em+1 , . . . , en } une base de
G, de sorte que la réunion {e1 , . . . , en } est une base de E . Dans cette base, la matrice de f est triangulaire
par blocs, de la forme A = A011 AA12 22
où A11 est la matrice de f |F . Le polynôme caractéristique de f est
le déterminant de la matrice
X Id −A11 −A12
X Id −A = .
0 X Id −A22
Comme le déterminant d'une matrice triangulaire par blocs est produit des déterminants des blocs diag-
onaux, on trouve χf (X) = det(X Id −A11 ) det(X Id −A22 ) = χf |F (X) det(X Id −A22 ) ce qui démontre
que χf |F divise χf .
Preuve : Montrer que χ(f ) = 0 revient à montrer que (χ(f ))(x) = 0 pour tout vecteur x. Fixons x et
notons m le plus petit entier tel qu'il existe une combinaison linéaire
f m (x) + am−1 f m−1 (x) + · · · + a1 f (x) + a0 x = 0. (2)
Par ce choix de m, la famille B = {x, f (x), . . . , f m−1 (x)} est libre de sorte que le sous-espace F =
Vect(B) est f -stable, de dimension m, de base B. Dans cette base, la matrice de f |F est
0 −a0
1 ...
−a1
..
.
. .. 0
.
1 −am−1
4
χ0 (f )(x) = 0. Or d'après le lemme 2.7, il existe un polynôme P tel que χ = P χ0 , donc χ(f ) = P (f )χ0 (f )
et
(χ(f ))(x) = P (f )(χ0 (f )(x)) = P (f )(0) = 0,
comme on voulait démontrer.
3.1 Dénition. Soient E un k -espace vectoriel de dimension nie et f ∈ L(E). On dit que f est
trigonalisable (resp. diagonalisable), s'il existe une base de E dans laquelle la matrice de f est triangulaire
supérieure (resp. diagonale).
Soit B une base de E et A la matrice de f dans cette base. Compte tenu du fait que la matrice
de f dans une base B0 est P −1 AP , où P est la matrice de passage de B à B0 , dire que f (ou A) est
trigonalisable (resp. diagonalisable) signie qu'il existe une matrice inversible P telle que P −1 AP est
triangulaire supérieure (resp. diagonale).
3.2 Théorème. Soit f un endomorphisme d'un k-espace vectoriel de dimension nie. Alors les condi-
tions suivantes sont équivalentes :
(1) f est trigonalisable,
(2) le polynôme caractéristique χ de f est scindé.
On rappelle qu'un polynôme est scindé s'il est produit de polynômes de degré 1.
Preuve : (1) ⇒ (2). Le polynôme caractéristique de f est le polynôme caractéristique de la matrice de
f dans une base quelconque. Si f est trigonalisable, on peut choisir une base dans laquelle la matrice
de f est triangulaire supérieure. On a alors
a11 ∗ ∗ X − a11 ∗ ∗
χ(X) = det X Id − ... ...
∗ = det ,
∗
0 ann 0 X − ann
c'est-à-dire χ(X) = (X − a11 ) . . . (X − ann ) qui est scindé.
(2) ⇒ (1). Montrons par récurrence sur n que si χ est scindé, f est trigonalisable. Pour n = 1, il
n'y a rien à démontrer. Supposons la propriété vraie au rang n − 1 et notons λ1 , . . . , λn les racines
non nécessairement distinctes de χ. Soit e1 un vecteur propre de f relatif à la valeur propre λ1 et
complétons-le en une base {e1 , e02 , . . . , e0n } de E . La matrice de f dans cette base est de la forme
λ1 B
A= .
0 C
Un calcul direct montre que χA (X) = (X −λ1 )χC (X) et donc χC est scindé, de degré n−1. D'après l'hy-
pothèse de récurrence, il existe une matrice Q ∈ GLn−1 (k) telle que Q−1 CQ est une matrice triangulaire
supérieure T . Introduisons la matrice diagonale par blocs P = 01 Q0 . On voit que
−1 λ1 BQ λ1 BQ
P AP = −1 = ,
0 Q CQ 0 T
5
qui est bien une matrice triangulaire supérieure.
3.3 Corollaire. Si k est un corps algébriquement clos, par exemple le corps C des nombres complexes,
alors tout endomorphisme est trigonalisable.
Preuve : Rappelons qu'un corps k est dit algébriquement clos lorsque tout polynôme à coecients dans
k est scindé. Ce corollaire est donc une application directe du théorème précédent. Dans le cas de C, il
faut invoquer le théorème fondamental de l'Algèbre (ou théorème de d'Alembert-Gauss) qui dit que C
est algébriquement clos.
3.4 Théorème. Soit f un endomorphisme d'un k-espace vectoriel de dimension nie. Alors les condi-
tions suivantes sont équivalentes :
(1) f est diagonalisable,
(2) le polynôme minimal µ de f est scindé à racines simples,
(3) il existe un polynôme scindé à racines simples P qui annule f .
Preuve : (1) ⇒ (2). Si f est diagonalisable, il existe une base {e1 , . . . , en } de E dans laquelle la matrice
de f est diagonale, avec pour coecients diagonaux les valeurs propres λ1 , . . . , λs apparaissant avec des
multiplicités αi . D'après le lemme des noyaux 1.5, l'espace E est somme directe des sous-espaces propres
Eλi , et il est alors clair que le polynôme P = (X − λ1 ) . . . (X − λs ) annule f . Le polynôme minimal µ
est un diviseur de P , donc il est scindé à racines simples. En fait on peut montrer que µ = P : il sut
de noter que si Q est un diviseur strict de P , l'une des valeurs propres λi n'est pas racine de Q et on
voit que la restriction de Q(f ) à Eλi n'est pas nulle.
(2) ⇒ (3) est évident.
(3) ⇒ (1). Soit P un polynôme scindé à racines simples tel que P (f ) = 0. Écrivons P = (X −λ1 ) . . . (X −
λs ). D'après le lemme des noyaux, on a E = ker P (f ) = Eλ1 ⊕ · · · ⊕ Eλs . Pour chaque i, notons Bi une
base de Eλi puis B = B1 ∪ · · · ∪ Bs . On obtient ainsi une base de E dans laquelle la matrice de f est
diagonale.
3.5 Corollaire. Soit f un endomorphisme d'un k-espace vectoriel de dimension nie E , et soit F ⊂ E
un sous-espace f -stable. Si f est diagonalisable, la restriction f |F est diagonalisable.
Preuve : D'après le théorème, le polynôme minimal de f est scindé à racines simples. Par ailleurs µ
annule f , donc il annule f |F . Par une nouvelle application du théorème, précisément l'implication (3)
⇒ (1), la restriction f |F est diagonalisable.
Dans cette section, à l'aide de la notion de sous-espace caractéristique, nous expliquons comment
utiliser tous les concepts développés précédemment pour étudier un endomorphisme f donné. Nous
en tirons ensuite quelques conséquences concernant le calcul pratique des objets les plus importants
attachés à f , notamment son polynôme minimal. Nous ne considérerons que le cas où le polynôme
caractéristique est scindé, c'est-à-dire qu'il est produit de polynômes de degré 1. Par exemple, ceci est
toujours le cas lorsque k = C.
6
4.1 Dénition. Soit f un endomorphisme d'un k-espace vectoriel de dimension nie, λ ∈ k une valeur
propre de f et α la multiplicité de f dans le polynôme caractéristique χf . On appelle sous-espace
caractéristique de f associé à la valeur propre λ le sous-espace Fλ = ker((f − λ Id)α ).
Si l'on désigne par Eλ le sous-espace propre associé à la valeur propre λ, alors Eλ ⊂ Fλ . Ceci vient
simplement du fait que ker(f − λ Id) ⊂ ker((f − λ Id)α ).
4.2 Théorème. Soient k un corps, E un k-espace vectoriel de dimension nie, f un endomorphisme
de E . On suppose que f a un polynôme caractéristique χ scindé : χ(X) = (X − λ1 )α1 . . . (X − λr )αr où
λ1 , . . . , λr sont les valeurs propres distinctes de f et αi > 1 est la multiplicité de λi . Enn, on note µ le
polynôme minimal de f .
(1) Soit Fi le sous-espace caractéristique associé à λi . On a E = F1 ⊕ · · · ⊕ Fr .
(2) Le sous-espace Fi est f -stable. Soit fi = f |Fi : Fi → Fi la restriction de f à Fi . L'endomorphisme
fi − λi Id est nilpotent et la seule valeur propre de fi est λi .
(3) Soit χi le polynôme caractéristique de fi . Alors χ = χ1 . . . χr .
(4) Soit µi le polynôme minimal de fi . Alors µ = µ1 . . . µr .
(5) On a χi (X) = (X − λi )αi . En particulier dim(Fi ) = deg(χi ) = αi .
(6) On a µi (X) = (X − λi )βi , où βi 6 αi est l'indice de nilpotence de fi − λi Id.
(7) Soit Bi une base de Fi qui trigonalise fi (une telle base existe d'après le théorème 3.2). Soit B =
B ∪ · · · ∪ Br qui est une base de E , et soit M la matrice de f dans la base B. Alors M est triangulaire,
diagonale par blocs (triangulaires) de tailles αi , et f est diagonalisable si et seulement si βi = 1 pour
tout i, si et seulement si M est diagonale.
7
deux. On sait aussi par le lemme 2.7 que µi divise µ. Alors µ qui est divisible par chacun des µi premiers
entre eux deux à deux doit être divisible par leur produit, c'est-à-dire π . Ceci termine la preuve du fait
que µ = µ1 . . . µr .
(5) Rappelons que χ(X) = P1 . . . Pr avec Pi (X) = (X − λi )αi . Comme χi divise χ d'après le lemme 2.7
et que de plus la seule valeur propre de fi est λi , on déduit que χi divise Pi . En d'autres termes, il existe
γi 6 αi tel que χi (X) = (X − λi )γi . Mais comme χ = χ1 . . . χr , la seule possibilité est que γi = αi .
Comme le degré du polynôme caractéristique est égal à la dimension de l'espace vectoriel ambiant, on
obtient dim(Fi ) = deg(χi ) = αi .
(6) L'indice de nilpotence βi est par dénition le plus petit entier m tel que (fi − λi Id)m = 0. Ceci
signie premièrement que (X − λi )βi est un polynôme annulateur de fi , et deuxièmement que (X − λi )m
n'est pas un polynôme annulateur si m < βi . Le premier fait implique que le polynôme minimal de fi
est de la forme µi (X) = (X − λi )δi avec δi 6 βi , et le deuxième fait implique que δi = βi .
(7) Le fait que la réunion des Bi est une base de E provient de la décomposition E = F1 ⊕ · · · ⊕ Fr . Le
fait que la matrice de f dans la base B, c'est-à-dire M , soit diagonale par blocs provient du fait que Fi
est stable par f . Chaque bloc est bien sûr triangulaire par choix de Bi . Enn, si M est diagonale alors
bien sûr f est diagonalisable, et réciproquement, si f est diagonalisable, alors pour tout i le sous-espace
caractéristique Fi est égal au sous-espace propre Ei , donc fi : Fi → Fi est l'homothétie de rapport λi et
sa matrice, qui est le i-ième bloc de M , est λi Id. Il s'ensuit que M est diagonale.
4.3 Remarques. (1) D'un point de vue pratique, dans le cas où l'on sait trouver toutes les racines de χ,
ce résultat explique comment calculer le polynôme minimal, et décider si oui ou non f est diagonalisable.
Plus précisément, la méthode est de calculer une base Bi de chaque sous-espace caractéristique Fi . Si f
est une homothétie sur chaque Fi (de rapport λi ), alors f est diagonalisable et son polynôme minimal
est µ(X) = (X − λ1 ) . . . (X − λr ). De manière générale, pour chaque i on dispose de la matrice Mi de
fi dans la base Bi ; on calcule les puissances successives de Mi − λi Id, et la première puissance nulle
donne l'indice de nilpotence βi . On sait alors que µ(X) = (X − λ1 )β1 . . . (X − λr )βr .
(2) Supposons que f est donné, après choix d'une base de E , par une matrice M . Si l'on a de bonnes
raisons de penser a priori que f (ou M ) est diagonalisable, alors la méthode la plus rapide est de poser et
résoudre directement le système M X = λX pour un λ arbitraire. En appliquant par exemple la méthode
du pivot de Gauss pour essayer de trouver des solutions X , on voit au cours du procédé que certaines
valeurs de λ posent problème i.e. donnent un système avec des lignes linéairement dépendantes. En fait,
la valeur χ(λ) (où χ est le polynôme caractéristique) doit apparaître naturellement, ce qui s'explique
par le fait que les manipulations lignes-colonnes opérées pour résoudre le système reviennent à calculer
un déterminant. Pour chaque λ racine de χ, on continue le calcul en donnant une base de l'espace propre
associé. On obtient ainsi directement les valeurs propres et, en même temps, une matrice de passage
dans une base de diagonalisation.
(3) En appliquant le lemme des noyaux pour µ = µ1 . . . µr , on voit que E = ker µ1 (f ) ⊕ · · · ⊕ ker µr (f ).
Étant donné que µi divise χi , on a par ailleurs ker µi (f ) ⊂ Fi et on en déduit que cette inclusion est une
égalité. Donc Fi = ker((f − λi )βi ) et on montre que Fi = ker((f − λi )m pour tout m > βi , par exemple
pour m = dim(E).