Metodi Matematici della Meccanica
Quantistica
Paolo Caressa, Roma, 1994
PREMESSA
Questo libro origina dalla rielaborazione degli appunti di lezione da me presi
durante il corso Meccanica quantistica tenuto dal prof. Sergio Doplicher presso
l’istituto matematico G. Castelnuovo di Roma I nell’A.A.1993/94: gli appunti
delle lezioni corrispondono grosso modo alla seconda parte ed agli ultimi tre capitoli della terza parte, mentre il restante materiale è una aggiunta di nozioni più
o meno preliminari prese dalla letteratura classica e da me rielabolate: in particolare mi sono posto l’obiettivo di dimostrare ogni nozione introdotta, partendo
dagli assiomi della teoria degli insiemi.
Va da sé che anche la parte originata da appunti è stata rielaborata e che
questi non rappresentano né lo stile, né l’erudizione, né l’ecletticità delle lezioni
del professor Doplicher, che queste note non possono e non intendono sostituire:
questa versione più o meno definitiva si mette liberamente a disposizione per uso
personale o didattico ma senza fini di lucro (una versione preliminare è circolata
per anni, specie fra gli studenti di Roma I).
Questo libro non rappresenta un testo didattico o una introduzione ai metodi
matematici della fisica: non ci sono esercizi e l’esposizione è mirata a raggruppare logicamente le nozioni più che a suddividerle affinché siano più facilmente
apprese. Piuttosto può essere impegato come un testo di riferimento da quanti
abbiano la necessità di utilizzare il macchinario matematico (o meglio parte di
esso) fondamentale per la meccanica quantistica, in particolare la teoria algebrica
dei campi.
La mia intenzione è che questo libro possa essere un utile vademecum per
studenti di matematica, fisica, chimica e altre materie scientifiche, a complemento di testi didatticamente più appropriati: la prima parte è un rapido riassunto
di nozioni matematiche fondamentali ma che generalmente non si affrontano, o
almeno non completamente, nei corsi istituzionali del primo anno o primo biennio di una facoltà scientifica. La seconda parte costituisce un corso di analisi
funzionale (orientato alle algebre di operatori e non alle equazioni a derivate parziali). La terza parte introduce il concetto di simmetria attraverso l’esplorazione
della teoria dei gruppi topologici e di Lie, ed è seguita da alcune applicazioni alla
meccanica quantistica dei sistemi in finiti gradi di libertà ed alla teoria dei campi
liberi (seconda quantizzazione). In particolare non si discute in modo sistematico
la meccanica quantistica se non nei suoi tratti elementari: non si troveranno né
rinormalizzazione, né QED, né stringhe, etc.
Nella bibliografia alla fine del volume sono elencati solo i titoli consultati
nella preparazione delle presenti note: ai testi specialistici sono rinviati i lettori
desiderosi di una bibliografia coerente sull’argomento.
Ovviamente errori, refusi, incongruenze e quant’altro sono responsabilità del
sottoscritto: potevano essercene di più, se Tommaso Addabbo, Sebastiano Carpi,
Roberto Conti, Ezio Vasselli ed altri (che ringrazio) non me ne avessero segnalato
qualcuno in precedenti versioni.
Paolo Caressa
Queste note in formato elettronico sono a disposizione di chiunque voglia farne uso, purché non a fini di lucro: precisamente possono essere
copiate, alterate e ridistribuite sia in parte che totalmente in modo
libero purché questo non comporti nessun guadagno, ma solo per uso
personale o per fini didattici.
Indice
I
Prolegomeni di Algebra, Analisi e Topologia
1 Insiemi
1.1 Un sistema di assiomi . . . . .
1.2 Ordinamento e Lemma di Zorn
1.3 Numeri ordinali e cardinali . .
1.4 Categorie e funtori . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Topologie
2.1 Spazi topologici . . . . . . . . . . . . . . . . . .
2.2 Spazi compatti . . . . . . . . . . . . . . . . . . .
2.3 Spazi normali e generalizzazioni della compattezza
2.4 Spazi connessi e localmente connessi . . . . . . .
2.5 Spazi semplicemente connessi . . . . . . . . . . .
3 Metriche
3.1 Spazi metrici . . . . . . .
3.2 Spazi metrici completi . .
3.3 Categorie di spazi metrici
3.4 Spazi metrici compatti . .
3.5 Teorema di Ascoli–Arzelà
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Misure
4.1 Algebre di insiemi e spazi di misura . . . . . .
4.2 Completamenti ed estensioni di misure . . . . .
4.3 Integrazione . . . . . . . . . . . . . . . . . . .
4.4 Misure con segno, complesse e misure prodotto.
4.5 Misure di Borel, Radon e integrale di Stieltjes.
4.6 Spazi Lp . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
6
9
17
. . .
. . .
. .
. . .
. . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
24
24
32
38
44
49
.
.
.
.
.
57
57
62
68
71
75
.
.
.
.
.
.
81
81
86
91
99
108
113
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5 Gruppi, algebre e rappresentazioni
118
5.1 Gruppi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
vi
5.2
5.3
5.4
5.5
5.6
II
Azioni di gruppi . . . . . . . . . . . .
Rappresentazioni di gruppi . . . . . .
Algebra di gruppo . . . . . . . . . . .
Algebre associative . . . . . . . . . . .
Appendice: Cenni di algebra tensoriale
5.6.1 Algebra tensoriale . . . . . . .
5.6.2 Algebra simmetrica . . . . . .
5.6.3 Algebra esterna . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Analisi Funzionale
6 Spazi normati ed operatori lineari
6.1 Spazi di Hilbert e di Banach . .
6.2 Somme e complementi ortogonali
6.3 Funzionali lineari . . . . . . . . .
6.4 Operatori lineari . . . . . . . . .
6.5 I tre principi di Banach . . . . .
.
.
.
.
.
.
.
.
123
129
141
147
157
157
161
165
173
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
175
. 175
. 182
. 187
. 191
. 198
7 Spazi di Hilbert e teoria di Fourier
7.1 Basi ortonormali negli spazi di Hilbert . . . . . . .
7.2 Operatori di proiezione negli spazi di Hilbert . . .
7.3 Serie di Fourier . . . . . . . . . . . . . . . . . . . .
7.4 Integrale di Fourier . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
208
. 208
. 213
. 220
. 228
8 Spazi vettoriali topologici
8.1 Topologie e seminorme . . . . . . . . . . . . . .
8.2 Dualità e topologie deboli . . . . . . . . . . . .
8.3 Compattezza e convessità . . . . . . . . . . . .
8.4 Distribuzioni . . . . . . . . . . . . . . . . . . .
8.5 Trasformata di Fourier di funzioni differenziabili
8.5.1 Appendice: l’integrale di Gauss . . . . .
8.6 Distribuzioni temperate . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
281
. 281
. 288
. 298
. 306
. 313
. 319
9 Algebre di Banach e C*-algebre
9.1 Algebre di Banach . . . . . . . . . . . .
9.2 L’algebra C(X) . . . . . . . . . . . . . .
9.3 Spettro e risolvente . . . . . . . . . . .
9.4 Morfismi e quozienti . . . . . . . . . . .
9.5 Teorema di Gel’fand–Najmark . . . . .
9.6 Appendice: elementi di analisi complessa
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. .
. .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
236
236
242
248
254
263
270
272
9.6.1
9.6.2
9.6.3
9.6.4
Funzioni e integrali complessi
Sviluppi in serie di potenze .
Continuazione Analitica . . .
Residui . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10 Teoria spettrale
10.1 Teorema della Mappa Spettrale . . . . . . . . .
10.2 Calcolo funzionale continuo . . . . . . . . . . .
10.3 Calcolo funzionale boreliano . . . . . . . . . . .
10.4 Misure spettrali . . . . . . . . . . . . . . . . .
10.5 Operatori compatti, Hilbert–Schmidt e nucleari
11 Algebre di von Neumann
11.1 Misure e Rappresentazioni . . . . . . .
11.2 Sottoalgebre commutative massimali in
11.3 Topologie ultradeboli e ultraforti. . . .
11.4 Teoremi di Densità . . . . . . . . . . .
11.5 Cenni sulla teoria dei fattori . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
320
324
329
333
.
.
.
.
.
340
. 340
. 349
. 357
. 365
. 377
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
391
. 391
. 402
. 411
. 418
. 426
12 Teoria delle rappresentazioni
12.1 Irriducibilità di rappresentazioni . . . . . . . .
12.2 Stati e rappresentazioni . . . . . . . . . . . . .
12.3 Il teorema di Gel’fand–Najmark–Segal . . . . .
12.4 Stati puri e rappresentazioni irriducibili . . . .
12.5 Rappresentazioni di operatori compatti . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
479
. 479
. 487
. 494
. 499
. 506
13 Operatori non limitati
13.1 Chiusura di operatori . . . . . .
13.2 Estendibilità di operatori . . . .
13.3 Un esempio: la derivata in L2 [0, 1]
13.4 Teoria delle perturbazioni . . . .
13.5 Un esempio: Il laplaciano in R3 .
III
. . .
. . .
. .
. . .
. . .
. . . .
B(H)
. . . .
. . . .
. . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Gruppi, Operatori e Quantizzazione
14 Gruppi topologici
14.1 Gruppi topologici e misure di Haar . . . . .
14.2 Gruppi compatti e rappresentazioni . . . .
14.3 Gruppi a un parametro e teorema di Stone
14.4 Vettori analitici . . . . . . . . . . . . . . . .
14.5 Gruppi commutativi e dualità di Pontriagin
.
.
.
.
.
431
431
441
452
463
472
513
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
515
. 515
. 522
. 533
. 548
. 554
15 Gruppi classici
15.1 Gruppi di matrici. . . . . . . .
15.2 Semplice connessione e Spin . .
15.3 Esponenziale di matrici . . . .
15.4 Coordinate canoniche sui gruppi
15.5 Varietà differenziabili . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
561
. 561
. 568
. 576
. 583
. 589
16 Gruppi e algebre di Lie
16.1 Gruppi di Lie . . . . . . . . . . . . . . . . . .
16.2 Funtore di Lie . . . . . . . . . . . . . . . . .
16.3 Algebre di Lie, rappresentazioni e coomologia
16.4 Teorema di Nelson . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
595
595
599
612
625
17 Sistemi quantistici
17.1 Stati ed osservabili . . . . .
17.2 Gruppi di simmetria . . . .
17.3 Rappresentazioni del gruppo
17.4 Equazione di Dirac . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
630
630
640
651
660
. . . . . . .
. . . . . . .
. . . . . . .
riducibilità
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
667
667
673
680
685
19 Seconda quantizzazione
19.1 Prodotti tensoriali e limiti induttivi. . . . . . .
19.2 Rappresentazione di Fock . . . . . . . . . . . .
19.3 Caratterizzazioni della rappresentazione di Fock
19.4 Teorema di Gårding–Wightman . . . . . . . . .
19.5 Sul concetto di campo . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
694
694
703
710
718
723
. . . . .
. . . . .
. . . . .
classici
. . . . .
. . . . . .
. . . . . .
di Lorentz
. . . . . .
18 Quantizzazione canonica
18.1 Formalismo canonico . . . . . . . .
18.2 Rappresentazione di Schrödinger .
18.3 Teorema di Stone–von Neumann .
18.4 Regole di commutazione e completa
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Parte I
Prolegomeni di Algebra, Analisi
e Topologia
Capitolo 1
INSIEMI
Il concetto di insieme è cosı̀ generale che non ha senso cercare di definirlo in
termini di nozioni più semplici: quindi si darà qui una caratterizzazione assiomatica degli insiemi, scrivendo dei postulati che generalizzino ciò che alla nostra
intuizione si presenta come “famiglia”, “aggregato” o generica “collezione” di
oggetti. Per evitare i paradossi della teoria ingenua degli insiemi distingueremo
fra classi ed insiemi immaginando intuitivamente che le classi siano insiemi cosı̀
grandi da non poter figurare come elementi di altri insiemi.
1.1
Un sistema di assiomi
Introduciamo alcuni assiomi1 per determinare il concetto di classe: supponiamo
di avere solo, oltre al concetto indefinibile di classe, un altro concetto primitivo,
vale a dire la relazione di “inclusione” x∈y che interpretiamo come l’appartenenza
dell’elemento x alla classe y.
Il primo assioma stabilisce il legame fra il concetto logico di uguaglianza e
quello insiemistico di appartenenza: intuitivamente equivale a dire che un insieme
è determinato dagli elementi che gli appartengono, e da null’altro:
Assioma 1. (di estensionalità) Se A e B sono classi allora A = B se e solo
se A e B hanno gli stessi elementi.
Volendo questa può essere presa come una definizione della relazione di uguaglianza in termini di appartenenza: ovviamente, a meno che non si lavori come
fanno i logici con i linguaggi al primo ordine, si può definire l’uguaglianza come
un concetto logico, seguendo Leibniz:
Principio di identità degli indiscernibili. Se A = B allora per ogni proprietà
P si ha P (A) ⇐⇒ P (B).
1
Si tratta sostanzialmente dell’assiomatica proposta da J. von Neumann, K. Gödel, e P.
Bernays.
1
2
Capitolo 1. Insiemi
Quest’ultimo è uno schema di assiomi , perché da esso si può desumere un
assioma data una qualsiasi proposizione2 P (x) che contenga una variabile libera
x.
Quando tutti gli elementi di una classe A sono anche elementi di una classe
B scriviamo A ⊂ B: questo si può definire come
1.1.1 Definizione A ⊂ B se e solo se per ogni x∈A si ha pure x ∈ B.
Se A ⊂ B e B ⊂ A allora le classi sono uguali: A = B; in vista del prossimo
assioma la seguente definizione è cruciale:
1.1.2 Definizione Una classe A è un insieme se esiste una classe B tale che
A ∈ B.
Il secondo assioma è appunto uno schema di assiomi
Assioma 2. (di formazione delle classi) Esiste una classe i cui elementi
sono esattamente gli insiemi che soddisfano la proposizione P (X).
Si noti che la classe la cui esistenza è postulata dall’assioma 2 è formata dagli
insiemi e non dalle classi che soddisfano P .
1.1.3 Esempio Esibiamo una classe che non è un insieme: si consideri la proposizione P (x) definita come x ∈
/ x (il segno ∈
/ è la negazione dell’appartenenza:
cioè x ∈
/ y se e solo se non è vero che x ∈ y); allora possiamo formare la classe R
degli insiemi tali che P (x): cioè R contiene gli insiemi x tali che x ∈
/ x; si noti
che questa classe è univocamente determinata (assioma di estensionalità) ma non
può essere un insieme: supponiamo infatti che R sia un insieme: allora possiamo
chiederci se R ∈ R e questo è vero se e solo se P (R) cioè se e solo se R ∈
/ R: un
assurdo. Quindi R non è un insieme.
La classe postulata dall’assioma 2 si denota
{x | P (x)}
Ad esempio la classe vuota si può definire come
∅ = {x | x 6= x}
Che questo sia un insieme, dobbiamo peró assumerlo assiomaticamente.3
2
In una trattazione rigorosa bisognerebbe definire il concetto di “proposizione” e caratterizzare quelle che si possono utilizzare per generare istanze di questo schema di assiomi; in questo
caso supporremo che le nostre proposizioni siano formate con i quantificatori ∀, ∃ ed i soliti
operatori logici usati in matematica (e, o, implica, se e solo se)... ed impiegati per connettere
termini che siano altri predicati, negazioni di altri predicati o relazioni della forma t = s o
Y ∈ X.
3
Si potrebbe obiettare che la classe ∅ è elemento della classe {∅} (la classe che ha come
elemento esattamente l’insieme vuoto): ma per formare questa classe, dobbiamo sapere che ∅
sia un insieme.
1.1. Un sistema di assiomi
3
Assioma 3. La classe ∅ è un insieme.
L’unione e l’intersezione sono ovviamente A ∪ B = {X | X ∈ A oppure X ∈ B}
e A ∩ B = {X | X ∈ A e X ∈ B}.
In generale definiamo unione e intersezione di una famiglia di insiemi (“famiglia” è un altro sinonimo di “classe”) come
[
[
Ai = {Ai }i∈I = {X | ∃i ∈ I X ∈ Ai }
i∈I
\
Ai =
\
{Ai }i∈I = {X | ∀i ∈ I X ∈ Ai }
i∈I
Osserviamo che in queste costruzioni otteniamo in generale delle classi. Per garantire che questi procedimenti diano luogo ad insiemi, dobbiamo imporre qualche
altro assioma.
Assioma 4. Se A e B sono insiemi allora {A, B} è un insieme.
Assioma 5. Se A è un insieme e B ⊂ A allora B è un insieme.
T
Dato che si dimostra facilmente che, se j ∈ I allora i∈I Ai ⊂ Aj , questo
assioma implica ad esempio che l’intersezione di una famiglia qualsiasi
di insiemi
S
è un insieme. Per l’unione, vale invece la relazione j ∈ I ⇒ Aj ⊂ i∈I Ai e quindi
non si può usare l’assioma 5.
S
Assioma 6. Se A è un insieme di insiemi allora l’unione A è un insieme.
Se A è un insieme, è naturale considerare l’insieme delle parti di A, ovvero
la classe dei suoi sottoinsiemi: è pure naturale imporre che si tratti a sua volta
di un insieme.
Assioma 7. Se A è un insieme, allora
P (A) = {X | X ⊂ A}
è un insieme.
L’assioma 2 consente anche la formazione di coppie ed in genere successioni
ordinate di elementi:
(a, b) = {a, {a, b}}
In generale, una n-pla (a1 , ..., an ) si definisce iterando la definizione di coppia.
L’insieme di tutte le possibili coppie di elementi di A e B è il prodotto (cartesiano)
di A per B:
A × B = {(a, b) | a ∈ A e b ∈ B}
Se A = B lo denotiamo anche A2 . Ricordiamo che
4
Capitolo 1. Insiemi
1.1.4 Definizione Una relazione fra due classi A e B è una sottoclasse del
prodotto A × B.
1.1.5 Definizione Una funzione da A in B è una relazione fra A e B tale che
un elemento di B non possa essere in relazione con piú di un elemento di A, cioè
se (a, b) ∈ f e (a, c) ∈ f allora c = b.
Definiamo
Dom(f ) = {a | a ∈ A e ∃b ∈ B b = f (a)}
(dominio della funzione f ) e
im(f ) = {b | b ∈ B e ∃a ∈ A b = f (a)}
(immagine della funzione f ).
Notiamo che se A è un insieme, certamente lo è Dom(f ); non è detto che lo
sia im(f ).
Assioma 8. Se f : A −→ B è una funzione e A è un insieme, allora im(f ) è un
insieme.
Siamo ora in grado di definire una nozione generale di prodotto
Q di insiemi: se
{Ai }i∈I è una famiglia di insiemi allora il loro insieme prodotto iI Ai è l’insieme
delle funzioni f : I −→ A. Gli assiomi che abbiamo dato implicano che sia un
insieme a patto che siaQ
gli Ai che I siano insiemi. Se per ogni i ∈ I è Ai = A
I
allora denotiamo A = i∈I Ai .
Nel caso di famiglie qualsiasi, se un prodotto di insiemi non è vuoto, possiamo
dire che ognuno degli insiemi che figurano nel prodotto non è vuoto? Per rispondere questo quesito è necessario chiarire il significato della parola “infinito” in
teoria degli insiemi.
Assioma 9. (assioma dell’infinito) Esiste un insieme U tale che ∅ ∈ U e se
u ∈ U allora u ∪ {u} ∈ U .
Questo assioma implica l’esistenza di un insieme infinito perché consente, ad
esempio, di costruire i numeri naturali. L’insieme postulato da questo assioma
contiene almeno un elemento, il vuoto, ma contiene anche l’insieme formato dal
vuoto {∅}, ed anche l’insieme {∅, {∅}} e cosı̀ via. Definiamo allora i numeri
naturali come
0=∅
1 = {∅}
2 = {∅, {∅}}
...
e quindi l’insieme N dei numeri naturali. Formalmente, basta considerare la classe
degli insiemi X tali che ∅ ∈ X e se x ∈ X allora x ∪ {x} ∈ X; l’intersezione di
questa classe è l’insieme N.
5
1.1. Un sistema di assiomi
Ora dimostriamo che si tratta esattamente dei numeri naturali, cioè che N
soddisfa gli assiomi di Peano.
Intanto 0 = ∅ ∈ N. Poi, definiamo n + 1 come n ∪ {n} e lo chiamiamo il
successore di n; in questo modo se n ∈ N allora n + 1 ∈ N ed è ovvio che 0 non è
mai della forma n + 1 per qualche n ∈ N. Inoltre abbiamo che:
∀n, m ∈ N
n+1=m+1⇒n=m
Infatti n + 1 = n ∪ {n} e quindi n + 1 = m + 1 implica n ∪ {n} = m ∪ {m} cioè,
per ogni x ((x ∈ n oppure x ∈ {n}) ⇐⇒ (x ∈ m oppure x ∈ {m})), il che è vero
se e solo se x = n = m oppure n e m hanno gli stessi elementi e quindi ancora
n = m.
Infine vale il principio di induzione matematica:
∀N ⊂ N 0 ∈ N e (∀x ∈ N
x + 1 ∈ N) ⇒ N = N
Infatti l’insieme N è l’intersezione della classe degli insiemi che soddisfano le
ipotesi del principio di induzione, quindi N ⊂ N .
Abbiamo in questo modo i numeri naturali, ciascuno dei quali è un insieme.
Allora, ricordando la seguente
1.1.6 Definizione Una funzione f : A −→ B si dice
(1) iniettiva se f (a) = f (b) implica a = b e si dice in tal caso che A va in B.
(2) suriettiva se im(f ) = B e si dice in tal caso che A va su B.
(3) biunivoca se è iniettiva e suriettiva e si dice in tal caso che A è biunivoco
a B.
possiamo dare quella di insieme finito:
1.1.7 Definizione Un insieme è finito se è biunivoco a un numero naturale; in
caso contrario si dice infinito.
Torniamo ora ai prodotti di insiemi: notiamo che se {AQ
i }i∈I è una famiglia
di insiemi, e se per qualche i ∈ I si ha che Ai = ∅ allora i∈I Ai = ∅, esattamente come nel caso dei numeri (se uno dei fattori è nullo anche il prodotto è
nullo; il viceversa è pure una proprietà che sembra naturale imporre (la “legge di
annullamento del prodotto”), ma che non è possibile dimostrare a partire dagli
assiomi fin qui dati.
Q
Assioma 10. (assioma moltiplicativo) Se i∈I Ai = ∅ allora esiste i ∈ I
tale che Ai = ∅.
6
Capitolo 1. Insiemi
Ora ricaviamo da questo assioma un altro famoso enunciato: l’assioma di
scelta. Per formularlo, diamo una
1.1.8 Definizione Una funzione f : A −→ B si dice funzione di scelta se per
ogni C ∈ Dom(A) si ha che f (C) ∈ C.
1.1.9 Teorema (assioma di scelta) Ogni insieme non vuoto ha una funzione
di scelta che lo ammette come dominio.
Dimostrazione: Consideriamo ora un insieme A: possiamo immaginarlo come
una famiglia di insiemi (i suoi elementi) indicizzata
da A stesso; cioè A = {Aa }a∈A
Q
(dove Aa = a). In questo modo, il prodotto a∈A Aa della famiglia A è l’insieme
delle funzioni da A −→ A, che in questo caso sono tutte funzioni di scelta (dato
che (f (a)) ∈ Aa = a). Dunque, dato che esiste a ∈ A in modo che Aa è non vuoto
(un modo contorto di dire che A 6= ∅), l’assioma moltiplicativo ci dice che anche
Q
a∈A Aa è non vuoto, cioè che l’insieme delle funzioni di scelta su A è non vuoto.
qed
L’ultimo assioma è il seguente:
Assioma 11. (assioma di fondazione) Ogni classe A non vuota contiene un
elemento X tale che A ∩ X = ∅.
Il significato intuitivo di questo assioma è che un insieme non può contenere
se stesso come elemento. Un modo equivalente di esprimerlo è dire che un insieme
non può contenere catene infinite di elementi, cioè a dire se A è un insieme, non
può aversi una catena di appartenenze
... ∈ An ∈ ... ∈ A2 ∈ A1 ∈ A
1.2
Ordinamento e Lemma di Zorn
Le seguenti definizioni catturano il concetto di “relazione” ed in particolare di
“ordinamento”:
1.2.1 Definizione Una relazione R ⊂ A2 su un insieme A si dice
(1) di ordine parziale se è riflessiva, antisimmetrica e transitiva, ovvero se per
ogni a ∈ A (a, a) ∈ R, per ogni a, b ∈ A (a, b) ∈ R ⇒ (b, a) ∈ R e per ogni
a, b, c ∈ A ((a, b) ∈ R e (b, c) ∈ R) ⇒ (a, c) ∈ R;
(2) di ordine totale se è di ordine e se per ogni a, b ∈ R (a, b) ∈ R oppure
(b, a) ∈ R;
1.2. Ordinamento e Lemma di Zorn
7
(3) di buon ordinamento se è di ordine totale e se ogni B ⊂ A non vuoto
possiede un elemento minimo m (cioè per ogni b ∈ B tale che (b, m) ∈ R
segue che b = m).
(4) di equivalenza se è riflessiva, transitiva e simmetrica cio per ogni a, b ∈ R
(a, b) ∈ R e (b, a) ∈ R ⇒ a = b.
(5) Un insieme A parzialmente ordinato da R è diretto se per ogni a, b ∈ A
esiste un c ∈ A tale che aRc e bRc.
Se R è una relazione in un insieme A, in genere si scrive aRb in luogo di
(a, b) ∈ R.
1.2.2 Definizione Sia A un insieme ordinato dalla relazione ≤.
(1) Una catena C in A è un sottoinsieme totalmente ordinato da ≤.
(2) Un confine superiore (inferiore) di un sottoinsieme B di A è un elemento
s ∈ A tale che per ogni b ∈ B si abbia b ≤ s (s ≤ b).
(3) Un massimale (minimale) in A è un elemento m ∈ A tale che per ogni a ∈ A
tale che m ≤ a si abbia a = m (tale che a ≤ m si abbia a = m).
(4) Il estremo inferiore (superiore) inf B (sup B) di un sottoinsieme B ⊂ A è
il minimo dei confini superiori (massimo dei confini inferiori) di B.
Si noti che un elemento massimale non è necessariamente un massimo.
1.2.3 Definizione Sia A un insieme bene ordinato dalla relazione ≤A . Un sottoinsieme B ⊂ A si dice
(1) Segmento iniziale di A se per ogni a, b ∈ A da a ∈ B e b ≤A a segue che
b ∈ B.
(2) Segmento iniziale chiuso di A se esiste un a∈A tale che B = {b∈A|b ≤A a}
e l’elemento a si dice estremo di B.
(3) Segmento iniziale aperto di A se esiste un a∈A tale che B = {b∈A|b <A a}.
Osserviamo che ∅ è segmento iniziale di ogni insieme bene ordinato (notare
l’analogia con le definizioni di intervalli aperti e chiusi a destra nei numeri reali).
Passiamo ora alla dimostrazione del principale risultato che coinvolge queste
definizioni:
Lemma di Zorn. Sia A un insieme ordinato dalla relazione ≤; se ogni catena
in A ha un confine superiore, allora A possiede un elemento massimale.
8
Capitolo 1. Insiemi
Dimostrazione: Consideriamo l’insieme
C = {B ⊂ A | B è una catena in A}
e, per ogni c ∈ C, l’insieme
S(c) = {a ∈ A | a è confine superiore di C}
Supponiamo per assurdo che A non possieda un massimale; allora la famiglia
F = {S(B) \ B}B∈C
è formata da sottoinsiemi di A non vuoti. Per l’assioma di scelta esiste una
funzione f : C −→ A tale che, per ogni B ∈ C, f (B) = S(B) \ B.
Sia ora Z l’insieme delle catene B (non vuote) tali che per ogni segmento
iniziale B 0 di B (diverso da B) di abbia
f (B 0 ) = inf{B \ B 0 }
i.e. una catena B di A sta in Z se e solo se la funzione di scelta sceglie in ogni
suo segmento iniziale un elemento che è piú piccolo di ogni elemento di B che
non è in B 0 .
Ovviamente f (∅) ∈ Z che è quindi non vuoto e se B 0 , B 00 ∈ Z, dato che f (∅) è
il minimo, in B 0 e B 00 deve esistere un segmento iniziale comune a B 0 ed a B 00 , e
quindi l’unione di tali segmenti è un insieme S non vuoto: si tratta naturalmente
di un segmento iniziale sia per B 0 che per B 00 .
Per quanto si è visto, l’insieme S ∪ {f (S)} è ancora un segmento iniziale (la
f sceglie un elemento apposta in questo modo) e quindi è un sottoinsieme di C:
questo non può essere a meno che non sia C = B 0 oppure C = B 00 .
Ne concludiamo che se B 0 , B 00 ∈Z allora deve aversi B 0 ⊂ B 00 oppure B 00 ⊂ B 0 ;
quindi l’insieme
[
B∗ =
B
B∈Z
è una catena in A. Ma, di nuovo, B ∗ ∪ {f (B ∗ )} ∈ Z il che contraddice sia la
definizione di B ∗ che il fatto f (B ∗ ) ∈ S(B ∗ ) \ B ∗ . L’assurdo deriva dunque dall’ipotesi che esistano elementi non vuoti nella famiglia F , e cioè dall’aver supposto
l’insieme A privo di massimali.
qed
Il primo e principale esempio di applicazione del lemma di Zorn è il teorema
di Zermelo secondo il quale ogni insieme è bene ordinabile: in séguito si avrà
occasione di dare molte applicazioni del lemma di Zorn.
1.3. Numeri ordinali e cardinali
9
Teorema del Buon Ordinamento. (Zermelo) Per ogni insieme A esiste una
relazione d’ordine ≤A su A rispetto alla quale A è bene ordinato.
Dimostrazione: Consideriamo l’insieme
W = {(B, ≤B ) | B ⊂ A e ≤B è un buon ordinamento su B}
Definiamo su W un ordinamento << come segue: (B, ≤B ) <
< (B 0 , ≤B 0 ) ⇐⇒
0
B ⊂ B , ≤B 0 ristretto a B è ≤B e B è segmento iniziale di B.
Cioè un elemento B ∈ W è piú piccolo di un altro B 0 ∈ W se è piú piccolo
come insieme (B ⊂ B 0 ), se è pure piú piccolo come insieme ordinato (nel senso
che la relazione di ordine su B 0 ristretta agli elementi di B sia esattamente la
relazione di ordine su B) e se non esistano elementi in B 0 ⊂ B piú piccoli di un
qualsiasi elemento di B.
Ora consideriamo una
<.
S catena {Bi }i∈I in W rispetto all’ordine parziale <
∗
Allora l’insieme B = i∈I Bi unione di questa catena è totalmente ordinato
rispetto alla relazione unione delle relazioni d’ordine {≤Bi }i∈I .
Sia C è un sottoinsieme non vuoto di B ∗ ; ciò vuol dire che esiste un indice
i0 ∈ I tale che C ∩ Bi0 6= ∅. L’insieme Bi0 è bene ordinato dalla sua relazione ≤B0
(per definizione) e quindi il suo sottoinsieme C ∩ Bi0 ha un elemento minimo c0
(rispetto all’ordinamento ≤Bi0 ).
Ma Bi0 è segmento iniziale di A, e dunque c0 è anche un minimo rispetto
all’ordinamento di ogni altro Bi , col che c0 è minimo rispetto all’ordinamento di
B ∗ . Quindi A ∈ W .
è poi ovvio che A è un confine superiore per la catena {(Bi , ≤i )}i∈I in W
rispetto all’ordinamento <<. Cioè l’insieme ordinato W soddisfa alle ipotesi del
lemma di Zorn e quindi deve avere un elemento massimale (M, ≤M ).
Per dimostrare il teorema basta far vedere che M = A. Se esistesse un elemento a0 ∈ A \ M allora M ∪ {a0 }, con la relazione d’ordine che su M coincide
con ≤M e che rende a0 maggiore di ogni elemento di M , è ancora un elemento
di W , il che contraddice la massimalità di M .
qed
1.3
Numeri ordinali e cardinali
Contare gli elementi di un insieme finito significa metterli in corrispondenza
biunivoca con un numero naturale: abbiamo cosı̀ la possibilità di determinarne
il numero di elementi di un insieme finito, che, in linguaggio insiemistico, si dice
cardinalità. Vogliamo ora estendere il concetto di “numero di elementi di un
insieme” anche al caso infinito.
10
Capitolo 1. Insiemi
1.3.1 Definizione Due insiemi A e B si dicono equipotenti ovvero si dice che
hanno la stessa cardinalità se sono biunivoci e si scrive in tal caso Card(A) =
Card(B).
1.3.2 Esempio
(1) Due numeri naturali sono equipotenti se e solo se sono uguali.
(2) L’insieme dei numeri reali R è equipotente all’intervallo (0, 1): un modo
per vederlo è osservare che questo intervallo è equipotente ad una circonferenza del piano privata di un punto (ad esempio t 7−→ (cos 2πt, sin 2πt) è
biunivoca fra (0, 1) e la circonferenza di centro l’origine e raggio 1 privata
del punto (1, 0)). Che poi una circonferenza privata di un punto sia equipotente a R si vede considerando un proiezione: se consideriamo ad esempio
la circonferenza di centro (0, 1) e raggio 1 privata del punto N = (0, 2),
possiamo associare ad un punto P di questo insieme l’unico punto f (P )
dell’asse reale {y = 0} che interseca la retta per P e per il punto (0, 2).
N
¡
q
'$
¡
P
¡
q
¡
q
¡
&%
f (P )
1.3.3 Definizione Un insieme è numerabile se è equipotente a N.
Stabiliamo una notazione: avendo denotato col simbolo Card(A) = Card(B)
l’esistenza di una funzione biunivoca fra A e B, denotiamo col simbolo Card(A) ≤
Card(B) l’esistenza di una funzione iniettiva da A in B, e col simbolo Card(A) <
Card(B) l’esistenza di una funzione iniettiva fra A e B e la non esistenza di
funzioni biunivoche fra A e B.
1.3.4 Teorema (Cantor–Schröder–Bernstein)
Card(A) ≤ Card(B) e Card(B) ≤ Card(A) ⇒ Card(A) = Card(B)
Dimostrazione: (Birkhoff–MacLane) Osserviamo preliminarmente che, come
in ogni questione riguardante la cardinalità, possiamo considerare gli insiemi A
e B disgiunti (cioè A ∩ B = ∅), dato che se non lo sono, possiamo considerare
C = A ∩ B e porre B 0 = (B \ C) ∪ C 0 con C 0 insieme equipotente a C e disgiunto
da C in modo che, ovviamente, Card(B) = Card(B 0 ).
1.3. Numeri ordinali e cardinali
11
Dimostriamo quindi il teorema nell’ipotesi che sia A∩B = ∅; consideriamo due
funzioni (che esistono per ipotesi) f : A −→ B e g : B −→ A iniettive. Definiamo
per un elemento a di A o B un suo discendente come un elemento che sia stato
ottenuto con applicazioni successive delle funzioni f e g (ad esempio g(f (g(b)))∈A
è discendente di b ∈ B). Allora possiamo decomporre A in tre insiemi: AP che
consiste degli elementi di A che hanno un numero pari di discendenti, AD che
consiste degli elementi di A che hanno un numero dispari di discendenti e AI che
consiste degli elementi di A con un numero infinito di discendenti. Analogamente
decomponiamo B ed osserviamo che f manda AP su BD e AI su BI e che g −1
manda AD su BP . Quindi la funzione che, su AP ∪ AI è definita come f e che su
AD è definita come g −1 è biunivoca da A in B.
qed
1.3.5 Teorema (Cantor) Se A è un insieme, allora Card(A) < Card(P (A)).
Dimostrazione: Che si abbia Card(A) ≤ Card(P (A)) è ovvio: la funzione
f : A −→ P (A) definita come f (a) = {a} è manifestamente iniettiva. Ora
dimostriamo per assurdo che Card(A) 6= Card(P (A)).
Supponiamo cioè che esista una funzione biunivoca f : A −→ P (A), e
definiamo l’insieme
B = {a ∈ A | a ∈
/ f (a)}
Per definizione è B ⊂ A e quindi B∈P (A). Deve allora esistere un unico elemento
aB ∈ A tale che f (aB ) = B; ma se aB ∈ B allora aB ∈
/ f (aB ) = B che è assurdo;
quindi deve aversi aB ∈
/ B, cioè a dire aB ∈ f (aB ) = B che è un altro assurdo.
Quindi la funzione biunivoca f non può esistere.
qed
Osserviamo che i numeri che abbiamo incontrato finora (i naturali e ω stesso)
sono insiemi che hanno due particolarità, espresse dalle definizioni seguenti:
1.3.6 Definizione
(1) Un insieme A è pieno se per ogni B ∈ A si ha pure B ⊂ A.
(2) Un insieme A è transitivo se per ogni B ∈ A e per ogni C ∈ B si ha che
C ∈ A.
(3) Un numero ordinale è un insieme pieno e transitivo.
Cioè un ordinale contiene come elementi esattamente i suoi sottoinsiemi e gli
elementi dei suoi elementi.
12
Capitolo 1. Insiemi
1.3.7 Teorema Un numero ordinale è bene ordinato dalla relazione ∈.
Dimostrazione: Consideriamo un numero ordinale α: che la relazione ∈ sia
un ordinamento parziale in α è ovvio; dimostriamo che ogni sottoinsieme A non
vuoto di α ha un primo elemento. Per l’assioma di fondazione v’è un elemento
a ∈ A tale che a ∩ A = ∅ e quindi nessun elemento di a appartiene ad A, il che
vuol dire che a è il primo elemento di A.
qed
1.3.8 Lemma Sia α un ordinale.
(1) Se A ⊂ α, A 6= α e A è pieno allora A ∈ α.
(2) Se β è un ordinale allora α ⊂ β oppure β ⊂ α.
(3) Se β è un ordinale allora α ∈ β oppure β ∈ α oppure β = α.
(4) Se A ∈ α allora A è un ordinale.
Dimostrazione:
(1) Per transitività di A esiste un B ∈ A tale che A = {a ∈ α|a ∈ B}. Infatti
l’insieme α \ A ha un primo elemento B per la relazione ∈, ed è un esercizio
vedere che A è formato dagli elementi che appartengono a questo B. Per
concludere basta allora osservare che, essendo ogni elemento di B anche
elemento di α ne segue che A = B.
(2) L’insieme α ∩ β è piena e per (1) è α = α ∩ β oppure α ∩ β ∈ α; nel primo
caso troviamo immediatamente α ⊂ β, mentre nel secondo caso, otteniamo
α∩β ∈
/ β (dato che α ∩ β ∈ α ∩ β), e quindi, per (1), α ∩ β = β (dato che
α∩β ∈
/ β) sicché β ⊂ α.
(3) Ovvio!
(4) Che A sia pieno segue dal fatto che lo è α; per vedere che è transitivo, si
osservi che α è bene ordinato da ∈ e che A ∈ α: allora se C ∈ B e B ∈ A
allora C ∈ A.
qed
1.3.9 Definizione Una funzione f : A −→ B fra due insiemi totalmente ordinati A e B si dice un isomorfismo (ordinale) se è suriettiva e monotona:
∀a, b ∈ A a ≤A b ⇒ f (a) ≤B f (b)
Un isomorfismo ordinale è necessariamente iniettivo ed il suo inverso è un
isomorfismo ordinale.
1.3. Numeri ordinali e cardinali
13
1.3.10 Lemma Siano A e B insiemi totalmente ordinati.
(1) Se f : A −→ B è un isomorfismo ordinale e S è un segmento iniziale
(aperto, chiuso) in A, allora f (S) è un segmento iniziale (aperto, chiuso)
in B.
(2) Se S è un segmento iniziale di A e A è bene ordinato, allora (se S 6= A) S
è aperto.
(3) Se f : A −→ B e g : B −→ A sono isomorfismi ordinali fra un insieme
bene ordinato A ed un segmento iniziale di un insieme totalmente ordinato
B allora f = g.
1.3.11 Teorema Per ogni insieme A bene ordinato dalla relazione ≤ esiste
un unico ordinale α che sia isomorfo (con la relazione ∈) ad A come insieme
ordinato.
Dimostrazione: L’unicità segue facilmente dalla (3) del lemma precedente.
Dimostriamo l’esistenza di α: denotiamo con B l’insieme di tutti gli a ∈ A tali
che esistano un ordinale αa e un isomorfismo fa dell’insieme bene ordinato αa sul
segmento chiuso Sa di estremo a: notiamo che per il lemma precedente questa
funzione fa è univocamente determinata da a.
Ora sia c ∈ B tale che b ≤ c. Allora l’insieme α0 = {fc−1 (a)}a∈Sb è un numero
ordinale. la funzione f ristretta a α0 è un isomorfismo su Sb e quindi b ∈ B e
fb = fc |α0 . In altri termini fb ⊂ fcS
.
Ma
allora
la
funzione
f
=
0
a∈B fa è un isomorfismo dell’ordinale β0 =
S
a∈B αa su B. Ora, se A = B il teorema è dimostrato, altrimenti, se A 6= B,
comunque B è segmento iniziale di A, che è bene ordinato, sicché deve esistere
un a0 ∈ A tale che B = Sa0 . Dunque f0 ∪ {(β0 , α0 )} è un isomorfismo dell’ordinale
β0 + 1 = β0 ∪ {β0 } su B ∪ {α0 } = Sa0 il che implica a0 ∈ B che è un assurdo.
Quindi A = B.
qed
Dato che ogni insieme è bene ordinato, per una opportuna relazione d’ordine
totale, dal teorema precedente segue che ogni insieme è isomorfo a un numero
ordinale: in particolare un isomorfismo è una funzione biunivoca e quindi
1.3.12 Corollario Ogni insieme è equipotente a un numero ordinale.
Un insieme qualsiasi è ordinato dalla relazione di uguaglianza: a ≤ a se e solo
se a = a. Questo è un ordinamento banale, che non aggiunge alcuna ulteriore
informazione alla natura dell’insieme stesso e definiamo i numeri cardinali come
gli ordinali che tengano conto di questa relazione.
14
Capitolo 1. Insiemi
1.3.13 Definizione Un numero ordinale α è un numero cardinale se per ogni
ordinale β ≤ α4 , β e α non sono equipotenti.
Dimostriamo ora che per ogni insieme A possiamo trovare un solo numero
cardinale che sia equipotente ad A; chiameremo questo numero la cardinalità di
A e lo indicheremo con Card(A)
1.3.14 Teorema Per ogni insieme A esiste un unico cardinale a ad esso equipotente.
Dimostrazione: Dato che A è bene ordinabile, per il corollario 1.3.12 esiste un
unico ordinale α isomorfo (in particolare equipotente) a A; ora vogliamo trovare
un cardinale a equipotente a α (e quindi ad A). Questo è facilissimo: dato che α
è bene ordinato da ∈ esiste un ordinale a ≤ α equipotente a α ma i cui elementi
siano tutti non equipotenti a α; questo a è quindi un cardinale.
L’unicità di a segue dall’unicità di α sancita nel corollario 1.3.12 e dalla
definizione di numero cardinale.
qed
1.3.15 Corollario Per ogni numero ordinale α esiste un unico numero cardinale
equipotente a α.
1.3.16 Teorema Se A è un insieme infinito, allora Card(A2 ) = Card(A).
Dimostrazione: Consideriamo la funzione
f : A −→ A2
a 7−→ (a, a)
Dato che è iniettiva, abbiamo subito che Card(A) ≤ Card(A2 ). Ora procediamo
per assurdo: supponiamo che non valga la Card(A2 ) ≤ Card(A); allora l’insieme
C dei cardinali infiniti a tali che
a ≤ Card(A) e a < Card(a2 )
è non vuoto e, i cardinali sono bene ordinati, sia a0 il suo minimo. Sull’insieme
a20 definiamo una relazione d’ordine ≤ come
(α, α0 ) ≤ (β, β 0 ) ⇐⇒ max(α, α0 ) < max(β, β 0 ) oppure
α < β e max(α, α0 ) < max(β, β 0 ) oppure
α = β e α0 ≤ β 0 e max(α, α0 ) < max(β, β 0 )
4
Ricordiamo che per gli ordinali la relazione ≤ significa ∈.
1.3. Numeri ordinali e cardinali
15
In questo modo a2 è totalmente ordinato; ma è pure bene ordinato: per ogni
insieme non vuoto B ⊂ a2 i seguenti sottoinsiemi sono non vuoti (in virtù della
definizione della relazione ≤ su a2 ):
B1 = {(α, α0 ) ∈ B|∀(β, β 0 ) ∈ B max(α, α0 ) ≤ max(β, β 0 )}
B2 = {(α, α0 ) ∈ B1 |∀(β, β 0 ) ∈ B1 α < β}
B3 = {(α, α0 ) ∈ B2 |∀(β, β 0 ) ∈ B2 α0 < β 0 }
e B3 non può che contenere esattamente un elemento, che è proprio il minimo
in B rispetto alla relazione ≤. Dato che a0 < Card(a20 ), l’insieme bene ordinato (dalla relazione ∈) a0 è isomorfo al segmento iniziale S (aperto di estremo
(α0 , β0 )) dell’insieme bene ordinato a20 . Ora consideriamo il massimo δ0 fra α0 e
β0 ; evidentemente deve aversi
B ⊂ (δ ∪ {δ})2
(notare che δ + 1 = δ ∪ {δ}). Ma α0 è infinito e quindi anche B e δ0 lo sono e si
ha
Card(δ0 + 1) = Card(δ0 ) < a0
Allora, per minimalità di a0 in C, abbiamo
a0 = Card(B) ≤ Card((δ0 + 1)2 ) ≤ Card(δ0 + 1) ≤ a0
che è assurdo. Quindi l’insieme C è vuoto e il teorema è dimostrato.
qed
1.3.17 Corollario Siano A e B insiemi, con A infinito.
(1) Se B 6= ∅ allora Card(A × B) = max(Card(A), Card(B)).
(2) Card(A ∪ B) = max(Card(A), Card(B)).
(3) Se n ∈ N oppure se n = N allora Card(An ) = Card(A).
Si può dimostrare che il teorema precedente non solo è conseguenza, ma equivale
al teorema del buon ordinamento. Concludiamo riportando alcuni fondamentali
risultati dovuti a Cantor.
n
Ricordiamo che possiamo identificare i numeri razionali con le frazioni m
(con
n, m 6= 0 interi) e quindi delle coppie (n, m) ∈ N × N \ {0} modulo la relazione di
equivalenza (n, m) ≡ (n0 , m0 ) ⇐⇒ ∃a ∈ Z an = n0 , am = m0 . Usando il teorema
precedente abbiamo che Q è numerabile.
1.3.18 Definizione Una successione in un insieme A è una funzione s : N −→
A; si denota pure {sn }n∈N e si scrive quindi s(n) = sn .
16
Capitolo 1. Insiemi
1.3.19 Teorema (Cantor) L’insieme R non è numerabile.
Dimostrazione: Basta dimostrare la non numerabilità dell’intervallo I = (0, 1)
che è infatti biunivoco con R. Supponiamo per assurdo che I sia numerabile:
allora deve esistere una successione {rn } = I. Un elemento di rn ∈ I è un numero
reale positivo minore di 1, che ha dunque uno sviluppo decimale della forma
−1
rn = cn1 10
−2
+ cn2 10
−3
+ cn3 10
+ ... =
∞
X
cnk 10−k
k=1
(le cnk sono le cifre dello sviluppo decimale di rn ). La successione {rn } dà quindi
luogo ad una “tabella infinita”
r0 ←→ r01
r1 ←→ r11
r2 ←→ r21
..
.
r02 r03 ...
r12 r13 ...
r22 r23 ...
..
.
Ora, combinando arbitrariamente una successione
di cifre a1 , a2 , a3 ,... possiamo
P
costruire il numero reale r∈I il cui sviluppo è k∈N+ ak 10−k e questo deve figurare
da qualche parte nella successione (rn ), deve cioè esistere un n0 (dipendente da
(am )) tale che r = rn0 .
Come successione (am ) prendiamo quella il cui elemento m-mo am è zero se
il termine rmm della tabella precedente è diverso da zero, e 1 se il termine rmm
della tabella precedente è uguale a zero. L’elemento r non potrà mai figurare
nella tabella, cioè la successione (am ) non corrisponde a nessuna (rnk ); infatti se
fosse am = rn0 m per un certo numero naturale n0 allora, se an0 = 0 avremmo
rn0 n0 6= 0 e quindi an0 6= 0 e se an0 6= 0 avremmo rn0 n0 = 0 e quindi an0 = 0. In
ogni caso un assurdo, e quindi la successione (rn ) non può esistere.
qed
1.3.20 Teorema (Cantor) Card(R) = 2N .
Il significato di 2N è evidente: 2 è l’insieme con due elementi 2 = {0, 1}. Allora
se A è un insieme e B è un altro insieme, poniamo per definizione
Card(A)Card(B) = Card(AB )
In questo modo definiamo l’esponenziale per i numeri cardinali. Se A è finito
e B è numerabile allora Card(AB ) = 2N . Il teorema di Cantor afferma che la
cardinalità dei numeri reali (che si dice cardinalità del continuo) è proprio questa.
1.4. Categorie e funtori
17
Per dimostrarlo si tenga presente il fatto che 2A è semplicemente l’insieme delle
funzioni da A in {0, 1} cioè un insieme di cifre binarie indicizzato da A; ogni
numero reale ammette sviluppi in base due (abbiamo usato prima quelli in base
dieci) ove, ad esempio, i numeri 0,111111... e 1 sono esattamente lo stesso (in
base due... in base dieci l’esempio è 0,999999... = 1).
1.4
Categorie e funtori
Sarà utile, nel seguito, il linguaggio astratto delle categorie.
1.4.1 Definizione Una categoria C è determinata da una classe Ob C i cui
elementi si dicono oggetti della categoria e da due funzioni:
(1) Una funzione che ad ogni coppia di oggetti X, Y associ un insieme hom(X, Y )
i cui elementi si diranno morfismi.
(2) Una funzione che, per ogni tripla di oggetti X, Y, Z associ una funzione
hom(Y, Z) × hom(Y, X) −→ hom(X, Z)
(denotata con (f, g) 7−→ g ◦ f e che si dirà composizione dei morfismi f e
g), tale che valgano i seguenti assiomi:
h ◦ (g ◦ f ) = (h ◦ g) ◦ f
1Y ◦ f = f e g ◦ 1Y = g
Il morfismo 1Y si dice identità e la classe dei morfismi {hom(X, Y )}X,Y ∈Ob C
si denota con Mor C. Vediamo alcuni esempi importanti di categorie.
La categoria S: i suoi oggetti sono tutti gli insiemi e, se X, Y sono insiemi un
morfismo è una qualsiasi funzione f : X −→ Y . La composizione è esattamente
la composizione di funzioni e le identità sono esattamente le funzioni identità di
ciascun insieme. Ovviamente gli oggetti di S ed i suoi morfismo sono classi che
non sono insiemi.
La categoria G dei gruppi: i suoi oggetti sono tutti i gruppi (si noti che
una classe C non può essere un gruppo, perché per definire l’operazione bisogna
considerare una funzione C × C −→ C) ed i suoi morfismi gli omomorfismi fra i
gruppi. Si tratta di una sottocategoria di S nel senso della seguente
1.4.2 Definizione Se C è una categoria, una sua sottocategoria è una categoria
D tale che Ob D ⊂ Ob C. Una sottocategoria D di una categoria C si dice piena
se per ogni X, Y ∈ Ob D ⊂ Ob C si ha che homD (X, Y ) = homC (X, Y ) ove
homC (X, Y ) denota i morfismi fra X e Y nella categoria C.
18
Capitolo 1. Insiemi
1.4.3 Esempio La categoria AB dei gruppi abeliani (i suoi oggetti sono gruppi
abeliani e i morfismi gli omomorfismi) è una sottocategoria piena della categoria
G dei gruppi.
In generale, tutte le categorie che avremo modo di considerare sono sottocategorie di S: ogni qual volta si definisce una struttura su un insieme ed una
classe di applicazioni che preserva tale struttura, si può considerare la categoria
associata: gli anelli, gli spazi vettoriali, i campi,... sono tutti esempi di categorie.
Non ogni esempio di categoria sorge in questo modo: se K è un anello commutativo, possiamo considerare la categoria MK i cui oggetti sono gli interi positivi
e i cui morfismi hom(m, n) sono le matrici Mn,m (K) m × n a coefficienti in K.
La composizione di morfismi sarà il prodotto di matrici.
Non bisogna cioè pensare che i morfismi di una categoria siano necessariamente applicazioni fra insiemi.
1.4.4 Esempio Se P è un insieme parzialmente ordinato dalla relazione ≤ allora
individua una categoria P i cui oggetti sono gli elementi di P (i.e. Ob P = P )
ed i morfismi sono cosı̀ definiti:
(
{ipq } se p ≤ q
hom(p, q) =
∅
altrimenti
Cioè esiste un solo morfismo fra p e q (che è un simbolo univocamente determinato
da p e q) se p ≤ q; altrimenti non esiste nessun morfismo (si noti che le identità
sono i simboli ipp ).
In generale, dato un qualsiasi grafo composto da vertici e frecce orientate,
questo definisce una categoria, i cui oggetti sono i vertici ed i cui morfismi le
frecce.
1.4.5 Esempio Un gruppo G induce una categoria C(G) con: Ob C(G) = {e}
(identità del gruppo) e hom(e, e) = G; la composizione è il prodotto del gruppo.
In questo esempio abbiamo una proprietà particolare: per ogni morfismo f
esiste un inverso i.e. un morfismo g tale che f ◦ g = 1 e g ◦ f = 1. è un esercizio
verificare che ogni categoria i cui morfismi siano tutti invertibili è della forma
C(G) per un opportuno gruppo G.
Evidentemente fra due categorie C(G) e C(H) esistono delle applicazioni che
è naturale considerare, e che sono indotte dagli omomorfismi del gruppo G nel
gruppo H. Si tratta di un caso particolare della nozione seguente.
1.4.6 Definizione Se C e D sono categorie, un funtore F : C −→ D è determinato da
19
1.4. Categorie e funtori
(1) Una funzione F : Ob C −→ Ob D.
(2) Una funzione F : Mor C −→ Mor D.
in modo che
∀X ∈ Ob C
F(1X ) = 1F(X)
∀f ∈ hom(Y, Z)∀g ∈ hom(X, Y ) F(f ◦ g) = F(f ) ◦ F(g)
Quindi un funtore è un “morfismo” fra categorie, nel senso che preserva la
struttura categorica. In particolare, se un funtore F è tale che le applicazioni
F : Ob C −→ Ob D e F : Mor C −→ Mor D sono biunivoche si dice una equivalenza fra le categorie C e D: questo significa che, anche se realizzate con insiemi
diversi, dal punto di vista categorico C e D vanno considerate come indistinguibili. Ovviamente se C è una categoria esiste sempre il funtore identico 1 : C −→ C
e due funtori si possono comporre.
1.4.7 Definizione Una categoria è piccola se la classe dei suoi oggetti è un
insieme.
Osserviamo che, in virtù degli assiomi che abbiamo dato per le classi, una
funzione f : S −→ C ove S sia un insieme e C una classe è un insieme: infatti
il suo grafico {(s, f (s))}s∈S è l’immagine della funzione s 7−→ (s, f (s)) e quindi,
per l’assioma 8 del §1, è un insieme. Se ora C è una categoria piccola, la classe
Ob C × Ob C è un insieme e quindi lo è l’insieme dei morfismi Mor C.
In altri termini, esiste la categoria delle categorie piccole: i suoi oggetti sono
tutte le categorie ed i cui morfismi sono i funtori.
Per le categorie costruite a partire da insiemi esiste sempre il funtore “distratto”: ad esempio se G è la categoria dei gruppi, il suo funtore distratto è
F : G −→ S (nella categoria degli insiemi) che assegna ad un oggetto G ∈ Ob G
se stesso (in quanto insieme) e ad ogni morfismo f ∈ Mor G se stesso in quanto
funzione: questo funtore dimentica quindi la struttura gruppale.
In molti casi il concetto di funtore non soddisfa pienamente le proprietà che
si vorrebbero: ad esempio se V è la categoria degli spazi vettoriali, esiste una
applicazione ∗ : V −→ V che ad ogni spazio vettoriale associa il suo duale: non
si tratta però di un funtore, perché
(f ◦ g)∗ = g ∗ ◦ f ∗
Cioè
∗
“inverte il senso delle frecce”. Si tratta di un nuovo tipo di funtore:
1.4.8 Definizione Se C e D sono categorie, un funtore controvariante F : C −→
D è determinato da
20
Capitolo 1. Insiemi
(1) Una funzione F : Ob C −→ Ob D.
(2) Una funzione F : Mor C −→ Mor D.
in modo che
∀X ∈ Ob C
F(1X ) = 1F(X)
∀f ∈ hom(Y, Z) ∀g ∈ hom(X, Y )
F(f ◦ g) = F(g) ◦ F(f )
Spesso anziché scrivere identità fra morfismi si scrivono diagrammi e si dichiara che sono commutativi, cioè che le applicazioni ottenute componendo frecce
che inizino e finiscano sugli stessi vertici sono uguali. Ad esempio anziché scrivere
f ◦ g = h ◦ i si dice che il diagramma
X
²
g
i
Z
h
/Y
²
f
/W
è commutativo. Quindi, se F : C −→ D è un funtore controvariante, la seconda
proprietà che lo definisce equivale alla commutatività del diagramma
F(f )
/ F(Y )
HH
HH
HH
F(g)
H
F(f ◦g) HH$
²
F(Z)
F(X)
Cosı̀ il funtore ∗ : V −→ V è controvariante (i funtori propriamente detti si dicono
anche covarianti). In generale il funtore che a un oggetto V ∈ V associa lo spazio
hom(V, W ) (ove W ∈ Ob V) è controvariante da V in V. Osserviamo che questa
asserzione è imprecisa: per meglio formalizzarla introduciamo la
1.4.9 Definizione Se C è una categoria, la sua categoria opposta C op è la categoria cosı̀ determinata: Ob C op = Ob C e ogni X
univocamente un Y
f op
f
/ Y ∈ Mor C determina
/ X ∈ Mor(C op ), in modo che
(f ◦ g)op = g op ◦ f op
Quindi fra una categoria e la sua opposta esiste un funtore controvariante
: C −→ C op . è ovvio che questo funtore è una equivalenza di categorie e che il
suo funtore inverso è op : C op −→ (C op )op = C. Questa dualità è simile alla dualità
degli spazi vettoriali di dimensione finita.
op
21
1.4. Categorie e funtori
1.4.10 Esempio Esiste fra la categoria degli insiemi S e la sua opposta Sop il
funtore controvariante P : Sop −→ S dato dall’insieme potenza: fissato un insieme
X il funtore Y 7−→ X Y è controvariante.
Analizziamo meglio l’esempio (che ha dato origine alla teoria) della dualità
per gli spazi vettoriali: sappiamo che il funtore ∗ : V −→ Vop è controvariante
come pure lo è ∗ : Vop −→ V. Il fatto che abbia l’isomorfismo canonico i fra uno
spazio vettoriale V ed il suo biduale V ∗∗ è di natura puramente categorica: se
f : V −→ W è un morfismo di spazi vettoriali (i.e. un’applicazione lineare) allora
il seguente diagramma è commutativo
i
V
/ (V ∗ )∗
f
²
i
W
²
(f ∗ )∗
/ (W ∗ )∗
Quindi la mappa i in un certo senso trasforma il funtore identità nel funtore
∗∗
.
1.4.11 Definizione Se F, G : C −→ D sono funtori, una trasformazione naturale t : F −→ G è una funzione che ad ogni oggetto X ∈Ob C associa un morfismo
tX
/ G(X) ∈ Mor D in modo che per ogni morfismo X
F(X)
il seguente diagramma sia commutativo:
F(X)
F(f )
²
F(Y )
tX
tY
f
/ Y ∈ Mor C
/ G(X)
²
G(f )
/ G(Y )
Quindi una trasformazione naturale è in un certo senso un morfismo fra funtori: precisamente, se C è una categoria piccola e D una categoria qualsiasi, per
l’assioma 8 del §1 una funzione Ob C −→ Ob D è un insieme: quindi i funtori
F : C −→ D sono insiemi. Possiamo cioè considerare l’insieme Fun(C, D) dei
funtori F : C −→ D; ora dimostriamo che la classe delle trasformazioni naturali
t : F −→ G del funtore F∈Fun(C, D) nel funtore G∈Fun(C, D), è, some applicazione, è un insieme.
Evidentemente, dato che C è piccola e F, G sono insiemi,
S
la classe M = X∈Ob C hom(F(X), G(X)) è un insieme (assioma 6 del §1) ed
una trasformazione naturale è una funzione t : Ob C −→ M ed il suo grafico è
una sottoclasse del prodotto C × M che è un insieme. Ma l’insieme P(C × M)
potenza di un insieme è un insieme (assioma 7 del §1) e quindi la classe delle
trasformazioni naturali da F in G è una sottoclasse di un insieme, cioè (assioma
5 del §1) è un insieme essa stessa.
22
Capitolo 1. Insiemi
Fatte tutte queste verifiche, che sono ovvie ma che abbiamo voluto esplicitare per mostrare l’importanza dell’assiomatica insiemistica, possiamo considerare
l’insieme dei funtori Fun(C, D) e definire una categoria che ha come insieme degli
oggetti proprio Fun(C, D), e come classe di morfismi le trasformazioni naturali
fra elementi di Fun(C, D). Questa categoria è la categoria dei funtori.
Una trasformazione naturale t : F −→ G si dice equivalenza naturale se per
ogni X ∈ Ob C il morfismo tX è invertibile in Mor D.
Quindi la teoria della dualità degli spazi vettoriali di dimensione finita si
riassume nella frase: esiste una equivalenza naturale fra il funtore identità e il
funtore ∗∗ effettuata dalla funzione iV : x ∈ V 7−→ (ϕ 7−→ ϕ(x)) ∈ V ∗∗ tale che,
per ogni morfismo f : V −→ W :
V
f
iV
²
W
/ V ∗∗
²
iW
f ∗∗
/ W ∗∗
Per concludere questa rapida rassegna sul concetto di categoria, introduciamo i
concetti forse più importanti della teoria.
1.4.12 Definizione Se F : C −→ S è un funtore da una categoria nella categoria
degli insiemi, una rappresentazione di F è determinata da un oggetto R ∈ Ob C
e da una famiglia di trasformazioni naturali
{ϕX : homC (R, X) ←→ F(X)}X∈Ob C
In altri termini, una rappresentazione di F è una equivalenza naturale f :
F −→ HR ove HR : C −→ S è il funtore (covariante)
Hr (X) = homC (R, X)
Osserviamo che una rappresentazione t del funtore F determina un elemento
S ∈ F(R) tale che per ogni Y ∈ Ob C e per ogni T ∈ F(Y ) esiste un unico
morfismo f : R −→ X tale che F(f )S = T . L’oggetto S si dice allora universale
per la rappresentazione del funtore.
Moltissimi oggetti dell’algebra astratta sono determinati da proprietà universali: ad esempio il prodotto tensoriale, i gruppi liberi, l’insieme quoziente modulo
una relazione, &c.
1.4.13 Lemma (Yoneda) Se F : C −→ S è un funtore covariante, e se
X, Y ∈ Ob C allora esiste una biiezione canonica fra la classe delle trasformazioni
naturali di HX −→ HY e homC (X, Y ).
23
1.4. Categorie e funtori
Dimostrazione: Ogni g ∈ hom(X, Y ) induce una trasformazione naturale di
funtori tg (f ) = f ◦ g. Ovviamente g = tg (1X ). Viceversa, una trasformazione
f
naturale t : HX −→ HY dà luogo, per ogni X −→ Z ∈ Mor C al diagramma
commutativo
t
HX (X) X / HY (X)
HX (f )
²
HX (Z)
²
tZ
HY (f )
/ HY (Z)
Allora definiamo un morfismo in g ∈ hom(X, Y ) ponendo g = tX (1X ): che si
tratti di un morfismo segue dal diagramma: f = f ◦ 1X = HX (f )(1X ) e tZ (f ) =
HY (f )(tX (1X )) = f ◦ g.
qed
Il seguente risultato è un modo diverso di esprimere il lemma di Yoneda:
1.4.14 Teorema La categoria C op opposta a C è equivalente alla categoria dei
funtori rappresentabili, che è una sottocategoria piena della categoria dei funtori.
Capitolo 2
TOPOLOGIE
Ogni spazio che si considera in gran parte della matematica e delle sue applicazioni è uno spazio topologico di qualche tipo: qui introduciamo in generale
le nozioni di base della topologia, facendo perno sugli esempi che il lettore certamente già conosce (spazi euclidei, spazi di funzioni, superficie). In particolare
l’esempio guida sarà la retta reale: discuteremo anche il concetto di omotopia,
nelle sue linee fondamentali.
2.1
Spazi topologici
2.1.1 Definizione Una coppia (X, T ) si dice spazio topologico se X è un insieme e T è una famiglia di suoi sottoinsiemi (detta topologia su X) tale che
(1) X, ∅ ∈ T .
(2) {Xα }α∈A ⊂ T ⇒
S
α
Xα ∈ T .
(3) A, B ∈ T ⇒ A ∩ B ∈ T .
Gli elementi di una topologia si dicono aperti ed i loro complementari in
X chiusi. Se Y ⊂ X, la chiusura Y di Y è l’intersezione di tutti i chiusi che
o
contengono Y , e l’interno Y di Y è l’unione di tutti gli aperti contenuti in Y .
o
Ovviamente Y è chiuso (risp. aperto) se e solo se Y = Y (risp. Y = Y ).
I chiusi di uno spazio topologico soddisfano le seguenti proprietà, dedotte dagli
assiomi di topologia passando ai complementari, che ovviamente caratterizzano
una topologia:
(1) X, ∅ sono chiusi.
(2) Se {Xα }α∈A sono chiusi allora
T
α
Xα è chiuso.
(3) Se A, B sono chiusi allora A ∪ B è chiuso.
24
25
2.1. Spazi topologici
Gli esempi fondamentali sono ovviamente gli spazi cartesiani Rn e Cn della
geometria elementare, dotati delle topologie naturali, cioè quelle per le quali un
aperto è un sottoinsieme A che, con ogni suo punto x, contiene una palla aperta
{y | |x − y| < ε} di raggio ε > 0.
Se (X, T ) è uno spazio topologico ogni suo sottoinsieme è uno spazio topologico con la topologia relativa TA definita come segue:
U ∈ TA ⇐⇒ ∃V ∈ T
U =A∩V
Gli assiomi sono cosı̀ generali che ogni insieme può considerarsi in svariati
modi uno spazio topologico: anche l’insieme vuoto. Infatti se X è un insieme
qualsiasi, la collezione P(X) di tutte le sue parti è una topologia, che si dice
topologia discreta, come pure lo è la collezione {∅, X}, che si dice topologia banale. Nella topologia discreta ogni sottoinsieme è aperto: ad esempio ogni punto.
Inoltre ogni sottoinsieme è anche chiuso.
2.1.2 Definizione Sia X uno spazio topologico.
(1) Un insieme Y ⊂ X è denso se Y = X.
o
(2) La frontiera di un insieme Y ⊂ X è l’insieme ∂Y = Y \ Y .
o
(3) Un insieme Y ⊂ X è raro se Y = ∅.
Un insieme Y è raro se e solo se il complementare della sua chiusura è denso,
se e solo se Y = ∂Y . L’esempio più familiare di insieme denso è il sottoinsieme
Q dei numeri razionali nei numeri reali R.
L’insieme delle topologie su un insieme X è ordinato dalla relazione di inclusione fra famiglie di sottoinsiemi di X, e se T ⊂ T 0 si dice che T è meno fine o
più debole di T 0 . L’insieme delle topologie su uno spazio X forma manifestamente
un reticolo; gli elementi 0 e 1 di questo reticolo sono la topologia banale formata
dal solo elemento ∅ e la topologia discreta che coincide con l’insieme delle parti
P(X) di X.
Una famiglia di sottoinsiemi di uno spazio X genera una topologia, che è la
più piccola topologia su X contenente gli elementi della famiglia, ed è la più
debole delle topologie che ammettono gli insiemi appartenenti agli elementi della
famiglia come aperti.
2.1.3 Definizione Se X è uno spazio topologico per la topologia T , un sottoinsieme B ⊂ T è una base se ogni aperto in T è unione di elementi di B, mentre
si dice una sottobase se le intersezioni finite di elementi di B sono una base.
26
Capitolo 2. Topologie
2.1.4 Esempio Una base per la topologia di Rn è data dalle palle aperte Br (x) =
{y ∈ Rn | |x − y| < r} di raggio r e centro x. Infatti un aperto A di Rn , per definizione, possiede con ogni suo punto x una palla Brx (x) di centro quel punto
completamente contenuta in A: allora
[
A=
Brx (x)
x∈A
e quindi A è unione di palle aperte. In R una palla aperta è semplicemente un
intervallo (x − ε, x + ε); gli intervalli della forma (x, ∞) e (−∞, x) formano una
sottobase.
2.1.5 Definizione Una topologia T su un insieme X si dice a base numerabile
se esiste una base numerabile di aperti.
2.1.6 Esempio Rn ha base numerabile: possiamo infatti scegliere le palle aperte
Br (x) in cui r ∈ Q e x ∈ Qn per densità dei razionali nei reali.
Se Y ⊂ X è un sottoinsieme di uno spazio topologico con topologia T , allora
è a sua volta uno spazio topologico rispetto alla topologia indotta da T su Y , i
cui aperti sono intersezioni di aperti di X con Y .
2.1.7 Definizione Un intorno di un punto x in uno spazio topologico X è un
aperto di X contenente x. Una base di intorni di x ∈ X è una famiglia di intorni
di x tale che ogni intorno di x contenga un intorno di questa famiglia.
2.1.8 Definizione Uno spazio topologico X si dice
(1) T1 se per ogni coppia x, y ∈ X esiste un aperto contenente x ma non y.
(2) T2 (o di Hausdorff) se per ogni coppia x, y ∈ X esistono un aperto contenente x ma non y e un aperto contenente y ma non x disgiunti.
(3) regolare (T3 se è anche T1 ) se per ogni chiuso F di X ed ogni punto x∈X\F
esistono un aperto contenente x ma non F ed un aperto contenente F ma
non x disgiunti.
(4) normale (T4 se è anche T1 ) se per ogni coppia di chiusi F1 , F2 disgiunti di
X esistono un aperto contenente F1 ma non F2 ed un aperto contenente F2
ma non F1 disgiunti.
Con degli esempi potrebbe mostrarsi che queste classi di spazi sono contenute
propriamente le une dentro le altre nel seguente modo: T4 ⊂ T3 ⊂ T2 ⊂ T1 : per
una discussione più approfondita rimandiamo ai testi specialistici (dove si definiscono anche altre classi di spazi, come i T0 e T 3 ); qui ci limitiamo a segnalare
2
alcuni semplici controesempi.
27
2.1. Spazi topologici
2.1.9 Esempio Uno spazio T1 ma non T2 è ad esempio il seguente: consideriamo
nello spazio Rn gli insiemi della forma
V (f ) = {x ∈ Rn | f (x) = 0}
(ove f ∈R[x] è un polinomio). È un semplice esercizio verificare che generano una
topologia come insiemi chiusi: gli aperti sono effettivamente i complementari delle
curve algebriche piane1 ; è facile constatare che in questa topologia ogni aperto è
denso, quindi non può essere di Hausdorff. Tuttavia i punti sono insiemi chiusi,
della forma V (x − c0 ) con c0 costante, quindi la topologia è T1 in virtù della
semplice
2.1.10 Proposizione Uno spazio topologico X è T1 se e solo se per ogni suo
punto x l’insieme {x} è chiuso.
Dimostrazione: Se x ∈ X preso un altro punto y ∈ X gli insiemi Ux := {{x} =
X \ {x} contenente x e Uy := {{y} = X \ {y} contenente y sono aperti e x ∈
/ Ux
e y ∈
/ Uy . Viceversa, se lo spazio è T1 e X ∈ X non fosse chiuso allora {x}
conterrebbe almeno un altro punto y. Ma allora dovrebbero esistere due intorni
x ∈ Ux e y ∈ Uy con x ∈
/ Uy e y ∈
/ Ux , il che è assurdo.
qed
2.1.11 Esempio Uno spazio T2 non T3 è dato dall’intervallo [0, 1] ⊂ R con la
topologia una cui base di intorni, in ogni punto che non sia lo zero, è quella della
topologia naturale (indotta da R), mentre come intorni dello zero prendiamo
gli insiemi [0, r) \ {1/n}n∈N cioè gli intervalli destri privati di una successione
numerabile tendente a zero. Ovviamente lo spazio è di Hausdorff, ma non è
possibile separare un punto ed un insieme chiuso con due suoi aperti disgiunti.
La classe degli spazi di Hausdorff è, come si vede, sensibilmente più vasta di
quella degli spazi regolari o, peggio ancora, normali.
2.1.12 Definizione Una successione generalizzata o rete in uno spazio topologico X è una famiglia {xα }α∈A di elementi di X indicizzata da un insieme
parzialmente ordinato e diretto A.
Evidentemente, se A è numerabile otteniamo il classico concetto di successione
considerato in Analisi. Se lo spazio ha base numerabile in quel che segue ci si
può limitare a queste successioni senza considerare quelle generalizzate.
1
Si tratta della topologia di Zariski .
28
Capitolo 2. Topologie
2.1.13 Definizione Una successione generalizzata {xα }α∈A si dice convergente
ad un elemento x ∈ X se per ogni intorno U 3 x esiste un elemento αx ∈ A tale
che per ogni α > αx xα ∈ U , e si scrive
lim xα = x
α∈A
L’elemento x si dice limite della successione.
In uno spazio di Hausdorff, il limite di una successione generalizzata, se esiste,
è unico, il che si vede esattamente come nel caso delle successioni: se una successione generalizzata converge a due punti limite, questi non potranno in alcun
modo essere separati con intorni disgiunti (due tali intorni conterranno sempre
ambedue i punti), e viceversa.
Ora vogliamo caratterizzare la topologia di uno spazio in termini di convergenza di successioni generalizzate. Se x è limite della successione {xα }α∈A
allora
x ∈ {xα }α∈A
Se Y è un sottoinsieme di X e x ∈ Y , allora per ogni intorno U di x esiste un
elemento xU ∈ U ∩ Y ; l’insieme Ux degli intorni di x munito della relazione di
ordine parziale
U < U 0 ⇐⇒ U ⊃ U 0
è diretto e
x = lim xU
U ∈Ux
Ogni punto di Y è limite di una successione generalizzata di elementi di Y :
cosı̀ abbiamo una caratterizzazione dei chiusi (e quindi della topologia su X) in
termini di convergenza generalizzata.
2.1.14 Definizione Un punto limite per una successione {xα }α∈A è un x ∈ X
tale che per ogni intorno U 3 x e per ogni α ∈ A esiste un αU > α in A tale che
xαU ∈ U .
In altri termini, se
Eα := {xα0 }α0 >α
T
allora l’insieme dei punti limite è α Eα : si tratta ovviamente di un chiuso.
2.1.15 Definizione Una sottosuccessione di una successione generalizzata {xα }α∈A
è una famiglia {xβ }β∈B di elementi di X tale che l’insieme B sia parzialmente
ordinato e diretto, ed esista una funzione i : B −→ A tale che
∀α ∈ A ∃βα ∈ B ∀β ∈ B
β > βα ⇒ i(β) > α
Come nel caso della retta reale, le sottosuccessioni giocano un ruolo importante nella topologia generale:
29
2.1. Spazi topologici
2.1.16TProposizione Se {xα }α∈A è una successione generalizzata e se l’insieme
E := α Eα è non vuoto allora esiste una sottosuccessione generalizzata che
converge ad ogni elemento di E. In altri termini l’insieme dei punti limite è non
vuoto se e solo se esistono sottosuccessioni convergenti.
Dimostrazione: Se x è un punto limite della successione generalizzata {xα }α∈A
in X e Ux una base di intorni di x, tali che
∀U ∈ Ux ∀α ∈ A U ∩ Eα 6= ∅
allora (gli elementi di Ux sono aperti): U ∩ {xα0 }α0 >α 6= ∅ e quindi per ogni α ∈ A
esiste α0 > α tale che xα0 ∈ U .
La relazione
(α, U ) > (α0 , U 0 ) ⇐⇒ α > α0 e U ⊂ U 0
rende l’insieme A × Ux parzialmente ordinato e diretto (dato che Ux è un sistema
fondamentale di intorni); per ogni β = (α, U ) ∈ A × Ux sia i(β) ∈ A tale che
i(β) > α e xi(β) ∈ U (l’esistenza di questo elemento i(β) è garantita dall’assioma
di scelta). Allora, dato che B è parzialmente ordinato e diretto, {xi(β) }β∈B è una
sottosuccessione della {xα }α∈A , tale che
x = lim xi(β)
β
i.e. convergente a x.
qed
Quindi una successione generalizzata in uno spazio topologico ammette sottosuccessioni convergenti se e solo se l’insieme dei suoi punti limite non è vuoto.
Ovviamente se la cardinalità dell’insieme dei punti limite è uno, di certo la
successione converge all’unico elemento di questo insieme.
Si noti che, se nessun punto di X ammette una base numerabile di intorni, può succedere che {xn }n∈N sia densa in X ma che nessuna sottosuccessione
(numerabile) sia convergente.
2.1.17 Definizione Una successione universale è una successione generalizzata
{xα }α∈A tale che per ogni S ⊂ X, la successione {xα }α∈A appartiene definitivamente all’insieme S ovvero all’insieme X \ S.
T
Osserviamo che se {xα } è T
una successione universale allora Eα = ∅ oppure
(se lo spazio è di Hausdorff) Eα = {x}.
2.1.18 Definizione Una famiglia di sottoinsiemi F ⊂ P(X) di un insieme X
possiede la proprietà dell’intersezione finita se per ogni sottofamiglia F 0 ⊂ F
finita:
\
F 0 6= ∅
30
Capitolo 2. Topologie
Questa definizione è duale a quella di ricoprimentoSfinito: una famiglia di
sottoinsiemi U ricopre uno spazio topologico se X = U; se ogni sottofamiglia finita U 0 ⊂ U ricopre X allora la famiglia formata dai complementari di U
possiede la proprietà dell’intersezione finita e viceversa.
2.1.19 Teorema Se {xα }α∈A è una successione generalizzata nello spazio topologico X e possiede la proprietà dell’intersezione finita, possiede una sottosuccessione universale.
Dimostrazione: Consideriamo l’insieme delle famiglie F di sottoinsiemi di X
con la proprietà dell’intersezione finita che contengano la successione generalizzata {xα }: evidentemente si tratta di un insieme parzialmente ordinato rispetto
all’inclusione. Verifichiamo che soddisfa alle ipotesi del lemma di Zorn.
Se L è una catena di famiglie con la proprietà dell’intersezione
finita che conS
tengano la successione generalizzata {xα }, la famiglia L è un confine superiore
S
rispetto all’ordinamento dato dall’inclusione. è facile rendersi conto che L ha
ancora la proprietà dell’intersezione finita. Possiamo quindi applicare il Lemma
di Zorn e dedurre l’esistenza di un massimale F; questa famiglia, vista come
insieme parzialmente ordinato rispetto all’inclusione di sottoinsiemi di X fornisce un sistema di indici per {xα } che determina una sottosuccessione in {Eα }
universale.
qed
Il classico concetto di funzione reale continua si estende agli spazi topologici
qualsiasi
2.1.20 Definizione Se (X, T ) e (Y, S) sono spazi topologici, una funzione
f : X −→ Y
si dice continua se per ogni A ∈ S f −1 (A) ∈ T , si dice aperta se per ogni A ∈ T
f (A) ∈ S e si dice omeomorfismo se è biunivoca, continua e aperta.
Ad esempio è chiaro che una funzione f : R −→ R è continua nel senso
dell’Analisi se e solo se lo è nel senso della definizione precedente.
Se (X, T ) è uno spazio topologico e Y un insieme qualsiasi, e se f : X −→ Y
è una applicazione suriettiva, possiamo definire su Y una topologia, che si dice
topologia quoziente come segue:
Q = {U ⊂ Y | f −1 (U ) ∈ T }
In questo modo la mappa f diviene continua per definizione. Lo spazio Y si dice
spazio topologico quoziente. Fare il quoziente di uno spazio topologico equivale
ad identificare fra loro i punti di un suo sottospazio: in effetti se y ∈ Y , i punti
dell’insieme f −1 (y) ⊂ X vengono, tramite f , tutti identificati in y.
31
2.1. Spazi topologici
2.1.21 Esempio Consideriamo R con la sua topologia naturale e l’insieme
S 1 := {(x, y) ∈ R2 | x2 + y 2 = 1}
(si tratta della circonferenza in R2 ). La funzione f : R −→ S 1
f (t) := e2πit
è ovviamente suriettiva; inoltre se f (t) = (x, y) allora, per ogni n ∈ Z, f (t + n) =
(x, y); cioè f identifica i punti che abbiano distanza intera fra loro, e quindi
possiamo scrivere
S 1 = R/Z
intendendo che lo spazio quoziente S 1 è ottenuto identificando fra loro i punti
del sottospazio Z in R. S 1 si dice anche toro di dimensione 1 e si denota pure T.
La categoria T op degli spazi topologici ha per oggetti gli spazi topologici e
per morfismi le applicazioni continue: evidentemente due spazi vanno considerati
equivalenti dal punto di vista topologico se sono omeomorfi, i.e. se esiste un
omeomorfismo fra essi.
Vogliamo definire i prodotti nella categoria degli spazi topologici. Sia X un
insieme, A un insieme di indici e per ogni α∈A sia (Xα , Tα ) uno spazio topologico
con una funzione fα : X −→ Xα .
2.1.22 Definizione La topologia debole T su X definita dalla famiglia di funzioni {fα }α∈A è la più debole delle topologie T 0 per le quali fα : X −→ Xα sia
continua per ogni α ∈ A.
Una sottobase per la topologia debole è
[
fα−1 (Tα )
α∈A
Un esempio di topologia debole si ha proprio considerando i prodotti: siano
{Xα }α∈A spazi topologici e X l’insieme prodotto cartesiano2
Y
X=
Xα
α∈A
La topologia prodotto (o di Tichonov) è la topologia debole rispetto alla famiglia
di proiezioni {pα : X −→ Xα }α∈A . Una successione generalizzata {xξ }ξ∈I converge ad x in X se e solo se per ogni α ∈ A la successione {pα (xξ )}ξ∈I converge
a pα (x) (non necessariamente in modo uniforme da α).
2
Ricordiamo che si tratta di un insieme non vuoto in virtù dell’assioma di scelta.
32
Capitolo 2. Topologie
Se U è un intorno di x∈X, la condizione y ∈U pone restrizioni solo un numero
finito di proiezioni pα1 (y), ..., pαn (y): ad esempio per definire U basta assegnare
un sottoinsieme A0 finito di A e, per ogni suo elemento α0 dare un intorno Uα0 di
pα0 (x) mediante le condizioni
y ∈ U se pα0 (y) ∈ Uα0
Al variare di A0 e α0 si ottiene una base di intorni per la topologia prodotto su
X.
2.2
Spazi compatti
2.2.1 Definizione Una famiglia di sottoinsiemi U di uno spazio topologico X
si dice ricoprimento di X se
[
U =X
U si dice ricoprimento aperto (risp. chiuso) se è formato da sottoinsiemi aperti
(risp. chiusi).
La seguente definizione è fra le principali della Topologia:
2.2.2 Definizione Uno spazio topologico si dice compatto se da ogni suo ricoprimento aperto se ne può estrarre uno finito.
2.2.3 Esempio Il classico teorema di Heine–Borel afferma che i sottoinsiemi
compatti di Rn sono esattamente quelli chiusi e limitati.
2.2.4 Proposizione Se X è uno spazio topologico allora sono equivalenti le:
(1) X è compatto.
(2) Da ogni famiglia di chiusi con l’intersezione vuota se ne può estrarre una
finita con l’intersezione vuota.
(3) Ogni famiglia di chiusi con la proprietà dell’intersezione finita ha intersezione non vuota.
(4) Ogni successione generalizzata in X ammette una sottosuccessione convergente.
(5) Ogni successione universale in X è convergente.
33
2.2. Spazi compatti
Dimostrazione: L’equivalenza delle (1)-(3) è basata sulle leggi di de Morgan3 .
(1) implica (2): se F è una famiglia di chiusi con l’intersezione vuota, allora,
passando ai complementari,
\
[
{
C = {∅ =⇒
{C = X
C∈F
C∈F
il che vuol dire che la famiglia di aperti U = {{C | C ∈ F} è un ricoprimento: per
compattezza possiamo allora estrarne uno finito {{C1 , ..., {Cn }, cioè
n
[
i=1
{Ci = X =⇒ {
n
\
Ci = {∅ =⇒
n
\
Ci = ∅
i=1
i=1
dunque abbiamo la famiglia finita di chiusi che volevamo. Lo stesso ragionamento,
scambiando i chiusi con gli aperti, dimostra che (2) implica (1).
L’equivalenza di (1) con (3) è un fatto puramente logico: dire che X è compatto vuol dire che
Ã
!
n
[
[
∀U ⊂ T X =
U =⇒ ∃U1 , ..., Un ∈ U X =
Ui
i=1
Dato che P ⇒ Q è la stessa cosa che non Q ⇒ non P , possiamo scrivere questa
definizione come
!
Ã
n
[
[
Ui =⇒ X 6=
U
∀ U ⊂ T ∀U1 , ..., Un ∈ U X 6=
i=1
o anche, prendendo i complementari degli insiemi, come (con C indichiamo la
famiglia di tutti gli insiemi chiusi di X)
Ã
!
n
\
\
∀ F ⊂ C ∀C1 , ..., Cn ∈ F ∅ 6=
Ci =⇒ ∅ 6=
F
i=1
Quest’ultima è esattamente la (3).
Per quel che riguarda l’equivalenza fra la (3) e le (4)-(5) si procede nel seguente
modo: se X è compatto e {xα }α∈A una successione generalizzata in X, i chiusi
Fα ; = {xα0 }α0 >α
3
Il complementare di una unione è l’intersezione dei complementari e il complementare di
una intersezione è l’unione dei complementari.
34
Capitolo 2. Topologie
hanno la proprietà dell’intersezione finita (essendo A un insieme diretto). Dunque
per la (3)
\
Fα 6= ∅
α∈A
Questo insieme è esattamente l’insieme dei punti limite di {xα } e quindi, essendo
non vuoto, esistono delle sottosuccessioni convergenti; inoltre, dato che gode della
proprietà dell’intersezione finita, esiste una sottosuccessione universale.
Viceversa, sia F è una famiglia di chiusi con la proprietà dell’intersezione
finita in uno spazio topologico X, T
Ge la famiglia delle sottofamiglie finite di F e,
e sia dato un xG ∈ F (possiamo supporre che ciò sia possibile
per ogni G ∈ G,
grazie all’assioma di scelta).
T
Allora, se la successione {xG }G∈Ge ha un punto limite x, deve aversi x ∈ F.
qed
2.2.5 Esempio R non è compatto: ci sono svariati e facili modi per vederlo:
ad esempio, per la (4) della proposizione precedente: la successione {n}n∈N non
possiede alcuna sottosuccessione convergente.
Per determinare la compattezza esistono alcuni potenti criteri, il più importante dei quali è il teorema di Tichonov:
2.2.6 Teorema (Tichonov) Se {Xα }α∈A è una famiglia di spazi compatti allora il prodotto topologico
Y
X :=
Xα
α∈A
è compatto.
Dimostrazione: Dimostriamo la compattezza verificando la (4) della proposizione precedente. Sia dunque {xβ }β∈B una successione generalizzata in X: costruiremo una sottosuccessione tale che, se il suo insieme di punti limite è non
vuoto, sia convergente. Sia
Eβ := {xβ 0 }β 0 >β
La famiglia {Eβ } gode per definizione della proprietà dell’intersezione finita e
soddisfa alle ipotesi del lemma di Zorn: ne segue che esiste una famiglia G ⊂ P(X)
massimale rispetto alla proprietà dell’intersezione finita ed alla
{Eβ }β∈B ⊂ G
Se β ∈ B e M ∈ G sono tali che M ∩ Eβ 6= ∅ e se fβ,M ∈ B è tale che fβ,M > β e
xfβ,M ∈ M allora l’insieme B × G è parzialmente ordinato dalla relazione
(β, M ) > (β 0 , M 0 ) ⇐⇒ β > β 0 e M ⊂ M 0
35
2.2. Spazi compatti
e la sottosuccessione
{xfη }η∈B×G ⊂ {xβ }β∈B
converge oppure non ha punti limite.
Dato che Xα è compatto, la successione
{pα (xfη,M )}η∈B×G
(ove pα : X −→ Xα sono le proiezioni canoniche) ha un punto limite xα : definiamo
allora
x = (xα )α∈A ∈ X
Dimostriamo che si tratta di un punto limite per {xβ }β∈B : se A0 ⊂ A è un
sottoinsieme finito, e, per α ∈ A0 : Uα un intorno di xα , se
\
U :=
p−1
α (Uα )
α∈A0
Evidentemente, al variare di α ∈ A0 e degli Uα , U descrive una base di intorni
di x in X. Quindi per dimostrare che x è un punto limite per {xβ }β∈B , basta
dimostrare che
∀β ∈ B Eβ ∩ U 6= ∅
i.e. che se α ∈ A0 allora p−1
α (Uα ) ∈ G (dato che G ha la proprietà dell’intersezione
finita, ed Eβ ∈ G). Ma questo equivale a dimostrare che
∀α ∈ A M ∩ p−1
α (Uα ) 6= ∅
ovvero, essendo M ∈ G e G massimale, che
∀α ∈ A pα (M ) ∩ Uα 6= ∅
Ma xα è un punto limite per la successione {pα (xfη,M )}η∈B×G e Uα è un intorno
di xα : quindi, per ogni η = (β, M ) ∈ B × G esiste un η 0 > η tale che
pα (xfη0 ) ∈ Uα
Dunque pα (M ) ∩ Uα 6= ∅.
qed
2.2.7 Proposizione Se X è uno spazio topologico compatto e F ⊂ X un sottospazio chiuso allora F è compatto. Se inoltre X è di Hausdorff, un sottospazio
F ⊂ X compatto è necessariamente chiuso.
36
Capitolo 2. Topologie
Dimostrazione: La prima asserzione è ovvia: se F non fosse compatto esisterebbe
T una famiglia G di chiusi in F con la proprietà dell’intersezione finita tale
che G = ∅; ma un sottoinsieme chiuso di un sottoinsieme chiuso è chiuso, quindi
la famiglia G è una famiglia di chiusi di X che ne contraddice la compattezza.
Viceversa, se F è compatto in X e x ∈ F esiste una successione generalizzata
{xα } ⊂ F convergente a x: dato che F è compatto la successione ammette un
limite x0 ∈ F e, essendo X di Hausdorff, deve aversi x = x0 .
qed
2.2.8 Proposizione Se K è compatto e f : K −→ X è continua a valori nello
spazio topologico X allora l’immagine f (K) di K tramite la f è un sottospazio
compatto di X.
Dimostrazione: Se A è un ricoprimento aperto di f (K) allora {f −1 (U )}U ∈A
è un ricoprimento aperto di K, dal quale possiamo estrarne uno {f −1 (Uα1 ), ...,
f −1 (Uαn )} finito: è ovvio che allora {Uα1 , ..., Uαn } è un ricoprimento finito estratto
da A.
qed
2.2.9 Corollario Siano K uno spazio topologico compatto e X uno spazio di
Hausdorff:
(1) Una funzione continua f : K −→ R sulla retta reale (con la topologia
naturale) ammette massimo e minimo.
(2) Una funzione continua ed iniettiva f : K −→ X è chiusa.
(3) Una funzione continua e biunivoca f : K −→ X è un omeomorfismo.
Dimostrazione:
(1) Dato che f (K) è compatto è chiuso e limitato in R, quindi ammette
massimo e minimo per il classico teorema di Weierstrass.
(2) Se F ⊂ K è chiuso è pure compatto, quindi lo è f (F ) che risulta essere
chiuso, perché X è di Hausdorff.
(3) Segue immediatamente da (2).
qed
Il terzo punto del corollario fornisce un criterio utilissimo per determinare
se due spazi topologici sono omeomorfi e quindi, dal punto di vista topologico,
equivalenti: ad esempio
2.2. Spazi compatti
37
2.2.10 Corollario Se X è un insieme ed è uno spazio topologico rispetto a due
diverse topologie T e T 0 e se rispetto alla topologia T è uno spazio compatto
e rispetto alla topologia T 0 è uno spazio di Hausdorff allora la mappa identica
id : (X, T ) −→ (X, T 0 ) è continua se e solo se T 0 < T .
In altri termini: la topologia che rende uno spazio X compatto è minima nel
reticolo delle topologie di Hausdorff su X.
2.2.11 Definizione Uno spazio topologico è localmente compatto se ogni suo
punto possiede un intorno la cui chiusura è compatta.
2.2.12 Esempio Rn è localmente compatto, perché se x ∈ Rn basta considerare
l’intorno {y ∈ Rn | |x − y| ≤ 1}, che è compatto, essendo una sfera (chiuso e
limitato in Rn ).
2.2.13 Teorema Uno spazio localmente compatto è regolare.
Dimostrazione: Se x ∈ X e F ⊂ X è un chiuso (non contenente x), allora x
appartiene all’aperto X \ F e, per locale compattezza, esiste un intorno Vx di x a
tale che Vx ⊂ X \ F , quindi Vx ∩ F = ∅. Ora costruiamo un aperto che contenga
F e sia disgiunto da Vx : se y ∈F esiste certamente un intorno US
y di y disgiunto da
Vx (dato che X è in particolare T2 e Vx è compatto) e UF := y∈F Uy è l’aperto
richiesto.
qed
2.2.14 Definizione Se X è uno spazio topologico, una compattificazione per X
è uno spazio compatto CX dotato di una immersione continua i : X ,→ CX tale
che i(X) = CX.
Lo spazio Rn non è compatto, mentre lo spazio proiettivo PnR sı̀: lo spazio
proiettivo si può ottenere quozientando la sfera S n ⊂ Rn+1 identificandone i
punti antipodali: questa è una mappa continua e la sfera è compatta, quindi,
per la proposizione 2.2.8, il quoziente è compatto; dato che PnR può vedersi come Rn con aggiunto un “piano improprio”, vediamo che si tratta di una sua
compattificazione.
2.2.15 Definizione Se X è uno spazio topologico, una sua compattificazione di
Alexandroff (o compattificazione a un punto) è una compattificazione X 0 = X ∪
{ξ} ottenuta aggiungendo un punto ξ all’insieme X e dotando l’unione X ∪ {ξ}
di una topologia per la quale ξ non sia un punto isolato.
L’esempio più elementare è la sfera S n , che è la compattificazione a un punto
dello spazio Rn .
38
Capitolo 2. Topologie
2.2.16 Teorema (Alexandroff) Uno spazio topologico X ammette una compattificazione di Alexandroff se e solo se è localmente compatto. In questo caso
la topologia di X determina univocamente la topologia di X 0 e, come sottospazio
di X 0 , X ha la topologia relativa.
Dimostrazione: Se X 0 = X ∪ {ξ} è una compattificazione di Alexandroff di X,
X è aperto in X 0 (ovviamente ogni suo punto contiene un intorno interamente
contenuto in X): in particolare, per ogni x∈X esiste un intorno Ux nella topologia
di X 0 ; essendo X 0 compatto, anche Ux lo è, quindi ogni punto di x ha un intorno
a chiusura compatta.
Viceversa, sia X è localmente compatto (diciamo T la sua topologia) e
consideriamo sull’insieme X 0 = X ∪ {ξ} la topologia
T 0 := T ∪ {A ∪ {ξ} | A ∈ T e X \ A compatto}
(la famiglia degli aperti il cui complementare sia compatto è non vuota per locale
compattezza di X). Che si tratti di una topologia su X 0 è immediato. Verifichiamo
che è compatta: se {Uα } è un ricoprimento di X 0 , deve esistere un Uα0 contenente
ξ e quindi Uα0 = A ∪ {ξ} per un certo aperto di X a complementare compatto.
Ma allora il ricoprimento {Uα } \ {Uα0 } ricopre X \ A, che è compatto, quindi
se ne può estrarre un ricoprimento finito: aggiungendo a questo ricoprimento
finito l’insieme {Uα0 } si ottiene un sottoricoprimento finito di {Uα }. Quindi X 0
è compatto.
qed
Evidentemente la compattificazione di Alexandroff di uno spazio localmente
compatto è unica a meno di omeomorfismi: si tratta effettivamente di un funtore:
2.2.17 Definizione Una funzione f : X −→ Y fra spazi topologici si dice
propria se per ogni compatto K ⊂ Y , f −1 (K) è compatto.
Le funzioni proprie sono esattamente quelle estendibili da uno spazio compatto alla sua compattificazione di Alexandroff in modo che i punti aggiunti nella
compattificazione si corrispondano: quindi la compattificazione di Alexandroff è
un funtore dalla categoria i cui oggetti sono gli spazi di Hausdorff localmente
compatti ed i cui morfismi le funzioni proprie nella categoria i cui oggetti sono
gli spazi compatti ed i morfismi le funzioni continue.
Osserviamo che X è Hausdorff se e solo se X 0 lo è.
2.3
Spazi normali e generalizzazioni della compattezza
Ricordiamo che uno spazio topologico X è normale se è T1 ed è possibile
separare due chiusi disgiunti in X con aperti disgiunti.
2.3. Spazi normali e generalizzazioni della compattezza
39
2.3.1 Proposizione Uno spazio di Hausdorff X compatto è normale.
Dimostrazione: Se F1 , F2 ⊂ X sono chiusi e disgiunti e sia y2 ∈ F2 . Allora,
essendo X di Hausdorff, per ogni x ∈ F1 esistono intorni disgiunti Ux (y) di y e
Uy (x) di x: per compattezza di F1 (è un chiuso in un compatto), dal ricoprimento
{Uy (x)}x∈F1 se ne può estrarre uno finito {Uy (x1 ), ..., Uy (xn )}. Poniamo
Ay := Uy (x1 ) ∪ ... ∪ Uy (xn ) ⊃ F1
Wy := Ux1 (y) ∪ ... ∪ Uxn (y)
Per definizione Wy è un intorno di y e per compattezza di F2 dal ricoprimento
{Wy }y∈F2 possiamo estrarne uno finito {Wy1 , ..., Wym }. Poniamo allora
A1 := Ay1 ∩ ... ∩ Aym A2
:= Wy1 ∪ ... ∪ Wym
A1 e A2 sono ovviamente aperti disgiunti, tali che F1 ⊂ A1 e F2 ⊂ A2 .
qed
2.3.2 Lemma (Urysohn) Se X è uno spazio normale e F0 , F1 ⊂ X chiusi
disgiunti in X allora esiste una funzione continua f : X −→ [0, 1] tale che
f |F1 = 0 e f |F2 = 1.
Dimostrazione: Notiamo intanto il
2.3.3 Sublemma Se F è un chiuso e A è un aperto in X tali che F ⊂ A allora
esiste un aperto B ⊂ X tale che
F ⊂B⊂B⊂A
Infatti i chiusi F e {A sono disgiunti e quindi per normalità di X esistono
due aperti disgiunti B ⊃ F e B 0 ⊃ {A che li separano. Dunque B ∩ B 0 = ∅ e
F ⊂ B ⊂ {B 0 ⊂ A.
Usiamo questo fatto nel caso in cui F = F0 e A = A1 = {F1 : esiste allora un
aperto A0 tale che
F0 ⊂ A0 ⊂ A0 ⊂ A1 = {F0
Applichiamo nuovamente il sublemma con F = {A0 e A = A1 ottenendo un aperto A 1 . Iterando il procedimento, possiamo costruire per ogni numero razionale
2
diadico r ∈ [0, 1] (i.e. della forma k/2n con k = 0, ..., 2n ) un aperto Ar tale che
∀s > r
Ar ⊂ As
40
Capitolo 2. Topologie
Poniamo quindi per ogni numero reale t ∈ [0, 1]:
[
Ay :=
Ar
r≤t
r razionale diadico
Evidentemente si ha ancora la proprietà
(M )
∀u > t At ⊂ Au
Se 0 ≤ t1 < t2 ≤ 1 e r1 , r2 sono razionali diadici tali che t1 < r1 < r2 < t2 allora
At1 ⊂ Ar1 e Ar2 ⊂ At2 per definizione, mentre per la proprietà (M):
Ar1 ⊂ Ar2
Se poniamo
e
(
1
f (x) :=
inf x∈At t
At1 ⊂ At2
se x ∈ F1
se x ∈ A1
allora f : X −→ [0, 1] è una funzione che, ristretta a F0 vale identicamente 0
(dato che F0 ⊂ A0 ) e che ristretta a F1 vale identicamente 1. Resta da provare
che è continua.
Dimostriamo quindi che la controimmagine f −1 (t1 , t2 ) di un intervallo aperto
di [0, 1] è un aperto di X. Intanto, se t, t0 ∈ [0, 1]:
f −1 (t0 , t) ⊂ At \ At0 ⊂ f −1 [t0 , t]
Infatti se x ∈ At ⊂ At allora f (x) ≤ t e, viceversa, se f (x) < t0 deve aversi x ∈ At0 .
Se quindi t < f (x) e t0 ≤ f (x) si ha che x ∈
/ At ∪ At0 e, per la (M) si hanno le
inclusione volute.
A questo punto non resta che osservare che
[
f −1 (t1 , t2 ) =
At \ At0
t2 <t0 <t<t1
e che At \ At0 è ovviamente aperto.
qed
Ovviamente non è necessario che il codominio della funzione sia l’intervallo
[0, 1]: se consideriamo un intervallo [a, b] evidentemente la funzione ga,b (x) :=
(b − a)f (x) + a ha valori in [a, b] ed è tale che g|F0 = a e g|F1 = b.
2.3.4 Teorema (Tietze) Se X è uno spazio normale, A un chiuso in X e
f : A −→ R una funzione continua e limitata allora esiste una funzione continua
F : X −→ R tale che F |A = f e supa∈A |f (a)| = supx∈X |F (x)|.
2.3. Spazi normali e generalizzazioni della compattezza
41
Dimostrazione: Costruiremo la funzione F come limite di una opportuna
successione; poniamo f0 := f e, per a0 := supa∈A |f (a)|:
n
n
a0 o
a0 o
A0 := a ∈ A | f0 (a) ≤ −
e
B0 := a ∈ A | f0 (a) ≥
3
3
Evidentemente A0 e B0 sono chiusi e disgiunti: per il lemma di Urysohn esiste
quindi una funzione continua g0 : X −→ R tale che |g0 (x)| ≤ a30 e
(
− a0 se x ∈ A0
g0 (x) = a0 3
se x ∈ B0
3
Poniamo ora f1 := f0 −g0 : si tratta di una funzione continua a valori reali tale che
a1 := supa∈A |f1 (a)| ≤ 23 a0 . Iterando allora il procedimento possiamo costruire
degli insiemi chiusi e disgiunti A1 e B1 ed una funzione g1 con |g1 | ≤ a31 che valga
−a1 /3 su A1 e a1 /3 su B1 , e cosı̀ via.
Quello che si ottiene è una successione {fn } di funzioni reali e continue su A
ed una successione {gn } di funzioni reali e continue su X tali che
an
fn+1 = fn − gn
e
|gn (x)| ≤
3
2
con an+1 ≤ 3 an e an := supa∈A |fn (a)|. Quindi
µ ¶n
µ ¶n
2
a0
2
a0
e
|gn (x)| ≤
|fn (a)| ≤
3
3
3
P
Ne segue che la serie n≥0 gn (x) = converge assolutamente ed uniformemente
ad una funzione F perciò continua e reale su X. Ovviamente
∞ µ ¶n
X
2
a0
|F (x)| ≤
= a0
3
3
n=0
Si noti che, se x ∈ A, per definizione si ha F (x) = f0 (x) = f (x).
qed
In particolare, per la proposizione data in precedenza, il teorema di Tietze si
applica agli spazi compatti di Hausdorff: in questo caso non è necessario assumere
che f sia limitata, visto che, essendo continua e definita in un compatto, deve
esserlo necessariamente.
Consideriamo ora collezioni di funzioni su uno spazio X localmente compatto
di Hausdorff: ricordiamo che, se f : X −→ R, il supporto si f è l’insieme chiuso
supp f := {x ∈ X | f (x) 6= 0}
Diciamo che una collezione {ϕα } di funzioni continue reali su X è subordinata
ad un ricoprimento {Aβ } di aperti di X se per ogni α esiste un β tale che
supp ϕα ⊂ Aβ .
42
Capitolo 2. Topologie
2.3.5 Teorema (Partizione dell’unità) Sia X uno spazio localmente compatto di Hausdorff, K in sottoinsieme compatto e {Aα } un ricoprimento aperto
di K; allora esiste una collezione finita {ϕ1 , ..., ϕn } di funzioni continue reali non
negative subordinate alla collezione {Aα } e tali che
ϕ1 + ϕ2 + ... + ϕn = 1
su K.
Dimostrazione: Sia A un aperto tale che K ⊂ A e A sia compatto; allora per
ogni k ∈ K esiste una funzione continua reale fk tale che
(1) per ogni x ∈ X: 0 ≤ f (x) ≤ 1;
(2) fk (k) = 1
(3) esiste β tale che supp fk ⊂ A ∩ Aβ .
Per ciascun k ∈ A \ K sia gk la funzione reale continua tale che
(1) per ogni x ∈ X: 0 ≤ g(x) ≤ 1;
(2) gk (k) = 1
(3) supp gk ⊂ {K
Ma A è compatto, quindi esiste un numero finito di funzioni f1 ,...,fn ,g1 ,...,gm tali
che gli insiemi sui quali assumano valori positivi ricoprano A. Poniamo allora
f :=
n
X
fi
e
g :=
m
X
gj
j=1
i=1
Si ha ovviamente che, su K, f > 0, supp f ⊂ A e su A: f + g > 0 e g|K = 0.
Quindi
f
f +g
è continua e ristretta a K è identicamente 1: basta prendere allora
ϕi :=
fi
f +g
per avere la tesi
qed
2.3. Spazi normali e generalizzazioni della compattezza
43
La costruzione effettuata in questa proposizione può farsi, ad esempio in Rn ,
considerando funzioni differenziabili e non semplicemente continue. In questo
caso la possibilità di definire una partizione dell’unità differenziabile4 è legata
ad un’altra proprietà di Rn che si può assiomatizzare per uno spazio topologico
qualunque:
2.3.6 Definizione Una famiglia U di sottoinsiemi di uno spazio topologico X
si dice localmente finita se per ogni x∈ esiste un intorno U 3 x la cui intersezione con gli elementi di U sia non vuota solo per un numero finito di essi. Uno
spazio topologico si dice paracompatto se ogni ricoprimento aperto possiede un
raffinamento localmente finito.
Ricordiamo che un raffinamento di un ricoprimento U è un ricoprimento V
tale che ogni elemento di V è contenuto in qualche elemento di U: in questo modo
la relazione di raffinamento introduce un ordine parziale fra i ricoprimenti di uno
spazio.
Ovviamente uno spazio compatto è paracompatto; uno spazio localmente
compatto non è necessariamente paracompatto, ma lo è se possiede un’altra
proprietà che generalizza la compattezza:
2.3.7 Definizione Uno spazio topologico è σ-compatto se è unione numerabile
di sottospazi compatti.
Vale allora il
2.3.8 Lemma Se X è uno spazio di Hausdorff localmente compatto allora le
seguenti proposizioni sono equivalenti:
(1) Da ogni ricoprimento aperto di X se ne può estrarre uno numerabile (uno
spazio con questa proprietà si dice di Lindelöf).
(2) X è σ-compatto.
(3) Esiste una successione {An } di aperti a chiusura compatta tali che:
An ⊂ An+1
e
X=
[
An
n
(4) Esiste una funzione continua e propria ϕ : X −→ (0, ∞).
4
Cosa per la quale si rimanda ai testi specialistici di Geometria Differenziale, ad esempio
[17], pp. 272–274.
44
Capitolo 2. Topologie
Dimostrazione: (1) implica (2) dato che se X si può ricoprire con una famiglia
di aperti a chiusura compatta (essendo localmente compatto) allora possiamo
estrarne un sottoricoprimento numerabile le chiusure dei cui elementi forniscono
la famiglia numerabile desiderata. S
(2) implica (3) perché se X = n Kn con Kn compatti, possiamo prendere
come A1 un aperto a chiusura compatta tale che K ⊂ A1 e procedere induttivamente, prendendo come An un aperto a chiusura compatta contenuto in Kn ∪An−1
ottenendo cosı̀ la successione voluta.
(3) implica (4) ovviamente: basti prendere una famiglia {ϕn } di funzioni reali
a supporti contenuti in An e tali che ϕn |An−1 = 1 e porre
∞
X
ϕ :=
(1 − ϕn )
n=1
Infine (4) implicaS (1) perché se ϕ : X −→ (0, ∞) è una mappa propria
continua allora X = n Kn con Kn = ϕ−1 ([0, n]): si tratta di compatti perché ϕ è
propria. Dunque ogni ricoprimentoSaperto U di X ammette un sottoricoprimento
finito Un che ricopre Kn e quindi n Un è il ricoprimento numerabile richiesto.
qed
2.3.9 Teorema Se X è uno spazio localmente compatto e σ-compatto allora è
paracompatto.
Dimostrazione: Sia U un ricoprimento aperto di X e {An } una famiglia come
nella (3) del teorema precedente. Se Un è la famiglia degli insiemi
Un = {U ∩ (An+1 \ An−2 )}U ∈U
allora ogni Un è un raffinamento di U ed è un ricoprimento degli insiemi compatti
fn
A − n \ An−1 : quindi, per compattezza, possiede un sottoricoprimento finito U
S
S f
di Kn . Ma X = n Kn , quindi V := n Un è un ricoprimento numerabile di X
ed è un raffinamento di U.
Ora, dato che per ogni x ∈ X esiste n ∈ N tale che x ∈ An \ An−2 e dato che
fk (che
questi aperti possono intersecare soltanto quattro elementi della famiglia U
è una famiglia finita) ne segue che An \ An−2 interseca solo un numero finito di
elementi di V. In altre parole, V è localmente finito.
qed
2.4
Spazi connessi e localmente connessi
Una nozione fondamentale che abbiamo trascurato fin qui è quella di spazio
connesso.
2.4. Spazi connessi e localmente connessi
45
2.4.1 Definizione Uno spazio topologico (X, T ) si dice connesso non è unione
di due suoi aperti A, B ∈ T disgiunti (A ∩ B = ∅) non banali.
In altri termini, se X = A ∪ B con A, B ∈ T e A ∩ B = ∅ allora A e B devono
essere ∅ o X.
2.4.2 Proposizione Uno spazio è connesso se e solo se non esistono sottoinsiemi S propri (S 6= X, ∅) tali che S sia aperto e chiuso allo stesso tempo.
Dimostrazione: In effetti se S è chiuso e aperto allora X = S ∪ {S è unione
di aperti propri disgiunti e quindi non è connesso. Se X non è connesso allora
esistono A, B ∈ T con A ∩ B = ∅ e X = A ∪ B: ma allora A = {B è chiuso
(essendo il complementare di un aperto) e aperto (per ipotesi).
qed
2.4.3 Esempio Un insieme X non ridotto ad un sol punto (e.g. X = N) con la
topologia discreta non è connesso.
Diamo qualche altro esempio di di insieme connesso.
2.4.4 Teorema Un segmento [a, b] ⊂ R è connesso.
Dimostrazione: Sia per assurdo5 [a, b] = A ∪ B con A ∩ B = ∅ aperti e
supponiamo ad esempio a ∈ A; allora, si ricordi che A è aperto, i segmenti [a, ε)
per ε abbastanza piccolo sono contenuti in A; possiamo allora considerare il sup
di questi ε: sia esso a0 . Ovviamente a0 6= b (altrimenti [a, b) ⊂ A e quindi A = [a, b]
dato che B deve essere aperto e quindi non può essere {b}).
Dunque: a0 ∈
/ B (perché A e B sono aperti disgiunti); quindi deve essere
0
a ∈ A. Ma allora esiste un intorno di a0 contenuto in [a, b) (a 6= b) e quindi deve
esistere un a00 > a0 tale che [a, a00 ) ⊂ A, il che è assurdo per definizione di a0 .
Ne segue che a0 ∈ A e quindi A = [a, b] e B = ∅.
qed
Dalla seguente combinazione di proposizione e teorema segue in particolare
la connessione degli spazi Rn :
2.4.5 Proposizione Se f : X −→ Y è continua fra spazi topologici e X è
connesso allora f (X) è connesso.
5
Quasi tutte le dimostrazioni sugli spazi connessi si fanno per assurdo...
46
Capitolo 2. Topologie
Dimostrazione: Sia f (X) = A ∪ B con A, B aperti disgiunti in f (X) (con la
topologia relativa di X); allora f −1 (A), f −1 (B) sono aperti in X (dato che f è
continua) tali che
X = f −1 (f (X)) = f −1 (A)∪f −1 (B)
e
f −1 (A)∩f −1 (B) = f −1 (A∩B) = ∅
Ne segue che X non è connesso.
qed
Questa proposizione implica che la connessione è una proprietà topologica:
se X e Y sono omeomorfi allora X è connesso se e solo se Y è connesso.
2.4.6 Teorema Un sottoinsieme convesso X ⊂ Rn è connesso.
Dimostrazione: Per assurdo, sia X = A ∪ B e siano a ∈ A e b ∈ B; allora, dato
che X è convesso, il segmento ab è contenuto in X e quindi ab = (ab∩A)∪(ab∩B)
contraddice la connessione del segmento ab (per la proposizione e la connessione
di un segmento in R).
qed
n
In particolare R è convesso, quindi è connesso. Inoltre il classico teorema di
Bolzano del valor medio ammette una generalizzazione agli spazi connessi:
2.4.7 Teorema Se f : X −→ R è una funzione continua da uno spazio topologico connesso alla retta reale, e se x, y ∈ X e c ∈ R sono tali che
f (x) < c < f (y)
allora esiste z ∈ X tale che f (z) = c.
Dimostrazione: Se un tale z non esistesse, gli insiemi f −1 ((−∞, c)) e f −1 ((c, ∞))
sarebbero aperti disgiunti in X e X ne risulterebbe unione, il che è assurdo perché
è connesso.
qed
Il seguente criterio è utile per verificare la connessione di uno spazio:
2.4.8 Proposizione Uno spazio X è connesso se per ogni x, y ∈ X esiste un
sottospazio C ⊂ X connesso tale che x, y ∈ C.
Dimostrazione: Sia X non è connesso per mezzo della decomposizione in aperti
X = A ∪ B (A ∩ B)∅), e siano a ∈ A e b ∈ B; allora esiste per ipotesi un connesso
C contenente sia a che b. Gli insiemi A − 1 = A ∩ C e B1 = B ∩ C sono
aperti e non vuoti in C (rispetto alla topologia relativa di C) ed ovviamente
C = C ∩ X = C ∩ (A ∪ B) = A1 ∪ B1 . Quindi C non è connesso, dato che
A1 ∩ B1 ⊂ A ∩ B = ∅, il che è assurdo.
qed
2.4. Spazi connessi e localmente connessi
47
Possiamo limitare la scelta di C, nella proposizione precedente, alle curve:
2.4.9 Definizione Un cammino fra x e y in uno spazio topologico X è una
funzione continua c : [0, 1] −→ X tale che c(0) = x e c(1) = y.
2.4.10 Esempio Una curva nel piano è un esempio di cammino: dato che [0, 1]
è connesso l’immagine di un cammino è connessa, e quindi soddisfa le ipotesi
della proposizione precedente.
2.4.11 Definizione Uno spazio topologico X è connesso per archi se per ogni
x, y ∈ X esiste un cammino fra x e y.
Possiamo allora riformulare il criterio precedente come
2.4.12 Teorema Uno spazio connesso per archi è connesso.
Si danno tuttavia esempi di insiemi connessi ma non connessi per archi:
2.4.13 Esempio Si consideri il sottoinsieme di R2
[ µ1 ¶µ1 ¶
,0
, 1 ∪ (0, 1)
X = (0, 0)(1, 0) ∪
n
n
n≥1
(il lettore dovrebbe provare a disegnarlo) ove P Q denota il segmento che unisce
i punti P e Q: allora X è connesso, ma il punto (0, 1) non può essere connesso
da alcun cammino agli altri punti di X.
2.4.14 Teorema Il prodotto di due spazi connessi è connesso.
Dimostrazione: Siano X e Y gli spazi connessi in questione e supponiamo che
X × Y = A ∪ B con A, B aperti disgiunti (propri). Possiamo supporre che A sia
connesso (se A = A1 ∪ A2 consideriamo A = A1 e B = A2 ∪ B, e cosı̀ via fino ad
ottenere A connesso).
Ora, se (x, y) ∈ A ⊂ X × Y i sottoinsiemi di X × Y dati da {x} × Y e
X × {y} sono connessi (perché omeomorfi a Y e X rispettivamente); quindi
{x} × Y ∩ A ⊂ A e X × {y} ∩ A ⊂ A (dato che A è connesso). Dunque, avendosi
[
X ×Y =
X × {y0 }
y0 ∈Y
esprimiamo X × Y come unione di sottoinsiemi di A, per cui B = ∅, il che è
assurdo.
qed
Questo teorema si estende, col medesimo ragionamento, al prodotto di insiemi
qualsiasi.
48
Capitolo 2. Topologie
Ora osserviamo che se uno spazio è connesso, è naturale tentare di decomporlo
in sottospazi connessi, come si è fatto nella dimostrazione del teorema precedente.
Se x∈X possiamo considerare la famiglia di tutti i sottoinsiemi connessi di X che
contengono x: dato che, per la proposizione 2.4.8, l’unione di due insiemi connessi
è connessa, l’insieme unione Cx della famiglia dei connessi che contengono x è
un insieme connesso “massimale” contenente x: ogni insieme più grande che
contenga x non può essere connesso.
Chiamiamo Cx componente connessa di X contenente y; ovviamente
∀y ∈ Cx
Cy = Cx
Inoltre la relazione x ∼ y ⇐⇒ Cx = Cy è di equivalenza, e le componenti
connesse ne sono le classi. Si noti che, se x, y ∈ X allora o Cx = Cy oppure
Cx ∩ Cy = ∅.
Evidentemente una componente connessa è chiusa, dato che Cx è un connesso
contenente Cx e quindi deve coincidere con esso. Quindi
2.4.15 Teorema Uno spazio topologico è unione disgiunta delle sue componenti
connesse.
Osserviamo che una componente connessa Cx non è necessariamente un aperto:
tuttavia
S se lo spazio X ha un numero finito di componenti connesse, allora X =
Cx ∪ y∈C
/ x Cy e quindi il complementare di Cx è una unione finita di chiusi,
quindi un chiuso, quindi Cx è aperto.
Si osservi inoltre che il numero di componenti connesse (in generale un numero
cardinale) è un invariante topologico dello spazio.
2.4.16 Definizione Uno spazio topologico si dice localmente connesso se possiede una base formata da connessi.
(In modo equivalente, ogni suo punto contiene un sistema di intorni connessi).
Non è affatto detto che uno spazio connesso sia localmente connesso: vale infatti
il
2.4.17 Teorema Uno spazio topologico X è localmente connesso se e solo se,
per ogni A aperto in X le componenti connesse di A sono aperti.
Questo segue dalla definizione: ogni aperto è unione di elementi di una base, che
può supporsi connessa.
2.5. Spazi semplicemente connessi
49
2.4.18 Esempio Lo spazio connesso ma non connesso per archi
[ µ1 ¶µ1 ¶
X = (0, 0)(1, 0) ∪
,0
, 1 ∪ (0, 1)
n
n
n≥1
visto in precedenza, non è neanche localmente connesso: infatti il punto (1, 0)
non possiede nessun sistema di intorni connessi.
I concetti di connessione e locale connessione sono quindi indipendenti: è
infatti facile esibire spazi localmente connessi ma non connessi, non connessi e
non localmente connessi e connessi e localmente connessi.
2.5
Spazi semplicemente connessi
Abbiamo visto come considerare cammini su uno spazio topologico sia utile,
ad esempio nel dimostrarne la connessione: è naturale chiedersi se la scelta di un
cammino possa essere arbitraria e, altrimenti, come distinguere fra cammini che
uniscano gli stessi punti. Una nozione utile per questo è la seguente
2.5.1 Definizione Due cammini c, c0 : [0, 1] −→ X che congiungano due stessi
punti x e y (i.e. c(0) = c0 (0) = x e c(1) = c0 (1) = y) si dicono omotopi se esiste
una funzione continua
F : [0, 1] × [0, 1] −→ X
tale che
∀t ∈ [0, 1] F (t, 0) = c(t) e F (t, 1) = c0 (t)
e
∀s ∈ [0, 1] F (0, s) = x e F (1, s) = y
Si scrive c ≈ c0 e si dice che F è una omotopia fra i due cammini x e y.
Intuitivamente due cammini sono omotopi se è possibile deformare (in modo continuo) l’uno sull’altro. Questa nozione è particolarmente significativa se i
cammini sono cicli i.e. se x = y: allora li immaginiamo come due “cappi” che
abbiano un punto in comune.
In particolare, se c0 (t) := x è il cammino costante cioè il cappio “degenere”
che coincide con x, un cammino è omotopo a c0 se è possibile “contrarlo” fino
a farlo sparire nel punto x: ad esempio questo non è possibile se il cammino c
racchiude un “buco” dello spazio:
Ovviamente l’omotopia è una relazione di equivalenza, e l’insieme delle classi
di equivalenza di cammini chiusi su un punto x0 si denota con π1 (X, x0 ), e si dice
gruppo fondamentale. Infatti vale il
50
Capitolo 2. Topologie
2.5.2 Teorema Rispetto alla composizione di cammini
(
c(2t)
se 0 ≤ t ≤ 12
cc0 (t) =
c0 (2t − 1) se 12 ≤ t ≤ 1
le classi di omotopia di cammini su un punto fissato formano un gruppo (potrebbe
essere un interessante esercizio per il lettore) con inverso
c−1 (t) = c(1 − t)
e con identità data dal cammino costante x0 .
Dimostrazione: Scriviamo esplicitamente le omotopie per dei cammini nelle
classi di equivalenza di π1 (X, x0 ): per dimostrare l’associatività del prodotto di
cammini c, c0 , c00 definiamo
¡ ¢
4t
se 0 ≤ t ≤ 14 (s + 1)
c s+1
F (t, s) := c0 (4t − s − 1) se 14 (s + 1) ≤ t ≤ 14 (s + 2)
00 ¡ 4t−s−2 ¢
c
se 14 (s + 2) ≤ t ≤ 1
2−s
che stabilisce una omotopia fra (cc0 )c00 e c(c0 c00 ). Per dimostrare che il cammino
costante x0 è l’elemento neutro definiamo
( ¡ ¢
2t
se 0 ≤ t ≤ s+1
c s+1
2
F (t, s) =
x0
se s+1
≤
t
≤
1
2
Infine il fatto che [c−1 ] è l’inverso di [c] segue definendo
se 0 ≤ 2t ≤ s
c(2t)
F (t, s) = c(s)
se s ≤ 2t ≤ 2 − s
−1
c (2t − 1) se 2 − s ≤ 2t ≤ 2
qed
Si verifica facilmente che, se lo spazio X è connesso per archi, al variare
del punto x0 , i gruppi fondamentali π1 (X, x0 ) sono isomorfi, e che quindi si può
parlare del gruppo fondamentale di uno spazio topologico connesso per archi: in
effetti se x − 1 è un altro punto e γ un cammino che connetta x0 con x1 allora la
mappa
γ∗ : [c] 7−→ [γcγ −1 ]
è un isomorfismo fra i gruppi fondamentali π1 (X, x0 ) e π1 (X, x1 ) (il suo inverso
è infatti (γ −1 )∗ ).
51
2.5. Spazi semplicemente connessi
Osserviamo che, se f : X −→ Y è una mappa continua fra spazi connessi per
archi tale che f (x0 ) = y0 allora esiste un morfismo di gruppi
f∗ : π1 (X, x0 ) −→ π1 (Y, y0 )
dato semplicemente da
f∗ ([c]) := [f ◦ c]
La mappa non dipende che dalla classe di omotopia: se c0 ≈ c allora esiste una
omotopia F fra c e c0 allora f ◦ F è una omotopia fra f ◦ c e f ◦ c0 .
Evidentemente, se X = Y allora
(idX )∗ = idπ1 (X,x0 )
e se f : X −→ Y e g : Y −→ Z sono continue e f (x0 ) = y0 e g(y0 ) = z0 allora
(g ◦ f )∗ = g∗ f∗
Dunque π1 (−, x0 ) è un funtore covariante dalla categoria degli spazi topologici
con un punto fissato (i cui oggetti sono le coppie (X, x0 ) e i cui morfismi le mappe
continue f : X −→ Y tali che f (x0 ) = y0 ) nella categoria dei gruppi.
2.5.3 Definizione Uno spazio topologico si dice semplicemente connesso se è
connesso per archi ed il suo gruppo fondamentale è banale (i.e. è ridotto all’identità {e}).
Vedremo fra breve come gli spazi Rn siano semplicemente connessi; prima
introduciamo il concetto di omotopia fra mappe.
2.5.4 Definizione Due mappe continue f, g : X −→ Y fra spazi topologici sono
omotope se esiste una mappa continua F : X × [0, 1] −→ Y tale che
∀x ∈ X
F (x, 0) = f (x)
e
F (x, 1) = g(x)
e si scrive f ≈ g.
Se X = [0, 1] otteniamo il concetto di omotopia fra cammini: quindi due mappe sono omotope se le loro immagini possono essere “deformate” l’una sull’altra.
Di nuovo l’omotopia fra mappe è una relazione di equivalenza sull’insieme delle funzioni continue da X in Y . Questa nozione può generalizzarsi ulteriormente
come segue:
52
Capitolo 2. Topologie
2.5.5 Definizione Due mappe continue f, g : X −→ Y fra spazi topologici sono
omotope relativamente ad un sottoinsieme A ⊂ X fissato se esiste una mappa
continua F : X × [0, 1] −→ Y tale che
∀x ∈ X
F (x, 0) = f (x)
e
F (x, 1) = g(x)
e
∀a ∈ A ∀t ∈ [0, 1] F (a, t) = f (a) = g(a)
e si scrive f ≈A g.
In particolare due mappe omotope relativamente a A coincidono su A. Se
A = ∅ ritroviamo la definizione di omotopia precedente.
Il seguente risultato è immediata conseguenza della definizione:
2.5.6 Teorema Se f, g : X −→ Y sono omotope relativamente all’insieme
{x0 } ⊂ X allora f∗ = g∗ .
Cioè f e g inducono lo stesso omomorfismo di gruppi π1 (X, x0 ) −→ π1 (Y.y0 )
ove y0 = f (x0 ) = g(x0 ).
2.5.7 Definizione Un sottoinsieme A ⊂ X di uno spazio topologico si dice retratto di X se esiste una mappa continua r : X −→ A tale che pre ogni a ∈ A
r(a) = a. r si dice ritrazione.
Si tratta di una nozione molto forte: ad esempio il cerchio S 1 = {(x, y) | x2 +
y 2 = 1} è un retratto del piano “bucato” R2 \ 0: basta considerare
r(x, y) :=
x2
1
(x, y)
+ y2
Le ritrazioni sono interessanti in omotopia per il seguente motivo: se r : X −→ A
è una ritrazione e i : A −→ X è l’inclusione (A ⊂ X) allora possiamo considerare,
fissato un a ∈ A, i morfismi di gruppi:
r∗ : π1 (X, a) −→ π1 (A, a)
i∗ : π1 (A, a) −→ π1 (X, a)
Dato che r ◦ i = idA allora r∗ i∗ = idπ1 (A,a) e da questo segue che i∗ è iniettivo
e r∗ suriettivo6 .
6
Se i∗ ([c]) = i∗ ([c0 ]) allora [c] = r∗ (i∗ ([c])) = r∗ (i([c0 ])) = [c0 ]; se [c] ∈ π1 (A, a) allora
[c0 ] = i∗ ([c]) ∈ π1 (X, a) è tale che r∗ ([c0 ]) = r∗ (i∗ ([c])) = [c].
2.5. Spazi semplicemente connessi
53
2.5.8 Definizione Un sottoinsieme A ⊂ X è un retratto di deformazione di X
se esistono una ritrazione r : X −→ A ed una omotopia F : X × [0, 1] −→ X
tali che
∀x ∈ X F (x, 0) = x
e
F (x, 1) = r(x)
e
∀a ∈ A ∀t ∈ [0, 1] F (a, t) = a
In altre parole, A è un retratto di deformazione se esiste una ritrazione r :
X −→ A che sia omotopa all’identità X −→ X.
2.5.9 Teorema Se A è un retratto di deformazione di X allora, per ogni a ∈ A,
l’inclusione i : A −→ X induce un isomorfismo fra i gruppi fondamentali π1 (A, a)
e π1 (X, a).
Dimostrazione: Sappiamo che r∗ i∗ è l’identità: basta mostrare quindi che anche
i∗ r∗ è l’identità per concludere che i∗ = r∗−1 è l’isomorfismo cercato. Ma i ◦ r è
omotopo alla mappa identità per ipotesi e quindi induce l’identità in omotopia
per il teorema 2.5.6.
qed
Questo semplice risultato è utilissimo per dimostrare che due spazi hanno lo
stesso gruppo fondamentale o per contraddire questo fatto.
2.5.10 Definizione Uno spazio topologico X è contraibile se esiste un punto
x ∈ X tale che {x} è un retratto di deformazione di X.
Se uno spazio è contraibile, dal punto di vista dell’omotopia è sostanzialmente
banale, come mostra la seguente immediata conseguenza del teorema precedente:
2.5.11 Corollario Se X è contraibile allora è semplicemente connesso.
2.5.12 Esempio Dimostriamo che ogni insieme convesso K in Rn è contraibile,
e quindi che è semplicemente connesso: questo in particolare si applica a Rn
stesso. Sia k0 ∈ K e definiamo una F : K × [0, 1] −→ K come
F (k, t) = (1 − t)k + tk0
(k e k0 sono elementi di Rn e con tk si intende la moltiplicazione di uno scalare
per un vettore). In altri termini, fissato k, F (k, t) descrive, al variare di t ∈ [0, 1]
il segmento kk0 che è contenuto in K (per convessità). È immediato che F è
continua e che F (k, 0) = k e F (k, 1) = k0 . Si tratta cioè dell’omotopia richiesta7
7
Si noti che il ragionamento funziona non solo con i convessi ma con i sottoinsiemi stellati,
cioè tali che esista un punto k0 tale che per ogni altro punto k il segmento kk0 è completamente
contenuto in K.
54
Capitolo 2. Topologie
2.5.13 Esempio La sfera S n è un retratto di deformazione di Rn+1 : basta
considerare la palla piena bucata
P := {x ∈ Rn+1 | 0 < |x| ≤ 1}
e definire l’omotopia F : P × [0, 1] −→ P come
F (p, t) = (1 − t)p + t
p
|p|
Ora dimostriamo un risultato fondamentale:
2.5.14 Teorema Il gruppo fondamentale del cerchio è infinito ciclico: π1 (S 1 ) =
Z.
Dimostrazione: Consideriamo il cerchio come immerso nel piano complesso
C = R2 :
S 1 = {z ∈ C | |z| = 1}
Allora esiste una funzione continua f : R −→ S 1
f (t) := e2πit
che è aperta: in effetti si tratta della proiezione di R sul quoziente S 1 = R/Z (il
nucleo di f è esattamente Z ed è suriettiva). Ora necessitiamo di un lemma
Lemma (del sollevamento). Se c : [0, 1] −→ S 1 è un cammino tale che
c(0) = 1 ∈ S 1 ⊂ C allora
(1) Esiste un unico cammino e
c : [0, 1] −→ R tale che e
c(0) = 0 e che f ◦ e
c=c
(e
c si dice sollevamento di c).
(2) Se c0 : [0, 1] −→ S 1 è un altro cammino con c0 (0) = 1 omotopo a c relativamente all’insieme {0, 1} ⊂ C per mezzo dell’omotopia F allora esiste
un’unica omotopia Fe fra e
c e ce0 relativamente all’insieme {0, 1} tale che
f ◦ Fe = F (Fe si dice sollevamento di F ).
Assumendo il lemma definiamo una mappa χ : π1 (S 1 , 1) −→ Z come
χ([c]) := e
c(1)
Per il lemma questa mappa è ben definita, infatti il punto e
c(1) non dipende da c
ma dalla sua classe di omotopia [c] (come affermato dalla (2)). Dimostriamo che
si tratta di un morfismo di gruppi: siano [c], [c0 ] ∈ π1 (S 1 , 1) e m = e
c(1), n = ce0 (1);
allora se γ : [0, 1] −→ R è il cammino da m a n dato da
γ(t) = ce0 (t) + m
55
2.5. Spazi semplicemente connessi
allora f ◦ γ = c0 e quindi e
cce0 è il sollevamento di cc0 con punto iniziale 0 e punto
terminale m + n. In altre parole:
χ([c][c0 ]) = χ([c])χ([c0 ])
χ è ovviamente suriettivo: se n ∈ Z allora per c(t) := f (nt) si ha χ([c]) = n; infine
χ è iniettivo: se χ([c]) = 0 allora e
c(1) = 0 i.e. e
c è un cammino chiuso in R; ma R
è contraibile, quindi questo cammino è omotopo al cammino costante 0, sicché
(per la (1) del lemma) c(t) = f (0) = 1 e quindi [c] è l’identità di π1 (S 1 , 1).
Dunque χ è un isomorfismo di gruppi.
Dimostriamo infine il lemma: ne dimostreremo ambo gli enunciati allo stesso
tempo. Scriveremo Y per [0, 1] oppure per [0, 1] × [0, 1], ϕ : Y −→ S 1 per c
oppure per F e 0 per 0 ∈ [0, 1] oppure per (0, 0) ∈ [0, 1] × [0, 1].
Dato che Y è compatto e ϕ continua, è uniformemente continua (teorema di
Heine–Cantor) i.e. esiste δ > 0 tale che, se |y − y 0 | < δ allora
|ϕ(y) − ϕ(y 0 )| < 1
In particolare ϕ(y) 6= −ϕ(y 0 ) e quindi è ben definita la funzione
µ
¶
ϕ(y)
λ
ϕ(y 0 )
ove λ : S 1 \ {1} −→ (− 12 , 12 ) è la funzione che inverte f (determinazione del
logaritmo naturale). Possiamo dunque trovare N ∈ N tale che
∀y ∈ Y
Poniamo allora
ϕ(y)
e
:= λ
Ã
ϕ(y)
¡ N −1 ¢
ϕ N y
!
|y| < N δ
à ¡
à ¡ ¢!
¢!
ϕ NN−1 y
ϕ N1 y
¡
¢ + .... + λ
+λ
ϕ(0)
ϕ NN−2 y
La funzione ϕ
e : Y −→ R è ovviamente continua e tale che
ϕ(0)
e =0
e
f ◦ϕ
e=ϕ
Dimostriamone ora l’unicità: nel caso ϕ = c, se esistesse ce0 : [0, 1] −→ R tale che
ce0 (0) = 0 e f ◦ ce0 = c allora e
c − ce0 sarebbe una funzione continua da Y nel nucleo
di f i.e. in Z; ma Y è connesso, quindi anche la sua immagine per una mappa
continua lo è, e se ne deduce che e
c − ce0 è costante, i.e. e
c = ce0 .
0
Nel caso ϕ = F , Fe è una omotopia fra c e c : lo è infatti relativamente al
sottoinsieme {0, 1} e, su 0 × [0, 1]: f ◦ Fe = F = 1, quindi Fe(0 × [0, 1]) ⊂ Z e
quindi, di nuovo per connessione di, Fe(0 × [0, 1]) = 0. In modo analogo anche
Fe(1 × [0, 1]) è costante.
qed
56
Capitolo 2. Topologie
Come corollario diamo uno dei più famosi teoremi della topologia generale,
una cui dimostrazione elementare si rivelerebbe sorprendentemente complicata.
2.5.15 Teorema (del punto fisso di Brouwer) Se E n = {x∈Rn | |x| ≤ 1}
è la palla piena di centro l’origine e raggio 1 in Rn allora ogni mappa continua
f : E n −→ E n ha un punto fisso, i.e. esiste x ∈ E n tale che f (x) = x.
Dimostreremo questo teorema solo per n = 2: il caso generale richiede (seppure nei suoi sviluppi elementari) la nozione di omologia.
Quello che ci serve è il seguente
2.5.16 Lemma Il cerchio S 1 non è retratto di deformazione di E 1 .
Dimostrazione: Supponiamo che esista una ritrazione r : E 2 −→ S 1 tale che
R|S 1 = idS 1 ; allora, se i : S 1 −→ E 2 è l’inclusione, la mappa in omotopia r∗ i∗ è
l’identità del gruppo Z. Ma è
π1 (S 1 )
i∗
/ π (E 2 )
1
r∗
/ π (S 1 )
1
Z
i∗
/0
r∗
/Z
e quindi r∗ = i∗ = 0, il che è assurdo.
qed
Il teorema di Brouwer si dimostra ora in modo agevolissimo: supponiamo che
f : E 2 −→ E 2 non abbia nessun punto fisso: quindi per ogni x ∈ E 2 , f (x) 6= x.
Possiamo dunque considerare la retta che passa pe i punti f (x) e x: questa retta
incontrerà il cerchio S 1 (che è il bordo di E 2 ) in due punti; consideriamo fra
questi due punti quello più vicino a x (stiamo su un segmento: basta prendere
il punto di S 1 che è dall’altra parte di f (x) rispetto a x) e chiamiamolo r(x).
Abbiamo cosı̀ definito una funzione r : E 2 −→ S 1 che è continua (lo è f ) e che
ristretta a S 1 è l’identità, cioè una ritrazione di E 2 su S 1 , che non può esistere
per il teorema precedente.
qed
Capitolo 3
METRICHE
In molti esempi la topologia può definirsi in termini del concetto di “distanza
fra due punti”, e le topologie indotte da distanze caratterizzano gli spazi utilizzati
nell’analisi (spazi euclidei, di Hilbert, di Banach etc.). Richiamiamo qui le nozioni
fondamentali sugli spazi metrici ponendo l’accento sulle nozioni di completezza
e compattezza, e sul loro legame.
3.1
Spazi metrici
3.1.1 Definizione Se X è un insieme, una funzione d : X × X −→ R si dice
metrica se
(1) d(x, y) = d(y, x).
(2) d(x, y) = 0 ⇐⇒ x = y.
(3) d(x, y) ≤ d(x, z)+ ≤ d(z, y).
Uno spazio X equipaggiato di una metrica d si dice spazio metrico.
Ovviamente, in uno spazio metrico (X, d):
¯
¯
¯d(x, z) − d(z, y)¯ ≤ d(x, y)
(30 )
In particolare, d(x, y) > 0 per x 6= y.
In uno spazio metrico (X, d) gli insiemi
Br (x) := {y ∈ X | d(x, y) < r}
si dicono palle aperte di centro x e raggio r; è immediato verificare che {Br (x)}x∈X
è una sottobase di aperti per una topologia che si dice indotta dalla metrica. Ad
57
58
Capitolo 3. Metriche
esempio, la topologia della retta reale è usualmente definita in questo modo, con
d(x, y) = |x − y|.
Si osservi che, nella topologia indotta dalla distanza, la funzione
x 7−→ d(x, y)
è continua per la (30 ).
3.1.2 Proposizione Uno spazio metrico è di Hausdorff.
Dimostrazione: Se x, y ∈ X sono distinti e hanno distanza positiva ε = d(x, y)
allora sono separabili dalle palle B 2ε (x) e B 2ε (y). In effetti se esistesse z ∈ B 2ε (x) ∩
B 2ε (y), avremmo
ε = d(x, y) ≤ d(x, z) + d(z, y) <
ε ε
+
2 2
che è assurdo a meno che ε = 0 i.e. x = y.
qed
Oltre a R e C con le topologie naturali l’esempio fondamentale è il seguente:
n
n
3.1.3 Esempio L’insieme delle funzioni C[0, 1] continue sull’intervallo [0, 1] ⊂ R
è uno spazio metrico rispetto alla metrica uniforme
d(f, g) := max |f (x) − g(x)|
x∈[0,1]
Questo dovrebbe essere ben noto dai rudimenti dell’Analisi: l’unico assioma non
immediato è la disuguaglianza triangolare, che segue da
|f (t) − h(t)| ≤ |f (t) − g(t)| + |g(t) − h(t)|
≤ max |f (t) − g(t)| + max |g(t) − h(t)|
t
t
È inoltre facile constatare come la convergenza in questo spazio metrico sia la
convergenza uniforme delle funzioni continue.
3.1.4 Esempio Lo spazio B[0, 1] delle funzioni qualsiasi f : [0, 1] −→ R limitate
è uno spazio metrico rispetto alla metrica
d(f, g) := sup |f (t) − g(t)|
t∈[0,1]
59
3.1. Spazi metrici
3.1.5 Esempio Siano (Xn , dn ) spazi metrici per n ∈ N; sul prodotto
X=
Y
Xn
n∈N
(che è uno spazio topologico con la topologia prodotto) consideriamo la metrica
d(x, y) :=
X 1 dn (xn , yn )
2n 1 + dn (xn , yn )
n∈N
(con xn indichiamo la n-sima componente di x: si rammenti che possiamo vedere
x come una funzione N −→ X, e scriviamo xn in luogo di x(n)).
t
Questa d è effettivamente una distanza: più in generale, la funzione f (t) := 1+t
verifica sempre la f (t + s) ≤ f (t) + f (s); inoltre è chiaro che d(x, y) = 0 implica
dn (xn , yn ) = 0 e quindi xn = yn dato che le dn sono distanze, i.e. x = y.
Ora questa distanza induce una topologia su X: si tratta esattamente della
topologia prodotto delle topologie indotte dalle distanze dn .
Per vederlo osserviamo intanto che, se Td è la topologia indotta dalla distanza
d su X e T è la topologia prodotto, allora Td < T : una palla aperta in X è certo
aperta in T , dato che le funzioni x 7−→ δn (x, x0 ) (con x0 fissato) sono continue e
quindi Br (x0 ) è certamente aperta.
Viceversa consideriamo la base di intorni di x0 ∈ X per T :
(
\
)
p−1
n (Br (pn (x0 )))
n∈I
I⊂N finito;r>0
(con pn : X −→ Xn denotiamo la proiezione sulla n-sima componente). Basta
far vedere che ogni elemento di questa base contiene una palla aperta di Td ; si
fissi quindi un elemento della base (i.e. si fissi un sottoinsieme finito I ⊂ N e un
r > 0) e si prenda il massimo intero N dell’insieme I: allora
2N r ≤
r
1+r
T
e quindi Br (x0 ) ∈ n∈I p−1
n (Br (pn (x0 ))).
Ad esempio, se ciascuno degli Xn è lo spazio metrico R con la distanza usuale,
il prodotto X è lo spazio delle successioni di numeri reali.
Nell’esempio precedente le funzioni pn : X −→ Xn non sono soltanto continue,
ma hanno anche un’ulteriore proprietà, espressa dalla seguente
60
Capitolo 3. Metriche
3.1.6 Definizione Se (X, d) e (X 0 , d0 ) sono spazi metrici, una funzione f :
X −→ X 0 si dice uniformemente continua se per ogni ε > 0 esiste un δε > 0 tale
che, per ogni scelta di x, y ∈ X tali che d(x, y) < δε , si abbia
d(f (x), f (y)) < ε
Ogni funzione uniformemente continua è anche continua (per definizione!) ma
non vale il viceversa: ad esempio, il classico teorema di Heine–Cantor afferma
che su un compatto in R ogni funzione continua è uniformemente continua; in
generale, su un intervallo qualsiasi, questo non è vero: basti considerare su [0, 1) ⊂
1
R la funzione h(t) = 1−t
.
3.1.7 Definizione Se (X, d) e (X 0 , d0 ) sono spazi metrici, una funzione f :
X −→ X 0 si dice isometrica (isometria) se
∀x, y ∈ X
d(f (x), f (y)) = d(x, y)
Una isometria è un drastico esempio di funzione uniformemente continua: si
noti ad esempio che una isometria è sempre iniettiva:
f (x) = f (y) ⇒ 0 = d(f (x), f (y)) = d(x, y) ⇒ x = y
Quindi se f : X −→ X 0 è una isometria, X è un “sottospazio metrico” di X 0 : se
f è anche suriettiva, gli spazi metrici si dicono isometrici. Due spazi isometrici
sono equivalenti dal punto di vista della teoria degli spazi metrici: sono inoltre
omeomorfi, perché una isometria suriettiva f : X −→ X 0 possiede una inversa,
che per definizione è pure una isometria:
d(f −1 (x0 ), f −1 (y 0 )) = d(f (f −1 (x0 )), f (f −1 (y 0 ))) = d(x0 , y 0 )
e quindi continua.
Se (X, d) è uno spazio metrico, x ∈ X e S ⊂ X definiamo
d(x, S) := inf d(x, y)
y∈S
(distanza del punto x dall’insieme S).
3.1.8 Teorema Uno spazio metrico è normale.
Dimostrazione: Se C, C 0 sono chiusi disgiunti in X dobbiamo trovare due
aperti disgiunti che li contengano. Basta porre
A := {x ∈ X | d(x, C) < d(x, C 0 )} e A0 := {x ∈ X | d(x, C 0 ) < d(x, C)}
61
3.1. Spazi metrici
Dato che d è continua si tratta di due insiemi aperti. Inoltre C ⊂ A e C 0 ⊂ A0 :
se x ∈ C allora 0 = d(x, C) < d(x, C 0 ) ed analogamente per C 0 . Infine A ∩ A0 = ∅:
se infatti x ∈ A ∩ A0 allora
d(x, C) < d(x, C 0 ) < d(x, C)
(abbiamo usato nell’ordine x ∈ A e x ∈ A0 ). Assurdo.
qed
Questo ci permette di dare molti esempi di spazi topologici non metrizzabili:
in particolare è naturale chiedersi quando uno spazio topologico è metrizzabile.
La risposta è contenuta nel classico
3.1.9 Teorema (Uryshon) Uno spazio T1 , regolare a base numerabile è metrizzabile.
Dimostrazione: Sappiamo già, lo abbiamo visto come esempio, che un prodotto
numerabile di spazi metrizzabili è metrizzabile. Ora usiamo il seguente
3.1.10 Lemma Se X è uno spazio topologico T1 e F è una famiglia di funzioni
continue f : X −→ Yf che separino punti e chiusi (i.e. per ogni x ∈ X e ogni
chiuso C ⊂ X esiste una funzione
Q zero in x e identicamente 1 su C) allora la
mappa di valutazione e : X −→ f ∈F Yf (definita come e(x)(f ) = f (x)) è un
omeomorfismo fra X e e(X).
Q
Dimostrazione: Se pf : f ∈F Yf −→ Yf è la proiezione sulla f -sima coordinata
(che è continua) allora pf ◦ e = f è continua e quindi lo è e; inoltre è una mappa
aperta: basta mostrare che l’immagine tramite e di un intorno aperto U di un
punto x ∈ X contiene l’intersezione di e(X) con un intorno di e(x); si scelga per
questo un elemento f ∈ F tale che f (x) ∈
/ f (X \ U ) (il che è possibile per le
ipotesi su F); l’insieme
Y
{y ∈
Yf | yf ∈
/ f (X \ U )}
f ∈F
è aperta e la sua intersezione con e(x) è ovviamente contenuta in e(U ). Dunque
e è una mappa aperta.
Infine, dato che i punti di X sono chiusi, è chiaro che e è iniettiva.
qed
Quello che abbiamo in mente è applicare questo lemma trovando per questo
una famiglia numerabile di funzioni continue definite da X a uno spazio metrico
Yf che separi i punti dai chiusi: ne dedurremo che X sarà omeomorfo ad uno
spazio metrico per tramite della mappa di valutazione, e quindi avremo la tesi
del teorema di Uryshon. Tutto quello che ci occorre è il seguente teorema di
immersione, interessante di per sé.
62
Capitolo 3. Metriche
3.1.11 Teorema Uno spazio T1 regolare a base numerabile è omeomorfo a un
sottospazio del cubo di Hilbert, i.e. del prodotto topologico numerabile [0, 1]ω di
copie dell’intervallo [0, 1] (che è uno spazio metrico perché lo è [0, 1]).
Dimostrazione: [0, 1]ω è lo spazio delle funzioni f : N −→ [0, 1]; quindi basta
dimostrare che esiste una famiglia numerabile di funzioni continue X −→ [0, 1]
che separi i punti dai chiusi di X.
Se B è una base numerabile per la topologia di X e
A := {(U, V ) ∈ B × B | U ⊂ V }
allora A è numerabile e per ogni (U, V ) ∈ A possiamo scegliere una funzione
continua che sia zero su U e 1 su X \ U (lemma di Uryshon); sia F la famiglia
di tutte queste funzioni continue, Ovviamente F è numerabile e non ci resta che
mostrare la proprietà di separazione. Se C ⊂ X è chiuso e x ∈ X \ C scegliamo
V ∈ B tale che x ∈ V ⊂ X \ C (C è una base) e U ∈ B tale che x ∈ U ⊂ V ; allora
(U, V ) ∈ A e, se f è il corrispondente elemento di F, allora f (x) = 0 e f |C = 1.
qed
3.2
Spazi metrici completi
Il concetto di uniforme continuità non ha luogo negli spazi topologici generali,
ed è mediato dalla teoria delle funzioni in R: un altro concetto che si ritrova in
questa teoria è quello di successione di Cauchy.
Consideriamo una successione {xn } in uno spazio metrico (X, d) che sia convergente al punto x: intuitivamente i punti xn si avvicinano (al crescere di n) a
x, quindi le loro distanze reciproche dovrebbero divenire sempre più piccole: in
effetti
d(xn , xm ) ≤ d(xn , x) + d(x, xn )
Dato che xn converge a x se e solo se d(x, xn ) converge a zero abbiamo che
(C)
lim
n,m−→∞
d(xn , xm ) = 0
Una successione che goda della proprietà (C) si dice di Cauchy. Una successione
di Cauchy che ammette dei punti limite converge, ed il limite è unico.
Ad esempio, in R, ogni successione di Cauchy converge: si dice che R è
completo nel senso della
3.2.1 Definizione Uno spazio metrico è completo se ogni successione di Cauchy
converge.
63
3.2. Spazi metrici completi
In generale non è vero: basti prendere Q con la metrica d(q, q 0 ) = |q − q 0 |: la
successione (1+ n1 )n non converge ad alcun numero razionale, pur essendo di Cauchy. Cantor costruı̀ i numeri reali proprio aggiungendo ai razionali i limiti delle
successioni di Cauchy: questo procedimento può darsi per ogni spazio metrico.
3.2.2 Esempio Il classico teorema di Weierstrass (del quale dimostreremo una
profonda generalizzazione) afferma che lo spazio delle funzioni P : [0, 1] −→ R
polinomiali rispetto alla metrica
d(P, Q) = sup |P (t) − Q(t)|
t∈[0,1]
è denso in C[0, 1], quindi non è completo.
3.2.3 Esempio Lo spazio C[a, b] delle funzioni continue f : [a, b] −→ R è completo: infatti se {fn } è una successione di Cauchy, allora per ogni ε > 0 e per
ogni x ∈ [a, b], esiste Nε ∈ N tale che se n, m > Nε si abbia
|fn (x) − fm (x)| < ε
Quindi la successione {fn } converge uniformemente ed il suo limite è dunque una
funzione continue f ∈ C[a, b]. Allora per m −→ ∞ nella disugualianza precedente
troviamo la
|fn (x) − f (x)| ≤ ε
e quindi che f è il limite di {fn } nella metrica di C[a, b].
Si noti che la completezza di uno spazio metrico è una nozione metrica e non
topologica: se consideriamo lo spazio [0, 1), questo non è completo: la successione
1 − n1 è di Cauchy ma si guarda dal convergere; lo spazio [0, ∞) (sempre con
la metrica abituale) è completo (facile esercizio). Ora, questi due spazi sono
omeomorfi. La funzione
1
h(t) =
1−t
già considerata è in effetti biunivoca e bicontinua fra [0, 1) e [0, ∞); ma non può
essere una isometria (dato che la completezza è una proprietà che si conserva per
isometrie). Si osservi inoltre che la successione di Cauchy 1 − n1 viene trasformata
da h nella successione n − 1 che non è di Cauchy.
Tutti questi accidenti derivano dall’essere h non uniformemente continua:
3.2.4 Proposizione Se f : X −→ X 0 è una funzione uniformemente continua
fra spazi metrici allora l’immagine, tramite f di una successione di Cauchy in
X, è una successione di Cauchy in X 0 ; inoltre se f è un omeomorfismo e sia f
che f −1 sono uniformemente continue allora X è completo se e solo se X 0 lo è.
(La dimostrazione si riduce ad applicare le definizioni).
64
Capitolo 3. Metriche
3.2.5 Teorema Se (X, d) è uno spazio metrico allora esiste uno spazio metrico
e completo ed una isometria i : X −→ X
e d)
e tale che i(X) è denso in X.
(X,
Dimostrazione: Consideriamo l’insieme C delle successioni di Cauchy di X, e
su di esso la relazione
{xn }R{x0n } ⇐⇒
(†)
lim d(xn , x0n ) = 0
n−→∞
Si tratta evidentemente di una relazione di equivalenza (la transitività segue da
d(xn , zn ) ≤ d(xn , yn ) + d(yn , zn ) = 0) e quindi possiamo considerare l’insieme
e delle classi di equivalenza di C modulo R.
quoziente X
e se x
e una metrica d:
e e se {xn } ∈ x
Definiamo su X
e, ye ∈ X,
e e {yn } ∈ ye allora
poniamo
e x, ye) := lim d(xn , yn )
d(e
n−→∞
Questo limite esiste perché la successione {d(xn , yn )} è di Cauchy in R:
d(xn , yn ) − d(xm , ym ) ≤ d(xn , ym ) + d(ym , yn ) − d(xm , ym )
< d(xn , ym ) − d(xm , ym ) + ε
≤ d(xn , xm ) + d(xm , ym ) − d(xm , ym ) + ε < ε + ε
e quindi converge, ed è ben definito perché, se {x0n } ∈ x
e e {yn0 } ∈ ye allora (usando
la disuguaglianza triangolare e la (†))
lim d(xn , yn ) = lim (d(xn , yn ) + d(xn , x0n ) + d(yn , yn0 )) ≥ lim d(x0n , yn0 )
n−→∞
n−→∞
n−→∞
e, viceversa (scambiando i ruoli delle variabili senza apice e quelle con apice):
lim d(x0n , yn0 ) ≥= lim d(xn , yn )
n−→∞
n−→∞
e x, ye) non dipende dalle successioni scelte in x
i.e. il valore d(e
e e ye, ma solo dalla
classe di equivalenza.
Che de sia una distanza segue passando al limite le proprietà della distanza
e e mostrando di nuovo che il calcolo non
d (usando i rappresentanti {xn } ∈ x
dipende da questa scelta ma solo dalla classe).
e sia completo segue dalla definizione: se {e
e d)
Che lo spazio (X,
xn } è di Cauchy,
(n)
e che contiene la successione
sia {xm }∈ x
en ; allora il limite di {e
xn } è la classe x
e∈ X
(n)
{xn }. Infatti
e xn , x
e) =
lim d(e
n−→∞
lim
n,m−→∞
(dato che {e
xn } è di Cauchy).
(m)
d(x(n)
m , xm ) =
lim
n,m−→∞
e xn , x
d(e
em ) = 0
65
3.2. Spazi metrici completi
Dimostriamo ora che X si immerge isometricamente in un sottospazio denso
e
e
di X: l’isometria sarà i : X −→ X:
i(x) := {xn | ∀n ∈ N xn = x}
cioè la mappa che associa a x la successione costante {x}. Che si tratti di una
isometria è banale:
e
d(i(x),
i(y) = lim d(x, y) = d(x, y)
n−→∞
e e {xn } ∈ x
Dimostriamo che i(X) è denso; sia x
e∈X
e. Ovviamente
e x, i(xn )) = lim d(xm , xn )
d(e
m−→∞
e, dato che {xn } è di Cauchy, per ogni ε > 0 esiste un nε ∈ N tale che
∀n, m > nε
d(xm , xn ) < ε
Al limite per m −→ ∞ otteniamo
e x, i(xn )) < ε
d(e
Quindi x
e = limn i(xn ); inoltre questo limite (i.e. x
e) appartiene alla chiusura di
i(X).
Dunque i(X) è denso.
qed
Notiamo che, se (X, d) è completo allora
(1) Se Y ⊂ X è un sottospazio, è uno spazio metrico rispetto a d|Y , ed è
completo se e solo se è chiuso.
(2) Se f : X −→ X 0 è una isometria allora f (X) è chiuso in X 0 .
e costruito nel teorema precedente è unico
Osserviamo inoltre che lo spazio X
a meno di isometrie suriettive: infatti se (X 0 , d0 ) è uno spazio metrico completo
nel quale X si immerge isometricamente per mezzo della j : X −→ X 0 , la
e
funzione j ◦ i−1 : X −→ X è una isometria dal sottoinsieme denso i(X) ⊂ X
0
al sottoinsieme denso j(X) ⊂ X . Esiste quindi un unico modo di estenderla ad
e e X 0 suriettiva.
una isometria fra X
Infatti ogni punto x0 ∈ X 0 è limite di una successione di punti di j(X), e ogni
e è limite di una successione {i(xn )} di punti di i(X). Poniamo quindi
punto x
e∈X
e −→ X 0
f :X
x
e 7−→ lim j(i(xn ))
n
Si tratta ovviamente di una mappa biunivoca, ed isometrica:
66
Capitolo 3. Metriche
e associato a X si dice il suo completamento.
3.2.6 Definizione Lo spazio X
Un risultato sugli spazi completi che non si può passare sotto silenzio è
il principio delle contrazioni , largamente usato nella risoluzione di equazioni
(ad esempio per dimostrare i teoremi di esistenza per equazioni differenziali
ordinarie).
3.2.7 Definizione Una funzione T : X −→ X di uno spazio metrico in sé si
dice contrazione se esiste una costante positiva c < 1 tale che, per ogni x, y ∈ X:
d(T (x), T (y)) ≤ cd(x, y)
Una tale funzione “accorcia” le distanze fra i punti di X.
3.2.8 Teorema (Principio delle Contrazioni) Se (X, d) è uno spazio metrico completo e T : X −→ X una contrazione allora esiste x0 ∈ X tale che
T (x0 ) = x0 .
Dimostrazione: Se x ∈ X poniamo: x1 = T (x), x2 = T 2 (x) = T (x1 ),... in
modo da ottenere una successione {xn = T n (x)}. Dimostriamo che si tratta di
una successione di Cauchy: infatti
d(x1 , x2 ) =d(T (x), T (x1 )) ≤ cd(x, x1 ) = cd(x, T (x))
d(x2 , x3 ) =d(T (x1 ), T (x2 )) ≤ cd(x1 , x2 ) ≤ c2 d(x, T (x))
.......................................................
d(xn , xn+1 ) ≤cn d(x, T (x))
Quindi, supponendo ad esempio m > n:
d(xn , xm ) ≤d(xn , xn+1 ) + d(xn+1 , xn+2 ) + ... + d(xm−1 , xm )
≤(cn + cn+1 + ... + cm−1 )d(x, T (x))
cn − cm
=
d(x, T (x))
1−c
Ma c < 1, sicché per n, m −→ ∞ otteniamo d(xn , xm ) −→ 0.
Per completezza di X la successione {xn } converge dunque ad un punto x0 .
Ora:
d(x0 , T (x0 )) ≤d(x0 , xn ) + d(xn , T (x0 )) = d(x0 , xn ) + d(T (xn−1 ), T (x0 ))
≤d(x0 , xn ) + cd(xn−1 , x0 ) −→ 0
n−→∞
i.e. d(x0 , T (x0 )) = 0 e quindi T (x0 ) = x0 .
qed
67
3.2. Spazi metrici completi
Le applicazioni al problema di Cauchy per le equazioni differenziali ordinarie
di questo teorema dovrebbero essere note dai rudimenti dell’Analisi: diamo qui
alcune applicazioni alle classiche equazioni integrali.
3.2.9 Esempio L’equazione integrale di Fredholm di seconda specie è l’equazione non omogenea
Z b
f (x) = λ
K(x, y)f (y)dy + ϕ(x)
a
dove K : [a, b] × [a, b] −→ R e ϕ : [a, b] −→ R sono funzioni continue (K si
dice il nucleo dell’equazione integrale). In particolare, dato che è continua su
un compatto, |K(x, y)| ≤ M per una certa costante M ∈ R. Consideriamo la
funzione T : C[a, b] −→ C[a, b] data da, se g ∈ C[a, b]
Z b
T (f )(x) := λ
K(x, y)f (y)dy + ϕ(x)
a
Abbiamo che
d(T (f1 ), T (f2 )) = max |T (f1 )(x) − T (f2 )(x)|
x∈[a,b]
≤ |λ|M (b − a) max |f1 (x) − f2 (x)|
x∈[a,b]
1
e quindi per |λ| < M (b−a)
la mappa T è una contrazione nello spazio metrico
completo C[a, b]. Dunque l’equazione di Fredholm ha, in questo caso, una unica
soluzione per il principio delle contrazioni.
3.2.10 Esempio L’equazione integrale di Volterra è un’equazione del tipo
Z x
f (x) = λ
K(x, y)f (y)dy + ϕ(x)
a
con x ∈ [a, b] e le stesse ipotesi su f , K e ϕ del caso precedente: si potrebbe considerare questa equazione un caso particolare della precedente, definendo
e y) = 0 se y > x e considerando l’equazione di Fredholm corrispondenK(x,
e Tuttavia in questo caso possiamo svincolarci dalla limitazione
te di nucleo K.
1
|λ| < M (b−a)
, se notiamo che l’operatore
Z x
V (f )(x) := λ
K(x, y)f (y)dy + ϕ(x)
a
non è una contrazione, ma una sua opportuna potenza T n lo è: infatti per ogni
f, g ∈ C[a, b]
|V (f )(x) − V (g)(x)| ≤ |λ|M (x − a) max |f (y) − g(y)|
y∈[a,x]
68
Capitolo 3. Metriche
con M = max K(x, y). Da questa segue la
|V (V (f ))(x) − V (V (g))(x)| ≤ |λ|2 M 2
(x − a)2
max |f (y) − g(y)|
y∈[a,x]
2
ed in generale la
|V n (f )(x) − V n (g)(x)| ≤ |λ|n M n
(x − a)n
max |f (y) − g(y)|
y∈[a,x]
n!
Dato che (x−a) < (b−a) basta prendere n tale che |λ|n M n (x−a)n maxy∈[a,x] |f (y)−
g(y)| < n! (cosa sempre possibile) per avere che V n è una contrazione. Allora
esiste un’unica f ∈ C[a, b] tale che V n (f ) = f , per cui
V (f ) = V (V n (f )) = V n (V (f )) = V n (g)
dove g = V (f ): dato che V n è una contrazione, {V n (g)} converge al punto fisso
f di V n qualsiasi sia g, e quindi, passando al limite per n −→ ∞ nell’equazione
precedente, troviamo V (f ) = f .
3.3
Categorie di spazi metrici
Il seguente teorema esprime una proprietà cruciale degli spazi completi, che sarà
ampliamente sfruttata nel séguito:
3.3.1 Teorema (Baire) Se (X, d) è uno
T spazio metrico completo e {An } è una
successione di aperti densi in X allora n An è un insieme denso in X.
Dimostrazione: Sia U un aperto in X, x1 ∈ A1 ∩ U e B1 la palla di centro
x1 (e raggio r1 > 0) contenuta in A1 ∩ U . Per densità di A2 in X deve esistere
x2 ∈ A2 ∩ B1 e, dato che A2 è aperto, deve esistere una B2 palla di centro x2 (e
raggio r2 > 0 contenuta in A2 . Possiamo supporre (a meno di rimpicciolire B2 )
che
1
r2 < r1
e
r2 < r1 − d(x! , x2 )
2
Con queste condizioni si ha che B2 ⊂ B1 .
Iteriamo questa costruzione ottenendo una successione di palle {Bn } tali che
Bn ⊂ Bn−1 e Bn ⊂ An , i cui raggi ri siano una successione di numeri reali che
tende a zero.
Consideriamo anche la successione dei centri {xn } di queste palle: per costruzione, dato N ∈ N, per ogni n, m > N si ha che xn , xm ∈ BN , i.e.
d(xn , xm ) ≤ 2rN
N →∞
/0
69
3.3. Categorie di spazi metrici
Quindi {xn } è una successione di Cauchy e, per completezza di X, deve convergere ad un punto x∈X. Dato che xn ∈BN +1 (se n > N ) allora x∈BN +1 ⊂ BN ⊂ AN .
In altre parole, per ogni N ∈ N: x ∈ An , i.e. x ∈ ∩N AN ; ora si rammenti che ogni
BN era contenuta in AN ∩ U , quindi, in particolare, x ∈ U .
Dunque abbiamo dimostrato che, per ogni aperto U , esiste x ∈ ∩N AN tale
che x ∈ U . Cioè ∩N AN è denso in X.
qed
Osserviamo che, dalla dimostrazione del teorema di Baire, traiamo la seguente
generalizzazione del principio di Cantor dei segmenti nidificati in R: diciamo che
una successione di palle aperte {Bn } è nidificata se Bn ⊂ Bn+1 e se la successione
dei raggi converge a zero.
3.3.2 Teorema Se {Bn } è una successione di palle aperte nidificate
in uno
T
spazio metrico completo allora esiste un unico punto interno in n Bn .
Dimostrazione: Che esista un tale punto interno segue dalla dimostrazione
del teorema precedente: se x0 è un altro punto interno dell’intersezione delle
palle {Bn } allora
d(x, x0 ) ≤ d(x, xn ) + d(xn ), x0 ) < ε + ε
ove {xn } è la successione dei centri delle palle {Bn }.
qed
Come nel caso reale, questa proprietà caratterizza la completezza:
3.3.3 Teorema Se (X, d) è uno spazio metrico tale che ogni successione di palle
aperte nidificate possiede intersezione non vuota allora X è completo.
Dimostrazione: Se {xn } è una successione di Cauchy in X, possiamo associarle una successione di palle aperte nidificate {Bn } come segue: scegliamo una
sottosuccessione {xnk } imponendo la condizione
∀m > 0 d(xnk +m , xnk ) <
1
2k
Allora definiamo Bk come la palla aperta di centro xnk e raggio 1/2k−1 . La
successione {Bk } è nidificata: infatti Bk ⊂ Bk+1 dato che
∀x ∈ Bk+1
d(x, xnk ) ≤ d(x, xnk+1 ) + d(xnk+1 , xnk ) <
1
1
1
+
=
2k 2k
2k−1
(si ricordi che il centro di Bk è xnk ). Inoltre, dato che {xn } è di Cauchy, i raggi
delle Bk tendono a zero.
70
Capitolo 3. Metriche
Ora, per ipotesi, esiste x0 comune a tutte le palle; evidentemente si tratta del
limite della successione: infatti, dato che la successione {xn } è di Cauchy:
d(x0 , xn ) ≤ d(x0 , xnk ) + d(xnk , xn ) <
1
2k−1
+ε
qed
3.3.4 Definizione Un sottoinsieme S ⊂ X di uno spazio metrico X si dice:
(1) raro (o mai denso) se X \ S è denso;
(2) di prima categoria (o magro) se è unione di una famiglia numerabile di
insiemi rari;
(3) di seconda categoria se non è di prima categoria.
Notiamo che S è raro se e solo se non contiene aperti non vuoti. Con questa
terminologia classica possiamo dare il
3.3.5 Teorema (della Categoria di Baire) Se X è uno spazio metrico completo allora non contiene sottoinsiemi aperti di prima categoria (eccetto il vuoto).
Dimostrazione: Sia {Rn } una collezione numerabile di sottoinsiemi rari di X:
allora, per definizione, An := X \Rn sono aperti T
densi; se U è un
S aperto qualsiasi,
per il teorema di Baire, esiste x ∈ U tale che x ∈ n An = X \ n Rn , i.e. per ogni
n, x ∈
/ Rn ed in particolare x ∈
/ Rn . Ne segue che U non può essere contenuto in
S
R
.
n n
qed
In altri termini in uno spazio metrico completo non esistono aperti (non vuoti)
che siano l’unione di una famiglia numerabile di sottoinsiemi rari.
3.3.6 Esempio Q con la metrica abituale è di prima categoria; il suo completamento R è di seconda categoria, dato che è completo.
Come conseguenza del teorema di Baire possiamo ottenere la non numerabilità dell’insieme dei numeri reali, che è uno spazio metrico completo:
3.3.7 Corollario I numeri reali sono un insieme non numerabile.
Dimostrazione: Supponiamo che R sia numerabile: in questo caso potremmo
trovare una successione (xn ) i cui termini siano tutti i numeri reali; in altre parole
[
R=
{xn }
n∈N
3.4. Spazi metrici compatti
71
i numeri reali sarebbero esattamente gli elementi di questa successione; ma è
ovvio che l’insieme formato da un singolo elemento è raro (possiede un unico
punto di accumulazione: se stesso, quindi i numeri reali che non sono suoi punti
di accumulazione sono tutti quelli diversi da lui, che formano ovviamente un
insieme denso). Questo contraddice il teorema di Baire.
qed
Questi risultati sono notevoli perché traggono conclusioni puramente topologiche (densità) da ipotesi metriche (completezza).
Ovviamente ci sono spazi che non sono completi ma che non sono di prima
categoria: ad esempio se (X, d) è completo e A ⊂ X è un aperto il cui complementare X \ E non sia aperto allora A con la metrica indotta non è completo,
ma non è di prima categoria: in effetti esiste una metrica compatibile con la
topologia di A che lo rende completo, ad esempio
¯
¯
¯
¯
1
1
0
¯
d (x, y) := d(x, y) + ¯¯
−
d(x, X \ A) d(y, X \ A) ¯
3.4
Spazi metrici compatti
In generale uno spazio metrico non sarà compatto (basti pensare a Rn ) né
localmente compatto (ad esempio C[0, 1] non lo è): è un risultato notevole che
sia sempre paracompatto e vogliamo qui dimostrarlo anche come applicazione
della teoria del transfinito alla topologia generale.
3.4.1 Teorema (Stone) Uno spazio metrico (X, d) è paracompatto.
Dimostrazione: (M.E. Rudin) Consideriamo un ricoprimento aperto {Aα } di
X e supponiamo che gli indici α di questo ricoprimento siano numeri ordinali1 .
Sia Br (x) = {y ∈ X | d(x, y) ≤ r} la palla di centro x e raggio r in X: per ogni
intero positivo n definiamo induttivamente su n l’insieme Dα,n come l’unione
delle sfere B 1 n (x) tali che
2
(1) α è il più piccolo ordinale tale che x ∈ Aα ;
(2) se j < n allora x ∈
/ Dβ,j ;
(3) B 3n (x) ⊂ Aα ;
2
Abbiamo quindi una famiglia {Dα,n }n>0,α di aperti di X: dimostriamo che si
tratta di un raffinamento localmente finito di {Aα }.
1
Ricordiamo che è sempre possibile: ogni insieme bene ordinato è isomorfo a un numero
ordinale.
72
Capitolo 3. Metriche
Che si tratti di un raffinamento di {Aα } è ovvio dalla definizione: per vedere
che {Dα,n } è un ricoprimento di X basta notare che, se x ∈ X e se α è il minimo
ordinale per cui x ∈ Cα allora esiste n abbastanza grande perché valga la (3)
(essendo Cα aperto) e quindi, per la (2), esiste j ≥ n tale che x ∈ Dβ,j .
Dimostriamo infine che {Dα,n } è localmente finito. Sia x ∈ X e sia α il più
piccolo ordinale tale che x ∈ Dα,n per qualche n; scegliamo j tale che
B 1j (x) ⊂ Dα,n
2
Allora basta dimostrare che
(a) Se i ≥ n + j allora B2−n−j (x) non interseca nessun Dβ,i ;
(b) Se i < n + j allora B2−n−j (x) interseca Dβ,i per al più un β.
Dimostriamo (a): dato che i > n, per (2) ciascuna palla di raggio 2−i coinvolta
nella definizione di Dβ,i ha centro y fuori da Dα,n , e dato che
B 1j (x) ⊂ Dα,n
2
allora d(x, y) ≤ 2−j ; ma i ≥ j + n e n + j ≥ j + 1, sicché
B
1
2n+j
(x) ∩ B 1i (y) = ∅
2
Dimostriamo infine (b): siano p ∈ Dβ,i , q ∈ Dγ,i e β < γ; vogliamo mostrare
che
1
2n+j−1
< d(p, q)
Ma esistono y, z ∈ X tali che p ∈ B2−j (y) ⊂ Dβ,i e q ∈ B2−i (z) ⊂ Dγ,i e, per la (3):
B 3i (y) ⊂ Cβ
2
da cui (per la (2)) z ∈
/ Cβ . Ne segue che
1
2n+j−1
<
1
≤ d(p, q)
2i
qed
In molti esempi, specie negli spazi di funzioni, una proprietà cruciale è la
separabilità:
3.4.2 Definizione Uno spazio topologico si dice separabile se contiene un sottoinsieme denso e numerabile.
73
3.4. Spazi metrici compatti
L’esempio ispiratore è ovviamente quello di Q ⊂ R. Più in generale, ogni
spazio topologico X a base numerabile è separabile: infatti se {An } è una base
numerabile di aperti, per l’assioma di scelta possiamo dare una successione S =
{xn } di elementi di X tali che xn ∈ An : evidentemente S = X; infatti se x ∈ X
esiste un intorno Un di x che contiene xn ∈ S.
Tuttavia non è vero il viceversa: consideriamo su un insieme qualsiasi X la
topologia cofinita CX ; si tratta della famiglia degli insiemi il cui complementare è
un insieme finito (si dimostra facilmente che si tratta di una topologia). Allora,
se X è più che numerabile, la topologia cofinita non può avere base numerabile, e tuttavia è separabile: infatti ogni sottoinsieme infinito di X è denso (per
definizione), quindi in particolare ogni sottoinsieme numerabile.
3.4.3 Teorema Se X è uno spazio topologico T1 allora le seguenti proposizioni
sono equivalenti:
(1) X è metrizzabile e separabile;
(2) X è regolare a base numerabile;
(3) X è omeomorfo ad un sottospazio del cubo di Hilbert.
Dimostrazione: (1) implica (2): se D ⊂ X è denso e numerabile allora la
famiglia numerabile
B := {B 1 (x)}x∈D,n∈N
n
è una base di aperti: infatti per ogni aperto A ⊂ X e per ogni x0 ∈ A esiste un
R > 0 tale che BR (z0 ) ⊂ A e quindi, se x ∈ D è tale che d(x, x0 ) < n1 ≤ R2 allora
x0 ∈ B 1 (x) ⊂ BR (x) ⊂ A, sicché ciascun punto di A appartiene ad un elemento
n
di B contenuto in A.
(2) implica (3) per il teorema di metrizzabilità di Uryshon.
Infine il cubo è metrizzabile ed ha base numerabile (la ha [0, 1]) sicché ogni
suo sottospazio possiede queste proprietà2 : dunque (3) implica (1).
qed
La situazione è molto più semplice nel caso compatto:
3.4.4 Proposizione Uno spazio metrico compatto è separabile.
Dimostrazione: Per ogni ε > 0 la famiglia
{Bε (x)}x∈X
2
Si noti comunque che un sottospazio di uno spazio separabile non è necessariamente
separabile.
74
Capitolo 3. Metriche
è un ricoprimento aperto di X, e quindi esiste sottoricoprimento indicizzato da
un insieme finito Xε ⊂ X. Ponendo
[
D=
X1
n
n≥1
otteniamo un insieme numerabile che è denso, dato che per ogni x ∈ X e n ≥ 1
esiste x0 ∈ X 1 tale che d(x, x0 ) < 1/n.
n
qed
Se X è compatto metrizzabile, ogni successione possiede un insieme di punti
limite, e quindi ogni successione di Cauchy converge:
3.4.5 Proposizione Uno spazio metrizzabile compatto è completo.
Un sottoinsieme compatto in Rn è chiuso e limitato: ci chiediamo se una
proprietà analoga non valga anche per gli spazi metrici qualsiasi; intanto è ovvio
che un compatto K in uno spazio metrico (X, d) è chiuso e limitato: è chiuso
perché uno spazio metrico è di Hausdorff (un compatto in uno spazio di Hausdorff
è chiuso); è limitato perché la funzione distanza è continua e quindi, fissato x0 ∈X:
x 7−→ d(x0 , x) ristretta al compatto K assume un massimo e minimo.
3.4.6 Definizione Uno spazio metrico (X, d) si dice totalmente limitato se, per
ogni ε > 0 esiste una famiglia finita di punti {x1 , ..., xn } ⊂ X tali che, per ogni
x ∈ X esiste un kε tale che d(x, xkε ) < ε.
Equivalentemente, uno spazio totalmente limitato si può ricoprire con una
famiglia finita di palle di raggio ε.
3.4.7 Teorema Uno spazio metrico (X, d) è compatto se e solo se è completo e
totalmente limitato.
Dimostrazione: Se K è compatto è totalmente limitato e completo in modo
ovvio. Viceversa, se X è completo e totalmente limitato, dimostriamo che ogni
successione {xn } ammette una sottosuccessione convergente; ricopriamo X con
palle di raggio 1 (totale limitatezza) e scegliamone una B1 che contenga infiniti
elementi della successione (deve esistere per forza, dato che le palle ricoprono
X). Ora, di nuovo per totale limitatezza, ricopriamo X con sfere di raggio 1/2 e
scegliamone una B2 che contenga infiniti elementi della successione, ed iteriamo
il procedimento per ogni n (assioma di scelta). Abbiamo cosı̀ una successione
di palle {Bk } di raggi 1/k tale che B1 ∩ ... ∩ Bk contiene infiniti punti della
successione.
75
3.5. Teorema di Ascoli–Arzelà
Possiamo allora scegliere, fissato n, un nk tale che nk > nk−1 e xnk ∈B1 ∩...∩Bk ;
questo determina la scelta di una sottosuccessione {xnk } che è di Cauchy:
d(xnk , xnh ) ≤
2
N
se N ≤ k, h. Per completezza di X si ha la convergenza.
qed
3.5
Teorema di Ascoli–Arzelà
L’applicabilità pratica del teorema con cui si è conclusa la sezione precedente, è
assai limitata: tuttavia è importante determinare la compattezza di uno spazio,
perché nelle applicazioni si costruiscono oggetti come limiti di sottosuccessioni:
un teorema classico di teoria delle funzioni che serve a questo scopo è il teorema
di Ascoli–Arzelà.
3.5.1 Definizione Un sottoinsieme M ⊂ C(X) dell’algebra delle funzioni continue definite su uno spazio metrico compatto a valori reali si dice equicontinuo
se per ogni ε > 0 esiste δε > 0 tale che
∀x, y ∈ X
d(x, y) < δε ⇒ ∀f ∈ M |f (x) − f (y)| < ε
e si dice equilimitato se esiste un N ≥ 0 tale che, per ogni f ∈ M : d(f, 0) < N
(ovvero sup |f (x)| < N ).
Il seguente teorema caratterizza i sottoinsiemi a chiusura compatta di C(X)
come equicontinui ed equilimitati.
3.5.2 Teorema (Ascoli–Arzelà) Se (X, d) è uno spazio metrico compatto e
{fn } ⊂ C(X) una successione equicontinua ed equilimitata allora possiede una
sottosuccessione convergente.
Dimostrazione: Dato che X è compatto metrizzabile, è separabile: sia D ⊂ X
un denso numerabile e supponiamo che D = {xn }. Ora la chiusura dell’insieme
{fn (x1 )} è compatta, quindi esiste una sottosuccessione {fn(1) (x1 )} convergente.
Ora consideriamo la successione {fn(1) (x2 )} e scegliamone una sottosuccessione {fn(2) (x2 )} convergente. Iterando il procedimento otteniamo una successione
{fn(k) } in C(X) tale che le successioni numeriche
fn(k) (xk )
sono convergenti.
76
Capitolo 3. Metriche
La sottosuccessione diagonale fn(n) (xk ) converge allora per ogni xk ∈ D; si
definisca
gn := fn(n)
Dimostriamo che si tratta di una successione di Cauchy, e quindi che converge
(per compattezza e quindi completezza dello spazio).
Dato che le fn sono equicontinue lo sono anche le gn , e quindi, per ogni ε > 0
esiste mε tale che
∀x, x0 ∈ X
d(x, x0 ) <
1
⇒ |gn (x) − gn (x0 )| < ε
mε
Ma X è compatto, quindi totalmente limitato, dunque esiste un insieme finito
{y1 , ..., ynε } tale che
∀k = 1...nε ∀n, m > nε
|gn (yk ) − gm (yk )| < ε
Sia ora x ∈ X; per equilimitatezza deve esistere k tale che
d(x, x0 ) <
1
nε
e quindi, per ogni n, m > nε :
|gn (x) − gm (x)| ≤ |gn (x) − gn (yk )| + |gn (yk ) − gm (yk )|+
+ |gm (yk ) − gm (x)| < 3ε
Quindi {gn } è di Cauchy, e, per completezza di C(X) è una sottosuccessione
convergente di {fn }.
qed
Diamo una applicazione del teorema di Ascoli–Arzelà: il teorema di Peano.
3.5.3 Teorema Se f : D −→ R è una funzione continua nel dominio chiuso
D ⊂ R2 allora per ogni punto interno (x0 , y0 ) ∈ D passa almeno una curva
integrale dell’equazione differenziale
df
= f (x, y)
dx
Dimostrazione: Poiché è continua su un chiuso, f è limitata: |f (x, y)| ≤
M . Ora consideriamo le rette per il punto (x0 , y0 ) di coefficienti angolari M e
77
3.5. Teorema di Ascoli–Arzelà
−M e due rette verticali x = a e x = b
tali che i due triangoli di vertice (x0 , y0 )
delimitati da queste rette siano contenuti in D, e chiamiamo ∆ l’insieme
chiuso dato dall’unione di questi due
triangoli.
Ora costruiamo una spezzata di Eulero L0 per l’equazione differenziale data nell’enunciato: dal punto (x0 , y0 ) tracciamo una retta r0 di coefficiente angolare f (x0 , y0 ) (che quindi è compresa fra le rette che delimitano ∆; su r0 ∩ ∆
scegliamo un punto (x1 , y1 ) e tracciamo da esso una retta r1 di coefficiente angolare f (x1 , y1 ); su r1 ∩ ∆ scegliamo un punto (x2 , y2 ) e cosı̀ via (stiamo usando
l’assioma di scelta).
Possiamo costruire ovviamente infinite spezzate L0 , L1 , L2 , ... in questo modo partendo da (x0 , y0 ) e scegliendo punti differenti sulle rette rn che andiamo
a considerare: consideriamo ora una successione di tali spezzate (Ln ) in modo
che la massima lunghezza lk di un segmento di estremi (xk , yk ) e (xk+1 , yk+1 )
appartenente alla spezzata tenda a zero per k −→ ∞.
Alla successione di curve {Ln } corrisponde una successione di funzioni {ϕn }
i cui grafici sono dati dalle {Ln }: queste funzioni hanno le seguenti proprietà:
(1) ϕn è definita sull’intervallo [a, b];
(2) Le ϕn sono uniformemente limitare;
(3) La successione {ϕn } è equicontinua.
Per il teorema di Ascoli–Arzelà, esiste allora una sottosuccessione {ϕnk } convergente ad una certa funzione ϕ. Ovviamente
ϕ(x0 ) = y0
Mostriamo che ϕ è la soluzione dell’equazione differenziale dell’enunciato.
Precisamente mostriamo che, per ogni ε > 0, se |x0 −x00 | è abbastanza piccolo,
allora
¯
¯
¯ ϕ(x00 ) − ϕ(x0 )
¯
0
0 ¯
¯
− f (x , ϕ(x ))¯ < ε
¯
00
0
x −x
cioè che, per k abbastanza grande,
¯
¯
¯ ϕnk (x00 ) − ϕnk (x0 )
¯
0
0
¯
¯<ε
(∗)
(x
))
−
f
(x
,
ϕ
n
k
¯
¯
x00 − x0
Ora sfruttiamo la continuità di f in D: dato ε > 0, esiste δ > 0 tale che
|x − x0 | < 2δ ,
|y − y 0 | < 4M δ
=⇒
|f (x, y) − f (x0 , y 0 )| < ε
78
Capitolo 3. Metriche
Consideriamo i punti del rettangolo R = {(x, y) | |x − x0 | < 2δ , |y − y 0 | < 4M δ},
e prendiamo N ∈ N grande abbastanza affinché, per k > N si abbia
|ϕ(x) − ϕnk (x)| < 2M δ
e
lk < δ
(lk è la lunghezza massima di un segmento della spezzata Lk ). In questo modo,
se x − x0 | < 2δ, le spezzate di Eulero Lk giacciono interamente nel rettangolo R.
Per fissare le idee supponiamo ora che x0 < x00 (il resto della dimostrazione
nell’altro caso è del tutto analoga), e supponiamo che la spezzata Lk abbia come
vertici dei segmenti che la compongono i punti (x0 , y0 ) = (a0 , b0 ), (a1 , b1 ), (a2 , b2 ),
..., (an+1 , bn+1 ) in modo che
x0 = a0 ≤ x0 < a1 < a2 < · · · < an < x00 ≤ an+1
Allora, se ϕnk è la funzione corrispondente a questa spezzata, si ha
ϕnk (a1 ) − ϕnk (x0 ) = f (a0 , b0 )(a1 − x0 )
ϕnk (a2 ) − ϕnk (a1 ) = f (a1 , b1 )(a2 − a1 )
···
···
00
ϕnk (x ) − ϕnk (an ) = f (an , bn )(x00 − an )
da cui, per |x00 − x0 | < δ, troviamo
(f (x0 , y 0 ) − ε)(a1 − x0 ) < ϕnk (a1 ) − ϕnk (x0 ) < (f (x0 , y 0 ) + ε)(a1 − x0 )
(f (x0 , y 0 ) − ε)(a2 − a1 ) < ϕnk (a2 ) − ϕnk (a1 ) < (f (x0 , y 0 ) + ε)(a2 − a1 )
···
···
0 0
00
(f (x , y ) − ε)(x − an ) < ϕnk (x00 ) − ϕnk (an ) < (f (x0 , y 0 ) + ε)(x00 − an )
Sommando queste disequazioni troviamo la
(f (x0 , y 0 ) − ε)(x00 − x0 ) < ϕnk (x00 ) − ϕnk (x0 ) < (f (x0 , y 0 ) + ε)(x00 − x0 )
cioè la (*).
qed
Notiamo che la soluzione non è unica: infatti costruendo una sottosuccessione
non attraverso le spezzate di Eulero si ottengono soluzioni diverse.
Vediamo un’altra applicazione del teorema di Ascoli–Arzelà che segue lo
spirito della dimostrazione del teorema di Peano. Per prima cosa diamo una
3.5.4 Definizione Una curva parametrizzata in uno spazio metrico (X, d) è
una funzione continua c : [0, 1] −→ X.
79
3.5. Teorema di Ascoli–Arzelà
Geometricamente la curva è l’immagine della funzione: comunque uno stesso
insieme di punti può essere immagine di moltissime funzioni distinte, che possono
individuare la stessa curva o meno.
3.5.5 Definizione Due curve parametrizzate c, c0 : [0, 1] −→ X si dicono equivalenti se esistono due funzioni continue crescenti ϕ, ϕ0 : [0, 1] −→ [0, 1] tali che
ϕ(0) = ϕ0 (0) = 0, ϕ(1) = ϕ0 (1) = 1 e
∀t ∈ [0, 1]
c(ϕ(t)) = c0 (ϕ0 (t))
Si tratta ovviamente di una relazione di equivalenza.
3.5.6 Definizione Una curva continua in uno spazio metrico (X, d) è una classe
di equivalenza di curve parametrizzate in (X, d).
Una curva continua congiunge due punti x, y ∈ X quando per una (e quindi
per ogni) sua rappresentazione parametrica c : [0, 1] −→ X si ha che c(0) = x e
c(1) = y.
Possiamo allora dire quando una successione {Cn } di curve converge ad una
curva C: precisamente quando è possibile parametrizzare le Cn con delle funzioni
cn e C con una funzione c in modo che d(c, cn ) −→ 0. Ovviamente il limite di
una famiglia di curve che congiungono due punti x, y ∈ X congiunge gli stessi
punti.
3.5.7 Definizione Se C è una curva continua in uno spazio metrico (X, d)
parametrizzata da c : [0, 1] −→ X, la sua lunghezza è il numero reale
l(C) =
sup
n
X
d(c(ti−1 ), c(ti ))
(t0 ,t1 ,...,tn )∈T i=1
dove T è l’insieme dei punti (t0 , t1 , ..., tn ) tali che
a = t0 < t1 < · · · < tn−1 < tn = b
e n ∈ N.
Questa definizione non dipende dalla parametrizzazione scelta, dato che
d(c(ti−1 ), c(ti )) = d(c(ϕ(t0i−1 )), c(ϕ(t0i ))) = d(c0 (ϕ0 (t0i−1 )), c0 (ϕ0 (t0i )))
= d(c0 (t00i−1 ), c0 (t00i ))
(le ϕ trasformano elementi di T in elementi di T ).
80
Capitolo 3. Metriche
3.5.8 Teorema Se K ⊂ X è compatto in uno spazio metrico (X, d) e se due
suoi punti x, y ∈ K si possono congiungere con una curva continua di lunghezza
finita, allora esiste una curva che li congiunge di lunghezza minima.
Dimostrazione: Consideriamo una successione di curve {Cn } tale che:
(1) l(Cn ) ≤ L dove L è la lunghezza di una curva fissata che congiunga x e y
(che esiste per ipotesi);
(2) l(Cn ) −→ l dove l è l’estremo inferiore delle lunghezze delle curve che
congiungono x e y.
Mostriamo ora come si possano parametrizzare le curve Cn con una funzioni
equicontinue: se C è una curva che congiunge x e y, e c : [0, 1] −→ X una sua
rappresentazione parametrica, allora la funzione ϕ : [0, 1] −→ R data da
ϕ(t) = l(Ct )
dove Ct è la curva che congiunge x con c(t): allora
c0 (t) = c(ϕ−1 (t))
è una rappresentazione parametrica per C, tale che
d(c0 (t1 ), c0 (t2 )) ≤ l(C)|t1 − t2 |
Poiché tutte le curve della famiglia {Cn } hanno lunghezza minore L, la condizione
precedente implica la loro equicontinuità; ovviamente sono equilimitate (perché
definite in [0, 1]), quindi il teorema di Ascoli–Arzelà 3 implica che da {Cn } si può
estrarre una sottosuccessione convergente ad una curva C.
La lunghezza di C sarà maggiore o uguale a l, e sarà minore o uguale all’estremo inferiore delle lunghezze delle Cn (cioè la lunghezza è una funzione
semicontinua inferiormente), che è ancora l, quindi C è la curve di lunghezza
minima cercata.
qed
3
O meglio una sua generalizzazione al caso dello spazio C(X, Y ) delle funzioni continue da
uno spazio metrico (X, d) ad un altro spazio metrico (Y, d0 ), che si dimostra in modo analogo
al caso Y = R.
Capitolo 4
MISURE
La teoria moderna dell’integrazione può svolgersi a partire dalla teoria dei
funzionali lineari e continui sugli spazi di funzioni continue, o a partire dalla teoria
della misura: il primo approccio, più analitico, consente profonde generalizzazioni
(distribuzioni, correnti, etc.) mentre il secondo approccio è più insiemistico e
legato alla topologia. Qui diamo le linee portanti della teoria della misura, che è
alla base dell’integrazione e del calcolo delle probabilità.
4.1
Algebre di insiemi e spazi di misura
Se A ⊂ X è un sottoinsieme di un fissato insieme X denoteremo il complemento X \ A anche col simbolo {A.
4.1.1 Definizione Un’algebra di sottoinsiemi di un insieme X è una famiglia
A ⊂ P(X) tale che:
(1) ∅ ∈ A.
(2) Se A, B ∈ A allora A ∪ B ∈ A.
(3) Se A ∈ A allora {A ∈ A.
Ad esempio P(X) è un’algebra di sottoinsiemi di X. Per le leggi di de Morgan:
{(A ∪ B) = {A ∩ {B e {(A ∩ B) = {A ∪ {B si ha che, se A è un’algebra di insiemi
e se A, B ∈ A allora A ∩ B ∈ A.
Le algebre di insiemi sono in particolare algebre di Boole: queste ultime sono
infatti arbitrari insiemi dotati di tre operazioni (∩, ∪ e {) e di due elementi (0 e
1) tali da soddisfare le regole dell’algebra degli insiemi. Evidentemente le unioni
e le intersezioni finite di elementi di un’algebra appartengono ancora all’algebra.
Osserviamo che un’algebra di insiemi è sempre un insieme parzialmente ordinato rispetto alla relazione ⊂: in effetti potremmo definire questa relazione
81
82
Capitolo 4. Misure
semplicemente come
a ⊂ b ⇐⇒ a ∩ b = a
Evidentemente rispetto a questo ordinamento un’algebra di insiemi è un reticolo, cioè ogni coppia di elementi A, B ∈ A ha un massimo e minimo dati
rispettivamente da A ∪ B e a ∩ B.
Ovviamente non ogni famiglia di sottoinsiemi di un insieme X è un’algebra,
ma possiamo sempre associargliene una:
4.1.2 Proposizione Se X ⊂ P(X) è una famiglia di sottoinsiemi di un insieme
X, esiste un’algebra A(X ) contenente X e minima rispetto a questa proprietà,
i.e. ogni altra algebra contenente X deve contenere A(X ).
Dimostrazione: Sia F la famiglia di tutte le algebre di sottoinsiemi di X
contenenti X : certamente F =
6 ∅ dato che almeno P(X) ∈ F. Consideriamo
A(X ) :=
\
A
A∈F
Una semplice verifica mostra che si tratta di un’algebra di sottoinsiemi di X che,
per definizione, è la minima rispetto all’inclusione.
qed
4.1.3 Definizione L’algebra A(X ) si dice generata da X .
4.1.4 Definizione Una σ-algebra è un’algebra A di sottoinsiemi diSun insieme
X tale che per ogni successione {An }n∈N di elementi di A l’insieme n∈N An sia
un elemento di A.
Dato che i complementari di un elemento di A appartengono ancora a A
anche le intersezioni numerabili di elementi di una σ-algebra appartengono alla
σ-algebra.
La proposizione precedente vale ovviamente anche per le σ-algebre sicché
possiamo parlare di σ-algebra generata da una famiglia di sottoinsiemi di X.
4.1.5 Esempio Se X è uno spazio topologico, la sua topologia è una famiglia di
sottoinsiemi di X: dunque esiste la σ-algebra β(X) generata dalla topologia di
X, che si dice σ-algebra di Borel ed i cui elementi si dicono boreliani. Equivalentemente, β(X) è la σ-algebra generata dai chiusi, ovvero da una qualsiasi base
per la topologia di X: ad esempio la σ-algebra di Borel associata alla topologia
naturale della retta reale R è la σ-algebra generata dagli intervalli aperti.
4.1. Algebre di insiemi e spazi di misura
83
4.1.6 Definizione Se X è uno spazio topologico, un suo sottoinsieme si dice
Fσ se è unione numerabile di chiusi e si dice Gδ se è intersezione numerabile di
aperti.
Evidentemente i chiusi e le unioni numerabili di Fσ sono ancora Fσ , cosı̀
come gli aperti e le intersezioni numerabili di aperti sono Gδ : per definizione,
gli insiemi di tipo Fσ e Gδ sono boreliani, come pure sono boreliani tutte le
possibili combinazioni di Fσ e Gδ . Ad esempio, un insieme è Fσδ se è intersezione
numerabile di insiemi Fσ , è cosı̀ via; gli insiemi Fσδ... e Gδσ... sono tutti boreliani
ma, si può dimostrare, non tutti i boreliani sono di questo tipo.
4.1.7 Definizione Uno spazio misurabile è una coppia (X, B) formata da un
insieme X e da una σ-algebra B di sottoinsiemi di X. Un elemento A ∈ B si dice
misurabile.
4.1.8 Definizione Una misura esterna µ∗ su un insieme X è una funzione µ∗ :
P(X) −→ [0, ∞] tale che
(1) µ∗ (∅) = 0.
(2) Se E ⊂ F allora µ∗ (E) ≤ µ∗ (F ) (monotonia).
(3) Se {En } è una successione di insiemi misurabili disgiunti allora
̰ !
∞
X
[
∗
µ∗ Ei
µ
Ei ≤
i=1
i=1
(Subadditività numerabile).
4.1.9 Esempio La misura esterna di Lebesgue sulla retta reale è definita come
X
l(In )
l∗ (E) = inf
S
E⊂
In
n
ove {In } sono successioni di intervalli in R e l(I) è la lunghezza dell’intervallo
I. In questo caso, classicamente si definisce un insieme E misurabile secondo
Lebesgue se per ogni altro insieme F si ha che l∗ (F ) = l∗ (E ∩ F ) + l∗ ({E ∩ F ).
Forti di questo esempio definiamo
4.1.10 Definizione Se µ∗ è una misura esterna su un insieme X, un sottoinsieme Y ⊂ X tale che
∀Z ⊂ X
µ∗ (Z) = µ∗ (Y ∩ Z) + µ∗ ({Y ∩ Z)
si dice misurabile (rispetto a µ∗ ).
84
Capitolo 4. Misure
4.1.11 Teorema Se µ∗ è una misura esterna su un insieme X l’insieme dei
sottoinsiemi di X misurabili rispetto a µ∗ è una σ-algebra.
Dimostrazione: Sia B := {Y ⊂ X | Y misurabile rispetto a µ∗ }; ovviamente
∅ ∈ B, e se E ∈ B, anche {E ∈ B. Consideriamo quindi le unioni fra due insiemi
misurabili E1 , E2 ∈ B: dato che sono misurabili si ha, per ogni F ⊂ X:
µ∗ (F ) = µ∗ (E2 ∩ F ) + µ∗ ({E2 ∩ F )
µ∗ (F ∩ {E2 ) = µ∗ (E1 ∩ F ∩ {E2 ) + µ∗ ({E1 ∩ F ∩ {E2 F )
Ma F ∩ (E1 ∪ E2 ) = (F ∩ E1 ) ∪ (F ∩ E1 ∩ {E2 ) e quindi, per subadditività di µ∗ :
µ∗ (F ∩ (E1 ∪ E2 )) + µ∗ (F ∩ E1 ∩ {E2 ) ≤ µ∗ A
Cioè E1 ∪ E2 è misurabile per la legge di de Morgan. Quindi B è un’algebra di
insiemi.
S
Ora consideriamo E = En unione di insiemi misurabili disgiunti; poniamo
Fn :=
n
[
Ei
i=1
Fn è misurabile e, dato che {E ⊂ {Fn :
µ∗ (F ∩ Fn ) + µ∗ (F ∩ {E) ≤ µ∗ (F ∩ Fn ) + µ∗ (F ∩ {Fn ) = µ∗ F
Ma Fn ∩ En = En ∈ B e Fn ∩ {En = Fn−1 sicché
µ∗ (F ∩ Fn ) = µ∗ (F ∩ En ) + µ∗ (F ∩ Fn−1 )
e, per induzione:
∗
µ (F ∩ Fn ) =
da cui (dato che F ∩ E =
S∞
i=1 (F
∞
X
µ∗ (F ∩ Ei )
i=1
∩ Ei )
µ∗ (F ∩ {E) + µ∗ (F ∩ E) ≤ µ∗ (F ∩ {E) +
∞
X
µ∗ (F ∩ Ei ) ≤ µ∗ A
i=1
qed
4.1.12 Definizione Una misura µ su uno spazio misurabile (X, B) è una funzione µ : B −→ [0, ∞] tale che
(1) µ(∅) = 0.
85
4.1. Algebre di insiemi e spazi di misura
(2) Se {En } è una successione di insiemi misurabili disgiunti allora
̰ !
∞
[
X
µ
Ei =
µEi
i=1
i=1
(Additività numerabile).
Uno spazio di misura è una tripla (X, B, µ) ove µ è una misura sullo spazio
misurabile (X, B).
4.1.13 Esempio Se X è un insieme non vuoto a B = P(X) l’insieme delle parti,
data una funzione f : X −→ [0, ∞] poniamo
X
∀E ∈ B µE :=
f (x)
x∈E
ove si intende che
X
x∈E
f (x) =
sup
x1 ,...,xn ∈E
n∈N
n
X
f (xk )
k=1
Evidentemente si tratta di una misura. Ad esempio, per f = 1 otteniamo la
misura # che conta, i.e. tale che
(
Card(E) se E è finito
#E =
∞
se E è infinito
Se x0 ∈ X è fissato, per f (x) = δxx0 otteniamo la misura δx0 di Dirac concentrata
in x0 :
(
1 se x0 ∈ E
δx0 E =
0 se x0 ∈
/E
Un esempio notevole di misura è ottenuto a partire da misure esterne:
4.1.14 Teorema Se µ∗ è una misura esterna su un insieme X e B è la σ-algebra
degli insiemi misurabili rispetto a µ∗ allora la restrizione µ di µ∗ a B è una misura
su B.
Dimostrazione: Dato che µ = µ∗ |B è una misura esterna, per dimostrare che è
una misura basta far vedere che soddisfa l’additività numerabile. Intanto dimostriamo che soddisfa l’additività finita: se E1 e E2 sono misurabili e disgiunti, la
misurabilità di E2 implica
µ(E1 ∪ E2 ) = µ∗ (E1 ∪ E2 ) = µ∗ ((E1 ∪ E2 ) ∩ E2 ) + µ∗ ((E1 ∪ E2 ) ∩ {E2 )
= µ∗ E2 + µ∗ E1
86
Capitolo 4. Misure
Ora, se {En } sono misurabili e disgiunti allora
Ãn
!
n
X
[
µEi = µ
Ei ≤ µE
i=1
per ogni n, quindi
i=1
∞
X
µEi ≤ µE
i=1
Ma la disuguaglianza opposta vale sempre dato che µ è una misura esterna e
quindi (tenendo conto che µ∅ = µ∗ ∅ = 0) si ha la tesi.
qed
4.1.15 Esempio Sulla retta reale, partendo dalla misura esterna di Lebesgue
l∗ associata alla lunghezza degli intervalli, la misura indotta sull’insieme degli
insiemi misurabili è la misura di Lebesgue in R; dato che gli intervalli sono
misurabili, la classe degli insiemi misurabili secondo Lebesgue contiene i boreliani
della retta reale.
Se f : R −→ R è una funzione monotona, possiamo definire una misura
esterna sulla retta reale come
sf (I)
s∗f (E) = inf
S
E⊂
In
ove sf ([a, b] = f (b) − f (a) (osserviamo che se f è la funzione identità sf è
la lunghezza dell’intervallo). La misura esterna e la misura che ne derivano si
chiamano di Lebesgue–Stieltjes e sono fondamentali nel calcolo delle probabilità:
le approfondiremo in séguito.
4.2
Completamenti ed estensioni di misure
Diamo alcune proprietà essenziali delle misure.
4.2.1 Proposizione Se (X, B, µ) è uno spazio di misura:
(1) Se A ⊂ B sono misurabili allora µA ≤ µB.
(2) Se {En }n∈N sono misurabili e µE1 < ∞ e En ⊂ En+1 allora
̰ !
\
µ
Ei = lim µEn
i=1
n−→∞
4.2. Completamenti ed estensioni di misure
87
(3) Se {En }n∈N sono misurabili allora
̰ !
∞
X
[
µEi
Ei ≤
µ
i=1
i=1
Dimostrazione:
(1) Segue daTB = A ∪ (B \ A) e A ∩ (B \ A) = ∅.
(2) Se E = Ei allora
!
̰
[
E1 = E ∪
Ei \ Ei+1
i=1
(unione disgiunta) e quindi µE1 = µE+
quindi
P
µ(Ei \Ei+1 ). Ma Ei = Ei+1 ∪(Ei \Ei+1 )
n−1
∞
X
X
(µEi −µEi+1 ) = µE+µE1 −lim µEn
µE1 = µE+ (µEi −µEi+1 ) = µE+ lim
n−→∞
i=1
(3) Se Fn = En \
µFn ≤ µEn e
¡Sn−1
i=1
µ
i=1
¢
Ei allora Fn ⊂ En e gli Fn sono disgiunti. Quindi
³[
´ X
X
µFi ≤
µEi
Ei =
qed
4.2.2 Definizione Una misura µ su uno spazio X si dice finita se µ(X) < ∞
e σ-finita se è possibile ricoprire l’insieme X con insiemi misurabili {Xn }n∈N :
X=
∞
[
Xi
i=1
tali che per ogni i: µXi < ∞.
Un insieme misurabile E è di misura finita se µE < ∞ ed è di misura σ-finita
se è unione di una famiglia numerabile di insiemi di misura finita.
4.2.3 Definizione Uno spazio (X, B, µ) è completo (e la misura µ si dice completa) se B contiene tutti i sottoinsiemi degli insiemi di misura nulla:
∀E ∈ B ∀A ⊂ E
µE = 0 ⇒ A ∈ B
4.2.4 Esempio La misura µ indotta (per restrizione) da una misura esterna µ∗
sulla σ-algebra dei suoi insiemi misurabili è completa.
88
Capitolo 4. Misure
4.2.5 Teorema Se (X, B, µ) è uno spazio di misura allora esiste uno spazio di
eµ
misura (X, B,
e) tale che
e
(1) B ⊂ B.
(2) Se E ∈ B allora µE = µ
eE.
(3) E ∈ Be se e solo se esistono B ⊂ B e A ⊂ C con C ∈ B tali che µC = 0 e
E = A ∪ B.
Dimostrazione: Consideriamo la σ-algebra B0 generata da B e P(N ) ove
N := {N ∈ B | µN = 0}
e i.e. che è caratterizzata dalla (3). Che
Mostriamo che questa σ-algebra è B,
sia Be ⊂ B0 è ovvio. Dimostriamo allora che Be è una σ-algebra: dovrà quindi
contenere B0 per definizione di σ-generata da una famiglia di insiemi.
Un elemento di Be può scriversi come E = A ∪ B con A ∩ B = ∅ (sostituendo
se necessario C con E \ C. Allora il complementare di E è
{(B ∪ C) ∪ ({A ∩ C)
Ma B, C ∈ B e quindi {A ∩ N ⊂ N i.e. {A ∩ C ∈ P(N ), cioè il complementare di
e Infine, che l’unione numerabile di elementi di Be stia in Be è ovvio.
E sta in B.
Ora definiamo µ
e: se B è completa allora Be = B e basta porre µ
e = µ.
e
Altrimenti, se E ∈ B è E = A ∪ B, con B ∈ B e A ⊂ C e µC = 0; poniamo
µ
e(E) := µ(B)
Questa definizione è ben posta: se E = A0 ∪ B 0 con A0 ⊂ C 0 allora
B ⊂ B ∪ A = B 0 ∪ A0 ⊂ B 0 ∪ C 0 ∈ B
e quindi µB ≤ µB 0 . Scambiando B on B 0 si ha µB = µB 0 .
Verifichiamo che si tratta di una misura: se {En }n∈N sono disgiunti, allora
ciascuno è della forma En = An ∪ Bn e quindi gli Bn debbono essere disgiunti,
quindi
!
Ã
[
[
X
X
µ
e
En = µ(
Bn ) =
µ(Bn ) =
µ
e(En )
n∈N
n∈N
n∈N
n∈N
qed
4.2.6 Esempio La misura di Lebesgue è il completamento della misura di Borel
ottenuta restringendo la misura esterna di Lebesgue alla classe dei boreliani.
89
4.2. Completamenti ed estensioni di misure
Per concludere stabiliamo un risultato fondamentale, che ci fornisce un metodo molto potente per costruire misure.
4.2.7 Definizione Se A è un’algebra di insiemi, una misura su A è una funzione
µ : A −→ [0, ∞] tale che
(1) µ∅ = 0.
(2) Se {An } è una successione di elementi di A disgiunti tale che
allora
!
̰
∞
[
X
An =
µ
µAn
n=1
S
An ∈ A
n=1
L’unica differenza con le misure propriamente dette è che queste ultime sono
definite sulle σ-algebre.
Osserviamo ora che, data una misura µ su un’algebra A di sottoinsiemi di un
insieme X, esiste su X una misura esterna µ∗ associata a µ. Infatti basta porre,
per ogni E ⊂ X:
∞
X
∗
µ (E) := inf
µAi
S
E⊂
i
Ai
i=1
(l’inf varia su tutte le successioni {Ai } in A).
4.2.8 Lemma µ∗ è una misura esterna e µ∗ |A = µ.
Dimostrazione:
L’unica cosa da dimostrare è la subadditività numerabile. Sia
S
quindi E = n En con gli {En } disgiunti; se per ogni En si ha che µ∗ En = ∞ la
subadditività è ovvia. Supponiamo quindiSche, per ogni ε > 0 ed ogni n esista la
successione {Ani }i∈N in A tale che En ⊂ i Ani e
∞
X
µAni < µ∗ En +
i=1
Quindi
∗
µE≤
∞
X
i=1
µAni <
∞
X
ε
2
µ∗ En + ε
n=1
Per arbitrarietà di ε segue allora la subadditività di µ∗ .
La seconda parte del lemma è ovvia.
qed
90
Capitolo 4. Misure
4.2.9 Teorema di Estensione di Carathéodory Se µ è una misura su un’algebra A è µ∗ la misura esterna indotta da µ allora la restrizione µ di µ∗ alla
σ-algebra dei suoi insiemi misurabili è una misura sulla σ-algebra (contenente
A) di questi insiemi. Se µ è una misura finita, anche µ lo è, e se µ è una misura
σ-finita allora µ è l’unica misura definita sulla σ-algebra generata da A tale che
µ|A = µ.
Dimostrazione: La prima parte è praticamente già stata dimostrata: data
una misura sull’algebra A abbiamo costruito una misura esterna che quindi dà
luogo ad una misura sulla σ-algebra dei suoi insiemi misurabili; l’unica cosa da
dimostrare, per avere che effettivamente µ|A = µ∗ è che gli elementi di A sono
misurabili rispetto a µ∗ . Per questo basta far vedere che, per ogni A ∈ A, se E è
un insieme qualsiasi allora
µ∗ (E ∩ A) + µ∗ (E ∩ {A) ≤ µ∗ E
∗
(la disuguaglianza opposta è vera sempre per
S subadditività di µ ). Sia dunque
{An } una successione in A tale che E ⊂ n An tale che, per ogni ε > 0 (se
ciò non è possibile ogni Ei ha misura esterna infinita è non abbiamo nulla da
dimostrare):
X
µAn < µ∗ E + ε
Per additività di µ su A abbiamo
∗
∗
µ (E ∩ A) + µ (E ∩ {A) ≤
∞
X
µ(An ∩ A) +
n=1
∞
X
µ(An ∩ {A) < µ∗ E + ε
n=1
S
S
(dato che E ∩ A ⊂ (An ∩ A) e E ∩ {A ⊂ (An ∩ {A)). Per arbitrarietà di ε si
ha quindi la misurabilità di A.
Che µ sia finita non appena lo sia µ è ovvio. Resta quindi solo da dimostrare
l’unicità di µ nel caso in cui µ sia σ-finita.
Sia dunque ν una misura definita sulla σ-algebra B generata dall’algebra
A, che coincida con µ su A. Se Aσ denota l’insieme delle unioni numerabili
di elementi di A, ogni suo elemento può esprimersi come unione numerabile di
elementi disgiunti di A: sia ora B ∈ B di misura esterna finita e dimostriamo che
esiste un A ∈ Aσ tale che B ⊂ A e
µ∗ A ≤ µ∗ B + ε
(basta prendere A come unione di una successione {An } ⊂ A tale che B ⊂
Quindi, dato che B ⊂ A:
νB ≤ νA = µ∗ A ≤ µ∗ B + ε
S
An ).
91
4.3. Integrazione
e, per arbitrarietà di ε:
∀B ∈ B
νB ≤ µ∗ B
Ma gli insiemi misurabili rispetto a µ∗ sono una σ-algebra contenente A, quindi
ogni tale B è misurabile.
Ora, se B è misurabile, A ∈ Aσ , B ⊂ A e µ∗ A ≤ µ∗ B + ε allora, se µ∗ B < ∞:
µ∗ A = µ∗ B + µ∗ (A \ B) ⇒ ν(A \ B) ≤ µ∗ (A \ B) ≤ ε
Per arbitrarietà di ε si ha quindi
µ∗ A ≤ νB ⇒ µ∗ B = νB
A questo punto facciamo intervenire l’ipotesi di σ-finitezza
S della misura µ: se
{Xi } è una successione di elementi di A tali che X = i Xi con, per ogni i,
µXi < ∞ allora, per ogni B ∈ B:
[
X
X
B = (Xi ∩ B) ⇒ νB =
ν(Xi ∩ B)
e
µB =
µ(Xi ∩ B)
i
i
i
(perché (Xi ∩ B) ∩ (Xj ∩ B) = ∅). Ma µ∗ (Xi ∩ B) < ∞ e quindi
µ(Xi ∩ B) = ν(Xi ∩ B)
qed
4.3
Integrazione
Assumeremo d’ora innanzi che le misure prese in considerazione siano sempre
complete, ed adotteremo la seguente efficace terminologia: una proprietà qualsiasi
che si riferisca a spazi di misura si dice valere quasi ovunque (q.o.) se non vale al
più su un insieme di misura nulla.
4.3.1 Definizione Se (X, A, µ) e (Y, B, ν) sono spazi di misura, una funzione
f : X −→ Y si dice misurabile se per ogni insieme E ∈ B l’insieme f −1 (E)
appartiene alla σ-algebra A.
Ad esempio, se X e Y sono spazi topologici, una funzione continua è anche
misurabile rispetto alle misure di Borel; in particolare, una funzione f : X −→ R
definita su uno spazio misurabile è misurabile se la controimmagine di un aperto
è misurabile, e quindi se g : Y −→ Z è una mappa continua fra spazi topologici
e f : X −→ Y è misurabile dallo spazio misurabile X allo spazio topologico Y
allora la composta g ◦ f è misurabile.
92
Capitolo 4. Misure
4.3.2 Proposizione Se (X, A, µ) è uno spazio di misura, una funzione f :
X −→ R ∪ {±∞} è misurabile se e solo se vale uno dei seguenti enunciati
equivalenti:
(1) Per ogni a {x | f (x) > a} è misurabile.
(2) Per ogni a {x | f (x) ≥ a} è misurabile.
(3) Per ogni a {x | f (x) < a} è misurabile.
(4) Per ogni a {x | f (x) ≤ a} è misurabile.
In questi casi, l’insieme {x | f (x) = a} è misurabile.
Dimostrazione: Si tratta di ovvie verifiche, per le quali è utile osservare che,
ad esempio
¾
∞ ½
\
1
{x | f (x) ≥ a} =
x | f (x) > a −
n
n=1
e cosı̀ via, ed il fatto che ogni aperto di Rn è unione di intervalli
qed
Ad esempio la funzione caratteristica χE di un insieme misurabile è misurabile; viceversa se la funzione caratteristica di un insieme A è misurabile, l’insieme
è misurabile.
Usando il teorema precedente è immediato verificare che somme, prodotti e
limiti di funzioni misurabili sono ancora funzioni misurabili.
Vogliamo ora definire nel contesto generale degli spazi di misura il concetto di
integrale: per farlo considereremo classi sempre più generali di funzioni. Partiamo
dalle funzioni semplici , cioè quelle della forma
ϕ(x) =
n
X
ci χEi (x)
i=1
ove ci sono costanti e gli insiemi Ei sono misurabili.
4.3.3 Teorema Se f : X −→ [0, ∞] è una funzione misurabile allora esiste una
successione monotona {ϕn } di funzioni semplici che converge puntualmente a f .
Se la misura su X è σ-finita, possiamo scegliere le ϕn a supporto in insiemi di
misura finita.
Dimostrazione: Dato che, per ogni intero positivo n ed ogni numero reale t
esiste un unico intero kt,n tale che
kt,n
kt,n + 1
≤t≤
n
2
2n
93
4.3. Integrazione
possiamo definire
(
kt,n 2−n
sn (t) :=
n
se 0 ≤ t < n
se n ≤ t ≤ ∞
Evidentemente si tratta di funzioni misurabili sull’insieme [0, ∞] (sono addirittura boreliane) e tali che, per ogni t: 0 ≤ s1 (t) ≤ s2 (t) ≤ ... ≤ t. è anche ovvio
che limn−→∞ sn (t) = t in [0, ∞] e quindi le funzioni
ϕn (x) := sn (f (t))
soddisfano la tesi del teorema
qed
Se ϕ è una funzione semplice non negativa e E un insieme misurabile, definiamo
Z
n
X
ϕdµ :=
ci µ(E ∩ Ei )
E
i=1
Se E = X si omette ed in genere si omette anche la misura.
Evidentemente una funzione semplice ammette diverse rappresentazioni in
termini di diversi insiemi Ei , ma è ovvio verificare che l’integrale cosı̀ definito
non dipende dalla rappresentazione scelta per ϕ.
Osserviamo che una funzione semplice può definirsi come una funzione misurabile che assume solo un numero finito di valori {a1 , ..., aN }; allora possiamo
rappresentarla sempre come
N
X
ϕ=
a i χA i
i=1
ove Ai = {x | ϕ(x) = ai }. In questa rappresentazione gli Ai sono disgiunti e gli
ai distinti e non nulli. La adotteremo sistematicamente.
4.3.4 Proposizione Se ϕ e ψ sono funzioni semplici i cui supporti abbiano
misure finite, allora
Z
Z
Z
∀a, b ∈ R
(aϕ + bψ) = a ϕ + b ψ
e, se ϕ ≥ ψ q.o. allora
Z
Z
ϕ≥
ψ
Dimostrazione: Se consideriamo gli insiemi Ek = Ai ∩Bj ottenuti intersecando
in tutti i modi possibili gli insiemi delle rappresentazioni canoniche di ϕ e ψ, allora
ϕ=
N
X
k=1
ak χEk
e
ψ=
N
X
k=1
bk χEk
94
Capitolo 4. Misure
quindi
aϕ + bψ =
X
(aak + bbk )χEk
e, per additività della misura si ha il primo enunciato. Per dimostrare il secondo
basta notare che
Z
Z
Z
ϕ − ψ = (ϕ − ψ) ≥ 0
qed
4.3.5 Proposizione Se f è una funzione reale definita e limitata su un insieme
misurabile E di misura finita allora
Z
Z
inf
ψ = sup ϕ
f ≤ψ
ϕ≤f
E
E
per tutte le funzioni semplici ϕ e ψ se e solo se f è misurabile.
Dimostrazione: Se |f | ≤ M e f è misurabile allora gli insiemi
½
¾
(k − 1)M
kM
Ek := x |
< f (x) ≤
n
n −n≤k≤n
sono disgiunti, misurabili e la loro unione è E. Quindi
µ(E) =
n
X
µ(Ek )
i=−n
Evidentemente le funzioni semplici
n
M X
ψn (x) :=
kχEk (x)
n k=−n
e
n
M X
ϕn (x) :=
(k − 1)χEk (x)
n k=−n
sono tali che ϕn ≤ f ≤ ψn e quindi
Z
Z
n
M X
inf
kµ(Ek )
ψ≤
ψn =
n k=−n
E
E
e
Z
Z
n
M X
sup ϕ ≤
(k − 1)µ(Ek )
ϕn =
n k=−n
E
E
Quindi, per ogni n:
Z
0 ≤ inf
Z
ψ − sup
E
ϕ≤
E
M
µE
n
95
4.3. Integrazione
Z
i.e.
Z
inf
ψ = sup
ϕ
E
Viceversa, se vale la
E
Z
Z
inf
f ≤ψ
ϕ
ψ = sup
ϕ≤f
E
E
allora, per ogni n, esistono funzioni semplici ϕn e ψn tali che ϕn ≤ f ≤ ψn e
Z
Z
1
ψn − ϕ <
n
Allora le funzioni ψ ∗ = inf ψn e ϕ∗ = sup ϕn sono misurabili e ϕ∗ ≤ f ≤ ψ ∗ .
Dunque se
D := {x | ϕ∗ (x) < ψ ∗ (x)}
è unione degli insiemi
½
Dν =
1
x | ϕ (x) < ψ (x) −
ν
∗
¾
∗
Ogni tale insieme è contenuto in {x | ϕn (x) < ψn (x) − 1/ν} che ha misura minore
di ν/n. Allora, per arbitrarietà di n:
∀ν
µDν = 0 ⇒ µD = 0
Dunque ϕ∗ = ψ ∗ q.o. e ϕ∗ = f q.o. Ma una funzione uguale q.o. ad una funzione
misurabile è pure misurabile, per definizione.
qed
4.3.6 Definizione Se f : X −→ [0, ∞] è misurabile sullo spazio di misura
(X, A, µ) allora definiamo l’integrale di f come
Z
Z
ϕdµ
f dµ := sup
0≤ϕ≤f
ove ϕ varia fra le funzioni semplici.
Una conseguenza immediata della definizione è che
Z
Z
f ≤g⇒ f ≤ g
Z
e che
∀c ∈ R c
Z
f=
cf
Vogliamo ora dimostrare i teoremi di passaggio al limite sotto il segno di integrale
per l’integrale che abbiamo appena definito.
96
Capitolo 4. Misure
4.3.7 Lemma di Fatou Se {fn } è una successione di funzioni misurabili non
negative che converge q.o in un insieme E ad una funzione f allora
Z
Z
f ≤ lim fn
E
E
Dimostrazione: Possiamo assumere che fn −→ f ovunque. Allora basta mostrare che se ϕ è una funzione semplice non negativa tale che ϕ ≤ f allora
Z
Z
ϕ ≤ lim fn
E
R
E
Se E ϕ = ∞ allora esiste un insieme misurabile A ⊂ E con µA = ∞ e tale che
su A 0 < a < ϕ. Poniamo allora
An = {x ∈ E | ∀k ≥ n fk (x) > a}
ottenendo cosı̀ una successione crescente di insiemi misurabili la cui unione
contiene A, dato che ϕ ≤ lim fn . Quindi lim µA = ∞ e, essendo
Z
fn ≥ aµAn
E
Z
allora
Z
fn = ∞ =
lim
ϕ
R
Se E ϕ < ∞ allora l’insieme A = {x ∈ E | ϕ(x) > 0} è misurabile ed ha misura
finita; se ϕ ≤ M e ε > 0, gli
E
E
An := {x ∈ E | ∀k ≥ n fk (x) > (1 − ε)ϕ(x)}
definiscono una successione crescente di insiemi la cui unione contiene A; quindi
{A \ An } è una successione descrescente di insiemi la cui intersezione è vuota.
Ne segue che µ(A \ An ) = 0 e quindi esiste n tale che, per k ≥ n µ(A \ An ) < ε.
Quindi, per k ≥ n:
Z
Z
Z
Z
Z
fk ≥
fk ≥ (1 − ε)
ϕ ≥ (1 − ε) ϕ −
ϕ
E
Ak
Ak
E
A\Ak
µZ
¶
Z
≥
ϕ−ε
ϕ+M
E
Dunque
E
Z
µZ
Z
fn ≥
lim
E
ϕ−ε
ϕ+M
E
e, per arbitrarietà di ε:
¶
E
Z
Z
fn ≥
lim
E
ϕ
E
qed
97
4.3. Integrazione
4.3.8 Teorema della Convergenza Monotona (B.Levi) Se {fn } è una successione di funzioni misurabili non negative che converge q.o. ad una funzione f
e tale che per ogni n fn ≤ f allora
Z
Z
f = lim fn
R
R
Dimostrazione: Dato che fn ≤ f si ha fn ≤ f e quindi, per il lemma di
Fatou:
Z
Z
Z
Z
f ≤ lim fn ≤ lim fn ≤ f
qed
4.3.9 Proposizione Se f e g sono funzioni misurabili non negative e a, b > 0
costanti allora
Z
Z
Z
(af + bg) = a f + b g
Inoltre si ha q.o:
Z
0≤
con
R
f
f = 0 se e solo se f = 0 q.o.
Dimostrazione: Per dimostrare il primo asserto usiamo il teorema di convergenza monotona: consideriamo due successioni {ϕn } e {ψn } crescenti di funzioni
semplici non negative convergenti a f e g, col che la successione {aϕn + bψn }
soddisfa le stesse ipotesi e converge a af + bg. Allora
µ Z
¶
Z
Z
Z
Z
Z
(af + bg) = lim (aϕn + bψ) = lim a ϕn + b ψn = a f + b g
Che sia 0 ≤
R
f è ovvio; se poi è
R
f = 0 presi gli insiemi
An = {x | f (x) >
si ha che, essendo χA /n ≤ f è µAn =
positivi di f ha misura nulla.
R
1
}
n
χAn = 0 e quindi l’insieme dei valori
qed
4.3.10 Corollario Se {fn } è una successione di funzioni misurabili non negative
allora
Z X
∞
∞ Z
X
fn =
fn
n=1
n=1
98
Capitolo 4. Misure
4.3.11 Definizione Una funzione non negativa f si dice integrabile su un insieme E misurabile se
Z
f <∞
E
Se f non è non negativa possiamo comunque dire se è integrabile: lo è se e
solo se lo sono la sua parte positiva f+ e parte negativa f− definite come
f+ (x) = max(f (x), 0)
e
f− (x) = min(f (x), 0)
L’integrale di una funzione integrabile qualsiasi è
Z
Z
Z
f = f+ − f−
4.3.12 Teorema della convergenza dominata (Lebesgue) Se g è integrabile e {fn } è una successione di funzioni misurabili convergenti q.o. a f su un
insieme E e tali che, su E si abbia
|fn | ≤ g
Z
allora
Z
f = lim
E
fn
E
Dimostrazione: Basta applicare il lemma di Fatou alle successioni {g + fn } e
{g − fn }.
qed
Osserviamo infine che, avendo a disposizione il concetto di integrale per
funzioni positive, possiamo estenderlo a funzioni reali e complesse qualsiasi,
semplicemente ponendo, se f è una funzione misurabile reale:
Z
Z
Z
f dµ =
f+ dµ −
f− dµ
E
E
E
e, se f = u + iv è una funzione misurabile complessa:
Z
Z
Z
f dµ =
udµ + i vdµ
E
E
E
99
4.4. Misure con segno, complesse e misure prodotto.
4.4
Misure con segno, complesse e misure prodotto.
Osserviamo che, se µ1 e µ2 sono misure definite sullo stesso spazio (X, A)
possiamo considerare una loro combinazione lineare a coefficienti positivi:
µ(E) := c1 µ1 (E) + c2 µ2 (E)
per c1 , c2 ≥ 0. Quello a cui vogliamo dare senso, sono tuttavia anche misure del
tipo
ν(E) := µ1 (E) − µ2 (E)
Ovviamente, dobbiamo supporre che sia µ1 che µ2 siano misure finite1 .
4.4.1 Definizione Una misura con segno sullo spazio misurabile (X, A) è una
funzione ν : A −→ [−∞, ∞] tale che
(1) ν assume al più uno fra i due valori ±∞.
(2) ν(∅) = 0.
(3) Se {En } è una successione di insiemi misurabili e disgiunti allora
!
̰
∞
[
X
En =
ν(En )
ν
n=1
n=1
ove il segno = significa che la serie converge assolutamente se ν(
è finito e diverge positivamente altrimenti.
S∞
n=1
En )
Quindi una misura con segno non è una misura nel senso fin qui inteso. Un
insieme A è positivo (negativo) se è misurabile e per ogni suo sottoinsieme E ⊂ A
misurabile si ha che ν(E) ≥ 0 (≤ 0). Un insieme è nullo se è sia positivo che
negativo., ovvero se ogni suo sottoinsieme misurabile ha misura nulla: evidentemente un insieme nullo è di misura nulla, mentre un insieme di misura nulla può
benissimo essere unione di un insieme positivo ed un insieme negativo.
4.4.2 Lemma
(1) Ogni sottoinsieme misurabile di un insieme positivo è positivo.
(2) L’unione numerabile di insiemi positivi è positivo.
(3) Se E è misurabile e 0 < ν(E) < ∞ allora esiste un insieme positivo A ⊂ E
con ν(A) > 0.
1
è impossibile dare senso, anche a livello puramente convenzionale, ad espressioni della
forma ∞ − ∞!
100
Capitolo 4. Misure
Dimostrazione: La (1) è ovvia. La (2) segue facilmente considerando una successione {an } di insiemi positivi la cui unione sia A; allora per ogni insieme
E ⊂ A misurabile si ha che
En := E ∩ An ∩ {An−1 ∩ ... ∩ {A1
sono misurabili e quindi ν(En ) ≥ 0; sono anche disgiunti e la loro unione è E, da
cui
∞
X
ν(En ) ≤ 0
ν(E) =
n=1
Qundi A è positivo.
Dimostriamo la (3): E è positivo oppure deve contenere un insieme di misura
negativa in modo che n − 1 sia il più piccolo intero positivo tale che esista
Sk−1 un
insieme misurabile E1 ⊂ E con ν(E1 ) < −1/n1 ; ricorsivamente, se E \ i=1 Ei
non è positivo, sia nS
k il più piccolo intero positivo tale che esista un insieme
k−1
misurabile Ek ⊂ E \ i=1
Ei e ν(Ek ) < −1/nk .
Ponendo
∞
[
Ei
A := E \
i=1
allora E è unione disgiunta di A e degli Ei , quindi
ν(E) = ν(A) +
∞
X
ν(Ei )
i=1
P
(la serie converge assolutamente per finitezza di ν(E). Quindi la serie
1/nk
converge ed in particolare nk −→ ∞.
Ora dimostriamo che A è positivo. Sia ε > 0; allora possiamo scegliere k tale
che
1
<ε
nk − 1
S
(perché nk tende ad ∞). Ma A ⊂ E \ ki=1 Ei e quindi non può contenere insiemi
misurabili di misura minore di −1/(nk −1) che è maggiore di −ε. Per arbitrarietà
di ε A non può quindi contenere insiemi misurabili di misura negativa.
qed
4.4.3 Teorema (decomposizione di Hahn) Se ν è una misura con segno su
uno spazio misurabile (X, A) allora esiste un insieme positivo A ed un insieme
negativo B tali che X = A ∪ B con A ∩ B = ∅.
4.4. Misure con segno, complesse e misure prodotto.
101
Dimostrazione: Supponiamo ad esempio che ν non assuma il valore +∞; se λ
è il sup di ν(A) al variare di tutti gli insiemi positivi A, dato che ∅ è positivo, si
ha che λ ≥ 0. Se {An } è una successione di insiemi positivi tali che
λ = lim µ(An )
n−→∞
e se A è l’unione degli An allora per il lemma 4.4.2(2) A è positivo e quindi
λ ≥ ν(A). Ma A \ Ai ⊂ A e quindi ν(A \ Ai ) ≥ 0 col che
ν(A) = ν(Ai ) + ν(A \ Ai ) ≥ ν(Ai ) ≥ λ
Quindi ν(A) = λ < ∞.
Se B = {A e E ⊂ B è positivo allora A ∩ E = ∅ e E ∪ A è positivo, sicché
λ ≥ ν(E ∪ A) = ν(E) + ν(A) = ν(E) + λ
i.e. ν(E) = 0 dato che λ ∈ [0, ∞). Allora B non può contenere nessun insieme
positivo di misura positiva e quindi per il lemma 4.4.2(3) nessun sottoinsieme di
misura positiva. Quindi B è negativo.
qed
La decomposizione di Hahn non è necessariamente unica. Lo è a meno di
insiemi nulli, come si può facilmente osservare.
4.4.4 Definizione Due misure µ1 e µ2 su uno spazio misurabile (X, A) si dicono
mutuamente singolari se esistono insiemi A e B disgiunti tali che X = A ∪ B e
µ1 (A) = µ2 (B) = 0. Si scrive in tal caso µ1 ⊥µ2 .
4.4.5 Teorema (decomposizione di Jordan) Se ν è una misura con segno
sullo spazio misurabile (X, A) allora esistono uniche due misure mutuamente
singolari ν ∗ e ν − su (X, A) tali che ν = ν + − ν − .
Dimostrazione: Se X = A ∪ B è una decomposizione di Hahn definiamo
ν + (E) := ν(E ∩ A)
e
ν − (E) := −ν(E ∩ B)
Per definizione queste misure sono mutuamente singolari. La loro unicità è pure
un fatto semplice: se µ+ e µ− sono due misure che pure soddisfano la decomposizione di Jordan, allora possiamo considerare gli insiemi C e D disgiunti e tali che
X = C ∪ D e µ+ (C) = µ− (D) = 0. Evidentemente questi insiemi danno luogo
ad una decomposizione di Hahn, e quindi le misure µ+ , ν + e µ− e ν − differiscono
solo su insiemi di misura nulla.
qed
102
Capitolo 4. Misure
La decomposizione di Jordan di una misura ci consente di definire il valore
assoluto (o variazione totale) di una misura con segno ν come
|ν|(E) := ν + (E) + ν − (E)
Si tratta ovviamente di una misura; gli insiemi nulli sono esattamente gli insiemi
E tali che |ν|(E) = 0.
4.4.6 Definizione Se µ e ν sono misure definite su uno spazio misurabile (X, A)
si dice che ν è assolutamente continua rispetto a µ se per ogni A tale che µ(A) = 0
si ha che ν(A) = 0. Si scrive in questo caso ν ¿ µ.
In caso di misure con segno, la mutua singolarità e l’assoluta continuità si
riferiscono ai loro valori assoluti.
Il risultato fondamentale sull’assoluta continuità delle misure, il teorema di
Radon–Nikodym, verrà dimostrato usando il teorema di rappresentazione di
Riesz per funzionali lineari su uno spazio di Hilbert.
Considerando le misure di Lebesgue su R, R2 ,...,Rn è lecito chiedersi se non si
possano definire tutte in termini della misura su R utilizzando la decomposizione
Rn = R×...×R. Ci chiediamo cioè se si possa effettuare il prodotto nella categoria
degli spazi di misura.
Siano quindi (X, A, µ) e (Y, B, ν) spazi di misura completi e consideriamo
l’insieme X × Y . Se A ∈ A e B ∈ B chiamiamo l’insieme A × B un rettangolo
misurabile. La famiglia dei rettangoli misurabili
R := {A × B}A∈A,B∈B
non è una σ-algebra e nemmeno un’algebra in generale: tutto quello che possiamo
dire è che l’intersezione di elementi di R appartiene a R dato che
(A × B) ∩ (C × D) = (A ∩ C) × (B × D)
e che il complementare di un elemento di R è unione disgiunta di elementi di
R2 , avendosi:
{(A × B) = ({A × B) ∪ (A × B) ∪ ({A × {B)
Possiamo comunque definire una funzione su R come
λ(A × B) = µA · νB
2
Si dice che R è una semialgebra di insiemi .
4.4. Misure con segno, complesse e misure prodotto.
103
4.4.7 Lemma Se {(An × Bn )} è una successione di elementi di R a due a due
disgiunti, la cui unione sia A × B allora
λ(A × B) =
∞
X
λ(An × Bn )
i=1
Dimostrazione: Se x ∈ A allora, per ogni y ∈ B esiste un unico ny tale che
(x, y) ∈ Any × Bny e quindi
X
νBn · χAn (x) = νB · χA (x)
(per additività numerabile di ν). Per il corollario 4.3.10 si ha quindi
Z
XZ
νBi χAi dµ = νBχA dµ
i.e.
X
νBn · µAn = νB · µA
qed
4.4.8 Lemma Esiste un’unica misura λ sull’algebra A generata dalla famiglia
R.
Dimostrazione: A contiene l’insieme vuoto, e ogni suo elemento è unione finita
disgiunta di elementi di R. Definiamo allora
λA :=
n
X
λRi
i=1
se A = R1 ∪ ... ∪ Rn e Ri ∈ R. Dato che la decomposizione di A in elementi
disgiunti di R non è unica bisogna dimostrare che questa definizione è ben posta
e dà luogo ad un’unica λ.
Intanto notiamo che la funzione λ è non negativa e ovviamente λ∅ = 0.
Inoltre, per il lemma, se A ∈ A è unione disgiunta di due famiglie {Ri } e {Si } in
R allora
X
X
λCi =
λDi
P
(infatti λCi = λ(Ci ∩ Di )). Inoltre, sempre per il lemma, λ è numerabilmente
additiva su A; quindi l’estensione λ è ben definita e unica.
qed
104
Capitolo 4. Misure
Abbiamo quindi una misura λ su un’algebra, e quindi, per il teorema di
estensione di Carathéodory, una misura completa λ sulla σ-algebra S generata
da A: questa misura si dice misura prodotto delle µ e ν e si denota con µ ⊗ ν: è
finita (o σ-finita) se lo sono µ e ν.
La misura di Lebesgue su R2 è definita quindi come dx ⊗ dy, ove dx e dy sono
misure di Lebesgue sui fattori R.
Il teorema fondamentale sulle misure prodotto è dovuto a Fubini. Per dimostrarlo avremo bisogno di alcuni lemmi preliminari: il seguente è un sottoprodotto
della dimostrazione del teorema di estensione di Carathéodory.
4.4.9 Lemma Se µ è una misura su un’algebra A e µ∗ la misura esterna indotta
da µ, allora per ogni insieme E ⊂ X e ε > 0 esiste un A ∈ Aσ (l’insieme delle
unioni numerabili di elementi di A) tale che E ⊂ A e
µ∗ A ≤ µ∗ E + ε
ed esiste un B ∈ Aσδ (l’insieme delle intersezioni numerabili di elementi di Aσ )
tale che E ⊂ B e
µ∗ E = µ∗ B
Dimostrazione: La prima parte del lemma è provata nel corso della dimostrazione del teorema di Carathéodory.
Il secondo enunciato si dimostra considerando, per ogni numero naturale
T n,
∗
∗
un insieme An ∈ A con E ⊂ An e µ An ≤ µ E + 1/n, e ponendo B = An .
Ovviamente B ∈ Aσδ e E ⊂ B. Infine
1
µ∗ E ≤ µ∗ B ≤ µ∗ An ≤ µ∗ E +
n
∗
∗
e, per arbitrarietà di n, µ E = µ B.
qed
Definiamo, se E ⊂ X × Y le sezioni di E in x e y come
Ex := {y ∈ Y | (x, y) ∈ E}
e
Ey := {x ∈ X | (x, y) ∈ E}
Osserviamo
che se E ∈ Rσδ allora è ν-misurabile. Se E ∈ R questo è ovvio. Se
S
E = En ∈ Rσ segue da
χEx (y) = χE (x, y) = sup χEn (x, y) = sup χ(En )x (y)
n
(gli En ∈ R sono misurabili). Analogamente se E =
n
T
n
En ∈ Rσδ segue da
χEx (y) = χE (x, y) = inf χEn (x, y) = inf χ(En )x (y)
n
n
(gli En ∈ Rσ sono misurabili come si è appena visto).
4.4. Misure con segno, complesse e misure prodotto.
105
4.4.10 Lemma Se E ∈ Rσδ e µ ⊗ ν(E) < ∞ allora la funzione g(x) := νEx è
misurabile in (X, A, µ) e
Z
gdµ = µ ⊗ ν(E)
Dimostrazione: Se E ∈ R il lemma è banale. Se {En } è una successione in R
di insiemi a due a due disgiunti e se
X
gn (x) := ν(En )x
e
g :=
gn
n
allora g è misurabile e, dato che gn ≥ 0, per il teorema della convergenza
monotona di B.Levi:
Z
XZ
X
gdµ =
gn dµ =
µ ⊗ ν(En ) = µ ⊗ ν(E)
n
n
quindi il lemma è vero per E ∈ Rσ . Infine, se E ∈ Rσδ haTmisura finita, allora
esiste una successione {En } ⊂ Rσ con En+1 ⊂ En e E = n En . Quindi, per il
lemma precedente, possiamo assumere µ ⊗ ν(E1 ) < ∞. Poniamo
gn (x) := ν(En )x
Dato che
Z
g1 dµ = µ ⊗ ν(E1 ) < ∞
si ha g1 < ∞ q.o: se dunque x è tale che g(x) < ∞ allora la successione {(En )x }
è descrescente e la sua intersezione è Ex . Per la proposizione 4.2.1(2) si ha
g(x) = ν(Ex ) = lim ν(En )x = lim gn (x)
n
n
i.e. gn −→ g q.o., da cui la misurabilità di g. Infine, essendo 0 ≤ gn ≤ g1 , per il
teorema della convergenza dominata di Lebesgue (e di nuovo per la proposizione
4.2.1(2)):
Z
Z
gdµ = lim
n
gn dµ = lim µ ⊗ νEn = µ ⊗ νE
n
qed
Diciamo che una funzione misurabile f : X −→ C su uno spazio di misura
(X, A, µ) è integrabile se
Z
|f |dµ < ∞
X
L’insieme delle funzioni integrabili modulo la relazione che identifica due funzioni
se sono uguali quasi ovunque è uno spazio vettoriale (rispetto alla somma e
moltiplicazione per uno scalare delle classi di equivalenza definite come [f ]+[g] =
[f + g] e a[f ] = [af ], che si indica con L1 (X, µ).
106
Capitolo 4. Misure
4.4.11 Teorema (Fubini) Se (X, A, µ) e (X, B, ν) sono spazi completi di misura e f ∈ L1 (X × Y, µ ⊗ ν) allora
(1) per quasi ogni x la funzione fx (y) := f (x, y) appartiene a L1 (Y, ν) e
Z
fx (y)dν(y) ∈ L1 (X, µ)
Y
(2) per quasi ogni y la funzione fy (x) := f (x, y) appartiene a L1 (Y, µ) e
Z
fy (x)dµ(x) ∈ L1 (Y, ν)
X
(3)
Z Z
Z
f dµ ⊗ ν =
fx dνdµ =
X
Y
Z Z
X×Y
fy dµdν
Y
X
Dimostrazione: Data la simmetria fra x e y nell’enunciato basta dimostrare
la (1) e la prima uguaglianza della (3); inoltre basta limitarsi a funzioni non
negative, perché se il teorema vale per funzioni qualsiasi, evidentemente vale
anche per le loro differenze.
L’idea della dimostrazione è di verificare il teorema per classi sempre più vaste
di funzioni. Iniziamo col verificarne la validità per le funzioni caratteristiche di
insiemi misurabili di misura finita.
Per il lemma 4.4.9 esiste un F ∈ Rσδ contenente E e tale che µ ⊗ ν(F ) =
µ ⊗ µ(E): l’insieme G := F \ E è misurabile (lo sono E e F ) e
µ ⊗ ν(F ) = µ ⊗ ν(E) + µ ⊗ ν(G)
e quindi µ ⊗ ν(G) = 0. Ora, a sua volta, esiste un insieme H ⊂ Rσδ contenente
G e con µ ⊗ ν(H) = µ ⊗ ν(G) = 0; quindi, per il lemma 4.4.10, ν(Hx ) = 0 per
quasi ogni x ∈ X e quindi (Gx ⊂ Hx ) ν(Gx ) = 0 (per completezza di ν). Quindi
g(x) = ν(Ex ) = ν(Fx )
q.o.
e quindi (ancora per il lemma 4.4.10) g è misurabile e
Z
gdµ = µ ⊗ ν(F ) = µ ⊗ (E)
Ne segue:
Z Z
Z
χE dµ ⊗ ν
(χE )x dνdµ =
X
Y
X×Y
4.4. Misure con segno, complesse e misure prodotto.
107
Il teorema è quindi dimostrato per funzioni caratteristiche di insiemi misurabili
di misura finita, e quindi (per linearità) per funzioni semplici nulle fuori da
insiemi di misura finita; ma, per il teorema 4.3.3, ogni ogni funzione integrabile
non negativa è limite di una successione crescente di tali funzioni: f = limn ϕn
e quindi fy = limn (ϕn )y , dunque, per il teorema della convergenza monotona di
B. Levi (si noti che le ϕn sono integrabili, essendolo la f ):
Z
Z
fx (y) = dν(y) = lim (ϕn )x (y)dy
n
Y
Y
In altri termini questo integrale è una funzione misurabile della x e, di nuovo per
il teorema della convergenza monotona:
Z
Z Z
Z Z
Z
ϕdµ ⊗ ν =
f dνdµ = lim
(ϕn )y dνdµ = lim
f dµ ⊗ ν
X
Y
n
X
n
Y
X×Y
X×Y
qed
Questo teorema è visibilmente di fondamentale importanza: tuttavia spesso
non è immediata la verifica della sua applicabilità. A questo scopo è spesso utile
considerare un criterio che permette di dedurre le ipotesi del teorema di Fubini:
4.4.12 Teorema (Tonelli) Se (X, A, µ) e (X, B, ν) sono spazi di misura σfiniti e f è una funzione misurabile su X × Y e non negativa, allora
(1) per quasi ogni x la funzione fx (y) := f (x, y) è misurabile e
Z
fx (y)dν(y)
è misurabile
Y
(2) per quasi ogni y la funzione fy (x) := f (x, y) è misurabile e
Z
fy (x)dµ(x)
è misurabile
X
(3)
Z Z
Z
f dµ ⊗ ν =
fx dνdµ =
X
Y
Z Z
X×Y
fy dµdν
Y
X
Dimostrazione: Osserviamo semplicemente che, nella dimostrazione del teorema di Fubini l’unico punto nel quale si usa l’ipotesi di integrabilità della f
(rispetto a µ ⊗ ν) è per dedurre l’integrabilità delle funzioni semplici ϕn } che approssimano la f : nel nostro caso non è necessario, perché basta la σ-finitezza degli
spazi di misura in questione per dedurre l’esistenza delle {ϕn }. Quindi la stessa
dimostrazione del teorema di Fubini fornisce, con questa modifica, il teorema di
Tonelli.
qed
108
4.5
Capitolo 4. Misure
Misure di Borel, Radon e integrale di Stieltjes.
Vogliamo qui accennare a qualche procedimento che consente la costruzione
di misure di Borel.
Consideriamo uno spazio topologico X localmente compatto di Hausdorff: in
questo paragrafo ogni spazio topologico sarà di questo tipo. Se f : X −→ R è
una funzione continua, il suo supporto è l’insieme
supp f := {x | f (x) 6= 0}
L’insieme Cc (X) delle funzioni reali continue a supporto compatto è uno spazio
vettoriale, e costituisce il protagonista della teoria dell’integrazione su X.
4.5.1 Definizione La σ-algebra degli insiemi di Radon è la σ-algebra R(X) di
sottoinsiemi di X tali che gli elementi di Cc (X) siano funzioni misurabili.
Quindi R(X) è generata da insiemi della forma
{x | f (x) ≥ a}
con f ∈ Cc (X). Se a > 0 questi sono insiemi compatti Gδ e, dato che i compatti
Gδ sono evidentemente insiemi di Radon, R(X) è generata da essi.
Ricordiamo che
4.5.2 Definizione La σ-algebra degli insiemi di Borel è la σ-algebra B(X) generata dagli insiemi chiusi.
Quindi R(X) ⊂ B(X). Il viceversa vale se X è uno spazio metrico separabile
localmente compatto.
4.5.3 Definizione Una misura di Radon su X è una misura completa sulla
σ-algebra R(X) tale che ogni insieme compatto abbia misura finita.
(Come sappiamo la richiesta di completezza può sempre soddisfarsi, completando la misura data). Ricordiamo che una misura di Borel è una misura
sui boreliani di X: spesso considereremo il suo completamento e lo chiameremo
sempre misura di Borel.
4.5.4 Definizione Una misura µ su una σ-algebra A contenente R(X), si dice
quasi-regolare se
(1)
∀E ∈ A
µE = inf µA
E⊂A
A∈A∩T
(T denota la topologia di X) e
(2)
∀A ∈ A ∩ T
µA =
inf
K⊂A
K∈A compatto
µK
Se la (2) vale per ogni A ∈ A la misura si dice regolare.
4.5. Misure di Borel, Radon e integrale di Stieltjes.
109
Ad esempio, la misura di Lebesgue sulla retta reale è regolare. Mimando la
costruzione della misura di Lebesgue vogliamo ora definire delle misure quasiregolari sul nostro spazio X localmente compatto di Hausdorff.
4.5.5 Definizione Una misura esterna µ∗ su X si dice topologicamente regolare
se
∀E ⊂ X
(1)
(2)
(3)
∀A1 , A2 ∈ T
µ∗ E = inf µ∗ A
E⊂A
A⊂T
A1 ∩ A2 = ∅ ⇒ µ∗ (A1 ∪ A2 ) = µ∗ A1 + µ∗ A2
∀A ∈ T
µ∗ A =
sup
µ∗ K
K⊂A
K compatto
4.5.6 Teorema Se µ∗ è una misura esterna topologicamente regolare su X allora
ogni boreliano è µ∗ -misurabile.
Dimostrazione: Dato che gli insiemi misurabili rispetto ad una misura esterna
formano una σ-algebra, basterà mostrare che i chiusi F sono µ∗ -misurabili.
Sia A un aperto di misura finita e ε > 0; allora A ∩ {F è aperto e ha misura
esterna finita. Ora, per la (3) nella definizione di regolarità topologica della µ∗ ,
si ha che
∀A ∈ T µ∗ A = sup µ∗ U
U ⊂A
U ∈T
U compatto
i.e. esiste un U aperto tale che U ⊂ A ∩ {F e
µ∗ U > µ∗ (A ∩ {F ) − ε
Allora, se V := A \ U , V ∩ U = ∅ e A ∩ F ⊂ V , quindi
µ∗ (A ∩ F ) + µ∗ (A ∩ {F ) < µ∗ V + µ∗ U + ε < µ∗ (U ∪ V ) + ε < µ∗ A + ε
(per la (2) nella definizione di regolarità topologica). Per arbitrarietà di ε si ha
dunque la misurabilità di F :
µ∗ (A ∩ F ) + µ∗ (A ∩ {F ) ≤ µ∗ A
(la disuguaglianza opposta è vera per monotonia della µ∗ ).
qed
110
Capitolo 4. Misure
4.5.7 Teorema Se µ : T −→ [0, ∞] è una funzione definita sugli aperti di X
tale che
(1) Se A è compatto allora µA < ∞.
(2) Se A1 ⊂ A2 allora µA1 ≤ µA2 .
(3) Se A1 ∩ A2 = ∅ allora µ(A1 ∪ A2 ) = µA1 + µA2 .
S
P
(4) µ ( n An ) ≤ n µAn .
(5) µA = sup
U ⊂A
U compatto
Allora la funzione
µU .
µ∗ E :=
inf
E⊂A⊂T
µA
è una misura esterna topologicamente regolare.
Dimostrazione: La monotonia e subadditività numerabile della µ∗ sono immediate per le (2) e (4); inoltre, se A ∈ T :
µ∗ A = µA
e quindi, per la (5), la (3) della definizione di regolarità topologica è vera per i
K che siano chiusure di aperti, e quindi è vera per ogni compatto. Infine le (1)
e (2) della definizione di regolarità topologica seguono dalla definizione di µ∗ e
dalla (3).
qed
Quindi, a partire da una funzione definita sugli aperti, possiamo definire
una misura sui boreliani associata alla misura esterna del teorema precedente:
la regolarità topologica della misura esterna garantisce la quasi-regolarità della
misura indotta.
Alternativamente, si può partire da una funzione definita sui compatti e cercare di estenderla ad una funzione che soddisfi le ipotesi del teorema precedente;
per questi ed altri approfondimenti si rimanda ai testi specialistici di teoria della
misura.
Consideriamo ora le misure di Radon sulla retta reale R: si tratta evidentemente di misure finite sui sottoinsiemi limitati di R; quindi, ad ogni tale misura
µ possiamo associare una funzione
F (x) := µ(−∞, x]
che si dice3 funzione di distribuzione della misura µ. Viceversa, data una funzione
F possiamo definire
µ(a, b] := F (b) − F (a)
3
Dato l’esteso utilizzo che se ne fa in teoria delle probabilità, usiamo il termine probabilistico.
4.5. Misure di Borel, Radon e integrale di Stieltjes.
111
4.5.8 Teorema La distribuzione associata ad una misura di Radon è una funzione monotona crescente, limitata, continua da destra e tale che
lim F (x) = 0
x−→−∞
Viceversa, una funzione F monotona crescente e continua da destra induce una
misura di Radon la cui distribuzione è esattamente la F .
Dimostrazione: Per le proprietà di µ è evidente che F è una funzione monotona
crescente a valori reali. Inoltre
µ(a, b] = F (b) − F (a)
e, dato che (a, b] =
T
n (a, b
+ 1/n], per la proposizione 4.2.1(2):
µ
¸
1
µ(a, b] = lim µ a, b +
n−→∞
n
µ
i.e.
F (b) = lim F
n−→∞
1
b+
n
¶
= F (b+)
il che significa che la funzione di distribuzione è continua da destra (o superiormente). Si noti che
µ
¸
1
µ{b} = lim b − , b = F (b) − F (b−)
n−→∞
n
Quindi F è continua in b se
T e solo se l’insieme {b} ha misura nulla. Nel caso
x = −∞ si trova, dato che n (−∞, −n) = ∅:
lim F (x) = 0
x−→−∞
Viceversa, sia F una funzione monotona crescente e continua da destra: allora la
µ(a, b] = F (b) − F (a)
definisce una funzione sulla classe I degli intervalli aperti a sinistra e chiusi a destra; questa classe non è una σ-algebra (non è neanche un’algebra) tuttavia, procedendo come nel lemma 4.4.2, possiamo
estendere µ ad una misura sull’algebra
S
generata da I, dato che, se (a, b] ⊂ n (an , bn ], allora
F (b) − F (a) ≤
∞
X
n=1
F (bn ) − F (an )
112
Capitolo 4. Misure
Allora, usando il teorema di estensione di Carathéodory, abbiamo una misura
sulla σ-algebra dei boreliani (che è quella generata da I) il cui completamento è
una misura di Radon; questa estensione è unica, dato che R è unione numerabile
di elementi di I e quindi µ è σ-finita.
qed
Quindi, se ϕ è una funzione boreliana su R possiamo integrarla rispetto ad
una funzione F monotona crescente continua da destra ponendo
Z
Z
ϕdF := ϕdµ
ove µ è la misura di Radon associata a F ; questo integrale si dice integrale di
Lebesgue–Stieltjes.
Uno spazio di misura (Ω, A, P ) tale che P (Ω) = 1 si dice spazio di probabilità
e la misura P si dice probabilità su Ω; ad esempio, l’intervallo [0, 1] con la misura
di Lebesgue è uno spazio di probabilità. In questo caso le distribuzioni delle
misure di Radon soddisfano alla
lim F (x) = 1
x−→∞
Una funzione misurabile X : [0, 1] −→ R si dice in questo contesto variabile aleatoria: ad una variabile aleatoria possiamo associare una funzione di distribuzione
ponendo
F (x) = P (X < x) := P {y | X(y) < x}
La F permette di calcolare le grandezze fondamentali associate ad una variabile
aleatoria, come la speranza matematica
Z
EX := xdF (x)
Z
e la varianza
DX :=
(x − EX)2 dF (x)
che infatti valgono
Z
EX =
Z
e
DX =
xF 0 (x)dx
(x − EX)F 0 (x)dx
Se ad esempio ϕ : [0, 1] −→ R è una funzione boreliana, avremo una nuova
variabile aleatoria Y = ϕ ◦ X, la cui speranza è
Z
xdG(x)
4.6. Spazi Lp .
113
(ove G è la distribuzione di Y ): ma se ϕ è integrabile rispetto alla misura di
Radon associata alla funzione di distribuzione di X, allora
Z
EY = Eϕ(X) = ϕ(x)dF (x)
Quindi la conoscenza di F determina la conoscenza delle distribuzioni di tutte le
variabili aleatorie ottenute trasformando X con funzioni boreliane.
4.6
Spazi Lp .
Da ultimo introduciamo gli spazi Lp : sia (X, A, µ) uno spazio di misura;
definiamo, per 1 ≤ p < ∞.
½
¾
Z
p
p
L (X, µ) := f : X −→ C | f misurabile e
|f | dµ < ∞ / ≡
come lo spazio delle classi di equivalenza (modulo la relazione f ≡ g ⇐⇒ f = g
q.o.) di funzioni la cui potenza p-sima abbia integrale finito in modulo. Per p = ∞
definiamo
L∞ (X, µ) := {f : X −→ C | f misurabile e misurabile}
Si tratta ovviamente di spazi vettoriali.
Per brevità scriviamo
¶ 1p
µZ
p
|f | dµ
||f ||p :=
e
||f ||∞ := esssupx∈X |f (x)|
ove il supremo essenziale è l’inf del sup di g per ogni g che sia uguale a f q.o:
esssupx∈X g(x) := inf{M | µ{x | M < f (x)}}
Nel séguito gli spazi Lp costituiranno l’esempio classico di spazi di Banach: per il
momento limitiamoci a dimostrare i risultati classici che permettono di effettuare
il calcolo in Lp : ricordiamo intanto la
4.6.1 Definizione Una funzione convessa è una funzione ϕ : (a, b) −→ R (con
−∞ ≤ a < b ≤ ∞) tale che
∀x, y ∈ (a, b) ∀λ ∈ [0, 1] ϕ((1 − λ)x + λy) ≤ (1 − λ)ϕ(x) + λϕ(y)
114
Capitolo 4. Misure
Ovviamente ϕ è convessa se e solo se
(C)
ϕ(t) − ϕ(s)
ϕ(u) − ϕ(t)
≤
t−s
u−t
∀s, t, u ∈ [a, b]
Da questo segue la continuità di ϕ in (a, b).
4.6.2 Lemma (disuguaglianza di Jensen) Se (X, A, µ) è uno spazio di misura con µ(X) = 1 e f ∈ L1 (X, µ) ha valori in (a, b) e ϕ è convessa in (a, b)
allora
µZ
¶ Z
ϕ
f dµ ≤
ϕ ◦ f dµ
X
X
Z
Dimostrazione: Poniamo
t :=
f dµ
X
(da cui t ∈ (a, b)) e β = sups∈(a,b) (t − s). Allora
∀s ∈ (a, b) ϕ(t) + β(s − t) ≤ ϕ(s)
i.e.
∀x ∈ X
ϕ(f (x)) − ϕ(t) − β(f (x) − t) ≥ 0
Dato che ϕ è continua, ϕ ◦ f è misurabile e quindi, integrando la disuguaglianza
precedente abbiamo
Z
Z
ϕ(t)µ(X) + β( f dµ − tµ(X)) ≤
ϕ ◦ f dµ
X
X
R
i.e. la tesi, dato che µ(X) = 1 e t =
X
f dµ.
qed
4.6.3 Teorema (disuguaglianza di Hölder) Se p, q > 0 sono tali che 1/p+
1/q = 1 (oppure se p = 1 e q = ∞) e (X, A, µ) uno spazio di misura, per ogni
coppia di funzioni f, g : X −→ [0, ∞] misurabili si ha
µZ
Z
f gdµ ≤
¶ 1p µZ
¶ 1q
q
f dµ
g dµ
p
X
X
Dimostrazione: Siano
µZ
¶ p1
p
A :=
f dµ
X
X
µZ
e
¶ 1q
g dµ
q
B :=
X
4.6. Spazi Lp .
115
Se A = 0 allora f = 0 q.o. quindi f g = 0 q.o. ed il teorema è dimostrato; se
A > 0 e B = ∞ pure il teorema è banale. Possiamo dunque supporre che siano
A, B ∈ (0, ∞). Poniamo
f
A
F :=
in modo che
e
Z
G=
g
B
Z
p
Gq dµ = 1
F dµ =
X
X
Ora, se F (x), G(x) ∈ (0, ∞), allora esistono s, t ∈ R tali che F (x) = es/p e G(x) =
et/q ; ma 1/p + 1/q = 1 e la funzione esponenziale è convessa: quindi
t
s
ep+q ≤
es et
+
p
q
i.e.
∀x ∈ X
e, integrando:
F (x)G(x) ≤
Z
F Gdµ ≤
X
F (x)p G(x)q
+
p
q
1 1
+ =1
p q
cioè la tesi.
qed
4.6.4 Corollario (disuguaglianza di Schwartz) Se (X, A, µ) uno spazio di
misura, per ogni coppia di funzioni f, g : X −→ [0, ∞] misurabili si ha
sZ
Z
sZ
f gdµ ≤
X
f 2 dµ
g 2 dµ
X
X
4.6.5 Teorema (disuguaglianza di Minkowski) Se p, q > 0 sono tali che
1/p + 1/q = 1 (oppure se p = 1 e q = ∞) e (X, A, µ) uno spazio di misura, per
ogni coppia di funzioni f, g : X −→ [0, ∞] misurabili si ha
µZ
p
(f + g) dµ
X
¶ 1p
µZ
≤
p
f dµ
X
µZ
¶ p1
¶ 1q
g dµ
q
+
X
116
Capitolo 4. Misure
Dimostrazione: Applichiamo all’identità
(f + g)p = f (f + g)p−1 + g(f + g)p−1
la disuguaglianza di Hölder:
µZ
Z
p−1
f (f + g)
dµ ≤
¶ 1p µZ
¶ 1q
(p−1)q
f dµ
(f + g)
dµ
p
X
X
X
ma (p − 1)q = p e quindi
µZ
Z
(f + g)p dµ ≤
(f + g)p dµ
¶ 1q õZ
µZ
g p dµ
+
X
X
X
f p dµ
¶ p1
¶ p1 !
X
Ora, supponiamo che in questa disuguaglianza la parte sinistra sia non nullo e
la parte destra non infinito (altrimenti il teorema è banale): dato che la funzione
tp è convessa per t ∈ (0, ∞):
µ
¶p
f +g
1
≤ (f p + g p )
2
2
e quindi
R
(f + g)p dµ
X
¡R
¢1 ≤
p dµ q
(f
+
g)
X
à µZ
¶ p1 µZ
¶ p1 !
p
f dµ
g dµ
+
p
X
X
cioè, dato che 1 − 1/q = 1/p, la disuguaglianza di Minkowski.
qed
Vogliamo infine dimostrare dei risultati molto utili di approssimazione per le
funzioni in Lp : consideriamo uno spazio di Hausdorff localmente compatto X, A
una σ-algebra su X contenente i boreliani e µ una misura regolare su X.
4.6.6 Teorema Se 1 ≤ p < ∞ per ogni funzione f ∈Lp (X, µ) esiste una funzione
continua a supporto compatto g tale che
||f − g||p −→ 0
Cioè ogni funzione Lp è approssimabile con funzioni continue a supporto compatto.
Dimostrazione: Dimostreremo in realtà di più: ogni funzione Lp si approssima
con funzioni “di salto”, cioè con funzioni semplici s che hanno supporto in insiemi
4.6. Spazi Lp .
117
di misura finita. Sia S l’insieme delle funzioni s : X −→ C misurabili semplici
tali che
µ({x ∈ X | s(x 6= 0)} < ∞
Dimostriamo che gli elementi di questo insieme approssimano Lp . Intanto è ovvio
che S ⊂ Lp (X, µ); consideriamo poi, data f : X −→ [0, ∞) in Lp (X, µ), una
successione {sn } monotona di funzioni semplici che converga a f (teorema 4.3.3);
dato che f − sn ≤ f (stiamo considerando funzioni reali positive in Lp : basta
dimostrare il teorema per esse):
|f − sn |p ≤ f p
Quindi possiamo usare il teorema della convergenza dominata:
Z
lim ||f − sn ||p = lim |f − sn |p dµ = 0
X
Per dimostrare il teorema ci basta sapere che, dato ε > 0, per ogni funzione s ∈ S
esiste g ∈ Cc (X) tale che
µ{x | g(x) 6= f (x)} < ε
e |g| ≤ ||s||∞ : infatti in questo caso
1
||f − g||p = ||f − g + s − s|| ≤ ||f − s||p + ||g − s||p < ε + 2ε p ||s||∞
Ora consideriamo la nostra s ∈ S e l’insieme A = {x | s(x) 6= 0}: sappiamo che è
diversa da zero su un insieme di misura finita, quindi, per regolarità della misura,
possiamo supporre che esista un compatto K un aperto U tali che K ⊂ U , s|U = 0
e µ(A \ K) < ε. Allora, per il lemma di Uryshon, esiste una funzione continua h
tale che h|K = 1 e g|{U = 0: evidentemente
µ{x | g(x) 6= s(x)} < ε
La g è la funzione cercata.
qed
Implicita nella dimostrazione di questo risultato è quella del seguente
4.6.7 Teorema (Lusin) Una funzione misurabile su un insieme di misura finita è approssimabile con funzioni continue a supporto compatto.
Capitolo 5
GRUPPI, ALGEBRE E
RAPPRESENTAZIONI
In questo capitolo collezioniamo alcune definizioni, teoremi ed esempi relativi
alle strutture algebriche più pervasive nella matematica: i gruppi, le algebre e le
loro rappresentazioni. Diamo solo alcune conseguenze quasi immediate della definizione di gruppo (nella III parte studieremo a fondo le strutture di gruppo che
intervengono in meccanica quantistica: i gruppi topologici e di Lie), mentre per
le algebre ci limitiamo alle definizioni ed agli esempi di dimensione finita, dato
che una classe importante di algebre a dimensione infinita, le algebre di operatori, saranno esaminate dettagliatamente nella II parte. Le rappresentazioni sono
pure introdotte nel caso di dimensione finita: in appendice 5.6 è data una trattazione elementare dei prodotti tensoriali per rendere autosufficiente l’esposizione
di questi concetti.
5.1
Gruppi
5.1.1 Definizione Un insieme G dotato di una operazione · : G × G −→ G si
dice un gruppo se l’operazione · (che si indicherà semplicemente per giustapposizione dei suoi operandi) è:
(1) associativa, cioè g(g 0 g 00 ) = (gg 0 )g 00 ;
(2) possiede identità e ∈ G, cioè ge = eg = g;
(3) ogni elemento g possiede un inverso, cioè esiste g −1 ∈ G tale che gg −1 =
g −1 g = e.
5.1.2 Definizione Un gruppo si dice abeliano (o commutativo) se l’operazione
è commutativa (i.e. gg 0 = g 0 g). Se un gruppo è finito, la sua cardinalità si dice
ordine del gruppo.
118
119
5.1. Gruppi
5.1.3 Esempio
(1) Uno spazio vettoriale rispetto alla somma di vettori è un gruppo abeliano.
(2) L’insieme SX delle funzioni biunivoche di un insieme X in sé è un gruppo
(non abeliano a meno che Card X ≤ 2).
(3) L’insieme degli interi Z è un gruppo rispetto alla somma, come pure il
“reticolo” Zn dei vettori in Rn a coordinate intere.
(4) Se V è uno spazio vettoriale reale di dimensione finita, l’insieme delle applicazioni lineari invertibili (isomorfismi lineari) di V n sé è un gruppo GL(V )
rispetto alla composizione, che si dice gruppo lineare generale; se fissiamo
una base in V , i.e. un isomorfismo V ∼
= Rn allora GL(V ) = GLn (R) è
il gruppo delle matrici invertibili di ordine n: l’operazione di gruppo è in
questo caso il prodotto di matrici (righe per colonne).
Se G e H sono gruppi e f : G −→ H è una funzione, si dice che f è un
omomorfismo 1 se f (gg 0 ) = f (g)f (g 0 ). Se inoltre f è iniettiva (risp. suriettiva,
biunivoca) si dice che è un monomorfismo (risp. epimorfismo, isomorfismo) del
gruppo G nel gruppo H. Gruppi isomorfi sono da considerarsi equivalenti ed
ovviamente la classe dei gruppi rispetto agli omomorfismi forma una categoria.
5.1.4 Esempio Se G è il gruppo dei numeri reali rispetto alla somma e H il gruppo dei numeri reali positivi rispetto al prodotto, allora la funzione esponenziale
x ∈ G 7−→ ex ∈ H è un isomorfismo.
Se G è un gruppo e S, T ⊂ G sono sottoinsiemi, definiamo
ST := {s · t | s ∈ S, t ∈ T }
Se f : G −→ H è un omomorfismo allora la sua immagine im f = f (G) è un
sottoinsieme di H tale che (im f )(im f ) ⊂ im f dato che f (g)f (g 0 ) = f (gg 0 ).
5.1.5 Definizione Un sottoinsieme H di un gruppo G tale che HH ⊂ H si dice
sottogruppo di G e si scrive in questo caso H < G.
Anche il nucleo del morfismo f
ker f := {g ∈ G | f (g) = e}
è un sottogruppo, che gode anche della proprietà (ker f )G = G(ker f ) (infatti se
k ∈ ker f e g ∈ G: f (kg) = f (k)f (g) = f (g) = f (g)f (k) = f (gk)). In altri termini,
se g ∈ G e k ∈ ker f allora gkg −1 ∈ ker f .
1
Si tratta della nozione analoga a quella di applicazione lineare nel caso degli spazi vettoriali:
molte definizioni che si danno per gli spazi vettoriali (funzioni lineari, sottospazi, quozienti,
prodotti) si generalizzano ai gruppi..
120
Capitolo 5. Gruppi, algebre e rappresentazioni
5.1.6 Definizione Un sottogruppo H < G tale che HG = GH si dice normale
e si scrive H C G.
5.1.7 Esempio Se G è abeliano, ogni sottogruppo è automaticamente normale:
in particolare nel caso di uno spazio vettoriale rispetto alla somma.
Come nel caso degli spazi vettoriali, un omomorfismo f : G −→ H è iniettivo
se e solo se ker f = {e}; in generale i : ker f ,→ G; ovviamente f : G −→ im f
è un epimorfismo, e la composizione i ◦ f è identicamente e. Si esprime questo
dicendo che la successione
(∗)
{e}
/ ker f
/G
/ im f
/ {e}
è esatta. Nel caso degli spazi vettoriali esiste una nozione analoga: se V, W e
Z sono spazi vettoriali e f : V −→ W , g : Z −→ V sono mappe lineari, la
successione
Z
g
/V
f
/W
è esatta se ker f = im g; quindi se Z = 0 l’esattezza vuol dire l’iniettività di f e
se W = 0 vuol dire la suriettività di g. La stessa cosa nel caso di gruppi qualsiasi.
Un modo diverso di esprimere la (*) è dire che il gruppo im f è quoziente del
gruppo G modulo il sottogruppo ker f .
In generale, se G è un gruppo e K C G è un sottogruppo normale allora
l’insieme
G/K := {gK | g ∈ G}
dei sottoinsiemi di G della forma gK è un gruppo rispetto al prodotto
(gK)(g 0 K) = (gg 0 )K
e si dice gruppo quoziente modulo K. Gli elementi gK di G/K si dicono classi
laterali (sinistre) di G modulo K.
5.1.8 Proposizione I sottogruppi normali di G sono esattamente i nuclei dei
possibili omomorfismi di G in un altro gruppo.
Dimostrazione: Che se f : G −→ H è un omomorfismo allora ker f C G già
lo sappiamo; viceversa, se K C G allora la proiezione p : G −→ G/K è un
epimorfismo di nucleo K.
qed
121
5.1. Gruppi
Nel caso della (*) G/ ker f è isomorfo, tramite l’isomorfismo G/ ker f 7−→
im f , a im f . Si noti che, se H non è normale, G/H non è un gruppo.
Se G e H sono gruppi il prodotto G × H è un gruppo rispetto a
(g, h)(g 0 , h0 ) := (gg 0 , hh0 )
Evidentemente questa definizione si generalizza al prodotto di una famiglia qualsiasi di gruppi; il gruppo G×H si dice prodotto diretto dei gruppi G e H: i fattori
si immergono nel prodotto con due immersioni
iG : G ,→ G × H
g 7−→ (g, e)
iH : H ,→ G × H
h 7−→ (e, h)
che sono monomorfismi: quindi G < G × H e H < G × H. Inoltre i sottogruppi
G e H sono normali, e si ha
G × H/G ∼
=H
e
G × H/H ∼
=G
(un isomorfismo fra i gruppi G e G0 si indica con G ∼
= G0 ). Quindi la struttura
di G × H è in un certo senso determinata da quella di G e H: ogni volta che un
gruppo ha sottogruppi normali, passando ai quozienti si trovano gruppi “meno
complicati” del gruppo di partenza. Questo motiva la seguente
5.1.9 Definizione Un gruppo G è semplice se non ha sottogruppi normali non
banali.
“Non banali” vuol dire diversi da {e} e G stesso, che sono ovviamente sottogruppi normali di G.
Se H, H 0 < G sono sottogruppi, anche H ∩ H 0 lo è, ovviamente; se S ⊂ G è
un sottoinsieme qualsiasi, il sottogruppo generato da S è
\
hSi :=
H
S⊂H<G
l’intersezione di tutti i sottogruppi che contengono S. In particolare, per S = {s}
si scrive hgi per il sottogruppo generato dall’elemento g ∈ G.
Naturalmente g è formato da e, g, gg,... Usiamo la notazione esponenziale
scrivendo g n in luogo di g · · · g (n volte): allora è ovvio che g n g m = g n+m e quindi
che hgi è abeliano.
5.1.10 Esempio Consideriamo il gruppo Z rispetto alla somma: l’identità è
e = 0; se consideriamo 1 ∈ Z allora ogni elemento di Z è della forma 1 + · · · + 1
(n volte) e quindi Z = h1i.
122
Capitolo 5. Gruppi, algebre e rappresentazioni
5.1.11 Definizione Se un gruppo G è generato da un suo elemento g ∈ G, i.e.
se G = hgi, si dice ciclico.
Quindi Z è ciclico. Notiamo che possiamo definire un gruppo ciclico finito
per ogni numero naturale n: basta considerare un insieme Cn = {c0 , ..., cn−1 } e
definire il prodotto ponendo
ck1 := ck
(k = 0, ..., n−1.) Otteniamo cosı̀ un gruppo ciclico generato da c1 con n elementi,
il cui elemento unità è c0 = e.
Un modo familiare di rappresentare questo gruppo è considerare le classi
di congruenza di numeri interi modulo n: Zn . Rispetto alla somma (modulo n)
si tratta esattamente di Cn (l’isomorfismo è la mappa c : Zn −→ Cn data da
c(n) = cn ).
Notiamo che, se n è un numero primo allora Cn è un gruppo semplice: in
effetti, dato che è abeliano, bisogna mostrare che non ha sottogruppi non banali;
sia C < Cn un sottogruppo e sia ck ∈ C; se c1 = ck allora C = Cn ; altrimenti,
C contiene di certo il sottogruppo (ciclico) generato da ck ; ma dato che cm
k = e
per un certo m e ck ∈ Cn , deve essere m|n; se n è primo questo non è possibile a
meno che m = n (col che ck = c1 ) oppure m = 1 (col che ck = e); quindi C = {e}
oppure C = Cn .
Il gruppo Z lo consideriamo come C∞ ; non esistono in effetti gruppi ciclico
di cardinalità maggiore al numerabile:
5.1.12 Teorema Un gruppo ciclico è finito o numerabile e due gruppi ciclici Cn
e Cm sono isomorfi se e solo se n = m (n, m ∈ N ∪ {∞}).
Dimostrazione: Sia hgi un gruppo ciclico infinito: allora, per definizione, le
potenze g n sono tutte distinte fra loro, e quindi la mappa
g n 7−→ n
è un isomorfismo fra hgi e Z: è ovviamente biunivoca, ed è un omomorfismo
perché g n g m = g n+m .
Se invece hgi è un gruppo ciclico finito, esiste un n tale che g n = e; sia n minimo rispetto a questa proprietà; allora la mappa c : g n 7−→ cn è un isomorfismo
di hgi in Cn .
qed
Nei gruppi, a differenza che negli spazi vettoriali, può manifestarsi il fenomeno
della torsione, vale a dire, un elemento g ∈ G può avere una potenza pari all’unità
e: ∃n > 0 g n = e. Il minimo intero che soddisfa questa relazione si dice ordine
123
5.2. Azioni di gruppi
dell’elemento g. Ad esempio nel caso di un gruppo ciclico finito, il suo generatore
ha ordine pari all’ordine del gruppo.
Esiste, nel caso dei gruppi, una nozione analoga a quella di base per gli spazi
vettoriali. Se ogni elemento di G si esprime come prodotto di numero finito di
elementi di un certo sottoinsieme fissato S ⊂ G, si dice che gli elementi di S
generano il gruppo. In altri termini, S è un insieme di generatori di G se
G = hSi
In generale la cardinalità di un sistema di generatori potrà variare, non si può
cioè parlare di “dimensione” di un gruppo. Tuttavia un gruppo può essere finitamente generato, cioè può avere un insieme finito di generatori. Un teorema
fondamentale, per il quale si rimanda ai testi specialistici, afferma che un gruppo
abeliano finitamente generato è il prodotto diretto di un gruppo ciclico finito Cn
e di un reticolo Zm di interi.
5.2
Azioni di gruppi
Abbiamo visto che se X è un insieme, possiamo considerare l’insieme di tutte le
funzioni biunivoche di X in sé: si tratta di un gruppo rispetto alla composizione
di applicazioni (l’elemento unità è la funzione identità x 7−→ x e l’inverso è la
funzione inversa).
In particolare, se X è un insieme finito, otteniamo il gruppo Sn delle permutazioni di n oggetti:
¶
µ
1
2
3 ... n
i=
i(1) i(2) i(3) ... i(n)
Possiamo infatti vedere Sn come l’insieme delle funzioni biunivoche i : {1, .., n}
−→ {1, .., n}.
Questo gruppo è di fondamentale importanza, specie nelle applicazioni in
Fisica e Chimica; osserviamo che contiene tutte le permutazioni possibili di n
oggetti, quindi ha ordine2 n!.
5.2.1 Teorema (Cayley) Ogni gruppo finito di ordine n è (isomorfo a) un
sottogruppo del gruppo simmetrico Sn .
2
In effetti per costruire una permutazione i su n oggetti {1, 2, ..., n} cominciamo a stabilire
quale sia il suo valore i(1) su 1; abbiamo n scelte possibili per questo, e ne restano (n − 1) per
il valore i(2); una volta assegnato anche questo valore, restano (n − 2) scelte possibili per i(3) e
cosı̀ via fino a i(n) che risulterà una scelta obbligata. In definitiva abbiamo n(n − 1)(n − 2)...2
possibili permutazioni.
124
Capitolo 5. Gruppi, algebre e rappresentazioni
Dimostrazione: Sia G un gruppo finito di ordine n: possiamo supporre che
Sn sia l’insieme delle funzioni biunivoche di G in sé (nella definizione di gruppo
simmetrico non conta affatto la natura degli elementi che permuta: tutti gli
insiemi finiti della stessa cardinalità sono equivalenti da questo punto di vista).
Allora, se g ∈ G definiamo
Lg : G −→ G
come
Lg (g 0 ) := gg 0
Fissato g ∈ G, Lg è una funzione biunivoca: infatti
Lg (g 0 ) = Lg (g 00 ) ⇐⇒ gg 0 = gg 00 ⇐⇒ g 0 = g 00
(poiché esistono gli inversi in un gruppo vale la legge di cancellazione). Quindi
Lg ∈ Sn , ed abbiamo quindi definito una funzione
L : G −→ Sn
Dimostriamo che si tratta di un monomorfismo di gruppi. Intanto è iniettiva: se
g, g 0 ∈ G allora
∀h ∈ G Lg (h) = Lg0 (h) ⇐⇒ gh = g 0 h ⇐⇒ g = g 0
(di nuovo per cancellazione), e quindi L : g 7−→ Lg è iniettiva; infine è un
omomorfismo di gruppi:
Lgg 0 (h) = gg 0 h = g(g 0 h) = Lg (g 0 h) = Lg Lg0 (h)
qed
L’idea usata in questa dimostrazione è di fondamentale importanza: la funzione Lg si dice rappresentazione regolare, ed è un caso particolare del concetto
generale di rappresentazione.
Osserviamo intanto che, chiaramente, la dimostrazione si estende al caso
di cardinalità qualsiasi: ogni gruppo G è un sottogruppo del gruppo SX delle
trasformazioni biunivoche di un insieme X, della stessa cardinalità di G, in sé.
Ovviamente l’insieme SG è in generale molto misterioso; tuttavia possiamo
sempre ridurci a particolari classi di trasformazioni biunivoche, e precisamente a
quelle lineari.
Per il momento studiamo comunque il concetto di rappresentazione più in
generale.
5.2.2 Definizione Se G è un gruppo e X un insieme, si dice che G agisce su X
se esiste un omomorfismo di gruppi A : G −→ SX (che si dice azione del gruppo
sull’insieme).
125
5.2. Azioni di gruppi
Esplicitamente, una azione A soddisfa le
∀g, g 0 ∈ G ∀x ∈ X Agg0 x =Ag Ag0 x
∀x ∈ X 0 Ae x = x
(5.1)
(5.2)
Si scrive più semplicemente gx in luogo di Ag x (o, ancora peggio, di A(g)x che
sarebbe la scrittura più pedantemente corretta).
Ad esempio, la rappresentazione regolare Lg è una azione di G su sé stesso; bisognerebbe chiamarla “rappresentazione regolare sinistra”, dato che, se il
gruppo non è commutativo, Lg h 6= Lh g, e si può definire una rappresentazione
regolare destra come
Rg h := hg
Un’altra rappresentazione di G in sé è la rappresentazione coniugata:
Ag h := ghg −1
Si noti che Ag = Lg Rg−1 . Un elemento della forma ghg −1 si dice coniugato di h
rispetto a g; il coniugio è una relazione di equivalenza, come è facile verificare
(vedremo questo fatto più in generale fra breve).
5.2.3 Definizione Se G agisce su un insieme X e sia x ∈ X; allora
(1) Lo stabilizzatore dell’elemento x è il sottogruppo Gx di G definito come
Gx := {g ∈ G | gx = x}
(2) L’orbita di x in X è il sottoinsieme Gx di X definito come
Gx := {y ∈ X | ∃g ∈ G gy = x}
Quindi lo stabilizzatore di un elemento è il sottogruppo (che lo sia segue dalle
definizioni) formato dagli elementi del gruppo che “fissano” un punto dell’insieme
X, mentre l’orbita di un elemento è l’insieme degli altri punti di X che possono
“essere spostati” su x agendo con elementi di G. Intuitivamente pensiamo a X
come ad uno spazio e a G come ad un gruppo di trasformazioni di quello spazio.
5.2.4 Esempio Se X = Rn e G = GLn (R) allora la moltiplicazione di una
matrice per un vettore fornisce una azione di G su Rn .
126
Capitolo 5. Gruppi, algebre e rappresentazioni
5.2.5 Teorema Le orbite dell’azione di un gruppo G su un insieme X formano
la partizione di X in classi rispetto alla relazione di equivalenza
x ≈ y ⇐⇒ ∃g ∈ G gx = y
Questo segue dalle definizioni; quindi possiamo sempre decomporre X in
unione di sottoinsiemi disgiunti:
[
X=
Gx
x∈X
che si chiamano orbite dell’azione.
Osserviamo che la rappresentazione regolare può definirsi da G sull’insieme
dei sotto-gruppi di G: se H < G:
gH = {gh | h ∈ H}
i.e. g manda H nella sua classe laterale sinistra gH: evidentemente lo stabilizzatore di H è H stesso
GH = {g ∈ G | gH = H} = H
e l’orbita
GH = {H 0 < G | ∃g ∈ G gH 0 = H}
è in corrispondenza biiunivoca con l’insieme dei laterali sinistri G/H. In particolare, se il gruppo G è finito, abbiamo, per il teorema precedente:
X
Card G =
Card gH
gH∈G/H
Ma gH è in corrispondenza biunivoca con H, quindi le classi hanno tutte la
stessa cardinalità Card H:
Card G = Card H · · · Card H = [G : H] Card H
ove [G : H] è l’intero che moltiplicato per Card H dà Card G: si dice indice del
sottogruppo H in G.
In particolare
5.2.6 Teorema (Lagrange) Un sottogruppo H di un gruppo finito G ha ordine che divide l’ordine di G.
Questo teorema è un criterio notevole per determinare la struttura di un
gruppo (e.g: se l’ordine di un gruppo è un numero primo, non possiede sottogruppi
non banali).
127
5.2. Azioni di gruppi
5.2.7 Definizione Se un’azione di G su X ha come unica orbita X stesso, si
dice transitiva.
Quindi un’azione è transitiva se ogni elemento di X può essere trasformato
in qualsiasi altro per mezzo di qualche g ∈ G.
5.2.8 Lemma Se G agisce su X e x, y ∈ X stanno nella stessa orbita allora gli
stabilizzatori Gx e Gy sono coniugati.
Dimostrazione: Se y ∈ Gx allora esiste g ∈ G con gx = y; consideriamo dunque
l’azione di coniugio in g Ag : h 7−→ ghg −1 ; allora
gGx g −1 = Gy
dato che se h ∈ Gx se e solo se ghg −1 y = ghx = gx = y.
qed
Quindi se y ∈ Gx esiste g ∈ G tale che gx = y e questo g è unico a meno di
elementi di Gx : infatti gx = y e g 0 x = y implicano che gx = g 0 x i.e. g −1 g 0 ∈ Gx .
Quindi ogni classe gGx corrisponde in modo unico ad un elemento y ∈Gx tramite
la gGx 7−→ gx. Ne segue il
5.2.9 Teorema Se G agisce su X e x ∈ X allora esiste una corrispondenza
biunivoca fra Gx e G/Gx .
Importante è il caso transitivo:
5.2.10 Corollario Se G agisce transitivamente su un insieme X allora, per ogni
x ∈ X, esiste una corrispondenza biunivoca
G/Gx ←→ X
Ad esempio, consideriamo l’azione di G su se stesso data dal coniugio:
g · h = ghg −1
Osserviamo che, per ogni gruppo, è definito il suo centro
Z(G) := {g ∈ G | ∀g 0 ∈ G gg 0 = g 0 g}
Si tratta cioè del sottoinsieme degli elementi di G che commutano con tutti
gli altri. Si tratta evidentemente di un sottogruppo normale, e notiamo che, se
z ∈ Z(G):
zhz −1 = zz −1 h = h
Viceversa, se ghg −1 = h allora g ∈ Z(G); quindi Z(G) è il nucleo dell’azione di
coniugio, secondo la
128
Capitolo 5. Gruppi, algebre e rappresentazioni
5.2.11 Definizione Se G agisce su X, il nucleo dell’azione è il sottogruppo
normale
Z := {g ∈ G | ∀x ∈ X gx = x}
In altri termini il nucleo di un’azione è l’intersezione degli stabilizzatori di
tutti gli elementi di X:
\
Z=
Gx
x∈X
Un’azione che abbia nucleo banale (Z = {e}) si dice fedele: ad esempio la
rappresentazione regolare sinistra (o destra) è fedele.
Tornando all’esempio dell’azione di coniugio, chiediamoci come sono fatte le
orbite e gli stabilizzatori. Se h ∈ G allora
Gh = {g ∈ G | gh = hg} =: Zh (G)
è il centralizzante dell’elemento h in G, i.e. il sottogruppo degli elementi che
commutano con un elemento fissato h. Le orbite dell’azione coniugata sono
Gh = {h0 ∈ G | ∃g ∈ G gh0 g −1 = h}
e si dicono classi coniugate di G contenenti h.
Se il gruppo è finito, allora la decomposizione in orbite
[
G=
Gh
g∈G
decompone il gruppo nelle sue classi coniugate: dato che Ge = Z(G) (la classe
coniugata dell’identità è il centro), e dato che ogni singola classe è l’orbita, per i
teoremi precedenti:
X
Card G = Card Z(G) +
[G : Gg ]
g
(g varia in G modulo l’appartenenza ad uno stesso stabilizzatore) ove [G : H]
denota l’indice del sottogruppo H; questa si chiama equazione delle classi , ed è
fondamentale in teoria dei gruppi finiti.
Ad esempio deduciamo da essa un lemma della teoria dei p-gruppi, importante
nell’ambito della teoria dei gruppi finiti.
5.2.12 Teorema Se G è un p-gruppo (i.e. è finito ed ha ordine pN ove p è un
numero primo) allora Z(G) non è banale.
129
5.3. Rappresentazioni di gruppi
Dimostrazione: Se G è abeliano, si ha per definizione G = Z(G) e quindi il
teorema è banale; altrimenti l’equazione delle classi è
pn = Card Z(G) +
X
[G : Gh ]
Ma se Card G = pn , la cardinalità di un suo sottogruppo è della forma pm con
m < n e quindi Card[G : H] = pn−m . Quindi p divide l’ordine di Z(G).
qed
Osserviamo che l’azione di coniugio non solo opera sull’insieme G, ma anche
sull’insieme dei sottogruppi di G: se H < G allora
Ag H := gHg −1
Rispetto a questa azione, lo stabilizzatore di un punto è
GH = {g < G | gHg −1 = H} =: N (H)
il normalizzante del sottogruppo H: per definizione si tratta del più piccolo
sottogruppo di G che contenga H come sottogruppo normale (in particolare,
H C G ⇐⇒ N (H) = G). L’orbita di un punto è
G · H = {H 0 < G | ∃g ∈ G gH 0 g −1 = H}
Si noti che la mappa h 7−→ ghg −1 è un isomorfismo del gruppo in sé: quindi gli
elementi di GH sono sottogruppi fra loro isomorfi. In particolare, al variare di
g ∈ G, l’insieme dei coniugati gHg −1 di H è esattamente l’insieme G/H:
G · H = G/H
5.3
Rappresentazioni di gruppi
Rappresentare un gruppo vuol dire realizzarlo come il gruppo delle trasformazioni di un opportuno insieme X: in realtà, spesso X sarà un insieme dotato
di qualche struttura, ad esempio uno spazio topologico, ed in questo caso si richederà che le trasformazioni del gruppo preservino questa struttura, ad esempio
che siano degli omeomorfismi.
5.3.1 Definizione Se V è uno spazio vettoriale, una rappresentazione lineare
di G è un omomorfismo del gruppo nel gruppo GL(V ) delle applicazioni lineari
ed invertibili di V in sé.
130
Capitolo 5. Gruppi, algebre e rappresentazioni
Spesso si dice semplicemente che lo spazio V è la rappresentazione del gruppo,
qualora sia chiara l’azione di G su GL(V ).
Sono possibili altri tipi di rappresentazioni: ad esempio, se X è uno spazio
proiettivo, una rappresentazione proiettiva di G è un omomorfismo del gruppo
nel gruppo P GL(X) delle trasformazioni proiettive invertibili di X in sé.
Tuttavia, nella discussione sulle rappresentazioni di un gruppo ci si limita al
caso lineare, ed alle particolarizzazioni di questo (ad esempio le rappresentazioni unitarie, se X non solo è uno spazio vettoriale ma ha anche una struttura
euclidea o hermitiana). Questa non è una limitazione troppo forte: se infatti è
data una rappresentazione ρ di un gruppo G nel gruppo SX di tutte le applicazioni (invertibili) di un insieme X in se stesso, possiamo sempre associargli una
rappresentazione π lineare ponendo
(π(g)f )(x) = f (ρ(g −1 )(x))
ove f appartiene allo spazio vettoriale di tutte le funzioni definite su X.
Quindi per noi una rappresentazione di un gruppo G sarà un omomorfismo di
G nel gruppo GL(V ) di un certo spazio vettoriale complesso: potremmo considerare spazi vettoriali su campi qualsiasi, ma la teoria classicamente si sviluppa su
C, che ha proprietà notevoli come l’essere algebricamente chiuso e di caratteristica zero; inoltre nel caso di rappresentazioni di dimensione infinita, si usa l’Analisi
Funzionale (cfr. capitolo ??) che essenzialmente ha luogo negli spazi complessi.
Per ora limiteremo la discussione al caso di rappresentazioni di dimensione finita, ove la dimensione di una rappresentazione è la dimensione dello spazio V . In
altri termini, siamo interessati a vedere quanto un gruppo possa considerarsi un
gruppo di matrici...
Ad esempio consideriamo un gruppo che già è un gruppo di matrici, GL(V );
esiste una rappresentazione ovvia di questo gruppo in V :
A · v := Av
che si dice rappresentazione identica.
In generale gli elementi del gruppo verranno fatti corrispondere a matrici, i
cui coefficienti saranno i coefficienti della rappresentazione; naturalmente questi
coefficienti dipendono dalla scelta della base; tuttavia, il cambiamento di base in
V avviene per coniugio rispetto ad elementi di GL(V ), cosı̀ che, se π : G −→
GL(V ) è una rappresentazione e A∈GL(V ) una matrice di cambiamento di base,
allora π(g)v = π(g)(Av 0 A−1 ) e quindi la rappresentazione non deve dipendere
dalla coniugazione per una matrice:
Aπ(g) = π(g)A
5.3. Rappresentazioni di gruppi
131
5.3.2 Definizione Due rappresentazioni π : G −→ GL(V ) e π 0 : G −→ GL(V 0 )
si dicono equivalenti se esiste un isomorfismo A : V −→ V 0 tale che
Aπ(g) = π 0 (g)A
Dato che una rappresentazione agisce su uno spazio vettoriale, possiamo provare ad estendere le nozioni dell’Algebra Lineare alla teoria delle rappresentazioni: in particolare considereremo i concetti di sottospazio, quoziente, morfismi,
dualità, somma diretta, prodotto tensoriale e prodotto scalare.
Se π : G −→ GL(V ) è una rappresentazione del gruppo G, un sottospazio W
di V si dice invariante se
∀g ∈ G π(g)W ⊂ W
Evidentemente, in questo caso, la restrizione π|W è una rappresentazione π|W :
G −→ GL(W ) che si dice sottorappresentazione di π.
In modo analogo, sul quoziente V /W di uno spazio per un sottospazio invariante è definita una rappresentazione π
e : G −→ GL(V /W ) che si dice quoziente
della rappresentazione π.
5.3.3 Definizione Se V è una rappresentazione di G e W una sottorappresentazione, V si dice riducibile se il complemento di W in V è pure un sottospazio
invariante: in questo caso la rappresentazione π si decompone in somma diretta
delle rappresentazioni π|W e π|W ⊥ .
Se W ⊂ V è una sottorappresentazione, allora la matrice che rappresenta V
sarà a blocchi della forma
¶
µ
A(g) B(g)
π(g) =
0
C(g)
ove A(g) = π|W (g) e C(g) è la matrice della rappresentazione quoziente; se V è
riducibile, allora possiamo trovare una base in cui la matrice B è zero.
5.3.4 Definizione Una rappresentazione V che non abbia sottorappresentazioni non banali (cioè diverse da V stesso e dalla rappresentazione nulla) si dice
irriducibile.
5.3.5 Esempio Una rappresentazione di dimensione 1 è irriducibile: si tratta
semplicemente di un omomorfismo di gruppi
π : G −→ C \ 0 = GL1 (C)
ed uno spazio di dimensione 1 non ha sottospazi non banali.
132
Capitolo 5. Gruppi, algebre e rappresentazioni
5.3.6 Definizione Se una rappresentazione V è tale che ogni sua sottorappresentazione ammetta una sottorappresentazione complementare, si dice che V è
completamente riducibile.
Non è affatto detto che una rappresentazione di dimensione finita sia completamente riducibile.
5.3.7 Esempio Consideriamo G = R (gruppo additivo dei numeri reali) e la
sua rappresentazione bidimensionale
¶
µ
1 t
t 7−→
0 1
Allora V = R2 , e t(x, y) = (x + ty, y); il sottospazio {(x, 0)} è invariante, mentre
{(0, y)} non lo è, quindi la rappresentazione non è completamente riducibile.
5.3.8 Esempio Se G = R è ancora il gruppo additivo dei numeri reali e V =
R[x] lo spazio dei polinomi su R, possiamo considerare la rappresentazione di G
in V (che ha dimensione infinita):
(π(t)p)(x) := p(x + t)
Se Vk è il sottospazio di V dei polinomi di grado al più k, evidentemente è un
sottospazio invariante per π. Le rappresentazioni Vk sono tutte riducibili (per
k ≥ 1) me non completamente riducibili, dato che in esse i sottospazi invarianti
Vk−1 non hanno complementi invarianti.
Gli elementi di homG (Vk , Vh ) sono operatori differenziali a coefficienti costanti:
da questo segue che
dim homG (Vk , Vh ) = 1 + min(h, k)
per ogni k, h, e quindi anche dim homG (Vk , V ) = 1 + k.
D’altra parte si trova che dim homG (V, Vk ) = 0: infatti ogni polinomio f può
scriversi come derivata (k + 1)-ma di un altro polinomio F e se A ∈ homG (Vk , V )
allora deve commutare con le traslazioni, e quindi anche con le derivate, sicché
Af = A
(dato che Af ∈ Vk ).
dk+1 f
dk+1 Af
=
=0
dxk+1
dxk+1
133
5.3. Rappresentazioni di gruppi
5.3.9 Definizione Se π1 : G −→ GL(V1 ) e π2 : G −→ GL(V2 ) sono rappresentazioni di un gruppo G negli spazi vettoriali V1 e V2 , l’insieme degli operatori di
allacciamento è
(π1 , π2 ) := {A ∈ hom(V1 , V2 ) | Aπ1 = π2 A}
Questo insieme si denota anche homG (V1 , V2 ) ed i suoi elementi si dicono anche
morfismi fra le rappresentazioni π1 e π2 .
L’insieme delle rappresentazioni di un gruppo forma una categoria rispetto
ai morfismi di rappresentazioni, come è immediato verificare.
Evidentemente A è un morfismo fra la rappresentazione π1 : G −→ GL(V1 ) e
la rappresentazione π2 : G −→ GL(V2 ) se e solo se il seguente diagramma
V1
π1 (g)
A
²
V1
/ V2
²
A
π2 (g)
/ V2
è commutativo per ogni g ∈ G.
La dimensione dello spazio vettoriale homG (V1 , V2 ) si dice numero di allacciamento delle rappresentazioni π1 e π2 .
Per rappresentazioni di dimensione finita, si ha che
dim homG (V1 , V2 ) = dim homG (V2 , V1 )
5.3.10 Definizione Se dim homG (V1 , V2 ) = 0 le rappresentazioni si dicono disgiunte.
Ovviamente
5.3.11 Proposizione Le rappresentazioni sono equivalenti se e solo se l’insieme
dei morfismi homG (V1 , V2 ) contiene un isomorfismo.
Osserviamo che se due rappresentazioni di dimensione finita sono equivalenti,
allora le loro dimensioni coincidono, ed è possibile trovare basi in questi spazi
vettoriali tali che le matrici che rappresentano gli operatori della rappresentazione
coincidano. Il risultato fondamentale sulle rappresentazioni irriducibili è il
5.3.12 Lemma (Schur) Se V1 e V2 sono rappresentazioni irriducibili di un
gruppo G allora ogni elemento (non nullo) di homG (V1 , V2 ) è invertibile.
134
Capitolo 5. Gruppi, algebre e rappresentazioni
Dimostrazione: Sia A ∈ homG (V1 , V2 ) non nullo: allora il nucleo di A è un
sottospazio di V1 :
ker A = {v ∈ V1 | Av = 0}
Dato che g · Av = Ag · v allora se v ∈ ker A: Ag · v = gAv = 0, quindi gv ∈ ker A.
Dunque ker A è una sottorappresentazione di V1 , che però è irriducibile. Ne segue
che ker A = 0 oppure ker A = V1 .
Se ker A = V1 allora A = 0 per definizione; se ker A = 0 allora A è invertibile.
Ma l’immagine di A è un sottospazio di V2
im A = {w ∈ V2 | ∃v ∈ V1 Av = w}
ed è una sottorappresentazione di V2 : infatti se w ∈ im A allora gw = gAv = Agv,
quindi gw è immagine di gv tramite A i.e. gw ∈ im A. Per irriducibilità di V2
segue che im A = 0 oppure im A = V2 ; ma A era invertibile, quindi im A 6= 0, i.e.
im A = V2 sicché A è un isomorfismo.
qed
In altri termini, un morfismo fra due rappresentazioni irriducibili è zero oppure è un isomorfismo: in particolare due rappresentazioni irriducibili distinte
non possono essere contenute l’una nell’altra. Questo ci dice che le rappresentazioni irriducibili sono le più semplici possibili: in effetti una rappresentazione
irriducibile si chiama anche semplice.
Consideriamo ora una rappresentazione π : G −→ GL(V ) di un gruppo;
osserviamo che, se dim V = 1 allora V = K e quindi
∀g ∈ G π(g) = idK
(infatti π(g)(k) = kπ(g)(1) = k: cioè im π = {idV } è il sottogruppo banale
formato dal solo isomorfismo v 7−→ v). Una rappresentazione la cui immagine
si riduca al solo elemento idV si dice banale; abbiamo appena visto che su uno
spazio vettoriale di dimensione 1 esiste solo la rappresentazione banale π0 . Se
π : G −→ GL(V ) è una rappresentazione allora gli operatori di (π, π0 ) sono
quindi funzionali lineari f ∈ V ∗ tali che f π = f .
5.3.13 Definizione Gli elementi di (π, π0 ) si dicono invarianti della rappresentazione.
In realtà è significativo considerare come invarianti non solo le funzioni lineari su V , ma anche i polinomi su V , che possono esser visti come gli elementi
dell’algebra simmetrica Sym(V ∗ ).
Se π : G −→ GL(V ) è una rappresentazione, possiamo considerare sullo
spazio duale V ∗ una rappresentazione π ∗ : G −→ GL(V ∗ ) definita come:
hπ ∗ (g)(A), vi = hf, π(g −1 )vi
5.3. Rappresentazioni di gruppi
135
(h, i è la dualità fra V e V ∗ ). è immediato verificare che si tratta in effetti di una
rappresentazione, che viene detta duale (o controgradiente) di π: in coordinate,
la matrice di π ∗ (g) è la trasposta di π(g −1 ).
Torniamo ora alle sottorappresentazioni: se V è una rappresentazione (di
dimensione finita) e V1 ⊂ V una sottorappresentazione che ammette un complementare, questo vuol dire che il sottospazio vettoriale V2⊥ ⊂ V (i.e. lo spazio tale
che V1 ⊕ V2 = V ) è pure una sottorappresentazione: in questo caso V di decompone in somma diretta di sottorappresentazioni . La matrice che rappresenta un
elemento di G in GL(V ) è della forma
¶
µ
A1 (g)
0
π(g) =
0
A2 (g)
ove A1 è la matrice che rappresenta G in GL(V1 ) e A2 è la matrice che rappresenta
G in GL(V1 ).
Una rappresentazione che si decompone in somma diretta di sottorappresentazioni irriducibili si dice talvolta semisemplice: dimostriamo ora che le rappresentazioni semisemplici sono esattamente quelle completamente riducibili: lo
faremo per rappresentazioni di dimensione qualsiasi.
5.3.14 Lemma Se V è una rappresentazione completamente riducibile allora
ogni sua sottorappresentazione è completamente riducibile.
Dimostrazione: Sia V una rappresentazione completamente riducibile, e W
una sottorappresentazione di V : allora ogni sottorappresentazione Z di W è
anche una sottorappresentazione di V , quindi esiste una sottorappresentazione
Z 0 di V tale che Z 0 ⊕ Z = V ; dato che Z ⊂ W ⊂ V allora
Z 0 ∩ W = (0)
Inoltre W = Z + (Z 0 ∩ W ) e questa somma è diretta; quindi Z 0 ∩ W è una
sottorappresentazione complementare di Z in W .
qed
5.3.15 Lemma Se V è una rappresentazione completamente riducibile allora
possiede una sottorappresentazione irriducibile.
Dimostrazione: Se V ha dimensione finita questo si vede facilmente per induzione; dimostriamolo tuttavia in generale: se V 6= 0 esisterà v ∈ V \ 0; sia R(v)
l’insieme delle sottorappresentazioni di V che non contengono v. R(v) è non
vuoto, dato che 0 è una sottorappresentazione che non contiene v, ed è un insieme parzialmente ordinato dall’inclusione: dimostriamo che soddisfa le ipotesi del
136
Capitolo 5. Gruppi, algebre e rappresentazioni
Lemma di Zorn. Se {Ri } è un sottoinsieme totalmente ordinato di R(v) l’unione
S
i Ri è chiaramente una sottorappresentazione di V che non contiene v, ed è
un confine superiore per gli {Ri }: quindi possiamo applicare il lemma di Zorn e
dedurre l’esistenza di un massimale R ⊂ V che non contenga v. Ora, dato che V
è completamente riducibile, esiste una sottorappresentazione Q complementare
a R, che contiene v. Dimostriamo che è irriducibile.
Supponiamo che Q contenga una sottorappresentazione Q1 : allora (essendo
Q completamente riducibile per il lemma precedente) esiste una sottorappresentazione Q2 di Q tale che Q = Q1 ⊕ Q2 ; supponiamo che v ∈
/ Q1 . Allora Q1 + R è
una sottorappresentazione di V che non contiene v e contiene R, il che contraddice la massimalità di R. Quindi una tale decomposizione di Q non esiste e Q è
irriducibile.
qed
5.3.16 Teorema Una rappresentazione è completamente irriducibile se e solo
se si decompone in somma diretta di rappresentazioni irriducibili.
Dimostrazione: Dimostriamo che se V è somma diretta di sottorappresentazioni irriducibili allora è completamente riducibile: sia W una sottorappresentazione di V ; dobbiamo mostrare che ammette una sottorappresentazione complementare. Sia R l’insieme di tutte le sottorappresentazioni irriducibili S tali
che S ∩ W = 0 e consideriamo la famiglia S degli elementi della forma ⊕i Si con
Si ∈ R; S è non vuota (non lo è R: contiene 0) ed è ordinata dall’inclusione: dimostriamo che soddisfa le ipotesi del lemmaL
di Zorn. Se {Rj } è una sottofamiglia
di S totalmente ordinata, basta porre R = j Rj per avere un confine superiore
in questa famiglia. Quindi per
L il lemma di Zorn esiste un elemento massimale
irriducibili di V tali
in S, i.e. una somma diretta i Si di sottorappresentazioni
L
che Si ∩ W = 0. Dimostriamo che V = i Si ⊕ W . Sappiamo per ipotesi che V è
M
V =
Vj
j
L
ove le Vj sono irriducibili e quindi, per ogni i, Si =
Si ∩ Vj i.e. Si = Vji per
qualche ji (per irriducibilità delle Si e Vj ed il lemma di Schur). Quindi
M
M
V =
Si ⊕
Vj
i
j6=ji
L
Ci basta quindi dimostrare che W = j6=ji Vj . Ora certamente W ⊂ j6=ji Vj ;
se l’inclusione fosse stretta, esisterebbe
j 6= ji tale che W ∩ Vj = 0 (infatti Vj è
L
irriducibile); ma allora Vj ⊕ i Si sarebbe
un elemento di S il che contraddice
L
la massimalità di ⊕i Si . Quindi W = j6=ji Vj .
L
5.3. Rappresentazioni di gruppi
137
Viceversa, se V è completamente riducibile consideriamo la somma diretta
W di tutte le sottorappresentazioni irriducibili di V (si tratta di un sottospazio
6= 0 per il lemma 5.3.15): vogliamo dimostrare che W = V . In effetti, se W ⊂ V ,
allora, per completa riducibilità di V , W avrebbe una sottorappresentazione
complementare W ⊥ ; ma questa sottorappresentazione è completamente riducibile
per il lemma 5.3.14 e quindi deve possedere una sottorappresentazione irriducibile
Z (per il lemma 5.3.15) quindi Z è una sottorappresentazione irriducibile di V ,
e, per definizione, Z ⊂ W . Il che è assurdo (W ∩ W ⊥ = 0) a meno che W ⊥ = 0
e quindi W = V .
qed
Assieme alla somma diretta, la costruzione più importante dell’Algebra Lineare è il prodotto tensoriale (cfr. 5.6): ci limitiamo nella discussione seguente al
caso di dimensione finita.
Se πi : G −→ GL(Vi ) (i = 1, 2) sono rappresentazioni di un gruppo G,
definiamo una funzione π1 ⊗ π2 : G −→ GL(V1 ⊗ V2 )
π1 ⊗ π2 (g)(v1 ⊗ v2 ) := (π1 (g)v1 ) ⊗ (π2 (g)v2 )
che di dice prodotto tensoriale delle rappresentazioni.
5.3.17 Proposizione Se V1 e V2 sono rappresentazioni di un gruppo allora il
prodotto tensoriale V1 ⊗ V2 è una rappresentazione del gruppo.
Dimostrazione: Ovviamente π1 ⊗ π2 (e)(v1 ⊗ v2 ) = v1 ⊗ v2 . Inoltre
π1 ⊗ π2 (gh)(v1 ⊗ v2 ) =π1 (gh)v1 ⊗ π2 (gh)v2
=π1 (g)π1 (h)v1 ⊗ π2 (g)π2 (h)v2
=π1 ⊗ π2 (g)π1 ⊗ π2 (h)(v1 ⊗ v2 )
qed
Il prodotto tensoriale di rappresentazioni è legato al prodotto diretto di
gruppi:
5.3.18 Teorema Ogni rappresentazione irriducibile (di dimensione finita) V
del prodotto diretto G = G1 × G2 è equivalente al prodotto tensoriale di rappresentazioni irriducibili Vi dei gruppi Gi .
Dimostrazione: V1 e V2 sono rappresentazioni irriducibili di Gi se e solo se
V1 ⊗ V2 è una rappresentazione irriducibile di G: infatti ogni rappresentazione
V1 ⊗ V2 induce due rappresentazioni ottenute considerando gli operatori idV1 ⊗
π2 (g) e π1 (g) ⊗ idV2 .
138
Capitolo 5. Gruppi, algebre e rappresentazioni
L’unica cosa che dobbiamo verificare è che ogni rappresentazione di G1 × G2
sia della forma V1 ⊗ V2 ; sia π una rappresentazione in V di G1 × G2 , e siano
V1 = π(g, e)(V )
e
V2 = π(e, g)(V )
Si tratta di rappresentazioni, rispetto alle restrizioni di π sul primo e sul secondo
fattore diretto di G1 × G2 ; ovviamente
π(g, h)(v1 , v2 ) = (π(g, e)(v1 ), π(e, h)v2 )
e quindi abbiamo una famiglia di funzioni bilineare V1 × V2 −→ V data da
π(g, h)(v1 , v2 ) = π(g, h)(v1 , v2 )
Per la proprietà del prodotto tensoriale abbiamo quindi V = V1 ⊗ V2 .
qed
Si noti che se V e W sono rappresentazioni irriducibili di G non è affatto
vero che V ⊗ W sia irriducibile per G: lo è solo per G × G. In generale decomporre un prodotto tensoriale in somma di rappresentazioni irriducibili è un
problema fondamentale (teoria di Clebsh–Gordan) per il quale si rimanda ai testi
specialistici.
Infine consideriamo ancora una costruzione degli spazi vettoriali che ha un
significativo riverbero in teoria delle rappresentazioni: supponiamo infatti che lo
spazio V sia unitario, i.e. che (sia complesso e) possegga un prodotto hermitiano
(v, w) definito positivo (i.e. quella che si dice una forma sesquilineare: (av+bw) =
ab(v, w)). Ricordiamo che una trasformazione lineare A : V −→ V è unitaria se
∀v, w ∈ V
(Av, Aw) = (v, w)
In termini di matrici questo significa, ovviamente, che
AT A = I
In particolare | det A| = 1 i.e. det A ∈ T = {|z| = 1} e quindi una matrice
unitaria è invertibile, cioè determina necessariamente un isomorfismo di V in sé.
Dunque le matrici unitarie formano un sottogruppo del gruppo lineare generale
(complesso3 )
U (V ) = {A : V −→ V | AT A = I} ⊂ GL(V )
3
Si noti che GLn (C) ⊂ GL2n (R): infatti una struttura complessa su uno spazio vettoriale è
sempre una struttura di spazio vettoriale reale 2n-dimensionale, mentre non ogni matrice reale
2n × 2n preserva la struttura complessa, i.e. la moltiplicazione per i numeri complessi.
5.3. Rappresentazioni di gruppi
139
5.3.19 Definizione Una rappresentazione πG −→ GL(V ) è unitaria se V è uno
spazio unitario e im π ⊂ U (V ).
In altri termini, π è unitaria se G agisce per operatori unitari su V . Scriveremo
A∗ in luogo di AT .
Le rappresentazioni unitarie sono le più importanti, perché vige il seguente
5.3.20 Teorema Una rappresentazione unitaria (di dimensione finita) è completamente riducibile.
Dimostrazione: Consideriamo una rappresentazione unitaria V di un gruppo
G; se W ⊂ V è un sottospazio invariante per G basta costruire un complementare
invariante per avere la completa riducibilità. Consideriamo quindi il complemento
ortogonale W ⊥ rispetto al prodotto hermitiano di V . Allora
∀v ∈ W ∀w ∈ W ⊥
(π(g)w, v) = (π(g)−1 π(g)w, π(g)−1 v) = (w, π(g)−1 v) = 0
dato che π(g) ∈ U (V ) e v è invariante; quindi π(g)w ∈ W ⊥ e W ⊥ è invariante.
qed
Abbiamo quindi una condizione sufficiente per la completa riducibilità di una
rappresentazione: che sia equivalente ad una rappresentazione unitaria.
5.3.21 Definizione Due rappresentazioni π1 , π2 qualsiasi di un gruppo G in uno
stesso spazio unitario V sono unitariamente equivalenti se esiste un operatore
unitario A ∈ (π1 , π2 ).
Questa condizione, per rappresentazioni unitarie, non è più restrittiva della
semplice equivalenza:
5.3.22 Proposizione Se due rappresentazioni unitarie sono equivalenti allora
sono unitariamente equivalenti.
Dimostrazione: Utilizziamo un fatto ben noto dall’Algebra Lineare: la decomposizione polare di un operatore: supponiamo che A sia un isomorfismo di V in
sé appartenente a (π1 , π2 ); allora
A = U |A|
ove |A| è un operatore hermitiano (i.e. |A| + |A|∗ = 0) e U è unitario. Quindi la
π1 (g)A = Aπ2 (g) diviene
π1 (g)U |A| = U |A|π2 (g)
140
Capitolo 5. Gruppi, algebre e rappresentazioni
Sostituendo g −1 e tenendo conto che π(g −1 ) = π(g)∗ abbiamo che π1 (g)∗ U |A| =
U |A|π2 (g)∗ i.e. applicando ∗ e tenendo conto che A∗ B ∗ ) = (BA)∗ :
|A|∗ U π1 (g) = π2 (g)|A|∗ U
i.e. (U ∗ U = I)
|A|2 π2 (g) =|A|∗ U ∗ U |A|π2 (g) = |A|U ∗ Aπ2 (g)
=|A|U ∗ π1 (g)U |A| = |A|∗ U π1 (g)U |A| =
=π2 (g)|A|∗ U U |A| = π2 (g)|A|2
quindi |A|2 (e dunque anche |A|) commuta con π2 (g). Allora
U π2 (g)|A| = U |A|π2 (g) = π1 (g)U |A|
e, dato che |A| è invertibile
π1 (g)U = U π2 (g)
i.e. U ∈ (π1 , π2 ) e quindi le rappresentazioni sono unitariamente equivalenti.
qed
Concludiamo con un risultato cruciale per la teoria dei gruppi finiti:
5.3.23 Teorema Ogni rappresentazione di dimensione finita di un gruppo finito
è equivalente ad una rappresentazione unitaria.
Dimostrazione: Sia V una rappresentazione di G: possiamo considerare su V
un prodotto hermitiano
P qualsiasi,Pad esempio fissando una base (e1 , ..., en ) di V
e ponendo, se v = i vi ei e w = i wi ei :
(v, w) =
n
X
v i wi
i=1
Ovviamente rispetto a questo prodotto non è affatto detto che la rappresentazione sia unitaria: possiamo comunque definire un nuovo prodotto hermitiano per
il quale lo è: basta considerare4 (il gruppo è finito)
(v, w)0 :=
X
1
(π(g)v, π(g)w)
Card G g∈G
4
Stiamo sommando sul gruppo, cioè “integrando”: in effetti questo ragionamento si estende
a tutti i gruppi sui quali esista una misura invariante, e.g. i gruppi compatti.
141
5.4. Algebra di gruppo
(.)0 è un prodotto hermitiano: è lineare perché lo sono π, (.) e la somma; inoltre
è definito positivo perché lo è (.); infine la rappresentazione è unitaria rispetto
ad esso:
X
1
(π(g)π(h)v, π(g)π(h)w)
Card G g∈G
X
1
=
(π(gh)v, π(gh)w)
Card G g∈G
X
1
=
(π(k)v, π(k)w) = (v, w)0
Card G k∈G
(π(h)v, π(h)w)0 =
ove k = gh; se g descrive G anche gh descrive G con h costante.
qed
5.3.24 Corollario Ogni rappresentazione di dimensione finita un gruppo finito
è completamente riducibile.
5.4
Algebra di gruppo
Approfondiamo ora la teoria delle rappresentazioni dei gruppi finiti: G sarà
sempre un gruppo finito con elemento neutro e.
Molti concetti che svilupperemo sono validi in generale, come la nozione di
carattere. Ricordiamo dall’Algebra Lineare le proprietà della traccia
tr A =
n
X
aii
i=1
di una matrice A ∈ Mn (K) su un campo K (ad esempio sui numeri complessi):
5.4.1 Proposizione
(1) tr(aA + bB) = a tr A + b tr B se a, b ∈ C e A, B ∈ Mn (C)
(2) tr AB = tr BA
(3) tr I = n
(4) tr ABA−1 = tr B
(5) La traccia di A è la somma degli autovalori di A contati con le loro molteplicità.
142
Capitolo 5. Gruppi, algebre e rappresentazioni
Consideriamo ora una rappresentazione π : G −→ GL(V ) di un gruppo finito:
per la (4) della proposizione, per ogni operatore F ∈ End(V ) è ben definita la
sua traccia, come la traccia di una qualsiasi matrice che rappresenti F in qualche
base di V .
5.4.2 Definizione Il carattere della rappresentazione π è la funzione χπ : G −→
C data da
χπ (g) = tr π(g)
Evidentemente il carattere di una rappresentazione ha valori in GL(C) = C\0,
ed è un invariante nel senso seguente
5.4.3 Proposizione I caratteri di due rappresentazioni equivalenti coincidono.
(Questo segue direttamente da tr ABA−1 = tr B). Inoltre
χπ ∗ (g) = χπ (g −1 )∗
e quindi, se π è unitaria
χ(g −1 ) = χ(g)
Notiamo anche che
χπ1 ⊕π2 = χπ1 + χπ2
Per il prodotto vale la
5.4.4 Proposizione χπ1 ⊗π2 = χπ1 χπ2 .
Dimostrazione: Basta fissare due basi (e1 , ..., en ) di V1 e (f1 , ..., fm ) di V2 ; allora
π1 (g) = ((aij ))
π2 (g) = ((brs ))
e quindi π1 ⊗ π2 (g) è una matrice i cui indici sono coppie di indici: ((cirjs )) =
((aij brs )); ne segue che
χπ1 ⊗π2 =
n
X
i,r=1
cirir =
n
X
i,r=1
aii brr =
n
X
i=1
aii
n
X
brr = χπ1 χπ2
i=1
qed
La traccia si dice essere una “funzione di classe”, perché è invariante rispetto
alla coniugazione di matrici: il riverbero di questo fatto a livello di caratteri è il
143
5.4. Algebra di gruppo
5.4.5 Teorema Il carattere di una rappresentazione è costante sulle classi coniugate del gruppo.
Ricordiamo ora che ogni rappresentazione finito-dimensionale di un gruppo finito
G è completamente riducibile: vogliamo trovare una tale decomposizione per ogni
rappresentazione: i caratteri giocano un ruolo in questa ricerca.
Consideriamo la rappresentazione regolare sinistra del gruppo, che già ci è
venuta in soccorso, ad esempio nel dimostrare che il gruppo è un sottogruppo di
Sn :
Lg (h) = gh
Questa rappresentazione ne induce una sullo spazio di tutte le funzioni del
gruppo:
C[G] = CG = {F : G −→ C}
come
(Lg (F ))(h) = F (gh)
Lo spazio C[G] è uno spazio vettoriale di dimensione Card G rispetto alla somma
di funzioni, e quindi è una rappresentazione, ed è unitaria rispetto al prodotto
hermitiano
X
1
(F, G)F =
F (g)G(g)
Card G g∈G
P
P
dato che g∈G H(hg) = g∈G H(g) (invarianza per traslazioni). Vedremo che
tutte le rappresentazioni irriducibili del gruppo sono sottorappresentazioni di
C[G].
Sia π : G −→ GL(V ) una rappresentazione (di dimensione finita) di G, e
consideriamo lo spazio degli invarianti di V
V G := {v ∈ V | ∀g ∈ G π(g)v = v}
e la funzione di media
I(v) :=
X
1
π(g)(v)
Card G g∈G
Ora, I : V −→ V G è un epimorfismo di spazi vettoriali: infatti è per definizione
lineare, e se v ∈ V G allora, sempre per definizione
X
1
π(g)v
v = π(g)v =
Card G g∈G
quindi I è una proiezione sul sottospazio V G :
I(I(v)) = I(v) = v
144
Capitolo 5. Gruppi, algebre e rappresentazioni
Rammentiamo che V può supporsi unitaria (il gruppo è finito) e quindi completamente riducibile: il metodo della media ci dà uno spunto per tentare di
decomporre V nelle sue sottorappresentazioni irriducibili.
Dato che I 2 = I su V G :
X
X
1
1
dim V G = dim im I = tr I =
tr π(g) =
χ(g)
Card G g∈G
Card G g∈G
Osserviamo che, se V è irriducibile, dato che V G è una sottorappresentazione,
si ha V G = V oppure V G = 0: nel primo caso V è la rappresentazione banale
π(g) = idV , nel secondo
X
χ(g) = 0
g∈G
Ora consideriamo due rappresentazioni irriducibili π : G −→ GL(V ) e ρ :
G −→ GL(W ), e la loro rappresentazione associata hom(V, W ) (si noti che è
hom(V, W ) = V ∗ ⊗ W ); dato che è il prodotto tensoriale di W per la rappresentazione duale di V abbiamo che
χhom(π,ρ) = χπ χρ
Osserviamo inoltre che
hom(V, W )G = (π, ρ)
e quindi, per il lemma di Schur, dim hom(V, W )G = δV W è zero se le rappresentazioni non sono equivalenti e 1 se lo sono. Dalla formula precedente per la
dimensione di V G segue che
5.4.6 Teorema (Ortogonalità dei caratteri) Se V e W sono rappresentazioni irriducibili di dimensione finita di un gruppo finito allora
(
X
1 se V ∼
1
=W
χW (g)χV (g) =
Card G g∈G
0 altrimenti
Dato che χ ∈ C[G], questo si scrive anche
(χW , χW )F = δV W
Quindi i caratteri sono un insieme ortonormale in C[G]: di più, sono una base
ortonormale nel sottospazio delle funzioni costanti sulle classi coniugate.
5.4.7 Corollario Il numero di rappresentazioni irriducibili di un gruppo finito
G è minore o uguale al numero di classi coniugate di G.
145
5.4. Algebra di gruppo
Infatti, due rappresentazioni irriducibili sono equivalenti se e solo se i loro caratteri coincidono, la corrispondenza che assegna ad una rappresentazione il suo
carattere è iniettiva.
5.4.8 Esempio Se il gruppo è abeliano, le classi coniugate coincidono con gli
elementi del gruppo: in questo caso i caratteri delle rappresentazioni irriducibili sono una base ortonormale di C[G] e le rappresentazioni irriducibili sono
di dimensione 1; in definitiva coincidono con i loro caratteri, e questi sono in
corrispondenza biunivoca con gli elementi del gruppo.
5.4.9 Corollario Una rappresentazione qualsiasi è determinata dal suo carattere
Dimostrazione: Se V è irriducibile questo è l’ortogonalità; altrimenti V sarà
somma diretta di rappresentazioni irriducibili
V = ⊕ki=1 Vi⊕mi
ove Vi è irriducibile e mi è la molteplicità con la quale figura nella decomposizione
di V ; ma allora
k
X
χV =
mi χVi
i=1
e le χVi sono linearmente indipendenti.
Si noti in particolare, che se Vi = Vj allora 1 = (χVi , χVj )F =
P
2
i mi
qed
e quindi
5.4.10 Corollario V è irriducibile se e solo se (χV , χV )F = 1.
Evidentemente
mi = (χV , χVi )F
Dimostriamo ora un teorema fondamentale:
5.4.11 Teorema Se V1 , ..., Vn sono tutte le rappresentazioni irriducibili di G (a
meno di equivalenza) allora i coefficienti akij delle matrici πk (g) sono una base
ortogonale dello spazio C[G].
Dimostrazione: L’ortogonalità degli elementi segue dall’ortonormalità dei caratteri delle rappresentazioni Vi : dato che il carattere è la traccia, se dim Vi = ni
allora
(
0
se k 6= h o i 6= r o j 6= s
(akij , ahrs ) = 1
se k = n, i = r, j = s
nk
146
Capitolo 5. Gruppi, algebre e rappresentazioni
Dimostriamo ora che le funzioni akij : G −→ C sono una base di C[G]; consideriamo la rappresentazione regolare sinistra: sappiamo che è completamente
riducibile, dato che è unitaria (per definizione del prodotto hermitiano (.)F ) e
quindi
C[G] = X1 ⊕ ... ⊕ Xp
ove Xj sono sottorappresentazioni tali che la restrizione Lj della rappresentazione
regolare ad esse è irriducibile: quindi, poiché le Vi esauriscono le rappresentazioni irriducibili di G, Lj è equivalente ad una certa Vij : allora esiste una base
(ej1 , ..., ejni ) di Xj nella quale la matrice che rappresenta Lj ha come coefficienti
j
i
arsj , quindi
ejs (gh) = L(g)ejs (h) = Lj (g)ejs (h) =
X
airsj (h)er (g)
r
Per g = e e csj = ejs (e) si ha
ejs (h) =
X
ij
(h)
csj ars
r
Dunque ciascuna funzione ejs appartiene ad una base di Xj (e quindi ciascuna
i
funzione su Xj ) è combinazione lineare delle arsj . Dato che C[G] è somma diretta
degli Xj si ottiene la tesi.
qed
Definiamo ora sullo spazio vettoriale C[G] una operazione, la convoluzione di
funzioni:
X
1
F ∗ G(g) =
F (h)G(gh−1 )
Card G h∈G
5.4.12 Teorema L’operazione ∗ è associativa, possiede un elemento neutro ed
è commutativa se e solo se lo è il prodotto del gruppo.
Dimostrazione: Basta osservare che una base dello spazio vettoriale C[G] sono
gli elementi del gruppo G, e che la convoluzione su essi coincide con il prodotto
del gruppo. L’elemento neutro è lo stesso del gruppo.
qed
Dato che C[G] è lo spazio della rappresentazione regolare, si decompone in
sottorappresentazioni irriducibili di G: questa decomposizione rispetta la struttura algebrica di C[G]. Per formulare correttamente questi risultati, dobbiamo
introdurre alcuni concetti algebrici generali.
147
5.5. Algebre associative
5.5
Algebre associative
Gli esempi fondamentali di gruppi che abbiamo considerato erano il gruppo delle trasformazioni biunivoche di uno spazio in sé, in particolare i gruppi
simmetrici Sn , ed il gruppo degli isomorfismi lineari di uno spazio vettoriale
GL(V ).
In generale ha interesse considerare trasformazioni che non siano necessariamente biunivoche: ad esempio, nel caso degli spazi vettoriali, ha interesse considerare lo spazio End(V ) di tutte le funzioni lineari di V in sé che, nel caso di
dimensione finita, corrisponde allo spazio di tutte le matrici Mn (C). Questo non
è semplicemente uno spazio vettoriale, ma i suoi elementi possono essere moltiplicati fra loro, componendo le mappe lineari o (equivalentemente) moltiplicando
le matrici righe per colonne.
Motivati da questi esempi diamo la
5.5.1 Definizione Uno spazio vettoriale A su un campo K (che per noi sarà
sempre C o al più R) si dice un’algebra se è data una funzione
µ : A × A −→ A
bilineare (il prodotto dell’algebra). Si scrive ab in luogo di µ(a, b).
Questo concetto è estremamente generale: notiamo che, per bilinearità del
prodotto µ, possiamo scrivere
µ : A ⊗ A −→ A
5.5.2 Esempio
(1) I numeri complessi, le matrici complesse e gli endomorfismi di uno spazio
vettoriale sono esempi di algebre complesse.
(2) Se X è un insieme, lo spazio vettoriale F (X) delle funzioni X −→ C
possiede un prodotto, definito come segue: se f, g ∈ F (X) allora
f g(x) = f (x)g(x)
(prodotto di numeri complessi).
(3) A = Mn (C) non è un’algebra solo per il prodotto AB di matrici; ponendo
[A, B] := AB − BA
148
Capitolo 5. Gruppi, algebre e rappresentazioni
otteniamo un nuovo prodotto [.] su A, che si dice prodotto di Lie. Una
ulteriore struttura di algebra sulle matrici è data dal prodotto di Jordan:
(A, B) = AB + BA
(4) Lo spazio dei polinomi complessi C[x1 , ..., xn ] è un’algebra rispetto al prodotto:
P Q(x1 , ..., xn ) := P (x1 , ..., xn )Q(x1 , ..., xn )
come si verifica immediatamente.
(5) Più in generale, lo spazio delle funzioni continue su uno spazio topologico
è un’algebra rispetto alla stessa moltiplicazione (punto per punto).
Notiamo che in questi esempi, i prodotti godono di proprietà differenti: ad
esempio il prodotto di funzioni è commutativo: f g = gf , mentre il prodotto di
matrici non lo è; il prodotto di matrici verifica tuttavia l’identità associativa
A(BC) = (AB)C
mentre il prodotto di Lie di matrici non lo è, ma verifica invece la
[A, [B, C]] + [C, [A, B]] + [B, [C, A]] = 0
(identità di Jacobi ) e la anticommutatività:
[A, B] = −[B, A]
Il prodotto di Jordan verifica invece l’identità di Jordan:
((A, B), (A, A)) = (A, (B, (A, A)))
5.5.3 Esempio Si consideri A = C ∞ (R2n ) (algebra delle funzioni differenziabili)
e si definisca il prodotto
¶
n µ
X
∂f ∂g
∂g ∂f
{f, g}(x1 , ..., x2n ) =
−
∂xi ∂xi+n ∂xi ∂xi+n
i=1
(parentesi di Poisson). Il classico teorema di Jacobi afferma che queste parentesi
verificano l’identità di Jacobi.
5.5.4 Definizione Un’algebra A si dice
(1) associativa se il prodotto verifica la proprietà associativa;
5.5. Algebre associative
149
(2) commutativa se il prodotto verifica la proprietà commutativa;
(3) di Lie se il prodotto verifica le proprietà anticommutativa e di Jacobi;
(4) di Jordan se il prodotto verifica le proprietà commutativa e di Jordan.
Questi assiomi sono indipendenti fra loro, ma si possono utilmente combinare:
ad esempio l’algebra dei polinomi è associativa e commutativa.
5.5.5 Definizione Un’algebra (associativa) si dice con identità o con unità se
possiede un elemento neutro e ∈ A tale che
∀a ∈ A ea = ae = a
Ad esempio le algebre delle matrici e dei polinomi posseggono gli elementi neutri I e 1. Un’algebra anticommutativa (e.g. un’algebra di Lie) non può possedere
un elemento neutro e, dato che a = ae = ea = −ae implica a = ae = 0.
Se un’algebra associativa non possiede elemento neutro è sempre possibile
aggiungerglielo, considerando Ae = A ⊕ K col prodotto
(a, k)(a0 , k 0 ) = (aa0 + ka0 + k 0 a, kk 0 )
Si vede facilmente che (0, 1) è un elemento neutro per Ae e che A è la sottoalgebra
di Ae degli elementi (a, 0).
Convenzione. Supporremo nel seguito che le nostre algebre, se non altrimenti
specificato, siano algebre associative con elemento neutro e di dimensione finita.
5.5.6 Esempio Lo spazio C[G] della rappresentazione regolare di un gruppo
finito è un’algebra rispetto al prodotto di convoluzione; sappiamo che si tratta
di un’algebra associativa con elemento neutro, commutativa se e solo se lo è il
gruppo.
5.5.7 Definizione Un elemento a di un’algebra con unità A si dice invertibile
se esiste un b ∈ A tale che ab = ba = e. Si scrive b = a−1 .
Ovviamente in un’algebra (associativa, con unità) l’insieme A−1 degli elementi invertibili forma un gruppo rispetto al prodotto dell’algebra: ad esempio
se A = End(V ) allora A−1 = GL(V ).
5.5.8 Definizione Se in un’algebra A ogni elemento è invertibile, A si dice un
corpo.
Ad esempio C è un corpo commutativo, cioè un campo (notiamo che si tratta
di una R-algebra oltre che di una C-algebra).
150
Capitolo 5. Gruppi, algebre e rappresentazioni
5.5.9 Esempio Consideriamo il corpo dei quaternioni: partiamo dallo spazio
vettoriale reale H = R4 con la base (1, i, j, k):
1 = (1, 0, 0, 0) i = (0, 1, 0, 0) j = (0, 0, 1, 0) k = (0, 0, 0, 1)
Per definire un prodotto basta definirlo sui generatori ed estenderlo per bilinearità: sia
ij = k = −ji jk = i = −kj
ki = j = −ik
i2 = j 2 = k 2 = −1
e 1 l’elemento neutro. Un elemento a1 + bi + cj + dk ∈ H (a, b, c, d ∈ R) si dice
quaternione e può essere rappresentato con una matrice (come spazi vettoriali
R4 ∼
= M2 (C))
µ
¶
a b
(Q)
−b a
ove a, b ∈ C; allora il prodotto di quaternioni è il prodotto di queste matrici. Non
ogni matrice 2 × 2 (ovviamente) è un quaternione, ed infatti la sottoalgebra di
M2 (C) dei quaternioni è un corpo: infatti ogni matrice della forma (Q) ammette
come inversa la
µ
¶
1
a −b
|a|2 + |b|2 b a
(ove |a|2 = aa è il modulo del numero complesso a).
Dato che il prodotto in un’algebra qualsiasi A è bilineare, resta completamente determinato una volta che lo si sia definito su una base dello spazio vettoriale
A. Ad esempio, se dim A < ∞ e se (e1 , ..., en ) ne è una base, i coefficienti del
sistema di equazioni
X
ei ej =
ckij ek
k
si dicono costanti di struttura dell’algebra e la determinano completamente.
In analogia con i gruppi, avremo i concetti di sottoalgebra, morfismo e quoziente di algebre. Una sottoalgebra B ⊂ A è un sottospazio vettoriale tale che
BB ⊂ B (se S, T ⊂ A sono sottoinsiemi di un’algebra scriviamo ST per l’insieme
{st | s ∈ S, t ∈ T }), un morfismo fra algebre è una mappa lineare
f : A −→ B
tale che
f (ab) = f (a)f (b)
Sia il nucleo
ker f = {a ∈ A | f (a) = 0}
che l’immagine im f di un morfismo sono sottoalgebre di A e B rispettivamente.
Inoltre il nucleo è un ideale nel senso della
151
5.5. Algebre associative
5.5.10 Definizione Una sottoalgebra B di un’algebra A è un ideale destro se
BA ⊂ B e un ideale sinistro se AB ⊂ B; se è un ideale sia destro che sinistro si
dice bilatero.
Dato che B è un ideale sinistro se per ogni a ∈ A e b ∈ B: ba ∈ B. Quindi se
B è un ideale di A sullo spazio vettoriale quoziente A/B il prodotto di A induce
un prodotto e quindi una struttura di algebra.
È inoltre ovvio che il quoziente è un’algebra associativa.
5.5.11 Teorema Un’algebra commutativa è un campo se e solo se è priva di
ideali non banali.
Dimostrazione: Osserviamo che un ideale I non può contenere e altrimenti
per ogni a ∈ A ea ∈ I i.e. I = A. Per lo stesso motivo non può contenere un
elemento invertibile, dato che in questo caso a−1 a ∈ I i.e. e ∈ I.
Ora, se A è un corpo, ogni elemento non nullo è invertibile e quindi un ideale
non può contenere elementi non nulli, i.e. non può che essere 0. Viceversa, se I
è un ideale non banale, un suo elemento non nullo non può essere invertibile,
quindi A non è un corpo.
qed
A differenza del caso dei gruppi, in un’algebra associativa commutativa non
è vero che le sottoalgebre sono ideali; ad esempio, in ogni algebra esiste il centro:
Z(A) = {z ∈ A | ∀a ∈ Aaz = za}
In generale non si tratta di un ideale: se z ∈ Z(A) e a, b ∈ A allora a(bz) = azb 6=
bza. Se l’algebra è commutativa allora A = Z(A).
All’opposto abbiamo il concetto di algebra semplice, motivato anche dal teorema precedente, che è falso nel caso non commutativo: mostreremo fra breve, ad esempio, che l’algebra delle matrici non possiede ideali non banali (ma
ovviamente non è un campo).
5.5.12 Definizione Un’algebra A si dice semplice se non possiede ideali bilateri
non banali.
Le algebre semplici, come suggerisce il nome, sono “prive di struttura interna”
e sono usate per produrre nuove algebre per mezzo della somma diretta, ad
esempio.
Se {Aα } è una famiglia di algebre
L(sullo stesso campo e dello stesso tipo) sul
prodotto diretto di spazi vettoriali α Aα v’è un ovvia struttura di algebra:
ab(α) = a(β)b(β)
152
Capitolo 5. Gruppi, algebre e rappresentazioni
(si rammenti che il prodotto è l’insieme delle applicazioni dall’insieme degli indici
alla totalità degli addendi diretti). Ad esempio, su A ⊕ B abbiamo
(a ⊕ b)(a0 ⊕ b0 ) = (aa0 ) ⊕ (bb0 )
Ogni addendo diretto è un ideale del prodotto.
5.5.13 Definizione Un’algebra si dice semisemplice se è somma diretta di algebre semplici.
Diamo ora qualche esempio.
5.5.14 Teorema L’algebra associativa delle matrici Mn (K) è semplice.
Dimostrazione: Sia J in ideale in Mn (K) non nullo e sia A ∈ J una matrice
non nulla, che possiamo esprimere in termini di matrici “elementari” Eij (ove
Eij è la matrice ((δij )) che ha zero in ogni entrata, tranne che nell’elemento della
riga i e della colonna j ove ha 1):
X
A=
aij Eij
i,j
Se h, k sono tali che ahk 6= 0 (A 6= 0) allora
∀r, s ∈ {1, ..., n} Ers = a−1
hk Erh AEks ∈ J
e quindi ogni matrice Ers ∈ J cioè J = Mn (K).
qed
Si noti che la dimostrazione funziona per l’algebra delle matrici a coefficienti
in un corpo K qualsiasi. Notiamo inoltre che Mn (K) possiede centro non banale:
Z(Mn (K)) = {kI | k ∈ K}
(di dimensione 1) formato dai multipli costanti della matrice I.
Dal teorema segue che le somme dirette di algebre di matrici sono semisemplici.
5.5.15 Esempio Consideriamo le matrici triangolari superiori:
a11 a12 ... a1n
0 a22 ... a2n
..
..
..
..
.
.
.
.
0
0 ... ann
Quest’algebra non è semisemplice, dato che possiede molti ideali: ad esempio
quello delle matrici triangolari i cui elementi diagonali siano tutti nulli (il quoziente è l’algebra delle matrici diagonali).
Il fatto che i nostri esempi siano tutti basati sulle matrici non è un caso:
153
5.5. Algebre associative
5.5.16 Teorema Ogni algebra associativa di dimensione n su un campo K è
isomorfa ad una sottoalgebra di Mk (K) con k ≤ n + 1.
Dimostrazione: Sia A un’algebra associativa con unità 1 e consideriamo la
rappresentazione regolare sinistra
L : A −→ End(A) = Mn (K)
definita da L(a)(b) = ab; si tratta evidentemente di un omomorfismo di A nell’algebra associativa End(A): dimostriamo che è iniettivo, il che ci fornisce la
tesi. Se L(a)(b) = 0 per ogni b ∈ A allora ab = 0 per ogno b e quindi per b = 1,
da cui a = 0; cioè il nucleo di L è banale.
Se A non possiede l’unità, possiamo considerare lo spazio vettoriale Ae =
A ⊕ K, e definire su di esso un prodotto
(a + k, b + h) = (ab + kb + ha, kh)
associativo; evidentemente l’algebra Ae possiede un elemento neutro: (0, 1). Ma
allora Ae (e quindi anche A, per restrizione) si immerge in Mk (K).
qed
Questo teorema è analogo al teorema di Cayley per i gruppi: l’idea è la stessa
e ci dà lo spunto per parlare di rappresentazioni di algebre; prima facciamo
un’ulteriore convenzione:
Convenzione. D’ora in avanti un’algebra sarà un’algebra associativa con elemento neutro di dimensione finita sui numeri complessi: K = C.
5.5.17 Definizione Una funzione a 7−→ A∗ in un’algebra A si dice una involuzione se
(1) a∗∗ = a
(2) (λa)∗ = λa∗ se λ ∈ C.
(3) (a + b)∗ = a∗ + b∗
(4) (ab)∗ = b∗ a∗
5.5.18 Definizione Un’algebra dotata di involuzione ∗ si dice una *-algebra.
L’esempio ispiratore è l’algebra delle matrici complesse: l’involuzione è semplicemente la coniugazione della trasposta:
A∗ = AT
Si noti che, sebbene ogni algebra sia una sottoalgebra delle matrici, non è detto che sia una sotto-*-algebra. Anche le matrici reali rispetto alla semplice
trasposizione sono una *-algebra.
154
Capitolo 5. Gruppi, algebre e rappresentazioni
5.5.19 Definizione Un elemento a ∈ A si dice autoaggiunto se a∗ = a e si dice
normale se a∗ a = aa∗ .
Ovviamente ogni elemento a ∈ A si scrive in modo unico come
a = a1 + ia2
ove a1 , a2 sono autoaggiunti: basta porre
1
a1 = (a + a∗ )
2
e
a2 =
1
(a − a∗ )
2i
Inoltre per ogni a, a∗ a e aa∗ sono autoaggiunti, come pure autoaggiunto è e.
Ora vogliamo dare per una *-algebra il concetto di rappresentazione: ovviamente un omomorfismo di *-algebre è un omomorfismo ϕ tale che
ϕ(a∗ ) = ϕ(a)∗
e si dice anche *-omomorfismo.
5.5.20 Definizione Un modulo su una *-algebra A è uno *-omomorfismo di
*-algebre
ϕ : A −→ End(M )
ove M è uno spazio vettoriale complesso.
In altri termini, se scriviamo
am := ϕ(a)(m)
allora
(1) (λa + µb)m = λ(am) + µ(bm) se λ, µ ∈ C, a, b ∈ A e m ∈ M ;
(2) (ab)m = a(bm)
(3) 1m = m
Il concetto è del tutto analogo a quello di rappresentazione, ed infatti, come
nel caso delle rappresentazioni abbiamo i concetti di
(1) sottomodulo, cioè di A-modulo N che sia un sottospazio di M ;
(2) modulo irriducibile, cioè di A-modulo M che non possiede sottomoduli
diversi da 0 e M ;
155
5.5. Algebre associative
(3) morfismo di moduli , cioè di applicazione lineare A : M −→ N fra due
sottomoduli tale che A(am) = a(Am) per ogni a ∈ A e m ∈ M ; l’insieme
dei morfismi si denota con homA (M, N );
(4) somma diretta di moduli , del tutto ovvia;
(5) completa riducibilità di moduli , cioè un modulo è completamente riducibile
se è somma diretta di sottomoduli irriducibili.
Esattamente come nel caso delle rappresentazioni dei gruppi abbiamo il
5.5.21 Lemma (Schur) Se M e N sono A-moduli irriducibile allora ogni morfismo di moduli F : M −→ N è un isomorfismo oppure è zero.
5.5.22 Corollario Se M è un A-modulo irriducibile allora homA (M, M ) = C.
Osserviamo che se lo spazio M possiede una struttura hermitiana (.), si dice
uno *-modulo se
(am, m0 ) = (m, a∗ m0 )
ovvero a∗ m = (am)∗ . Esattamente come per le rappresentazioni unitarie, si
dimostra il seguente
5.5.23 Teorema Uno *-modulo su una *-algebra A è completamente riducibile.
Ad esempio l’algebra di gruppo di un gruppo finito è completamente riducibile, dato che
5.5.24 Teorema Se G è un gruppo, esiste una corrispondenza biunivoca fra
C[G]-moduli e rappresentazioni di G: ai moduli irriducibili corrispondono rappresentazioni irriducibili.
Dimostrazione: Se π : G −→ GL(V ) è una rappresentazione di G possiamo
estenderla per linearità ad una funzione
X
X
ϕ(
ag g) =
ag ϕ(g)
g
g
su C[G] ottenendo cosı̀ una funzione C −→ End(V )
X
X
(
aa g)(v) :=
ag ϕ(g)(v)
g
g
che si verifica facilmente essere una struttura di C[G]-modulo su V .
Per ricostruire la rappresentazione del gruppo a partire dall’algebra basta
restringere la rappresentazione di C[G] a G ⊂ C[G].
qed
156
Capitolo 5. Gruppi, algebre e rappresentazioni
Dimostriamo ora che l’algebra di gruppo è semisemplice: in effetti vale molto
di più: ogni rappresentazione di un’algebra semisemplice è completamente riducibile (teorema di Wedderburn) ed è somma diretta di algebre di matrici, che ne
costituiscono i “fattori”; ogni tale fattore F verifica la relazione F ∩ F 0 = C ove
F 0 = {A∈A | ∀F ∈F AF = F A} è il commutante del fattore F. La teoria ammette una vastissima generalizzazione al caso di dimensione infinita, generalizzazione
dovuta a von Neumann e Murray.
5.5.25 Teorema Se G è un gruppo finito, l’algebra C[G] è somma diretta delle
algebre
Mn1 (C) ⊕ ... ⊕ Mnk (C)
ove ni sono le dimensioni delle rappresentazioni irriducibili di G e k è il loro
numero.
Dimostrazione: Siano π1 : G −→ GL(V1 ), ..., πk : G −→ GL(Vk ) le rappresentazioni irriducibili non equivalenti di G e supponiamo che sia dim Vi = ni ; allora,
se poniamo
Φ : C[G] −→ Mn1 (C) ⊕ ... ⊕ Mnk (C)
g 7−→ (π1 (g), ..., πk (g))
(definendola su G, che è una base di C[G] ed estendendola per linearità) abbiamo un omomorfismo di algebre: si tratta di uno *-omomorfismo, dato che le
rappresentazioni Vi sono unitarie.
Per vedere che è un isomorfismo ci basta dunque mostrare che è iniettivo e
suriettivo. è iniettivo perché se ker Φ 6= 0 allora
πi (a) = 0
e quindi tutti i coefficienti delle matrici πi (g) sono nulli; ma questi sono una base
dello spazio C[G] e quindi a = 0.
P
Dimostriamo infine che è suriettivo: abbiamo che, se a = g a(g)g:
πi (a) =
X
a(g)πi (g)
g∈G
L
Se quindi A1 ⊕ ... ⊕ Ak è un generico elemento di
Mni (C) allora vogliamo
mostrare che esiste a ∈ C[G] tale che Φ(a) L
= A1 ⊕ ... ⊕ Ak .
Sia perciò A1 ⊕ ... ⊕ Ak un elemento di
Mni (C); le matrici Ai sono matrici
delle rappresentazioni πi (g) rispetto a certe basi di Vi ; sappiamo che questi elementi generano come spazio vettoriale C[G], dato che ne costituiscono una base
157
5.6. Appendice: Cenni di algebra tensoriale
ortogonale, quindi ogni elemento a di C[G] è, in una certa base, combinazione
lineare di queste funzioni, da cui
Ã
Φ(a) = Φ
X
g∈G
!
a(g)g
=
X
a(g)(π1 (g) ⊕ ... ⊕ πk (g)) =
g∈G
X
a(g)A1 ⊕ ... ⊕ Ak
g∈G
qed
5.6
Appendice: Cenni di algebra tensoriale
In questa appendice supporremo di avere a che fare con spazi vettoriali di
dimensione finita su un campo K, che potremo limitarci a pensare come i numeri
reali R o complessi C.
5.6.1
Algebra tensoriale
Consideriamo quindi due spazi vettoriali V e W . Vogliamo costruire a partire
da questi due un nuovo spazio vettoriale di dimensione finita che abba il diritto
di dirsi “prodotto” dei due dati. L’idea è che i suoi elementi, che saranno formati
a partire dagli elementi di V e W non dovranno soddisfare altre relazioni se non
quelle di bilinearità.
Ricordiamo che una mappa bilineare fra gli spazi vettoriali V , W e Z è una
applicazione
f : V × W −→ Z
tale che, fissato un qualsiasi v ∈ V la mappa w 7−→ f (v, w) sia lineare da W a Z
e, fissato un qualsiasi w ∈ W la mappa v 7−→ f (v, w) sia lineare da V a Z.
Quando Z = K, f si dice forma bilineare. Ad esempio un prodotto scalare su
uno spazio vettoriale reale è una forma bilineare.
Il problema che ora ci poniamo è di trovare uno spazio vettoriale “universale”
rispetto al concetto di bilinearità, e la risposta è fornita dal seguente
5.6.1 Teorema Se V e W sono spazi vettoriali su K allora esiste uno spazio
vettoriale T su K ed una mappa bilineare
τ : V × W −→ T
tale che
158
Capitolo 5. Gruppi, algebre e rappresentazioni
(1) Per ogni mappa bilineare f : V × W −→ Z esiste un’unica mappa lineare
f∗ : T −→ Z tale che f = f∗ ◦ τ , i.e. che il seguente diagramma
τ
V ×W
HH
HH
HH
f HHH
#
Z
/T
Ä
ÄÄ
ÄÄf∗
Ä
ÄÄ
(2) Se (v1 , ..., vn ) è una base di V e (w1 , ..., wm ) è una base di W allora {τ (vi , wj )}i,j
è una base di T .
Dimostrazione: Questa dimostrazione non è la più raffinata ma ha il pregio
della concretezza: consideriamo la base (v1 , ..., vn ) di V e la base (w1 , ..., wm ) di
W , ed associamo ad ogni coppia (vi , wj ) un simbolo τij . Allora lo spazio vettoriale
T generato su K dai simboli τij ha dimensione nm, ed è formato da tutti le
combinazioni lineari formali
X
aij τij
i,j
con aij ∈ K. In altri termini le {τij } sono per definizione una base di T .
Definiamo ora la mappa τ su unaP
coppia qualsiasi
Pdi vettori di V e W , espressi
in termini delle loro basi come v = i xi vi e w = j yj wj , nel modo seguente:
X
τ (v, w) :=
xi yj τij
i,j
Per definizione questa mappa è bilineare. Verifichiamo ora i due enunciati del
teorema.
Sia dunque f la nostra mappa bilineare. Se definiamo
f∗ (τij ) := f (vi , wj )
questo determina un’unica mappa lineare su T (infatti l’abbiamo definita sulla
sua base {τij }) e per definizione si ha f = f∗ ◦ τ .
Per dimostrare il secondo enunciato, basta considerare due altre basi di V e
W : (v10 , ..., vn0 ) e (w10 , ..., wn0 ). Dobbiamo dimostrare che gli elementi {τ (vi0 , wj0 )}
costituiscono una base di T . Ma di certo questi elementi generano T , in quanto,
per ogni coppia (v, w) ∈ V × W esistono dei coefficienti in K tali che
X
X
e
w=
yi wi0
v=
xi vi0
Sicché, per bilinearità di τ :
τ (v, w) =
X
i,j
xi yj τ (vi0 , wj0 )
5.6. Appendice: Cenni di algebra tensoriale
159
e quindi ogni elemento di T si esprime come combinazione lineare degli {τ (vi0 , wj0 )}.
Inoltre, dato che questi elementi sono nm e che la dimensione di T pure è nm,
devono necessariamente costituirne una base.
qed
Osserviamo che la definizione di T è ben posta in virtù del secondo enunciato
del teorema, non dipende cioè dalla scelta delle basi fissate in V e W per costruire
i generatori di T .
Un altro corollario immediato del teorema è che lo spazio T è unico a meno di
isomorfismi: infatti se ne esiste un altro, diciamo T 0 , soddisfacente alla proprietà
(1) del teorema, possiamo applicare il teorema a T 0 con Z = T e f = τ ed a
T con Z = T 0 e f = τ 0 , ottenendo cosı̀ due mappe τ∗ e τ∗0 che sono ovviamente
l’una l’inversa dell’altra e dunque realizzano un isomorfismo di T con T 0 .
D’ora in poi indicheremo lo spazio T associato a V e W con V ⊗ W , e lo
chiameremo prodotto tensoriale di V e W . Inoltre al posto di τ (v, w) scriveremo
v ⊗ w e chiameremo gli elementi di V ⊗ W tensori.
Per costruzione si ha
dim V ⊗ W = dim(V ) dim(W )
è ovvia la verifica dell’esistenza dei seguenti isomorfismi canonici (tutto ciò che
bisogna usare è il teorema 1):
V ⊗W ∼
=W ⊗V
∼
V ⊗ (W ⊗ Z) = (V ⊗ W ) ⊗ Z)
5.6.2 Proposizione V ∗ ⊗ W ∼
= hom(V, W ).
Dimostrazione: Definiamo esplicitamente:
F : V ∗ ⊗ W −→ hom(V, W )
ϕ ⊗ w 7−→ (v 7−→ ϕ(v)w)
Cioè, al tensore ϕ ⊗ w (ove ϕ ∈ V ∗ e w ∈ W ) assegnamo la mappa lineare Fϕ⊗w :
V −→ W che calcolata su un elemento v dà come risultato ϕ(v)w. è un’ovvia
verifica che F è ben definita, lineare e iniettiva, dunque un isomorfismo.
qed
Il seguente fatto è banale, ma molto importante, ed esprime la funtorialità
del prodotto tensoriale: se f : V −→ U e g : W −→ Z sono mappe lineari di
spazi vettoriali allora è definita la mappa lineare
f ⊗ g : V ⊗ W −→ U ⊗ Z
160
Capitolo 5. Gruppi, algebre e rappresentazioni
come
(f ⊗ g)(v ⊗ w) := f (v) ⊗ g(w)
In altri termini, tensorizzare per uno spazio vettoriale fissato è un funtore nella
categoria degli spazi vettoriali: il prodotto tensoriale lo possiamo vedere come un
“funtore in due variabili”.
5.6.3 Proposizione
(1) V ⊗ K ∼
=V
(2) V ∗ ⊗ W ∗ ∼
= (V ⊗ W )∗
(3) Se V è uno spazio vettoriale reale, possiamo considerare V C := V ⊗C ove C
è visto come spazio reale bidimensionale. Allora V C è uno spazio vettoriale
complesso.
Dimostrazione: V soddisfa evidentemente la proprietà universale del prodotto
tensoriale V ⊗ K rispetto alla mappa F : V × K −→ V data da F (v, k) = kv.
La (2) è pure ovvia: se F : V ∗ × W ∗ −→ (V ⊗ W )∗ è data da
F (ϕ, ψ)(v ⊗ w) := ϕ(v)ψ(w)
allora la proprietà universale di V ∗ ⊗ W ∗ è verificata da (V ⊗ W )∗ .
Infine, se V C = V ⊗ C, vediamo che è definita una moltiplicazione fra gli
elementi di V C e quelli di C che rende V C uno spazio complesso: basti porre
∀v ∈ V C ∀z ∈ C zv = v ⊗ z
Le proprietà del prodotto tensoriale dicono esattamente che lo spazio V C è complesso. Si noti che dimR V = dimC V C : in effetti una R-base (e1 , ..., en ) di V è
anche una C-base di V C .
qed
Per concludere questa discussione del prodotto tensoriale notiamo il motivo per quale lo si può considerare una versione intrinseca del concetto di
multilinearità: ha luogo infatti l’isomorfismo
(V ⊗ W )∗ ∼
= Bil(V, W )
ove Bil(v, W ) denota lo spazio delle forme bilineari su V ×W . Questo isomorfismo
è semplicemente un modo differente di esprimere la proprietà (1) del Teorema 1.
In modo del tutto analogo, considerando per uno spazio vettoriale V le sue
potenze tensoriali V ⊗2 := V ⊗ V , V ⊗3 := V ⊗ V ⊗ V ,... possiamo identificare le
forme multilineari sullo spazio vettoriale V con le forme lineari sui tensori di V .
5.6. Appendice: Cenni di algebra tensoriale
161
Introduciamo ora un oggetto molto importante, l’algebra tensoriale. Partiamo
dal solito spazio vettoriale V su K. Scriviamo V ⊗2 in luogo di V ⊗V . Ovviamente
possiamo iterare il prodotto tensoriale quante volte vogliamo, e cosı̀ considerare
le potenze tensoriali di V : V ⊗0 := K, V ⊗1 = V ,...,V ⊗n , ...
Lo spazio vettoriale (di dimensione infinita)
T (V ) :=
∞
M
V ⊗n
n=1
si chiama algebra tensoriale. è infatti un’algebra associativa rispetto ad un ovvio
prodotto che possiamo definire nel modo seguente: se (v1 , ..., vn ) è una base di
V , allora un tipico elemento di T (V ) è della forma
X X
ai1 ,...,ik vi1 ⊗ ... ⊗ vik
k
i1 ,...,ik
ove la somma su k è finita e gli indici possono anche essere ripetuti, ed i coefficienti
stanno ovviamente in K. Cioè i tensori che stanno in T (V ), che sono tutti i tensori
possibili su V , sono una specie di polinomi nelle variabili {vi }, con la notevole
eccezione di non essere commutativi, in quanto ovviamente v ⊗ w 6= w ⊗ v. Che
T (V ) sia uno spazio vettoriale è vero per costruzione, mentre la struttura di
algebra si ha considerando il prodotto definito come:
vi1 ⊗ ... ⊗ vik · vj1 ⊗ ... ⊗ vjh := vi1 ⊗ ... ⊗ vik ⊗ vj1 ⊗ ... ⊗ vjh
Questo è ovviamente un prodotto associativo ed ha un’unità che è poi l’1 di
K ⊂ T (V ).
L’algebra tensoriale è ovviamente di dimensione infinita (possiamo pensare
i suoi elementi come “polinomi non commutativi” negli elementi di V ), e graduata, nel senso che si decompone in somma diretta di sottospazi vettoriali (per
costruzione). Ha cosı̀ senso parlare di grado di un tensore: un elemento x ∈ T (V )
ha grado n se si scrive come somma di elementi di potenze tensoriali di V non
maggiori della n-ma (del tutto analogamente al grado dei polinomi: l’algebra
K[X1 , ..., Xn ] è infatti graduata ed il grado è quello usuale dei polinomi).
5.6.2
Algebra simmetrica
Mostriamo ora come possiamo considerare i polinomi su V (le funzioni polinomiali V −→ K) come quoziente dell’algebra tensoriale.
Consideriamo in T (V ) l’ideale I(V) generato dagli elementi della forma v ⊗
w − w ⊗ v con v, w ∈ V , e quindi il quoziente
Sym(V ) := T (V )/I(V )
162
Capitolo 5. Gruppi, algebre e rappresentazioni
Denotiamo l’immagine di un tensore vi1 ⊗ ... ⊗ vik ∈ T (V ) nel quoziente ∧(V )
con la scrittura vi1 · ... · ∧vik . Poichè l’ideale I(V ) è graduato, nel senso che se
I k (V ) := I(V ) ∩ V ⊗k allora
M
I(V ) =
I k (V )
k
anche l’algebra Sym(V ) è graduata:
Sym(V ) =
M
S k (V )
k
con
S k (V ) = V ⊗k /I k (V )
Questa nuova algebra è stata costruita in modo che i suoi elementi, oltre a soddisfare le relazioni multilineari dei tensori qualsiasi, soddisfino anche la commutatività, cioè se v e w sono in V allora
vw = wv
Gli elementi di Sym(V ) si dicono tensori simmetrici, e Sym(V ) si dice algebra
simmetrica su V .
Si tratta effettivamente di un’algebra associativa con elemento neutro perché
l’ideale I(V ) è un ideale per la struttura associativa. Inoltr el’algebra simmetrica
è per definizione commutativa.
Notiamo che l’algebra simmetrica può ottenersi considerando la rappresentazione di Sn su V n data da
σ(v1 ⊗ ... ⊗ vn ) = vσ(1) ⊗ ... ⊗ vσ(n)
e considerando gli invarianti della rappresentazione, i,e, gli elementi υ di V ⊗n
tali che συ = υ: si tratta degli elementi di S n (V ).
Ora ci concentreremo sui singoli addendi S k (V ) dell’algebra simmetrica. Consideriamo cioè il solito spazio vettoriale V di dimensione n con la solita base
(v1 , ..., vn ), e l’algebra simmetrica di grado k su V : S k V .
Vogliamo caratterizzare questo spazio in termini di mappe multilineari, come
abbiamo fatto per i tensori. Intanto osserviamo che S k V si ottiene da V ⊗k quozientando per il sottospazio generato dai vettori v ⊗ v − w ⊗ v, e quindi i suoi
elementi, che hanno la forma
X
ai1 ...ik vi1 ...vik
i1 ,...,ik
5.6. Appendice: Cenni di algebra tensoriale
163
verificano la commutatività, i.e. si può sempre scrivere
vi1 ...vik = vj1 ...vjk
se {i1 , ..., ik } = {j1 , ..., jk }. Ora consideriamo le applicazioni multilineari simmetriche di V in sé, cioè le funzioni
f : V k −→ W
multilineari e tali che
f (v1 , ..., vk ) = f (vi1 , ..., vik ) = 0
per ogni permutazione i : j −→ ij degli interi {1, ..., n}.
Se W = K abbiamo il concetto di forma multilineare simmetrica in k variabili:
ad esempio un prodotto scalare è una forma bilineare simmetrica.
Notiamo ora che
5.6.4 Proposizione I tensori S k (V ) sono esattamente i polinomi omogenei di
grado k negli elementi di V .
Dimostrazione: Basta osservare che, dato che un elemento di S k (V ) è della
forma
X
s=
ai1 ...ik vi1 ...vik
i1 ,...,ik
Quindi se (e1 , ..., en ) è una base di V allora
X
s=
aj1 ...jn ej11 ...ejnn
j1 ,...,jn
convenendo che jk possa anche essere zero, ed in tal caso ejkk venga omesso.
qed
Dunque l’algebra simmetrica Sym(V ) può vedersi come l’algebra dei polinomi
K[V ] ovvero K[e1 , ..., en ]; in particolare, Sym(V ∗ ) sono le funzioni polinomiali su
V , quindi i polinomi nel senso elementare del termine. Si noti che K[V × W ] =
K[V ] ⊗ K[W ].
L’algebra simmetrica verifica una proprietà universale:
5.6.5 Teorema Se V è uno spazio vettoriale di dimensione n su K e se k è un
intero positivo allora esiste un unico spazio vettoriale Σ di dimensione finita su
K, ed una mappa multilineare simmetrica
σ : V k −→ Σ
tale che
164
Capitolo 5. Gruppi, algebre e rappresentazioni
(1) Se W è uno spazio vettoriale e se f : V k −→ W è una mappa multilineare
simmetrica, allora esiste un’unica mappa lineare f∗ : Σ −→ W tale che
f = f∗ ◦ σ, i.e. che il seguente diagramma
V k BB
σ
BB
BB
BB
!
f
W
/Σ
~
~~
~~
~
f
~~ ~ ∗
(2) Se (v1 , ..., vn ) è una base di V allora {σ(vi1 , ..., vik )} con 1 ≤ i1 ≤ ... ≤ ik è
una base di W .
Dimostrazione: Procediamo in modo analogo al teorema 5.6.1, considerando
per ogni sottoinsieme S di {1, ..., n} di k elementi anche ripetuti5 (ad esempio
può essere S = (1, 1, ..., 1) e si noti che (2, 1, 1, .., 1) e (1, 2, 1, ..., 1) corrispondono
alla stessa scelta) un simbolo σS , e prendendo
¢ lo spazio vettoriale generato da
¡
, e che denotiamo Σ. Se {v1 , ..., vn }
questi simboli su K, che ha dimensione n+1+k
k
è una base di V , allora S è lo spazio delle combinazioni lineari
X
ai1 ...ik vi1 ...vik
i1 ≤i2 ≤...≤ik
Sia ora v ∈ V k della forma
X
v=
ai1 ...ik (vi1 , ..., vik )
i1 ,...,ik
e definiamo la mappa σ come
σ(v) :=
X
ai1 ...ik (i1 , ..., ik )
i1 ≤i2 ≤...≤ik
(S è generato da elementi del tipo (i1 , ..., ik )). Che si tratti di una mappa multilineare simmetrica segue dalla definizione, ed è pure un fatto ovvio che
σ(vi1 , ..., vik ) = σS
se S = {i1 , ..., ik } con i1 ≤ ... ≤ ik .
La dimostrazione della (1) si riduce alla semplice osservazione che se f :
V k −→ W è multilineare simmetrica, la mappa
f∗ (σS ) := f (vi1 , ..., vik )
5
Si tratta sostanzialmente dei monomi di grado k nelle indeterminate 1, .., n.
5.6. Appendice: Cenni di algebra tensoriale
165
è ben definita su una base di Σ e quindi si estende ad un’unica mappa lineare da
Σ in W .
Per la dimostrazione della (2)
basta
¢ notare che gli elementi {σ(vi1 , ..., vik )}
¡n+k+1
.
generano Σ e sono esattamente
k
qed
Di nuovo possiamo dedurre l’unicità dello spazio Σ dalla sua proprietà universale, ed è evidente che la potenza simmetrica S k (V ) soddisfa questa proprietà:
ne segue che abbiamo una naturale identificazione
Σ∼
= S k (V )
che, a livello di basi, è
σ(vi1 , ..., vik ) ←→ vi1 ...vik
Osserviamo che il risultato precedente può riformularsi dicendo che lo spazio delle forme multilineari simmetriche è isomorfo allo spazio duale dei tensori
simmetrici:
Sym(V k , K) ∼
= (S k (V ))∗
Inoltre, è possibile associare ad una mappa f : V −→ W lineare la sua potenza
simmetrica k-sima S k f : S k V −→ S k W definita come
S k f (u1 , ..., uk ) = f (u1 )...f (uk )
L
Notiamo che l’algebra simmetrica completa k S k (V ) è di dimensione infinita e
corrisponde all’algebra dei polinomi su V .
5.6.3
Algebra esterna
Costruiamo ora un’altra algebra tensoriale: l’algebra esterna. Consideriamo
in T (V ) l’ideale I(V) generato dagli elementi della forma v ⊗ v per v ∈ V , e quindi
il quoziente
∧(V ) := T (V )/I(V )
Denotiamo l’immagine di un tensore vi1 ⊗ ... ⊗ vik ∈ T (V ) nel quoziente ∧(V )
con la scrittura vi1 ∧ ... ∧ vik . Poichè l’ideale I(V ) è graduato, nel senso che se
I k (V ) := I(V ) ∩ V ⊗k allora
M
I(V ) =
I k (V )
k
anche l’algebra ∧(V ) è graduata:
∧(V ) =
M
k
∧k (V )
166
Capitolo 5. Gruppi, algebre e rappresentazioni
con
∧k (V ) = V ⊗k /I k (V )
Questa nuova algebra è stata costruita in modo che i suoi elementi, oltre a
soddisfare le relazioni multilineari dei tensori qualsiasi, soddisfino anche quelle
antisimmetriche, cioè se v e w sono in V allora
v ∧ w = −w ∧ v
e quindi
v∧v =0
Da qui per induzione:
∀x ∈ ∧k (V ) ∀y ∈ ∧h (V ) x ∧ y = (−1)kh y ∧ x
Gli elementi di ∧(V ) si dicono tensori antisimmetrici, e ∧(V ) si dice algebra
esterna su V . Si tratta di un’algebra associativa, che per definizione è anticommutativa.
Notiamo che wk (V ) può essere costruito considerando la rappresentazione del
gruppo An su V ⊗n data da
σ(v1 ⊗ ... ⊗ vn ) = vσ(1) ⊗ ... ⊗ vσ(n)
e considerandone gli invarianti.
Ora ci concentreremo sui singoli addendi ∧k (V ) dell’algebra esterna. Consideriamo cioè il solito spazio vettoriale V di dimensione n con la solita base
(v1 , ..., vn ), e l’algebra esterna di grado k su V : ∧k V .
Vogliamo caratterizzare questo spazio in termini di mappe multilineari, come
abbiamo fatto per i tensori. Intanto osserviamo che ∧k V si ottiene da V ⊗k quozientando per il sottospazio generato dai vettori v ⊗ v, e quindi i suoi elementi,
che hanno la forma
X
ai1 ...ik vi1 ∧ ... ∧ vik
i1 ,...,ik
verificano relazioni del tipo:
vi1 ∧ ... ∧ vij ∧ ... ∧ vij ∧ ... ∧ vik = 0
Ora consideriamo le applicazioni multilineari alterne di V in sé, cioè le funzioni
f : V k −→ W
multilineari e tali che
f (vi1 , ..., v, ..., v, ..., vik ) = 0
167
5.6. Appendice: Cenni di algebra tensoriale
il che ovviamente implica
f (vi1 , ..., v, ..., w, ..., vik ) = −f (vi1 , ..., w, ..., v, ..., vik )
Se W = K abbiamo il concetto di forma multilineare alternante in k variabili.
5.6.6 Esempio Se guardiamo ad una matrice A come alla successione ordinata
dei vettori colonna che la compongono, A = (A1 , ..., An ), il determinante
det : V n −→ K
è multilineare alternante, e si può completamente caratterizzare aggiungendo la
condizione
det(1) = 1
che il determinante della matrice identica sia 1.
5.6.7 Esempio Consideriamo i tensori di grado due, i.e. degli elementi di V ⊗
V : ogni tale tensore è comma di un tensore antisimmetrico e di un tensore
simmetrico, in altri termini
V ⊗ V = S 2 (V ) ⊕ ∧2 (V )
Il determinante interviene nella dimostrazione del seguente teorema:
5.6.8 Teorema Se V e W sono spazi vettoriali su K e se
f : V k −→ W
è una funzione multilineare alternante, dati qualsiasi w1 , ..., wk ∈ V e se A =
((aij )) è una matrice e
u1 =
k
X
a1i wi ,
...
uk =
k
X
aki wi
i=1
i=1
allora
f (u1 , .., uk ) = det(A)f (w1 , ..., wk )
Dimostrazione: Intanto si ha
k
k
X
X
f (u1 , .., uk ) = f (
a1i wi , ...,
aki wi )
i=1
i=1
168
Capitolo 5. Gruppi, algebre e rappresentazioni
e, per multilinearità, si ottiene
X
f (a1,σ(1) wσ(1) , ..., a1,σ(k) wσ(k) )
σ
ove la somma è estesa a tutte le possibili mappe σ : {1, ..., k} −→ {1, ..., k} che
riordinano k elementi. Questa somma è pari a
X
a1,σ(1) ...ak,σ(k) f (wσ(1) , ..., wσ(k) )
σ
sempre per multilinearità. Osserviamo che la somma in realtà non è estesa a tutte
le combinazioni possibili di elementi, ma solo alle permutazioni, cioè alle mappe
σ biunivoche, perché nel caso di una combinazione di termini che non sia una
permutazione, nel termine f (wσ(1) , ..., wσ(k) ) due o più argomenti sono uguali e
quindi il termine è nullo, per alternanza di f . Otteniamo cioè
X
a1,σ(1) ...ak,σ(k) f (wσ(1) , ..., wσ(k) )
σ∈Sk
ove Sk è il gruppo simmetrico su k elementi. Ora, ogni permutazione σ ∈Sk si può
ottenere come una sequenza di scambi fra coppie di elementi: quando scambiamo
due argomenti nel termine f (wσ(1) , ..., wσ(k) ) il segno cambia (per alternanza) e
quindi una volta effettuata la permutazione, otteniamo un fattore (−1)sgn(σ) ove
il segno di una permutazione è il numero di scambi che la compongono.
Insomma, trasformare il termine f (wσ(1) , ..., wσ(k) ) in f (w1 , ..., wk ) comporta
unicamente l’apparizione di un segno (−1)sgn(σ) , e quindi la somma precedente
si trasforma in
X
f (u1 , ..., uk ) =
(−1)sgn(σ) a1,σ(1) ...ak,σ(k) f (w1 , ..., wk )
σ∈Sk
che è uguale a
det(A)f (w1 , ..., wk )
qed
Il fatto che il determinante di A sia definito come
X
det(A) =
(−1)sgn(σ) a1,σ(1) ...ak,σ(k)
σ∈Sk
segue dal familiare sviluppo di Laplace, e costituisce un esercizio di calcolo combinatorio (nel farlo può essere utile esaminare i casi k = 2 e k = 3 separatamente...)
5.6. Appendice: Cenni di algebra tensoriale
169
La comprensione del teorema precedente è cruciale per capire le forme alternanti. Abbiamo comunque bisogno di una versione più generale di questo teorema, la cui dimostrazione proveremo a lasciare per esercizio, non prima d’aver
messo in grado il lettore di risolverlo, per via delle seguenti osservazioni.
Consideriamo una matrice A di dimensioni k × n e con k ≤ n ed un sottoinsieme S dell’insieme di interi {1, ..., n} con k elementi. Di tali sottoinsiemi ve ne
sono
µ ¶
n
k
come noto dal calcolo combinatorio. Se questi elementi sono S = {i1 , ..., ik } allora
possiamo assumere che siano ordinati: i1 < ... < ik . Consideriamo una funzione
σ : {1, ..., k} −→ S
cioè un modo di associare ad un numero fra 1 e k un elemento di S e supponiamo
che questa funzione sia iniettiva. Allora è biunivoca (perché?) e quindi definisce
una permutazione di S.
5.6.9 Esempio Se n = 4 e k = 3, e S = {1, 3, 4}, la permutazione σ definita da
σ(1) = 4
σ(3) = 1
σ(4) = 3
ha segno +1.
Se chiamiamo P (S) l’insieme delle permutazioni degli elementi di S (che è dire
l’insieme delle biiezioni di S in sé, e se torniamo alla nostra matrice A = ((aij )),
per ogni insieme S di cardinalità k possiamo considerare il minore k × k di A
costituito dagli elementi aij tali che j ∈ S. Denotiamo con
det(A)
S
il determinante di questo minore. Allora è
X
det(A) =
(−1)sgn(σ) a1,σ(1) ...ak,σ(k)
S
σ∈P (S)
Ora siano w1 , ..., wn elementi in V , e per ognuno degli insiemi S definiamo
wS = (wi1 , ..., wik )
ove gli elementi di S sono tali che i1 < ... < ik . A questo punto, usando le
notazioni introdotte, il lettore dovrebbe dimostrare il seguente
170
Capitolo 5. Gruppi, algebre e rappresentazioni
5.6.10 Teorema Se V e W sono K-spazi vettoriali, e se
f : V k −→ W
è una mappa multilineare alternante, se w1 , ..., wn sono elementi di V e A è una
matrice k × n e se
u1 =
n
X
a1i wi ,
...
uk =
i=1
n
X
aki wi
i=1
allora
f (u1 , .., uk ) =
X
S
det(A)f (wS )
S
(Come suggerimento si osservi che la dimostrazione è simile a quella del teoP
rema P
precedente,
salvo in un punto nel quale bisogna spezzare la somma σ
P
come S σ∈P (S) ).
Siamo ora in grado di dimostrare una proprietà universale dei prodotti esterni,
analoga al teorema 5.6.1:
5.6.11 Teorema Se V è uno spazio vettoriale di dimensione n su K e se k è un
intero tale che 1 ≤ k ≤ n allora esiste un unico spazio vettoriale Λ di dimensione
finita su K, ed una mappa multilineare alternante
λ : V k −→ Λ
tale che
(1) Se W è uno spazio vettoriale e se f : V k −→ W è una mappa multilineare
alternante, allora esiste un’unica mappa lineare f∗ : Λ −→ W tale che
f = f∗ ◦ λ, i.e. che il seguente diagramma
V k BB
BB f
BB
BB
!
λ
W
/Λ
~
~
~~
~~ f∗
~
~~
(2) Se (v1 , ..., vn ) è una base di V allora {λ(vi1 , ..., vik )} con 1 ≤ i1 < ... < ik ≤
n è una base di W .
Dimostrazione: Procediamo in modo analogo al teorema 5.6.1, considerando
per ogni sottoinsieme S di {1, ..., n} di k elementi un simbolo λS , e prendendo
lo
¡ ¢
spazio vettoriale generato da questi simboli su K, che ha dimensione nk , e che
5.6. Appendice: Cenni di algebra tensoriale
171
denotiamo Λ. Se ora {v1 , ..., vn } è una base di V , se {u1 , ..., uk } sono elementi di
V e la matrice A è definita come
ui =
n
X
aij vj
j=1
allora la mappa λ si definisce come:
λ(u1 , ..., uk ) :=
X
det(A)λS
S
S
Che si tratti di una mappa multilineare alternante segue dalle proprietà dei
determinanti, ed è pure un fatto ovvio che
λ(vi1 , ..., vik ) = λS
se S = {i1 , ..., ik } con i1 < ... < ik .
La dimostrazione della (1) si riduce alla semplice osservazione che se f :
V k −→ W è multilineare alternante, la mappa
f∗ (λS ) := f (vi1 , ..., vik )
è ben definita su una base di Λ e quindi si estende ad un’unica mappa lineare da
Λ in W .
Per la dimostrazione della (2)
¡ ¢basta notare che gli elementi {λ(vi1 , ..., vik )}
generano Λ e sono esattamente nk .
qed
Di nuovo possiamo dedurre l’unicità dello spazio Λ dalla sua proprietà universale, ed è evidente che la potenza esterna ∧k (V ) soddisfa questa proprietà: ne
segue che abbiamo una naturale identificazione
Λ∼
= ∧k (V )
che, a livello di basi, è
λ(vi1 , ..., vik ) ←→ vi1 ∧ ... ∧ vik
Osserviamo che il risultato precedente può riformularsi dicendo che lo spazio delle forme multilineari alternanti è isomorfo allo spazio duale dei tensori
antisimmetrici:
Alt(V k , K) ∼
= (∧k (V ))∗
Inoltre, è possibile associare ad una mappa f : V −→ W lineare la sua potenza
esterna k-ma ∧k f : ∧k V −→ ∧k W definita come
∧k f (u1 , ..., uk ) = f (u1 ) ∧ ... ∧ f (uk )
172
Capitolo 5. Gruppi, algebre e rappresentazioni
In particolare, dato che
µ
dim ∧ (V ) =
k
dim V
k
¶
osserviamo che la massima potenza esterna (k = n) di V è unidimensionale: inoltre, dato che v ∧ v = 0, non possono esservi potenze esterne (n + 1)-dimensionali
o più, e quindi l’algebra esterna è finito dimensionale! Questa è una profonda
differenza rispetto all’algebra simmetrica.
Dato che ∧n (V ) ∼
= K, una sua base è data da un qualsiasi scalare non nullo:
una scelta naturale è proprio la funzione determinante, che si caratterizza con la
condizione det(1) = 1.
5.6.12 Proposizione Se dim V = n e se f : V −→ V è una mappa lineare,
allora la mappa ∧n f : ∧n (V ) −→ ∧n (V ) è semplicemente una mappa lineare di
K in sè, cioè la moltiplicazione per uno scalare, e precisamente
(∧n f )(x) = det(f )x
Si tratta di una riformulazione dello sviluppo di Laplace del determinante.
Per finire vogliamo osservare che un caso particolare di prodotto esterno è
certo noto al lettore: si tratta del prodotto vettoriale. Ricordiamo infatti che se
V ha dimensione 3, è definito il prodotto vettoriale di due suoi elementi:
v2 w3 − v3 w2
[v, w] := v3 w1 − v1 w3
v1 w2 − v2 w1
se v = (v1 , v2 , v3 ) e w = (w1 , w2 , w3 ). Ma si ha
[v, w] = v ∧ w
Infatti dim ∧2 V = dim V = 3 (in questo caso e solo in questo caso la dimensione
di V coincide con quella della sua seconda potenza esterna), e dato che il prodotto
vettoriale è una funzione bilineare alternante, per universalità si ha la formula
precedente.
L’algebra R3 col prodotto ∧ verifica l’identità di Jacobi
(v1 ∧ v2 ) ∧ v3 + (v3 ∧ v1 ) ∧ v2 + (v2 ∧ v3 ) ∧ v1 = 0
cioè, ponendo
[v, w] = v ∧ w
R3 diviene un’algebra di Lie. Si tratta dell’algebra so(3) associata al gruppo delle
rotazioni del piano.
Parte II
Analisi Funzionale
Capitolo 6
SPAZI NORMATI ED OPERATORI
LINEARI
I principali esempi di spazi vettoriali di dimensione infinita sono tutti spazi
di funzioni: come abbiamo visto, questi spazi sono in genere anche spazi metrici,
e spesso possiedono la proprietà di essere completi rispetto alla loro metrica:
si può dare una teoria generale per gli spazi vettoriali che soddisfino queste
proprietà, che generalizza profondamente quella degli spazi con prodotto scalare
in dimensione finita. In questo capitolo gettiamo le fondamenta di questa teoria,
e diamo numerosi esempi.
6.1
Spazi di Hilbert e di Banach
6.1.1 Definizione Uno spazio vettoriale H sul campo C dei numeri complessi
si dice spazio pre-hilbertiano se è data una funzione H × H −→ C, il cui valore
scriveremo come (x, y), tale che, se x, y, z ∈ H e a, b ∈ C:
• (x, y) = (y, x)
• (ax + by, z) = a(x, z) + b(y, z)
• x 6= 0 =⇒ (x, x) > 0
La mappa (−, −) si dice prodotto hilbertiano in H.
Notiamo che la (3) ha senso, dato che (x, x) = (x, x) è un numero reale. In
generale, se V e W sono spazi vettoriali complessi, una funzione f : V ×W −→ C
che soddisfi le (1)–(2) si dice funzione sesquilineare: le (1)–(2) equivalgono alla
f (au + bv, cw + dz) = acf (u, w) + adf (u, z) + bcf (v, w) + bdf (v, z)
175
176
Capitolo 6. Spazi normati ed operatori lineari
6.1.2 Esempio I seguenti sono spazi pre-hilbertiani:
• Lo spazio vettoriale complesso Cn con il prodotto
0
(z, z ) :=
n
X
zi zi
i=1
• Lo spazio delle funzioni a quadrato sommabile L2 (R, ds) rispetto alla misura di Lebesgue sulla retta reale rispetto al prodotto
Z
(f, g) :=
f (s)g(s)ds
R
• lo spazio l2 (N) delle funzioni ϕ : N −→ C non nulle solo in un numero
finito di punti con il prodotto
(ϕ, ψ) :=
∞
X
ϕ(n)ψ(n)
n=0
Se x, y ∈ X (spazio pre-hilbertiano) e a, b ∈ C allora
(ax + by, ax + by) ≥ 0
(l’eguaglianza vale, con a e b opportuni, se x e y sono linearmente dipendenti).
Si osservi che
(ax + by, ax + by) = aa(x, x) + ab(y, x) + ab(x, y) + bb(y, y)
è la forma quadratica associata alla matrice
¶
µ
(x, x) (x, y)
A=
(y, x) (y, y)
e quindi
0 ≤ det(A) = (x, x)(y, y) − (x, y)(y, y)
(il segno = vale se x e y sono linearmente dipendenti) cioè abbiamo la diseguaglianza di Cauchy–Schwartz :
(x, x)(y, y) ≥ |(x, y)|2
6.1.3 Definizione La norma di x∈X (spazio pre-hilbertiano) è il numero ||x|| :=
p
(x, x).
6.1. Spazi di Hilbert e di Banach
177
6.1.4 Proposizione Se X è uno spazio pre-hilbertiano:
• Per ogni x ∈ X: ||x|| ≥ 0 e, se x 6= 0 allora ||x|| > 0.
• Per ogni x ∈ X e a ∈ C: ||ax|| = |a| · ||x||.
• Per ogni x, y ∈ X:
||x + y||2 ≤ (||x|| + ||y||)2
Si tratta di riformulare le proprietà precedenti in termini della norma.
6.1.5 Definizione Uno spazio vettoriale X sul campo dei numeri complessi C
si dice spazio normato se è data una mappa || − || : X −→ C (la norma di X)
che verifichi le (1)–(3) della proposizione precedente.
Ponendo z = x + y nella (3) si ottiene
¯
¯
¯||x|| − ||z||¯ ≤ ||z − x||
Quindi se (X, || − ||) è uno spazio normato possiamo renderlo uno spazio metrico
con la distanza
d(x, y) = ||x − y||
Dunque possiamo considerare in uno spazio normato il concetto di convergenza:
in particolare ha senso chiedersi se la convergenza relativa alla distanza d indotta
dalla norma sia o meno completa.
6.1.6 Esempio Lo spazio pre-hilbertiano X delle successioni s : N −→ C di numeri complessi a supporto finito (cioè sn 6= 0 per un numero finito di n: possiamo
dunque immaginarle come successioni di numeri complessi definitivamente nulle)
rispetto al prodotto
X
(s, t) =
sn tn
n∈N
(la serie è in realtà una somma finita) non è completo, dato che la successione
{sn } degli elementi di X dati da sn (m) = 0 se n 6= m e 1/2n se n = m è di
Cauchy ma non ammette limite in X.
6.1.7 Definizione Uno spazio normato completo si dice spazio di Banach ed
uno spazio pre-hilbertiano completo si dice hilbertiano o spazio di Hilbert.
6.1.8 Esempio
• Lo spazio Cn è di Hilbert, come noto dall’Analisi elementare.
178
Capitolo 6. Spazi normati ed operatori lineari
• Lo spazio l2 (N) delle successioni {an } di numeri complessi tali che
X
|an |2 < ∞
n∈N
è uno spazio pre-hilbertiano rispetto al prodotto
X
({an }, {bn }) =
an b n
n∈N
Dimostreremo fra breve che si tratta di uno spazio di Hilbert1 .
• Lo spazio lp (N) delle successioni {an } di numeri complessi tali che
Ã
||a||p :=
X
! 1p
|an |p
<∞
n∈N
e lo spazio l∞ (N) delle successioni complesse limitate con la norma
||a||∞ := sup |an |
n∈N
sono pure spazi normati: sempre fra breve dimostreremo che si tratta di
spazi di Banach.
• In generale, se A è un insieme qualsiasi possiamo definire lp (A) come l’insieme delle successioni generalizzate indicizzate da A di numeri complessi
che verifichino le condizioni di finitezza precedenti: si tratterà sempre di
spazi di Banach.
Come noto, ogni spazio metrico (X, d) ammette un unico completamento
e ed è dotato di una isometria Ψ : X −→ X
e
e la cui immagine sia densa in X:
e
(X, d)
applicando questa costruzione al caso di uno spazio normato (o pre-hilbertiano)
si ottiene un unico spazio di Banach (o di Hilbert) che si dice completamento di
X, con relativa isometria Ψ.
6.1.9 Proposizione Uno spazio normato X è di Banach se e solo se ogni serie
assolutamente convergente in X è convergente.
P
Dimostrazione: Per definizione
la serie n xn è assolutamente convergente in
P
X se la serie numerica n ||xn || è convergente.
1
Non è difficile dimostrarlo “a mano”, cfr. [20], pp. 24–25.
179
6.1. Spazi di Hilbert e di Banach
Ora, sia X uno spazio di Banach e sia la serie
gente; allora per
N
X
zN :=
xn
P
n
xn assolutamente conver-
n=1
si ha
M
N
¯¯ X
¯¯ X
¯
¯
¯
¯
xn ≤
||xn ||
||zN − zM || =
n=N
n=M
da cui segue la convergenza della serie per il criterio di Cauchy.
Supponiamo invece che ogni serie assolutamente convergente in X sia convergente: vogliamo dimostrare che ogni successione {xn } di Cauchy sia convergente
in X. Ma se poniamo yn = xmn ove la sottosuccessione {mn } venga scelta dalla
definizione di successione di Cauchy:
∀n ∈ N ∃mn ∀i, j > mn
||xi − xj || <
1
2n+1
allora la successione {yn } converge: infatti la serie
y − 1 + (y2 − y1 ) + (y3 − y2 ) + ...
converge (perché converge assolutamente).
qed
Possiamo ad esempio, usando questo criterio, dimostrare il teorema di Riesz–
Fischer secondo il quale gli spazi Lp sono di Banach.
Ricordiamo che se (X, B, µ) è uno spazio di misura completo lo spazio vettoriale Lp (X, µ) (1 ≤ p ≤ ∞) è l’insieme delle funzioni misurabili e tali che
Z
|f |p dµ < ∞
X
modulo la relazione che identifica due funzioni che coincidano quasi ovunque.
6.1.10 Teorema (Riesz–Fischer) Rispetto alle norme
µZ
||f ||p :=
|f |P dµ
¶ p1
X
e
||f ||∞ := esssup |f |
Lp (X, µ) sono spazi di Banach.
180
Capitolo 6. Spazi normati ed operatori lineari
Dimostrazione: Il caso p = ∞ è elementare: si tratta di applicare la disuguaglianza triangolare per i moduli delle somme.
Sia quindi 1 ≤ p < ∞. Le diseguaglianze di Minkowski e di Hölder implicano
che Lp è uno spazio normato rispetto a ||−||p . Basta dimostrarne la completezza.
Sia dunque {fn } una successione assolutamente convergente in Lp :
∞
X
||fn ||p = M < ∞
n=0
e definiamo
gn (x) :=
n
X
|fk (x)|
k=1
Per la diseguaglianza di Minkowski:
||gm || ≤
n
X
||fk || ≤ M
k=0
i.e.
Z
(gn )p ≤ M p
Per ogni x la successione {gn (x)} è crescente (a valori in R ∪ {±∞}) e quindi
deve convergere ad un elemento g(x) ∈ R ∪ {±∞}. La funzione cosı̀ definita g è
misurabile e, dato che gn ≥ 0 si ha che
Z
g p ≤ mp
(per il Lemma di Fatou). Quindi g p è integrabile (i.e. sta in L1 ) e g(x) è finita
quasi ovunque.
P
Nei valori di x per i quali g è finita, la serie numerica ∞
k=1 fk (x) converge
assolutamente ad un numero reale s(x). Ponendo s(x) = 0 per gli x tali che
g(x) = ∞ abbiamo definito
cosı̀ una funzione s che è quasi ovunque limite delle
Pn
somme parziali sn = k=1 fk . È quindi misurabile e
|sn (x)| ≤ g(x) ⇒ |s(x)| ≤ g(x)
Dunque s ∈ Lp e
|sn (x) − s(x)|p ≤ 2p (g(x))p
Ma 2p g p ∈ L1 e |sn (x) − s(x)| −→ 0 per quasi ogni x sicché per il teorema della
convergenza dominata di Lebesgue:
Z
|sn − s|p −→ 0
181
6.1. Spazi di Hilbert e di Banach
Dunque ||sn − s||p −→ 0 i.e. ||sn − s|| −→ 0. La serie {fn } converge quindi in Lp
che è quindi uno spazio di Banach.
qed
6.1.11 Esempio La stessa tecnica, applicata allo spazio di misura (A, P(A), #)
con la misura che conta # consente di dimostrare che gli spazi lp (A) sono spazi
di Banach.
6.1.12 Esempio L’insieme C(X) delle funzioni continue a valori reali (o complessi) definite su uno spazio topologico compatto di Hausdorff X, è uno spazio
di Banach rispetto alla norma:
||f || := max |f (x)|
x∈X
Evidentemente si tratta di uno spazio normato, e la completezza segue dal fatto
che la condizione ||fn − fm || −→ 0 implica la convergenza uniforme della successione {fn } che tende quindi ad una funzione continua, cioè ad un elemento di
C(X).
Infine osserviamo che ogni spazio vettoriale (reale o complesso) di dimensione
finita è uno spazio di Banach:
6.1.13 Teorema (Tichonov) Se X è uno spazio vettoriale di dimensione finita allora tutte le norme possibili su di esso lo rendono uno spazio di Banach e
sono equivalenti.
Dimostrazione: Possiamo fissare una base (e1 , ..., en ) di X, e le coordinate
indotte da questa base:
∀x ∈ X∃x1 , ..., xn ∈ R x = x1 e1 + .. + xn en
∼
=
stabiliscono un isomorfismo di spazi vettoriali ι : X −→ Rn . Dimostriamo
che questo isomorfismo è un omeomorfismo rispetto alle topologie indotte dalle
norme. Per ogni x ∈ X:
v
v
u n
u n
n
n
X
X
uX
uX
|xi | ||ei || ≤ t
xi ei || ≤
||x|| = ||
||ei ||2 t
x2i = c||ι(x)||
i=1
i=1
i=1
i.e.
||x − y|| ≤ c||ι(x) − ι(y)||
ove c è una costante che non dipende né da x né da y.
i=1
182
Capitolo 6. Spazi normati ed operatori lineari
Stabiliamo la disuguaglianza opposta: sulla sfera unitaria S n−1 ⊂ Rn consideriamo la funzione
f (ι(x)) = f (x1 , ..., xn ) = ||x||
P 2
Evidentemente f > 0 perché
xi = 1 e ei sono una base; la disuguaglianza
¯
¯
|f (x1 , ..., xn ) − f (y1 , ..., yn )| = ¯||x|| − ||y||¯ ≤ ||x − y|| ≤ c||ι(x) − ι(y)||
mostra la continuità di f , che quindi, sul compatto S n−1 ⊂ Rn ammette un
minimo α, che deve ovviamente essere positivo. Quindi, se i(x) ∈ S n−1 si ha che
f (ι(x)) = ||x|| ≥ α e, per ogni x ∈ X:
¯¯ X
¯¯ n
xi ei
qP
f (ι(x)) = ||ι(x)|| ¯¯¯¯
n
i=1
j=1
¯¯
¯¯
¯¯ ≥ α||ι(x)||
¯¯
2
xj
Quindi la ι è un omeomorfismo.
qed
6.1.14 Corollario Un sottospazio vettoriale di uno spazio normato di dimensione finita è chiuso.
6.1.15 Corollario Ogni spazio normato localmente compatto è di dimensione
finita.
Dimostrazione: Se X è localmente compatto e U è un intorno dello zero a
chiusura compatta e tale che, per ogni |α| < 1 si abbia αU ⊂ U , allora, possiamo
ricoprire U con un numero finito di intorni ottenuti traslando U per degli elementi
x1 , ..., xn ∈ X:
1
1
U ⊂ x1 + U ∪ ... ∪ xn + U
3
3
Allora, ogni elemento di X si ottiene come combinazione lineare degli {x1 , ..., xn }.
Scegliendo n minimo, questi elementi formano quindi una base di X.
qed
6.2
Somme e complementi ortogonali
Abbiamo visto in precedenza una caratterizzazione degli spazi di Banach fra
gli spazi normati: un altro quesito che è naturale porsi è quando uno spazio di
Banach sia di Hilbert: la risposta è data dalla seguente
183
6.2. Somme e complementi ortogonali
6.2.1 Proposizione Uno spazio normato (X, ||−||) è uno spazio pre-hilbertiano
rispetto ad un prodotto scalare (−) se e solo se vale la seguente identità di
polarizzazione, che definisce il prodotto (−):
X
ε||x + εy||2 = 4(x, y)
ε
ove ε varia nell’insieme {1, −1, i, −i}.
Dimostrazione: Si tratta di osservare che, nell’ovvia identità
||ax + by||2 = |a|2 (x, x) + |b|2 (y, y) + 2 Re (ab(x, y))
ponendo a = 1 e b = ±1 e sommando, si ottiene
¡
¢
||x + y||2 + ||x − y||2 = 2 ||x||2 + ||y||2
(identità del parallelogramma). Moltiplicando per ±1, ±i e ripetendo il ragionamento per b = ±i si ottiene l’identità di polarizzazione.
qed
Se H1 e H2 sono spazi di pre-hilbertiani anche la loro somma diretta H1 ⊕ H2
lo è rispetto al prodotto
(x1 ⊕ y1 , x2 ⊕ y2 ) := (x1 , y1 )1 + (x2 , y2 )2
Se H1 e H2 sono di Hilbert anche H1 ⊕ H2 lo è, dato che
||xn ⊕ yn − xm ⊕ ym ||2 = ||(xn − xm ) ⊕ (yn − ym )||2
¯2
¯
= ¯(xn − xm ) + (yn − ym )¯
In modo analogo la somma diretta di spazi di Banach è uno spazio di Banach
con una delle norme
1
||x ⊕ y||p := (||x||p + ||y||p ) p
||x ⊕ y||∞ := sup(||x||, ||y||)
1≤p≤∞
Tutte queste norme sono equivalenti, nel senso che inducono le medesime topologie).
Possiamo generalizzare questa costruzione nel modo seguente: sia A un insieme arbitrario di indici e {Hα }α∈A una famiglia di spazi di Hilbert indicizzata da
A. Allora2
M
[
X
H :=
Hα = {x : A −→
Hα |x(α) ∈ Hα e
||x(α)||2 < ∞}
α
α∈A
2
Per definizione si ha
P
α∈A
||x(α)||2 := supI⊂A
α∈A
P
i∈I
||x(i)||2 ove gli insiemi I sono finiti.
184
Capitolo 6. Spazi normati ed operatori lineari
è uno spazio di Hilbert. Le operazioni di somma e prodotto sono definite punto
per punto: (ax + by)(α) = ax(α) + by(α) e l’identità del parallelogramma implica
che rendono H uno spazio vettoriale. Il prodotto si definisce pure punto per
punto:
X
(x, y) :=
(x(α), y(α))
α∈A
Questo ha senso, dato che |(x, y)| ≤ ||x|| ||y|| ≤
X
1
|(x, y)| ≤
2
α∈A
Ã
X
1
2
(||x||2 + ||y||2 ) e quindi
!
||x(α)||2 + ||y(α)||2
α∈A
col che (x, y) è definita da una somma assolutamente convergente. La completezza
del prodotto segue osservando che, se3 {xn } è una successione di Cauchy allora
per ogni ε > 0 esiste un nε ∈ N tale che per n, m > nε si abbia ||xn − xm ||2 < ε2
allora
X
||xn (α) − xm (α)||2 < ε2
α∈A
e quindi, per ogni α ∈ A: ||xn (α) − xm (α)||2 < ε2 . Dunque, fissato α la successione
{x(α)} è di Cauchy in Hα e, per completezza di Hα , converge ad un elemento
x(α) ∈ Hα . Allora
X
sup
||xn (i) − xm (i)||2 < ε2
I⊂A
i∈I
sicché
ε2 < lim sup
m I⊂A
=
X
X
||xn (i) − xm (i)||2 =
i∈I
X
α∈A
lim ||xn (α) − xm (α)||2
m
||xn (α) − x(α)||2 ≤ ε2
α∈A
Dunque la funzione α 7−→ (xn (α) − x(α)) appartiene a H: xn − x ∈ H, da cui
x ∈ H (dato che xn ∈ H).
Infine 4
X
||xn − x||2 =
||xn (α) − x(α)||2 ≤ ε2
α∈A
e quindi xn 7−→ x appartiene a H che risulta per questo essere completo.
Osserviamo cheS la cardinalità dell’insieme {α| ||x(α)|| =
6 0} è numerabile, dato che
{α| ||x(α)|| 6= 0} = n An ove An = {α| ||x(α)|| > n1 } sono ovviamente finiti.
4
È un fatto generale che dalla ||xn − x|| −→ 0 seguano le y + xn −→ x + y e ||xn || −→ ||x||.
3
6.2. Somme e complementi ortogonali
185
Osserviamo che gli spazi Hα si immergono isometricamente in H: infatti se
x ∈ Hα e se, per α0 ∈ A, poniamo
ψα (x)(α0 ) := δαα0 x
(delta di Kronecker) allora le ψα : Hα −→ H sono isometrie. Naturalmente, per
completezza di H, i sottoinsiemi Hα ⊂ H sono chiusi.
Inoltre, se α1 , α2 ∈ A i sottospazi ψα1 (Hα1 ) e ψα2 (Hα2 ) sono ortogonali fra
loro.
Osserviamo che
P il sottospazio vettoriale di H generato dai sottospazi {ψα (Hα )}
(cioè la somma
ψα (Hα ) definita come insieme delle funzioni a supporto finito
S
: A −→ α ψα (Hα )) è denso in H. Infatti se ε > 0 allora esiste un sottoinsieme
Aε ⊂ A finito e tale che5
X
||x(α)||2 < ε2
α∈A\Aε
Quindi, la
(
x(α)
xε (α) :=
0
se α ∈ Aε
se α ∈
/ Aε
P
è una funzione a supporto finito (dunque in
ψα (Hα )) tale che
||x − xε ||2 < ε2
P
ψα (Hα ) = H.
Questo significa che
Ad esempio, se per ogni α ∈ A, si ha che Hα = C allora la somma diretta H
è lo spazio
X
l2 (A) := {f : A −→ C|
|f (α)|2 < ∞}
che dunque risulta essere uno spazio di Hilbert.
In modo perfettamente analogo si definisce la somma di spazi di Banach e si
dimostra essere uno spazio di Banach.
6.2.2 Definizione Se S ⊂ H è un sottoinsieme di uno spazio di Hilbert, il suo
ortogonale è l’insieme
S ⊥ := {y ∈ H| ∀x ∈ S (y, x) = 0}
Evidentemente, se S ⊂ H è M è il sottospazio vettoriale generato da S in H
allora
S⊥ = M ⊥
5
Si ricordi che
P
α
||x(α)||2 = ||x||2 < ∞.
186
Capitolo 6. Spazi normati ed operatori lineari
e possiamo dunque limitarci a considerare sottospazi vettoriali, nelle questioni di
ortogonalità.
Si osservi inoltre che la diseguaglianza di Cauchy–Schwartz implica che, se
xn converge a x in H allora, per ogni y ∈ H:
(y, xn ) −→ (y, x)
(questo significa semplicemente che il prodotto hilbertiano (x, y) è una funzione
continua nelle due variabili x e y). Quindi
M⊥ = M
⊥
e il sottospazio vettoriale M ⊥ risulta sempre essere chiuso.
I sottospazi chiusi di uno spazio di Hilbert sono interessanti e naturali da
considerare, in virtù del seguente
6.2.3 Teorema (Riesz) La somma diretta6 di un sottospazio M ⊂ H e del suo
ortogonale M ⊥ esaurisce l’intero spazio di Hilbert: M + M ⊥ = H.
Dimostrazione: Basta ovviamente dimostrare che per ogni x ∈ H esista un
xM ∈ M tale che (x − xM , M ) = 0; questo equivale a dimostrare che esiste una
successione {xn } di Cauchy in M tale che7 d(x, xn ) −→ d(x, M ) =: d.Infatti,
in questo caso, detto xM il limite di {xn }, (che esiste perché H è completo), si
avrebbe x − xM ∈ M ⊥ (dato che d(x − xM ) = 0 e M è chiuso).
Dimostriamo dunque che
• Se xn −→ x allora x − xM ∈ M ⊥ .
• {xn } è di Cauchy.
(1) L’ipotesi significa che lim ||x − xn || = d e quindi, se y ∈ M , xM + y ∈ M ,
da cui ||x − (xm + y)||2 ≥ d2 , e
d2 ≤ ||(x − xM ) + y||2 = ||y||2 + 2 Re(y, x − xM ) + ||x − xM ||2
Ma, per ogni a ∈ C: ||ay||2 + 2 Re(ay, x − xM ) ≥ 0 e quindi Re(y, x − xM ) = 0
(per arbitrarietà di a). In modo analogo si vede che Im(y, x − xM ) = 0, e quindi
(y, x − xM ) = 0 per y ∈ M .
(2) Si ha che ||xn − xm ||2 = ||(xn − x) − (xm − x)||2 e quindi
||xn − xm ||2 + ||xn + xm − 2x||2 = s||x − xn ||2 + 2||x − xm ||2
6
Come spazi vettoriali e non di Hilbert.
Ricordiamo che la distanza d(x, M ) di un punto da un insieme è definita come
l’inf y∈M {d(x, y)} e che un punto x che abbia distanza nulla da un insieme M appartiene a
M se e solo se M = M .
7
187
6.3. Funzionali lineari
Ma {xn } ⊂ M , quindi
xn +xm
2
∈ M , i.e.
¯¯ xn + xm
¯¯2
4d2 ≤ 4¯¯
− x¯¯ = ||xn + xm − 2x||2
2
col che si ha
||xn − xm ||2 ≤ 2(||x − xn ||2 − d2 ) + 2(||x − xm ||2 − d2 )
e, dato che d = lim ||x − xn ||:
||xn − xm ||2 −→ 0
qed
Osserviamo che la somma diretta nel teorema di Riesz risulta essere in realtà
una somma di spazi di Hilbert: infatti se x = xM +xM ⊥ è ovvio che (xM , xM ⊥ ) = 0
e quindi che ||x||2 = ||xM ||2 + ||xM ⊥ ||2 (che M ∩ M ⊥ = {0} è ovvio).
Se M è un sottospazio vettoriale chiuso di H, dato che per ogni S ⊂ H:
S ⊂ S ⊥⊥ , si ha che M ⊂ M ⊥⊥ ; ma per il teorema di Riesz è M ⊕ M ⊥ = H =
M ⊥ ⊕M ⊥⊥ e quindi M = M ⊥⊥ . Rileviamo esplicitamente che, come conseguenza
di questo fatto, se S ⊂ H allora
S ⊥⊥ = {sottospazio di H generato da S}
6.3
Funzionali lineari
6.3.1 Definizione Se X è uno spazio normato, un funzionale lineare è una
mappa lineare f : X −→ C di spazi vettoriali. Se, come applicazione fra spazi topologici, f è continua, si dice funzionale lineare continuo e se, come applicazione
fra spazi metrici, è limitata, si dice funzionale lineare limitato.
Osserviamo che un funzionale lineare è limitato se, per definizione, esiste una
costante L tale che
∀x ∈ X |f (x)| ≤ L||x||
Ovviamente questo implica la continuità nel punto 0 ∈ X e, dato che la somma è
una applicazione continua e ogni punto si scrive come somma di se stesso e dello
zero, in tutto lo spazio. Quindi
6.3.2 Proposizione Un funzionale lineare limitato è continuo.
Ad esempio, in uno spazio di Hilbert H, per y ∈ H fissato, il funzionale
f (x) := (y, x) è limitato; si tratta in un certo senso del caso più generale, come
afferma il
188
Capitolo 6. Spazi normati ed operatori lineari
6.3.3 Teorema di Rappresentazione (Riesz) Se f : H −→ C è un funzionale lineare limitato su uno spazio di Hilbert, allora esiste un unico elemento
xf ∈ H tale che
∀x ∈ H f (x) = (xf , x)
Dimostrazione: f è continuo, essendo limitato, quindi l’insieme
Nf := {x ∈ H | f (x) = 0}
(il nucleo di f ) è un sottospazio vettoriale chiuso. Possiamo supporre che sia
Nf 6= H (altrimenti il teorema è banalmente verificato con xf = 0) e quindi
Nf⊥ 6= 0
Se x0 ∈Nf⊥ possiamo supporre, a meno di normalizzare dividendo per uno scalare,
che sia f (x0 ) = 1. Ora sia
g(x) := (x0 , x)
Si tratta di un funzionale lineare limitato, tale che Nf ⊂ Ng (ovvio!) e quindi
f deve essere proporzionale8 a g, dato che dodim Nf = 1 per ogni funzionale
lineare (evidentemente l’insieme degli zeri di un funzionale è un iperpiano di H):
g(x) = (x0 , x) = (x0 , x0 )f (x)
cioè f (x) = (xf , x) se xf :=
x0
.
(x0 ,x0 )
qed
6.3.4 Corollario Se f è un funzionale lineare, ||f || = ||xf ||.
Come notevole applicazione di questo teorema diamo la dimostrazione di von
Neumann9 del teorema di Radon–Nikodym.
6.3.5 Definizione Se µ e ν sono misure definite su uno spazio misurabile (X, A)
si dice che ν è assolutamente continua rispetto a µ se per ogni A tale che µ(A) = 0
si ha che ν(A) = 0. Si scrive in questo caso ν ¿ µ.
In caso di misure con segno, l’assoluta continuità si riferisce ai loro valori
assoluti.
Ad esempio, se µ è una misura su (X, A) e f una funzione misurabile non
negativa su X, la misura
Z
ν(E) :=
f dµ
E
(che è finita se e solo se f è integrabile) è assolutamente continua rispetto a µ.
Il teorema di Radon–Nikodym fornisce delle condizioni per le quali ogni misura
assolutamente continua è di questo tipo.
8
9
Infatti x = x − f (x)x0 + f (x)x0 e x − f (x)x0 ∈ Nf ⊂ Ng , i.e. g(x) = f (x)g(x0 ).
On Rings of Operators III Ann. Math. 41 (1950) pp. 124–130.
189
6.3. Funzionali lineari
6.3.6 Teorema (Radon–Nikodym) Se (X, A, µ) è uno spazio di misura σfinito e ν ¿ µ allora esiste una funzione non negativa misurabile su X tale che,
per ogni E ∈ A:
Z
ν(E) =
f dµ
E
La funzione f è unica µ-q.o.
Dimostrazione: (von Neumann) Osserviamo che, assumendo il risultato vero
nel caso
il caso σ-finito: infatti decomponiamo
S∞
S∞di misure finite, segue facilmente
X = i=1 Ai con µAi < ∞ e X = i=1 Bi con νBi < ∞ ove possiamo assumere
che le successioni {Ai } e {Bi } siano formate da insiemi a due a due disgiunti.
Dato che
[
X = (Ai ∩ Bj )
possiamo assumere che X =
i,j
S
i
Xi con µXi , νXi < ∞. Ora definiamo le σ-algebre
An := {E ∩ Xn }E∈A
sugli insiemi Xn e le restrizioni µn , νn si µ e ν agli spazi misurabili (Xn , An ).
Supponendo vero il teorema nel caso finito, esistono le funzioni misurabili non
negative {fn } tali che
Z
∀F ∈ An
ν(F ) =
fn dµ
F
S
Allora decomponendo un insieme E ∈ A come E = En ed En ∈ Bn definendo
una funzione f in modo che f |Xn = fn si ottiene un funzione non negativa e
misurabile (l’unione delle funzioni {fn }) tale che
∀E ∈ A ν(E) =
∞ Z
X
i=1
Z
fn dµ =
E
f dµ
E
Basta quindi dimostrare il teorema nel caso di misure finite.
Per prima cosa si osservi che, se µ e ν sono misure finite sullo spazio misurabile
(X, A) tali che λ = µ + ν, allora il funzionale
Z
F (f ) := f dµ
è lineare e continuo sullo spazio di Hilbert L2 (X, dλ). Infatti, se f ∈ L2 (X, dλ),
per la disuguaglianza di Schwartz:
¯ Z
¯Z
µZ
¶ 12
Z
p
¯
¯
2
¯
¯
≤
|f
|dµ
≤
|f
|dλ
≤
|f
|
dλ
f
dµ
λ(X)
¯
¯
X
X
X
X
190
Capitolo 6. Spazi normati ed operatori lineari
R
e λ(X) < ∞. Quindi F (f ) := X f dµ è lineare e continuo su L2 (X, λ).
2
R Ora, per il teorema di Riesz, esiste una g ∈ L (X, λ) tale che F (f ) = (f, g) :=
f gdλ; inoltre 0 ≤ g ≤ 1: infatti, per f = χE (ove E sia misurabile con λE > 0)
X
Z
Z
µE =
χE dµ =
gdλ
X
per cui (avendosi 0 ≤ µ ≤ λ):
1
0≤
λE
E
Z
gdλ =
E
µE
≤1
λE
Dunque g ∈ [0, 1] λ-q.o. Possiamo allora scrivere
Z
νE = (1 − g)dλ
E
Osserviamo che, se ν ¿ µ allora λ ¿ µ e g 6= 0 µ-q.o. In questo caso
Z
λE =
g −1 dµ
E
In effetti
Z
Z
−1
g dµ =
E
Z
−1
χE g dµ =
X
Z
−1
χE g gdλ =
X
dλ = λE
E
Infine, se ν ¿ µ allora (1 − g)g −1 ∈ L1 (X, µ): infatti
¯ Z
¯Z
¯
¯
¯ (1 − g)g −1 dµ¯ ≤
|1 − g| |g|−1 dµ
¯
¯
X
X
¶ 12 µZ
µZ
¶ 12
2
−2
|1 − g| dµ
≤
|g| dµ
<∞
X
X
(si rammenti che g ∈ L2 (λ) e che µ ≤ λ, quindi g ∈ L2 (µ)). Si trova allora che
Z
Z
Z
Z
−1
νE = (1 − g)dλ = λE −
gdλ =
g dµ −
1dµ
E
E
E
E
Z
= (1 − g)g −1 dµ
E
qed
La funzione f si dice derivata di Radon–Nikodym e si denota
f=
dν
dµ
Il nome si giustifica esaminandone alcune proprietà elementari.
191
6.4. Operatori lineari
6.3.7 Proposizione Se µ, ν e λ sono misure σ-finite allora:
• Se ν ¿ µ e f è misurabile non negativa:
Z
Z
dν
f dν = f dµ
dµ
•
d(ν1 + ν2 )
dν1 dν2
=
+
dµ
dµ
dµ
• Se ν ¿ µ ¿ λ allora
dν
dν dµ
=
dλ
dµ dλ
• Se ν ¿ µ e µ ¿ ν allora
dν
=
dµ
6.4
µ
dµ
dν
¶−1
Operatori lineari
I funzionali lineari sono un caso particolare degli operatori lineari: è noto dall’Algebra Lineare che un operatore lineare fra due spazi vettoriali qualsiasi è una
applicazione A : X −→ Y tale che
A(ax + by) = aA(x) + bA(y)
Se gli spazi X e Y sono normati ha senso chiedersi se A è continuo o meno.
Ovviamente, se A è continuo allora se xn −→ 0 anche A(xn ) −→ 0.
6.4.1 Definizione Un operatore lineare A : X −→ Y fra spazi normati è
limitato se esiste un L ∈ R tale che
∀x ∈ X
||Ax||Y ≤ L||x||X
6.4.2 Teorema Le tre seguenti condizioni sono equivalenti per un operatore A :
X −→ Y fra spazi normati:
• A è continuo.
• A è continuo nell’origine 0 ∈ X.
• A è limitato.
192
Capitolo 6. Spazi normati ed operatori lineari
Dimostrazione: (1) ⇒ (2) è ovvio.
(3) ⇒ (1) segue dal fatto che ||A(x − x0 )|| ≤ L||x − x0 ||.
(2) ⇒ (3): Per ipotesi, se x ∈ X è tale che ||x|| < δ allora ||Ax|| < 1 e quindi
||Aδ(||x|| + ε)−1 x|| < 1
i.e. ||Ax|| < δ −1 (||x|| + ε) ⇒ ||Ax|| < δ −1 ||x||.
qed
Lo spazio vettoriale10
B(X, Y ) := {A : X −→ Y | A operatore lineare limitato}
è normato dalla
||A|| := inf{M | ∀x ∈ X ||Ax|| ≤ L||x||}
che può scriversi come
||A|| : = sup{||Ax|| | ∀x ∈ X ||x|| ≤ 1} = sup{||Ax|| | ∀x ∈ X ||x|| = 1}
= sup{||Ax|| | ∀x ∈ X ||x|| < 1}
Naturalmente se A è limitato lo è pure aA e
||aA|| = |a| · ||A||
Inoltre
||(A + B)x|| ≤ ||Ax|| + ||Bx||
da cui (per ||x|| = 1)
||A + B|| ≤ ||A|| + ||B||
e
||A|| = 0 ⇒ A = 0
6.4.3 Teorema Se Y è uno spazio di Banach, anche B(X, Y ) è uno spazio di
Banach.
Dimostrazione: Se {An } è una successione di Cauchy in B(X, Y ) allora per
ogni ε > 0 esiste nε ∈ N tale che se n, m > nε allora
||An − Am || < ε
10
Ovviamente si pone (aA + bB)(x) = aAx + bBx.
193
6.4. Operatori lineari
i.e.
∀x ∈ X
||An (x) − Am (x)|| < ε||x||
Ma allora {An x} è una successione di Cauchy in Y (per ogni x), che è uno spazio
completo, quindi deve esistere un yx ∈ Y che ne sia il limite.
Evidentemente la mappa x 7−→ yx è lineare e quindi possiamo scrivere
y = Ax
ove A è un operatore lineare A : X −→ Y .
Mostriamo che A è continuo: per continuità della norma in uno spazio normato si ha che, per n > nε :
ε||x|| ≥ lim ||An x − Am x|| = ||An x − |x|| = ||(An − A)x||
m
Dunque An − A è limitato e ||An − A|| ≤ ε, i.e
A = An − (An − A) ∈ B(X, Y )
e si ha ||An − A|| < ε, cioè limn An = A.
qed
Il seguente risultato spiega perché nel teorema precedente non interviene la
completezza dello spazio X:
e il suo completamento (rispetto
6.4.4 Teorema Se X è uno spazio normato e X
e∈
alla distanza indotta dalla norma di X) allora per ogni A ∈ B(X, Y ) esiste A
e Y ) tale che A|
e X = A e ||A||
e = ||A||. In altri termini, la mappa
B(X,
e Y ) 7−→ B(X, Y )
B(X,
e 7−→ A|
eX
A
è un operatore lineare isometrico e suriettivo.
e che sia lineare è ovvio.
Dimostrazione: Consideriamo la mappa A 7−→ A:
e = ||A||. Se x ∈ X
e allora esiste una successione {xn } ⊂ X
Dimostriamo che ||A||
che converge ad X e quindi
e = lim ||Ax
e n || = lim ||Axn || ≤ ||A|| ||x||
||Ax||
e Cioè ||A||
e ≤ ||A||.
(per continuità di || − ||, A).
e estende A e quindi ||A|| ≤ ||A||
e (per definizione di estremo superiore!)
Ma A
e = ||A||.
dunque ||A||
194
Capitolo 6. Spazi normati ed operatori lineari
e e per una
Dimostriamo infine la suriettività: sia A ∈ B(X, Y ) allora per x ∈ X
e la successione {Axx }
successione di Cauchy {xn } in X che converga a x in X
è di Cauchy in Y , che è completo, dunque converge ad un elemento yx ∈ Y . La
mappa x 7−→ yx è manifestamente lineare e quindi possiamo scrivere
y = Ax
in modo che
||y|| ≤ ||A|| || lim xn || = ||A|| ||x||
e ∈ B(X,
e Y ).
Cioè A è la restrizione a X di un A
qed
Due casi particolari ma notevoli si hanno per Y = C ovvero per Y e X
ambedue spazi di Banach.
6.4.5 Definizione Il duale topologico di uno spazio normato X è lo spazio di
Banach X ∗ := B(X, C).
La norma in X ∗ è definita come
||f || = sup {|f (x)|}
||x||=1
Osserviamo esplicitamente che, nel caso di spazi di Hilbert, il teorema di Riesz
implica che
H spazio di Hilbert ⇒ H∗ spazio di Hilbert e H∗ ∼
=H
In particolare uno spazio di Hilbert è riflessivo, cioè è canonicamente isomorfo
al suo biduale
H∼
= H∗∗
In generale, lo spazio normato X ∗∗ = B(B(X, C), C) è sempre di Banach e
l’immersione naturale (che ha luogo per X spazio vettoriale qualsiasi)
X ,→ X ∗∗
x 7−→ (f 7−→ f (x))
è ovviamente una isometria.
In vista del prossimo esempio enunciamo il11
11
Non dimostreremo questo teorema, perché in seguito ne daremo una versione più generale,
dovuta a Markov, che caratterizza i funzionali lineari e continui su C(X) ove X è un qualsiasi
spazio di Hausdorff compatto.
195
6.4. Operatori lineari
6.4.6 Teorema (Riesz) Un elemento F ∈ C([0, 1])∗ è sempre della forma
Z 1
F (f ) =
f (t)dg(t)
0
ove g è una funzione a variazione limitata (integrale di Stieltjes).
6.4.7 Esempio Lo spazio di Banach C([0, 1]) delle funzioni continue a valori
reali sull’intervallo compatto [0,1] non è riflessivo. Infatti, supponiamo per assurdo che lo sia: allora ogni funzionale lineare definito sullo spazio V delle funzioni
a variazione limitata deve essere della forma
∀F ∈ C[0, 1]∗
ϕf (F ) = F (f )
ove f ∈ C[0, 1]. Ma usando il teorema di Riesz otteniamo
Z 1
ϕf (F ) = F (f ) =
f (t)dg(t)
0
Consideriamo allora
ψ(F ) := g(t0 + 0) − g(t0 − 0)
Si tratta di un funzionale additivo e
|ψ(F )| = |g(t0 + 0) − g(t0 − 0)| ≤ V01 (g)
Quindi ψ(F ) è limitato e di norma ≥ 1. Evidentemente non è il funzionale nullo:
basti calcolarlo sulla
(
0 se 0 ≤ t ≤ t0
h(t) =
1 se t0 < t ≤ 1
Di nuovo per il teorema di Riesz, deve esistere una f0 ∈ C[0, 1] tale che
Z 1
ψ(f ) = ϕf0 (f ) =
f0 (t)dg(t)
0
Se ora consideriamo la funzione
Z
F0 (t) =
t
f0 (τ )dτ
0
dato che è continua si ha ϕf0 (F0 ) = 0. Ma da ψ(F ) 6= 0 segue f0 6= 0 e
Z 1
Z 1
Φf0 (F0 ) =
f0 (t)df0 (t) =
f02 (t)dt > 0
0
0
Questo assurdo dimostra che non ogni funzionale su C[0, 1]∗ è della forma ΦF e
quindi che C[0, 1] non è riflessivo.
Esempi di spazi riflessivi sono gli Lp (X, µ) per 1 < p < ∞. Di nuovo il
risultato fondamentale è dovuto a Riesz:
196
Capitolo 6. Spazi normati ed operatori lineari
6.4.8 Teorema (Riesz) Se F è un funzionale lineare continuo su Lp (X, µ) con
1 ≤ p < ∞ e µ misura σ-finita, allora esiste un unico g ∈ Lq (X, µ) con 1p + 1q = 1
tale che
Z
F (f ) =
f gdµ
X
e tale che ||F || = ||g||q .
Dimostrazione: Consideriamo prima il caso di misure finite. Allora ogni funzione misurabile limitata sta in Lp e possiamo definire una funzione definita sui
sottoinsiemi misurabili di X come
νE := F (χE )
Se E è unione numerabile
P degli insiemi misurabili e disgiunti {En }, poniamo
αn = sgn F (χE ) e f = αn χEn . Allora, dato che F è limitato:
∞
X
|νEn | = F (f ) < ∞
n=1
e
∞
X
νEn = F (χE ) = νE
n=1
Quindi ν è una misura con segno che, per definizione, è assolutamente continua rispetto a µ: allora per il teorema di Radon–Nikodym, esiste una funzione
misurabile g tale che, per ogni insieme misurabile, E si abbia
Z
νE =
gdµ
E
Ma ν è finita e quindi g integrabile.
Ora dimostriamo che g soddisfa la relazione dell’enunciato. Prima verifichiamolo sulle funzioni semplici: se ϕ è semplice, per linearità si ha
Z
F (ϕ) =
ϕgdµ
X
Ma il |F (ϕ)| ≤ ||F || ||ϕ||p e, se {ψn } è una successione crescente di funzioni
1/p
semplici non negative che tende a |g|q , per ϕn = ψn sgn g si ha
Z
Z
ψn ≤ ϕn g ≤ ||F || ||ϕn ||p
¶1/p
µZ
≤ ||F ||
ψn
197
6.4. Operatori lineari
i.e.
R
ψn ≤ ||F ||q e, per il teorema della convergenza monotona:
Z
|g|q dµ ≤ ||F ||q
e quindi g ∈ Lq .
Ora se G è un funzionale lineare limitato che si annulla sul sottospazio delle
funzioni semplici, per densità di queste in LP , deve aversi F = G, i.e. per ogni
f ∈ Lp :
Z
F (f ) =
f gdµ
X
Che sia ||F || = ||G|| = ||g||q è ovvio.
Passiamo ora al caso σ-finito: sia {Xn } una successione crescente di spazi
misurabili di misura finita la cui unione sia X. Per il risultato nel caso di misura
finita, per ogni n esiste una funzione gn ∈ Lq che si annulla fuori da Xn e tale che
Z
p
∀f ∈ L (Xn ) F (f ) =
f gn dµ
X
Inoltre, ||gn ||q ≤ ||F || e dato che ogni gn con questa proprietà è unica su Xn (a
meno di insiemi di misura nulla) possiamo assumere che su Xn sia gn = gn+1 = ...
(essendo Xn ⊂ Xn+1 ).
Cosı̀ possiamo porre g(x) = gn (x) se x ∈ Xn ed ottenere una funzione misurabile ben definita tale che {|gn } tenda a |g|. Quindi per il teorema ella convergenza
monotona:
Z
Z
q
|g| dµ = lim |gn |q dµ ≤ ||F ||q
i.e. g ∈ Lq . Infine, da f ∈ Lp e fn è definita essere uguale a f su Xn e zero fuori
da Xn allora fn −→ f in Lp , e dato che |f g| è integrabile e |fn g| ≤ |f g| per il
teorema della convergenza dominata:
Z
Z
Z
f gdµ = lim fn gdµ = lim fn gn dµ = lim F (fn ) = F (f )
qed
Questo dimostra la riflessività di L (X, µ) per 1 < p < ∞: nel caso p =
1 possiamo dire che (L1 (x, µ)∗ = L∞ (X, µ) ma non abbiamo la riflessività: lo
dimostreremo nel prossimo paragrafo dopo aver discusso il teorema di Hahn–
Banach.
Osserviamo inoltre che la riflessività degli Lp implica che siano spazi di
Banach, dato che li presenta come duali di spazi normati.
p
198
Capitolo 6. Spazi normati ed operatori lineari
Nei casi generali, sui funzionali lineari, partendo solo dalla definizione, sappiamo molto poco: in realtà non è chiara nemmeno la loro esistenza, in uno spazio
normato qualsiasi. Un principio fondamentale che è indispensabile al loro studio è il teorema di Hahn–Banach, sul quale faremo una digressione nel prossimo
paragrafo.
6.5
I tre principi di Banach
Trattando con spazi di dimensione infinita, seppure normati, molti fatti che,
in dimensione finita sono evidenti o facilmente verificabili usando le coordinate,
risultano ardui da dimostrare e talvolta cessano di essere validi. Per procedere
nella teoria, classicamente si enunciano tre principi, dovuti a S. Banach, che
costituiscono gli strumenti più indispensabili per uno studio più approfondito
degli spazi di Banach.
Il primo di questi principi ha validità estremamente generale, e per enunciarlo
ci occorre una definizione, peraltro interessante di per sé.
6.5.1 Definizione Una seminorma su uno spazio vettoriale reale X è una funzione p : X −→ R ∪ {∞} tale che
• ∀x, y ∈ X
p(x + y) ≤ p(x) + p(y).
• ∀x ∈ X ∀a ≥ 0 p(ax) = ap(x).
Osserviamo che la (2) implica che p(0) = 0.
Ad esempio, ogni norma || − || su uno spazio vettoriale è una seminorma.
Precisamente, una seminorma p è una norma se e solo se per ogni x ∈ X \ (0)
p(x) è un numero reale non nullo.
6.5.2 Esempio Se B è un sottoinsieme di X, il suo funzionale di Minkowski è
la seminorma
pB (x) := inf
a
a>0
x∈aB
(se x ∈
/ aB poniamo pB (x) := ∞).
6.5.3 Lemma Se B è un insieme convesso ed equilibrato12 , allora pB è una
seminorma, e viceversa, se p è una seminorma, l’insieme Bp := {x∈X | p(x) ≤ 1}
è convesso ed equilibrato.
12
Cioè per ogni a ∈ R con |a| ≤ 1 si ha che se x ∈ U anche ax ∈ U .
199
6.5. I tre principi di Banach
Dimostrazione: La (2) nella definizione di seminorma è ovviamente verificata.
Resta solo da dimostrare la (1): per questo useremo la convessità.
Siano x, y ∈ X; se pB (x) o pB (y) sono ∞ non c’è nulla da dimostrare. Se
pB (x) = 0 allora per ogni a > 1 ax ∈ B e quindi se y ∈ B allora
y
∀ε ∈ (0, 1) (1 − ε)y + x(1 − ε)y + ε ∈ B
ε
e dunque la pB (y) < 1 implica che pB ((1 − ε)y + x) ≤ 1 e quindi la (1).
Resta solo il caso in cui sia pB (x) che pB (y) sono diversi da zero. Allora
prendiamo gli elementi di X:
xε :=
1−ε
x
pB (x)
e
yε :=
1−ε
pB (y)
Per definizione di pb si ha che xε , yε ∈ B se ε > 0. Ma B è convesso e quindi
∀t ∈ [0, 1] txε + (1 − t)yε ∈ B
Per t =
pB (x)
pB (x)+pB (y)
si ha
1−ε
(x + y) ∈ B
pB (x) + pb (y)
Quindi
pB (x + y) ≤
pB (x) + pB (y)
1−ε
per ε > 0, da cui segue la (1).
Cosı̀ abbiamo dimostrato la prima asserzione; il viceversa è ovvio.
qed
6.5.4 Teorema (Hahn–Banach) Se p è una seminorma su uno spazio vettoriale reale X e f un funzionale lineare definito su un sottospazio S di X tale
che
∀s ∈ S f (s) ≤ p(s)
allora esiste un funzionale lineare F : X −→ R tale che
• ∀x ∈ X
• ∀s ∈ S
F (x) ≤ p(x).
F (s) = f (s).
200
Capitolo 6. Spazi normati ed operatori lineari
Dimostrazione: Consideriamo l’insieme F dei funzionali lineari g definiti su
un sottospazio di X e tali che, per ogni punto x ove g sia definito, si abbia
g(x) ≤ p(x). L’insieme F è parzialmente ordinato dalla relazione
g < g 0 ⇐⇒ g 0 estende g
i.e. se e solo se il dominio di definizione di g 0 contiene quello di g e sul dominio
di definizione di g si abbia g = g 0 .
Osserviamo intanto che F 6= ∅ dato che certamente f ∈ F. Inoltre l’insieme
ordinato (F, <) soddisfa alle ipotesi del lemma di Zorn,
S dato che se {fα } è
un sottoinsieme totalmente ordinato di F, la funzione α fα (che ristretta al
dominio si fα coincide per definizione con fα per ogni α) è evidentemente un
confine superiore per l’insieme {fα }.
Quindi l’insieme F ha un massimale F . Sia L il sottoinsieme di X sul quale
F è definito. Per dimostrare il teorema basta dunque far vedere che F è definito
per su tutto X, i.e. che L = X. Supponiamo allora che esista un x ∈ X \ L.
Dimostreremo allora che, sullo spazio vettoriale L ⊕ xR, è possibile costruire
una estensione del funzionale F contraddicendone cosı̀ la massimalità. Una tale
estensione F 0 di F dovrebbe soddisfare l’equazione
F 0 (l + ax) := F (l) + aF (x)
Dunque per determinarlo basta dire quanto vale sull’elemento x.
Per l, l0 ∈ L abbiamo:
F (l) + F (l0 ) = f (l + l0 ) ≤ p(l + l0 ) ≤ p(l − x) + p(x − l0 )
Dunque
−p(l − x) + F (l) ≤ p(l0 + x) − F (l0 )
sicché
sup (−p(l − x) + F (l)) ≤ inf (p(l + x) − F (l))
l∈L
l∈L
Definiamo allora F 0 (x) = a ove a è un numero reale tale che
sup (−p(l − x) + F (l)) ≤ a ≤ inf (p(l + x) − F (l))
l∈L
l∈L
Dobbiamo a questo punto solo dimostrare che, se b ∈ R
F 0 (l + bx) = ba + F (l) ≤ p(l + bx)
Ma, per b > 0:
ab + F (l) = b(a + F (l/b)) ≤ b(((p(l/b + x) − F (l/b)) + F (l/b)
= bp(l/b + x) = p(l + bx)
201
6.5. I tre principi di Banach
mentre per b = −c < 0:
−ac + F (l) = c(−a + F (l/c)) ≤ c((p(l/c − x) − F (l/c)) + F (l/c))
= cp(l/c − x) = p(l − cx)
e quindi F 0 (l + ax) ≤ p(l + ax), contro la massimalità di F .
qed
Questo risultato è estremamente potente: ad esempio ci dice che ogni spazio
normato ha “abbastanza funzionali lineari per separare i suoi punti”:
6.5.5 Corollario Se x, y ∈ X sono punti distinti allora esiste un funzionale f
tale che f (x) 6= f (y).
Dimostrazione: Infatti, dato che x 6= y, esiste un intorno U dello zero in
X che non contiene x − y. Possiamo supporre che questo intorno sia convesso
ed equilibrato e quindi, per il lemma, il suo funzionale di Minkowski pU è una
seminorma. Ora applichiamo il teorema di Hahn–Banach al funzionale f definito
sul sottospazio (x − y)R come f (x − y) = 1. Allora esiste un funzionale F su X
tale che f (x) − f (y) = 1 e |f (x)| ≤ pU (x).
qed
6.5.6 Corollario Se x ∈ X spazio normato allora esiste un funzionale lineare f
su X tale che
f (x) = ||f || ||x||
Dimostrazione: Definiamo su xR il funzionale f (cx) = c||x||. Per il teorema
di Hahn–Banach (applicato alla seminorma p = || − ||) esiste una estensione di f
a X in modo che f (y) ≤ ||y||. Ma si ha pure f (−y) ≤ ||y|| i.e. ||f || ≤ 1. Inoltre
f (x) = ||x|| ≤ ||f || ||x|| e quindi ||f || = 1 e f (x) = ||f || ||x||.
qed
6.5.7 Esempio Possiamo ora dimostrare quanto avevamo promesso in precedenza parlando della dualità negli spazi Lp [0, 1], e cioè che il duale di L∞ [0, 1]
non è isomorfo a L1 [0, 1]; in particolare non possiamo rappresentare, come avviene nel caso 1 < p < ∞, un funzionale lineare su L∞ per mezzo di elementi di L1 :
l’idea è che le funzioni continue C[0, 1] sono un sottospazio chiuso di L∞ [0, 1] e
che se f è il funzionale lineare su C[0, 1] che al punto x ∈ C[0, 1] assegna il numero x(0), questo funzionale ha norma 1 e possiamo estenderlo ad un funzionale
limitato F su tutto L∞ [0, 1]. Ma non esiste alcun y ∈ L1 [0, 1] tale che
Z 1
∀x ∈ C[0, 1] F (x) =
xydt
0
202
Capitolo 6. Spazi normati ed operatori lineari
Infatti se {xn } è una successione in C[0, 1] di funzioni limitate da 1 e tali che
xn (o) = 1 e per ogni t 6= 0 xn (t) −→ 0, allora per ogni y ∈ L1 [0, 1] si ha che
Z
1
xn y −→ 0
0
mentre F (xn ) −→ 1.
Tornando al concetto generale di riflessività, è semplice ora dimostrare come
l’immersione j : X −→ X ∗∗ che all’elemento x associa il funzionale su X ∗ :
f 7−→ f (x) sia in realtà una isometria:
||j(x)|| = sup |j(x)(f )| ≥ ||x|| ≥ ||j(x)||
||f ||=1
Osserviamo, a proposito del concetti di riflessività di uno spazio normato X, che
X può essere isometrico con X ∗∗ senza essere tuttavia riflessivo, cioè senza che
la mappa canonica j : X −→ X ∗∗ sia un isomorfismo isometrico.
Concludiamo la discussione del teorema di Hahn–Banach osservando che ne
esiste una versione per spazi vettoriali complessi, che poggia su quella reale: in
questo caso una seminorma è una funzione p : X −→ R tale che
• ∀x, y ∈ X
p(x + y) ≤ p(x) + p(y).
• ∀x ∈ X ∀a ∈ C p(ax) = |a|p(x).
6.5.8 Teorema (Hahn–Banach complesso) Se p è una seminorma su uno
spazio vettoriale complesso X e f un funzionale lineare definito su un sottospazio
S di X tale che
∀s ∈ S |f (s)| ≤ p(s)
allora esiste un funzionale lineare F : X −→ C tale che
• ∀x ∈ X
|F (x)| ≤ p(x).
• ∀s ∈ S F (s) = f (s).
Dimostrazione: Vogliamo usare il teorema di Hahn–Banach reale, e possiamo
farlo osservando che uno spazio vettoriale complesso è anche uno spazio vettoriale
reale, nel quale semplicemente si ignora la moltiplicazione per scalari complessi.
Dato che anche C è uno spazio vettoriale reale, il funzionale F : X −→ C può
vedersi come una applicazione lineare fra spazi vettoriali reali. Osserviamo che,
viceversa, una applicazione R-lineare F : X −→ C è anche un funzionale lineare
(complesso) se e solo se per ogni x ∈ X F (ix) = iF (x).
203
6.5. I tre principi di Banach
Ora, il funzionale f definito su S come nelle ipotesi del teorema, dà luogo a
due funzionali reali g e h su S, semplicemente ponendo
f (x) = g(x) + ih(x)
Ma allora, per ogni s ∈ S, g(s) ≤ |f (s)| ≤ p(s) e cosı̀ possiamo estendere g ad un
funzionale G : X −→ R tale che G(x) ≤ p(x). Poniamo
F (x) := G(x) − iG(ix)
Evidentemente F (s) = f (s) per ogni s ∈ S, e dato che
F (ix) = G(ix) − iG(i2 x) = i(G(x) − iG(ix)) = iF (x)
F è un funzionale lineare complesso su X.
Infine scegliamo, per ogni x ∈ X, un numero complesso zx tale che |zx | = 1 e
zx F (x) = |F (x). Allora
|F (x)| = zx F (x) = F (zx x) = G(zx x) ≤ p(zx x) = p(x)
il che dimostra completamente il teorema.
qed
Il secondo principio che vogliamo esporre vale negli spazi di Banach, ed è il
cosiddetto teorema del grafo chiuso; per dimostrarlo avremo bisogno di qualche
preliminare. Intanto ricordiamo che, in uno spazio normato, la palla di centro
x ∈ X e raggio r ∈ R è il sottospazio
B(r, x) = Br (x) := {y ∈ X | ||y − x|| < r}
La palla B1 (0) si dice palla unitaria di X.
6.5.9 Lemma Se A∈B(X, Y ) è un operatore lineare continuo e suriettivo fra gli
spazi di Banach X e Y , allora l’immagine di A della palla unitaria di X contiene
una palla di centro l’origine di Y .
Dimostrazione: Siano
1
}
2n
S
Dato che A è suriettivo, e che, come spazio metrico, X = k≥1 kS1 , si ha che
Sn := {x | ||x|| <
Y =
[
k≥1
kA(S1 )
204
Capitolo 6. Spazi normati ed operatori lineari
Ora usiamo il fatto che lo spazio completo Y non è di prima categoria, e quindi
che A(S1 ) non può essere mai denso, sicché A(S1 ) deve contenere qualche palla,
ad esempio la
Bη (z) = {y | ||y − z|| < η}
Quindi A(S1 ) − z deve contenere la palla Bη (0). Ma
A(S1 ) − z ⊂ A(S1 ) − A(S1 ) ⊂ 2A(S1 ) = A(S0 )
e quindi A(S0 ) contiene una palla di centro l’origine e raggio η. Ma A è lineare,
sicché A(Sn ) contiene una palla di centro 0 e raggio η/2n .
Ora dimostriamo che A(S0 ) contiene una palla di centro l’origine e raggio
η/2: sia y ∈ Y con ||y|| < η/2. Dato che y ∈ A(S1 ) possiamo scegliere x1 ∈ S1 tale
che
η
||y − A(x1 )|| <
4
e, proseguendo, un x2 ∈ S2 tale che
||y − A(x1 ) − A(x2 )|| <
η
8
è cosı̀ via (usando l’assioma di scelta) per ogni n ∈ N; il generico xn ∈ Sn è tale
che
n
X
¯¯
¯¯
η
¯¯y −
A(xk )¯¯ < n+1
2
k=1
P
Ma ||xn || < 1/2n e quindi la serie k xk converge assolutamente13 ad un elemento
x ∈ S0 . Inoltre
̰
!
∞
X
X
Ax = A
A(xk ) = y
xk =
k=1
k=1
da cui y ∈ A(S0 ) e quindi B η2 (0) ⊂ A(S0 ).
qed
6.5.10 Teorema della mappa aperta (Banach) Un operatore lineare continuo e suriettivo A : X −→ Y fra spazi di Banach è necessariamente aperto,
come mappa fra spazi topologici. In particolare, se A è biunivoco allora è un
isomorfismo di spazi di Banach.
13
Evidentemente in uno spazio normato la convergenza di una serie si definisce in termini
della convergenza della successione delle ridotte.
205
6.5. I tre principi di Banach
Dimostrazione: Sia S un aperto si X e y ∈ A(S). Allora esiste x ∈ S tale che
y = Ax per suriettività di A, e, dato che S è aperto, deve contenere una palla di
centro x. Ma allora, per il lemma, A(S − x) deve contenere una palla di centro
l’origine, i.e. A(S) deve contenere una palla di centro y.
Cosı̀, per ogni y ∈ A(S) abbiamo esibito una palla di centro y completamente
contenuta in A(S), che risulta dunque essere aperto.
Ne segue che la controimmagine per tramite dell’operatore A di un aperto di
Y è un aperto di X.
qed
6.5.11 Corollario Se X è uno spazio vettoriale e || − ||1 , || − ||2 sono norme
per le quali X è di Banach, e se esiste una costante C tale che
∀x ∈ X
||x||1 ≤ C||x||2
allora le norme sono equivalenti, i.e. esiste un’altra costante C 0 tale che
∀x ∈ X
||x||2 ≤ C 0 ||x||1
Dimostrazione: La mappa identità fra gli spazi di Banach (X, ||−||1 ) e (X, ||−
||2 ) è lineare, continua e biunivoca, quindi un isomorfismo, i.e. la sua inversa pure
è continua.
qed
6.5.12 Teorema del grafo chiuso (Banach) Supponiamo che A : X −→ Y
sia un operatore lineare fra gli spazi di Banach X e Y , che goda della seguente
proprietà: se per ogni successione {xn } ⊂ X convergente ad un x ∈ X e la
successione {Axn } ⊂ Y converge ad un punto y ∈ Y allora y = Ax. Allora
A è continuo.
Dimostrazione: Definiamo in X una norma
||x||1 := ||x|| + ||Ax||
Dimostriamo che lo spazio X è completo anche per la norma || − ||1 : se ||xn −
xm ||1 −→ 0 allora ||xn − xm || −→ 0 e ||Axn − Axm || −→ 0; dunque (X e Y sono
completi) esistono x ∈ X e y ∈ Y tali che ||xn − x|| −→ 0 e ||Axn − y|| −→ 0.
Ma l’operatore A soddisfa la proprietà enunciata nell’ipotesi del teorema, sicché
y = Ax, il che vuol dire ||xn − x||2 −→ 0. Quindi X è completo per la norma
|| − ||2 .
Ora possiamo applicare il corollario del teorema della mappa aperta alle
norme || − || e || − ||1 ottenendone l’equivalenza:
∃C
||x|| + ||Ax|| ≤ C||x||
206
Capitolo 6. Spazi normati ed operatori lineari
Dunque A è limitato.
qed
Se A : X −→ Y è una applicazione, il suo grafo è l’insieme {(x, Ax)}x∈X ⊂
X × Y . Allora l’ipotesi del teorema precedente equivale a dire che il grafo di A
è chiuso in X × Y .
Il terzo pilastro sul quale poggia la teoria degli spazi di Banach è il principio
di uniforme limitatezza, che segue dalla teoria della categoria negli spazi metrici.
Per dimostrarlo utilizziamo un principio analogo di natura puramente topologica:
6.5.13 Lemma Se F è una famiglia di funzioni continue reali definite su uno
spazio metrico X, tale che, per ogni x ∈ X esista una costante Mx in modo che
∀f ∈ F
|f (x)| ≤ Mx
allora esistono un aperto non vuoto S ⊂ X ed una costante M tali che
∀f ∈ F∀s ∈ S
|f (s)| ≤ M
Dimostrazione: Sia, per ogni m ∈ N:
Efm := {x | |f (x)| ≤ m}
e poniamo
E m :=
\
Efm
f ∈F
Per continuità di f ciascun Efm è chiuso e dunque anche E m lo è. Per conseguenza
esiste un m ∈ N tale che x ∈ E m , i.e.
X=
[
Em
m∈N
Ma X è uno spazio metrico completo, e quindi, per il teorema di Baire, deve
esistere un m per il quale E m non sia mai denso. Dato che questo E m è chiuso,
deve contenere qualche palla S, e, per ogni s ∈ S deve aversi
∀f ∈ F
|f (s)| ≤ m
qed
207
6.5. I tre principi di Banach
6.5.14 Teorema di Uniforme Limitatezza (Banach–Steinhaus) Se X è
uno spazio di Banach, Y uno spazio normato e F ⊂ B(X, Y ) una famiglia di
operatori lineari limitati da X in Y tale che, per ogni x ∈ X esista una costante
Mx tale che
∀A ∈ F ||Ax|| ≤ Mx
Allora gli operatori di F sono uniformemente limitati, cioè esiste una costante
M tale che
∀f ∈ F ||A|| ≤ M
Dimostrazione: Per ogni A ∈ F, la funzione
f (x) := ||Ax||
è continua su X e dato che la famiglia di queste funzioni (al variare di A ∈ F)
soddisfa le ipotesi del teorema precedente e X è completo, ne segue che esistono
un aperto S ⊂ X ed una costante M tali che
∀s ∈ S
||As|| ≤ M
Sia ora y ∈ S. Dato che S è aperto, esiste una palla Bδ (y) contenuta in S; se
||z|| ≤ δ allora Az = A(z + y) − Ay con z + y ∈ Bδ (y) ⊂ S e quindi
||Az|| ≤ ||A(z + y)|| + ||Ay|| ≤ M + My
in modo che
∀f ∈ F
||A|| ≤
M + My
δ
qed
Capitolo 7
SPAZI DI HILBERT E TEORIA DI
FOURIER
In questo capitolo ci concentriamo sugli spazi di Hilbert: per questi spazi si
possono generalizzare molte nozioni geometriche valide negli spazi euclidei, ad
esempio i procedimenti di ortogonalizzazione, che forniscono i sistemi ortonormali completi: questi ultimi si inquadrano nella teoria di Fourier, della quale ci
occuperemo in fondo al capitolo, e che costituisce il primo e principale esempio
di applicazione degli spazi di Hilbert
7.1
Basi ortonormali negli spazi di Hilbert
Uno spazio di Hilbert, come ogni spazio vettoriale, possiede delle basi, che
tuttavia si dimostrano inadatte a descriverne la geometria, dato che “ignorano”
l’esistenza del prodotto hilbertiano; il concetto “giusto” di base per uno spazio
di Hilbert è quello di sistema ortonormale completo.
7.1.1 Definizione Un sistema ortonormale in uno spazio di Hilbert H è una
famiglia {eα }α∈A di elementi di H di norma 1 (∀α ∈ A ||eα || = 1) tali che
∀α, β ∈ A
(eα , eβ ) = δαβ
A priori un sistema ortonormale può essere del tutto insufficiente a descrivere
la totalità degli elementi di uno spazio di Hilbert; per questo diamo la
7.1.2 Definizione UnPsistema ortonormale {eα }α∈A si dice base ortonormale
(b.o.) se il sottospazio α eα C (generato dalla famiglia {eα }α∈A ) è denso in H.
7.1.3 Proposizione Se {eα }α∈A è un sistema ortonormale in uno spazio di
Hilbert H allora le seguenti proposizioni sono equivalenti:
208
7.1. Basi ortonormali negli spazi di Hilbert
209
• {eα }α∈A è una base ortonormale.
• Se ∀x ∈ H ∀α ∈ A (eα , x) = 0 allora x = 0.
P
• ∀x ∈ H ||x||2 = α |(eα , x)|2 (identità di Parceval).
P
• ∀x ∈ H x = α (eα , x)eα .
Dimostrazione: (1) ⇐⇒ (2) è ovvio per definizione di densità.
(1) ⇐⇒ (4) Segue dal fatto che M = M ⊥⊥ ; infatti se B ⊂ A è finito e N è
il sottospazio generato da {eβ }β∈B , che è chiuso, allora per x ∈ H:
X
xN =
(eβ , x)eβ
β∈B
e, se M0 è il sottospazio (non chiuso!) generato da {eα }α∈A , si ha che, per x ∈ M0 :
X
x=
(eα , x)eα
α∈A
e
||x||2 =
X
|(eα , x)|2
α∈A
(ove le somme sono estese ad un numero finito di termini non nulli). Consideriamo
ora il sottospazio N0 denso in l2 (A) definito come
N0 := {f : A −→ C | Card{α ∈ A | f (α) 6= 0} < ∞}
L’applicazione
Φ : N0 −→ M0
X
f 7−→
f (α)eα
α∈A
è una isometria lineare e suriettiva. Ma sia L2 (A) che H sono completi e quindi
Φ si estende per continuità ad una funzione
e : l2 (A) −→ H
Φ
lineare isometrica e suriettiva, i.e. un isomorfismo
di spazi di Hilbert. Quindi,
P
per ogni x ∈ M esiste f ∈ l2 (A) tale che x = α∈A f (α)eα e quindi esiste α0 ∈ A
tale che f (α0 ) = (eα0 , x). Quindi (1) ⇐⇒ (4).
Inoltre
X
||xM ⊥ ||2 = ||x||2 − ||xM ||2 = ||x||2 −
|(x, eα )|2
α∈A
210
Capitolo 7. Spazi di Hilbert e teoria di Fourier
da cui, per ogni x ∈ H:
X
|(x, eα )|2 ≤ ||x||2
α∈A
e quindi l’equivalenza (1) ⇐⇒ (3).
qed
Notiamo due conseguenze della dimostrazione:
7.1.4 Corollario Se {eα }α∈A è una base ortonormale in uno spazio di Hilbert
H allora H ∼
= l2 (A).
Cioè spazi di Hilbert che ammettano basi della stessa cardinalità sono isomorfi
2
a l (A) e quindi fra loro.
7.1.5 Corollario (Identità di Bessel)
X
|(x, eα )|2 ≤ ||x||2
α∈A
7.1.6 Teorema Uno spazio di Hilbert ha sempre una base ortonormale.
Dimostrazione: La famiglia S formata dai sistemi ortonormali in H è un insieme parzialmente ordinato dall’inclusione (e non vuoto, visto che un qualsiasi
vettore di norma 1 forma da solo un sistema ortonormale). Se Σ è una catena in
S (i.e. per ogni S, S 0 ∈ Σ si ha S ⊂ S 0 oppure S 0 ⊂ S) allora l’insieme unione di
Σ:
[
S
S
S∈Σ
è un sistema ortonormale: se x, y ∈ S∈Σ S allora esistono S, S 0 ∈Σ tali che x∈S e
y ∈ S 0 e quindi, dato che Σ è una catena, si ha x, y ∈ S ⊂ S 0 oppure x, y ∈ S 0 ⊂ S:
in ogni caso x, y appartengono ad un medesimo sistema ortonormale (che sia S
o S 0 ) e quindi devonoSverificare la (x, y) = δx,y .
Inoltre l’insieme S∈Σ S è evidentemente un confine superiore della famiglia
Σ rispetto all’ordine ⊂ e quindi, per il lemma di Zorn, l’insieme S dei sistemi
ortonormali ammette un elemento massimale: per definizione di massimalità (e
per la (2) della proposizione precedente) questo massimale deve essere una base
ortonormale; infatti la massimalità di una base è ovvia, mentre un sistema ortonormale massimale S che non sia una base è tale che S ⊥ 6= 0 e quindi deve
esistere e ∈ S ⊥ con ||e|| = 1 in modo che S ∪ {e} sia un sistema ortonormale,
contro la massimalità di S.
qed
7.1. Basi ortonormali negli spazi di Hilbert
211
7.1.7 Definizione La cardinalità di una base ortonormale in uno spazio di Hilbert si dice dimensione hilbertiana dello spazio.
Evidentemente se la dimensione di H come spazio vettoriale è finita allora
anche la dimensione hilbertiana lo è e questi due numeri coincidono. In generale
questo non sarà vero: molti spazi di funzioni, ad esempio L2 (R), avranno dimensione hilbertiana numerabile (lo vedremo fra breve rammentando che si tratta
di uno spazio separabile): tuttavia L2 (R), come spazio vettoriale, ha dimensione
continua: i suoi punti sono parametrizzati dagli elementi di R.
Nel caso generale non è ovvio nemmeno che tutte le basi ortonormali abbiano
la stessa cardinalità.
7.1.8 Teorema Tutte le basi ortonormali in uno spazio di Hilbert hanno la
stessa cardinalità, che è poi pari alla dimensione hilbertiana.
Dimostrazione: Siano {eα }α∈A e {fβ }β∈B basi ortonormali di H, allora
X
∀α ∈ A eα =
(fβ , eα )fβ
β∈B
Ma l’insieme
Gα := {β ∈ B | (fβ , eα ) 6= 0}
S
è numerabile, quindi l’unione B = α∈A Gα è una unione di insiemi numerabili
indicizzata da A:
Card(B) ≤ Card(A) · ℵ0 = Card(A)
(stiamo supponendo Card(A) infinita, i.e. ≥ ℵ0 ).
Viceversa, scrivendo gli elementi fβ in termini della base {eα }α∈A otteniamo
Card(A) ≤ Card(B)
e quindi, per il teorema di Cantor–Bernstein: Card(A) = Card(B).
qed
7.1.9 Teorema Gli spazi di Hilbert di dimensione hilbertiana numerabile (o
finita) sono tutti e soli quelli separabili1 .
Dimostrazione: Il caso di dimensione finita segue ovviamente da quello di
dimensione numerabile.
1
Cioè che contengono una successione densa.
212
Capitolo 7. Spazi di Hilbert e teoria di Fourier
Sia la dimensione hilbertiana di H numerabile: allora esiste una base ortonormale {en }n∈N ed, evidentemente, il sottospazio
X
(Q + iQ)en
P
n∈N
è denso in n∈N Cen , la cui chiusura è H.
Sia viceversa lo spazio H è separabile; dimostreremo che possiede una base
ortonormale indicizzata da N. Sia {xn }n∈N una successione di vettori totale2 , che
deve esistere per l’ipotesi di separabilità: usando un procedimento alla Gram–
Schmidt la renderemo ortonormale in modo da avere la base voluta.
Basta per questo osservare che il sottospazio Mn generato dall’insieme finito
di vettori {x1 , ..., xn } è chiuso (perché ha dimensione finita e quindi è completo)
e ovviamente non contiene xn+1 . Decomponiamo allora xn+1 secondo la somma
diretta Mn + Mn⊥ e chiamiamo yn+1 la componente di xn+1 in Mn⊥ . Ponendo per
ogni n ∈ N:
yn+1
en :=
||yn+1 ||
otteniamo ovviamente un sistema ortonormale in H
qed
La seguente definizione è di fondamentale importanza:
7.1.10 Definizione Un operatore unitario fra due spazi di Hilbert H1 e H2 è
un operatore U : H1 −→ H2 lineare isometrico tale che
U ∗ = U −1
Un operatore unitario è una realizzazione concreta di un isomorfismo fra spazi
di Hilbert: in particolare
7.1.11 Teorema Se due spazi di Hilbert H1 e H2 hanno la stessa dimensione
hilbertiana allora esiste un operatore unitario U : H1 −→ H2 .
Dimostrazione: Possiamo per ipotesi scegliere due basi ortonormali {eα }α∈A
e {fα }α∈A in H1 e H2 indicizzate dallo stesso insieme A. Quindi esistono gli
isomorfismi di spazi di Hilbert
Φ1 : H1 −→ l2 (A)
e
Φ2 : H2 −→ l2 (A)
(per il corollario 7.1.4) e componendo l’uno con l’inverso dell’altro otteniamo
l’operatore unitario voluto.
qed
2
Cioè gli {xn } sono linearmente indipendenti ed il sottospazio vettoriale che generano è
denso.
7.2. Operatori di proiezione negli spazi di Hilbert
213
Ad esempio, se H = l2 (N), e se consideriamo come insieme di indici i numeri
naturali pari 2N, allora esiste un operatore unitario in B(H) isometrico su un
sottospazio proprio:
U en := e2n
tale che
||U x||2 = ||x||2
e quindi (U x, U x) = (x, U ∗ U x) = (x, x) i.e. U ∗ U = I. Tuttavia U non è unitario,
dato che non è suriettivo.
Osserviamo inoltre che se A = {1, 2, 3, 4, ...} = N \ {0} allora esiste un
operatore
S : H −→ L2 (A)
en 7−→ en+1
tale che im(S)⊥ = Ce0 e che si dice shift unilatero. Si tratta di un operatore
isometrico.
7.2
Operatori di proiezione negli spazi di Hilbert
Consideriamo uno spazio di Hilbert H ed un suo sottospazio vettoriale chiuso
M . Per il teorema di Riesz ogni elemento x∈H si decompone come x = xM +xM ⊥ .
Quindi la mappa
x 7−→ xM
è lineare3 e suriettiva. Denotiamola EM .
2
Osserviamo che EM
= EM , cioè che l’operatore E : H −→ H è idempotente:
2
infatti EM (x) = EM (xM ) = xM . Questo è un fatto del tutto generale che si
verifica ogni qual volta uno spazio vettoriale X si decomponga in somma di
sottospazi e si considerino le proiezioni di X su questi suoi sottospazi.
Un altro fatto generale che probabilmente è ben noto al lettore è che, viceversa, se X è uno spazio vettoriale e E : X −→ X un operatore lineare idempotente,
X si decompone in somma diretta di due sottospazi, precisamente l’immagine
M = im(E) di E ed il suo conucleo N = im(I − E) (ove I è l’operatore identità
su X).
Nel caso di un sottospazio chiuso M di uno spazio di Hilbert H la proiezione
EM : X −→ X è un operatore continuo:
||x||2 = ||xM ||2 + ||xM ⊥ ||2
3
Se X è un qualsiasi spazio vettoriale che sia somma diretta di due sottospazi M e N allora
la decomposizione di un elemento x ∈ X come somma di un elemento xM ∈ M ed un elemento
xN ∈ N è unica, e quindi le mappe x 7−→ xM e x 7−→ xN sono lineari.
214
Capitolo 7. Spazi di Hilbert e teoria di Fourier
da cui segue ||EM x|| = ||xM || ≤ ||x||.
Osserviamo esplicitamente che, E 6= 0 se e solo se im(E) 6= (0), il che avviene
se e solo se esiste un elemento x0 ∈ H non nullo tale che Ex0 = x0 . Dunque
||E|| = 1.
Naturalmente
(y, Ex) = (yM + yM ⊥ , xM ) = (yM , xM ) = (Ey, Ex) = (y, E ∗ Ex)
e quindi un proiettore E è autoaggiunto. Dunque
(
E = E2
E = E ∗ E ⇐⇒
E = E∗
sono condizioni equivalenti all’essere E un proiettore su un sottospazio chiuso.
7.2.1 Definizione Una isometria parziale in uno spazio di Hilbert H è un elemento W ∈ B(H) tale che l’operatore
W |N (W )⊥
sia una isometria (si ricordi che N (A) è il nucleo dell’operatore A, i.e. l’insieme
{x ∈ H | Ax = 0}).
Ad esempio, se M e N sono sottospazi chiusi di H della stessa dimensione
allora esiste un operatore unitario
W0 : M −→ N
che possiamo comporre ad esempio con il proiettore EM ottenendo
W := W0 EM
che è evidentemente una isometria parziale.
7.2.2 Proposizione Esiste una corrispondenza biunivoca
{M ⊂ H | M = M } ←→ {E ∈ B(H) | E = E ∗ E}
Dimostrazione: Se E ∈B(H) è tale che E = E ∗ E allora prendiamo M = im(E)
e N = im(I − E). Ovviamente H = M + N . Inoltre M ∩ N = (0), dato che
M = N ⊥ : (Ey, (I − E)x) = (y, (E ∗ − E ∗ E)x) = 0, ed analogamente N = M ⊥ .
qed
7.2. Operatori di proiezione negli spazi di Hilbert
215
Se M1 e M2 sono sottospazi chiusi di H, con proiettori E1 , E2 , allora
M1 ⊂ M2⊥ ⇐⇒ E1 E2 = 0
Infatti 0 = (Ex , E2 y) ⇐⇒ (x, E1∗ E2 y) = 0 ⇐⇒ E1∗ E2 = 0 ⇐⇒ E1 E2 = 0
(essendo i proiettori autoaggiunti). Ovviamente E1 E2 = 0 ⇐⇒ E2 E1 = 0 e
M1 ⊂ M2⊥ ⇐⇒ M2 ⊂ M1⊥ .
Osserviamo che in generale la somma E1 + E2 non è necessariamente idempotente, ma tuttavia, se M1 ⊥M2 :
(E1 + E2 )2 = E12 + E1 E2 + E2 E1 + E22 = E1 + E2
e quindi E1 + E2 è in questo caso il proiettore di M1 + M2 .
qed
Questi fatti si estendono al caso di n proiettori, cosı̀ P
ad esempio, se M1 , ..., Mn
sono sottospazi
chiusi
mutuamente
ortogonali,
allora
Ei è il proiettore dello
P
spazio
Mi . In particolare la somma di sottospazi chiusi è chiuso.
Ancora più in generale, se {Mα } è una famiglia qualsiasi di sottospazi vettoriali chiusi di H mutuamente ortogonali:
∀α 6= β
Mα ⊥Mβ
P
allora lo spazio
Mα può non essere affatto chiuso. Bisogna considerare esplicitamente la sua chiusura in H.
Ad esempio, si noti che se {Ei }i∈N sono idempotenti autoaggiunti (non nulli!)
e tali che
∀i 6= j Ei Eh = 0
P
allora i∈N Ei non converge in norma. Se cosı̀ non fosse si avrebbe infatti, per
ogni ε > 0 e per n, m > nε :
n
¯¯ X
¯¯
Ei || < ε
i=1
P
il che è assurdo, visto che l’idempotente autoaggiunto
Ei ha norma 1.
Questo esempio mostra come sia necessario considerare topologie alternative
sullo spazio degli operatori lineari.
7.2.3 Definizione Se X è uno spazio di Banach e {An } ⊂ B(X) allora si dice
che la successione {An } converge fortemente a A, e si scrive
An
se per ogni x ∈ X: limn An x = Ax.
f
/A
216
Capitolo 7. Spazi di Hilbert e teoria di Fourier
Osserviamo che se ||An − A|| −→ 0 allora sup||x||=1 |An x − Ax| −→ 0 e quindi
||−||
(scriviamo An −→ A per la convergenza in norma):
||−||
f
An −→ A ⇐⇒ An −→ A uniformemente sulla palla unitaria in H
Ricordando la definizione di topologia debole su uno spazio topologico (definizione 2.1.22), diamo la
7.2.4 Definizione La topologia forte sullo spazio B(X) è la topologia debole
definita dalla famiglia di funzioni
{f : B(X) −→ X | ∀A ∈ B(X) f (A) = Ax}x∈X
Per capire meglio la definizione, scriviamo come sono fatti gli intorni di un
operatore A nella topologia forte:
Ux1 ,...,xn (A) = {B ∈ B(X) | ∀k = 1, ..., n ||(B − A)xk || ≤ 1}
(l’intorno U dipende da A e da n elementi x1 , ..., xn ∈ X).
Evidentemente questa topologia non possiede una base numerabile di intorni,
e non può dunque caratterizzarsi semplicemente con i limiti di successioni, bensı̀
con i limiti di successioni generalizzate.
Supponiamo quindi di avere una famiglia di proiettori {Eα }α∈A con {Mα }α∈A
relativi sottospazi e consideriamo l’insieme
B := {β ⊂ A | Card(β) < ∞}
parzialmente ordinato dalla relazione di inclusione ⊂. Si tratta di un insieme
diretto e quindi possiamo definire la successione generalizzata
X
Fβ :=
Eβ
α∈β
il cui limite (se esiste) è
P
α∈A
Eα .
7.2.5 Proposizione La serie
X
α∈A
converge nella topologia forte.
Eα =: E
7.2. Operatori di proiezione negli spazi di Hilbert
217
Dimostrazione: Dobbiamo dimostrare che per ogni x ∈ H esiste un β0 ∈ B tale
che se β0 ⊂ β allora
||Fβ x − Ex|| < 1
Sia x ∈ M con
M :=
X
Mα
α∈A
0
Dato che M è chiuso
P deve esistere x ∈
0
norma) i.e. x = α∈A Eα x. Dunque
x−
X
Eα x = x −
α∈β
X
P
E Ea(x − x0 ) +
||x −
X
Mα arbitrariamente vicino a x (in
X
Eα x0 = x − x0 + Fβ (x − x0 )
α∈β
α∈β
i.e.
α∈β0
Eα x|| ≤ ||x − x0 || + ||Fβ (x − x0 )|| −→ 0
α∈β
P
per ||x − x0 || −→ 0. Dunque, se x ∈ M allora x = α∈A Eα x.
Se ora x ∈ H è qualsiasi, Ex ∈ M e quindi, applicando il ragionamento
precedente (tenendo conto che Eα Ex = Eα x, avendosi Mα ⊂ M ) si trova
X
X
Ex =
Eα Ex =
Eα x
α∈A
α∈A
qed
Osserviamo che, se β ⊂ A (con Card(β) < ∞), allora
¯¯ X
¯¯2 X ¯¯
¯¯
¯¯
¯¯Eα x¯¯2
Eα x¯¯ =
α∈β
α∈β
Se x ∈ H, per la proposizione precedente si ha
¯¯ X
¯¯2 X
||Eα x||2
||Ex||2 = lim ¯¯
Eα x¯¯ =
β
α∈β
α
Allora le seguenti proposizioni sono equivalenti 4 :
P
•
α∈A Mα = H.
• H = M.
P
•
α Eα = I (nella topologia forte).
4
Un sottoinsieme è totale se il suo inviluppo lineare, il sottospazio vettoriale che genera, è
denso.
218
•
Capitolo 7. Spazi di Hilbert e teoria di Fourier
S
α∈A Mα è un sottoinsieme totale in H.
S
• ( α∈A Mα )⊥ = 0 (S è totale se e solo se S ⊥ = 0).
Non appena una di esse sia verificata allora ha luogo l’isomorfismo di spazi
di Hilbert
M
H∼
Mα
=
α∈A
realizzato dalla mappa x 7−→ {α ∈ A 7−→ χ(α) = Eα x ∈ Mα }. Si noti che
X
||χ(α)||2 = ||x||2
α
e si osservi che, se ciascuno degli spazi Mα è di dimensione 1, allora la teoria che
abbiamo svolto è semplicemente quella delle basi ortonormali in H.
Concludiamo la nostra analisi di B(H) indagandone alcune particolarità della
struttura algebrica. Prima svolgiamo qualche semplice osservazione sui proiettori
e sui loro sottospazi associati:
7.2.6 Proposizione (x, Ex) = (x, x) ⇐⇒ x ∈ M .
Dimostrazione: Basta osservare che
(Ex, Ex) = (x, Ex) = (x, x) = (Ex, Ex) + ((I − E)x, (I − E)x)
e che (I − E)x = 0 ⇐⇒ x = Ex.
qed
Se M e N sono sottospazi chiusi, allora
M ⊂ N ⇐⇒ EM EN = EM
Ma EF è autoaggiunto se e solo se EF = F E i.e. EM EN = EM ⇐⇒ EN EM =
EM :
M ⊂ N ⇒ EM EN = EN EM
Inoltre
M ⊥M ⇒ EM EN = EN EM
Se poi M = M1 + M2 allora E1 + E2 = EM := E e dunque, se F := EN ,
EF = F E.
In B(H) c’è una relazione di ordine parziale che possiamo determinare stabilendo quali sono gli elementi positivi:
B(H)+ := {B ∈ B(H) | ∀x ∈ H (x, Bx) ≥ 0}
Evidentemente, per l’identità di polarizzazione:
B ∈ B(H)+ ⇒ B = B ∗
Ad esempio per ogni A∈B(H) l’operatore AA∗ è semi-definito positivo: AA∗ ≥ 0.
In particolare, un autoaggiunto idempotente E è positivo.
7.2. Operatori di proiezione negli spazi di Hilbert
219
7.2.7 Proposizione M ⊂ N ⇐⇒ EM EN = EM ⇐⇒ EM ≤ EN .
Dimostrazione: Dato che N = M + (M ⊥ ∩ N ) si ha EN = EM + EM ⊥ ∩N e
quindi:
(x, EN x) = (x, EM x) + (x, EM ⊥ ∩N x)
quindi, dato che il secondo addendo del secondo membro è ≥ 0, troviamo (x, EN x) ≥
(x, EM x).
Viceversa, x ∈ M ⇐⇒ (x, EM x) = (x, x). Ma se EM ≤ EN allora
(x, x) = (x, EM x) ≤ (x, EN x) = (EN x, EN x) ≤ ||x||2 = (x, x)
(dato che EN è un proiettore). Quindi, per la proposizione precedente:
M ⊂N
qed
7.2.8 Teorema Se E e F sono idempotenti autoaggiunti in B(H) (e quindi esistono i sottospazi chiusi M e N in modo che E = EM e F = EN ) allora le
seguenti proposizioni sono equivalenti:
• EF = F E.
• EF = EM ∩N .
• N = (N ∩ N ) + (N ∩ M ⊥ ).
Dimostrazione: (3) ⇒ (1) è già stato dimostrato.
(1) ⇒ (2): EF = F E ⇒ EF = (EF )∗ e ⇒ (EF )2 = E 2 F 2 = EF . Quindi
EF è un proiettore se EF = F E.
Ma, se x ∈ M ∩ N allora Ex = x = F x e quindi EF x = x, cioè M ∩ N ⊂
im(EF ). Inoltre, se x ∈ im(EF ) allora x = EF x e Ex = E(EF )x = E 2 F x = x.
Scambiando il ruolo di E e F si ottiene anche F x = x e quindi M ∩N = im(EF ).
(2) ⇒ (1) è banale.
(2) ⇒ (3): Se EF = EM ∩N allora:
F = (F − EF ) + EF = F (I − E) + EF
Ma vale (1) (perché vale (2)) e quindi F e I − E commutano:
F (I − E) = EN ∩M ⊥
e EF = EN ∩M , sicché
F = EN ∩M ⊥ + EN ∩M ⇒ N = M ⊥ ∩ N + M ∩ N
qed
Possiamo formulare quanto fin qui ottenuto dicendo che il reticolo dei sottospazi chiusi (o equivalentemente degli idempotenti autoaggiunti) di uno spazio di
Hilbert è un’algebra di Boole.
220
7.3
Capitolo 7. Spazi di Hilbert e teoria di Fourier
Serie di Fourier
Corrediamo ora la teoria con gli esempi fondamentali: le serie e l’integrale di
Fourier5 .
Vogliamo considerare funzioni f : R −→ C periodiche, di periodo 2π (come
le classiche funzioni trigonometriche): f (t) = f (t + 2π); il modo più naturale di
procedere non è considerare queste funzioni definite sulla retta reale ma sulla
circonferenza T = {|z| = 1} ⊂ C. Osserviamo che T è lo spazio topologico
(compatto) ottenuto dall’intervallo [0, 2π] identificandone gli estremi 0 ≈ 2π,
ovvero è il quoziente R/2πZ (via la mappa t 7−→ eit ).
Consideriamo dunque lo spazio T, con la misura di Lebesgue: ricordiamo che
la misura di Lebesgue è invariante per traslazioni:
Z
Z
f (t − s)dt = f (t)dt
T
T
per ogni 0 ≤ s < 2π (integrare su T è come integrare sull’intervallo (0, 2π)).
Consideriamo lo spazio L1 (T) con la norma di Banach
Z
1
||f ||1 =
|f (t)|dt
2π T
(supponiamo che le funzioni abbiano valori complessi).
Ad esempio sia
N
X
p(t) =
an eint
n=−N
(una tale funzione si dice polinomio trigonometrico). I coefficienti an del polinomio sono tutto ciò che dobbiamo conoscere per determinarlo completamente;
inoltre si possono ricavare dal polinomio stesso, per mezzo della formula
Z
1
an =
p(t)e−int dt
2π T
Questa formula segue direttamente dalle relazioni di ortogonalità
Z
1
eint dt = δn0
2π T
5
Si tratta degli esempi che storicamente hanno dato impulso sia alla teoria della misura di
Lebesgue che alla teoria degli spazi di Hilbert.
221
7.3. Serie di Fourier
7.3.1 Definizione Una serie trigonometrica è una espressione formale
S=
∞
X
an eint
n=−∞
con an ∈ C.
Notiamo che si tratta di una serie formale, nel senso che può benissimo
non convergere; tuttavia, motivati dall’esempio dei polinomi trigonometrici, ci
chiediamo se una tale serie non possa rappresentare una funzione.
Sia f ∈ L1 (T) e definiamo l’n-simo coefficiente di Fourier di f come
Z
1
b
f (n) :=
f (t)e−int dt
2π T
Se f è un polinomio otteniamo esattamente il suo coefficiente in grado n; in
generale abbiamo non un polinomio ma una serie trigonometrica
Sf :=
∞
X
fb(n)eint
n=−∞
che si dice serie di Fourier associata alla funzione f . Si verificano immediatamente le seguenti proprietà:
7.3.2 Proposizione Siano f, g ∈ L1 (T);
• f[
+ g(n) = fb(n) + gb(n).
c (n) = z fb(n).
• ∀z ∈ C zf
• Se la traslata di t ∈ T della funzione f è la funzione
ft (s) := f (s − t)
allora fbt (n) = fb(n)e−int .
•
|fb(n)| ≤ ||f ||1
Forse solo la (4) merita un commento:
¯
¯Z
Z
¯
1 ¯¯
1
−int ¯
b
|f (n)| =
f (t)e
dt¯ ≤
|f (t)|dt = ||f ||1
2π ¯ T
2π T
(ricordiamo che eit è un numero complesso di modulo 1, se t∈R). Evidentemente,
se {fn } è una successione convergente in L1 (T) allora fbn converge uniformemente.
Definiamo ora una operazione sullo spazio L1 (T) che riflette il fatto che T è
un gruppo rispetto alla somma (modulo 2π).
222
Capitolo 7. Spazi di Hilbert e teoria di Fourier
7.3.3 Lemma Se f, g ∈ L1 (T) allora, per quasi ogni s ∈ T, la funzione t 7−→
f (t)g(s − t) è integrabile.
Dimostrazione: La funzione di due variabili (s, t) 7−→ f (t)g(s − t) è misurabile
(è prodotto di funzioni misurabili!) e quindi, per quasi ogni t, la funzione s 7−→
f (t)g(s − t) è multiplo costante di gt e quindi è integrabile e
Z
Z
Z
1
1
1
|f (t)g(s − t)|dsdt =
|f (t)| ||g||1 dt = ||f ||1 ||g||1
2π T 2π T
2π T
Quindi f (t)g(s − t) è integrabile (per il teorema di Fubini) come funzione di t,
per quasi ogni s.
qed
Abbiamo quindi, per ogni f, g ∈ L1 (T) la loro convoluzione f ∗ g ∈ L1 (T)
definita come
Z
1
f ∗ g(s) =
f (t)g(s − t)dt
2π T
Ovviamente
||f ∗ g||1 ≤ ||f ||1 ||g||1
dato che
1
2π
Z
Z
Z
1
1
|f ∗ g(s)|ds =
|f (t)g(s − t)|dtds
2π
2π
ZZ
1
≤ 2
|f (t)g(s − t)dt ⊗ ds = ||f ||1 ||g||1
4π
7.3.4 Proposizione f[
∗ g(n) = fb(n)b
g (n)
Dimostrazione: Si tratta di un semplice cambiamento di variabile nell’integrale
combinato col teorema di Fubini:
ZZ
Z
1
1
−ins
[
f (t)e−int g(s − t)e−in(s−t) dsdt
f ∗ g(n) =
f ∗ g(s)e
ds = 2
2π
4π
Z
Z
1
1
−int
=
f (t)e
dt
g(s)e−ins ds = fb(n)b
g (n)
2π
2π
qed
A questo punto, usando calcoli analoghi a quelli fin qui svolti, è un facile
esercizio dimostrare la
223
7.3. Serie di Fourier
7.3.5 Proposizione Rispetto alla convoluzione, lo spazio L1 (T) diviene un’algebra associativa e commutativa.
7.3.6 Esempio Calcoliamo la convoluzione di una funzione f ∈ L1 (G) con un
polinomio trigonometrico p:
1
f ∗ p(t) =
2π
=
Z
f (s)
N
X
i(t−s)n
an e
N
X
ds =
n=−N
N
X
int
an e
n=−N
1
2π
Z
f (s)e−ins ds
an fb(n)eint
n=−N
Consideriamo ora una successione di funzioni in L1 (T) (si tratta di polinomi
trigonometrici) nota come nucleo di sommabilità di Fejér :
(†)
µ
N
X
KN (t) :=
n=−N
|n|
1−
N +1
¶
eint
7.3.7 Proposizione Il nucleo di Fejér soddisfa alle proprietà seguenti:
• Per ogni N ∈ N:
1
2π
• Esiste una costante c tale che
KN (t)dt = 1
Z
1
2π
• Se 0 < δ < π:
Z
|KN (t)|dt ≤ c
Z
2π−δ
|KN (t)|dt = 0
lim
N −→∞
δ
• KN (t) ≥ 0.
int
Dimostrazione:
R int La (2) e la (4) sono ovvie, dato che |e | = 1. La (1) segue
dal fatto che e = δn0 :
1
2π
Z
KM (t)dt =
µ
N
X
n=−N
|n|
1−
1+N
¶
1
2π
Z
int
e
=
µ
N
X
n=−N
|n|
1−
1+N
¶
δn0 = 1
224
Capitolo 7. Spazi di Hilbert e teoria di Fourier
La (3) segue dalla formula
1
KN (t) =
1+N
Ã
sin N 2+1 t
sin 2t
!2
che si dimostra osservando che
¶
¶ N µ
µ
|n|
1 −it 1 1 it X
eint =
1−
− e + − e
4
2 4
1+N
n=−N
µ
¶
1
1 −i(N +1)t 1 1 i(N +1)t
=
− e
+ − e
1+N
4
2 4
ed utilizzando l’identità trigonometrica
sin2
t
1 − cos2 t
1
1 1
=
= − e−it + − eit
2
2
4
2 4
qed
Una successione di funzioni che verifichi queste proprietà si dice nucleo (positivo) di sommabilità. Notiamo che, per la (†):
f ∗ KN (t) =
µ
N
X
n=−N
|n|
1−
N +1
¶
fb(n)eint
Il nucleo di Fejér è di fondamentale utilità: ad esempio possiamo dimostrare per
mezzo di esso6 il
7.3.8 Teorema di Approssimazione (Weierstrass) Ogni funzione f ∈C(T)
è limite uniforme di polinomi trigonometrici.
Dimostrazione: Osserviamo che una funzione continua è in L1 (T) e che
||f ||1 ≤ ||f ||0
ove ||.||0 è la norma dello spazio di Banach C(T):
||f ||0 = max |f (t)|
t∈T
Infatti
1
||f ||1 =
2π
Z
1
|f (t)|dt ≤
2π
Z
||f ||0 dt =
1 ||f ||0
= ||f ||0
2π 2π
6
Questo teorema seguirà immediatamente da un risultato generale, il teorema di Stone–
Weierstrass 9.2.9, che daremo in seguito: ci sembra interessante darne comunque una
dimostrazione particolare in questa sede.
225
7.3. Serie di Fourier
Quindi la convergenza in L1 implica la convergenza uniforme; ora se f ∈ C(T) ⊂
L1 (T) dimostriamo che si può approssimare con i polinomi trigonometrici f ∗KN .
Dobbiamo dimostrare che ||f − f ∗ KN ||1 −→ 0, il che faremo in due passi: prima
dimostreremo che, se k ∈ C(T) e f ∈ L1 (T) allora
1
2π
(∗)
Z
k(t)ft dt = f ∗ k
e poi dimostreremo che
1
f = lim
N −→∞ 2π
(∗∗)
Z
KN (t)ft dt
(limite nella norma ||.||1 ). Da (*) e (**) segue la tesi.
Dimostriamo (*): se f ∈ C(T) scriviamo l’integrale alla Riemann:
1
2π
Z
k(t)ft dt =
X
1
lim
(tn+1 − tn )k(tn )ftn
2π
n
per una partizione {tn } di [0, 2π): ma
X
1
lim
(tn+1 − tn )k(tn )f (t − tn ) = f ∗ k(t)
2π
n
(limite nella norma uniforme) sempre per definizione di integrale di Riemann:
quindi per funzioni continue il teorema è dimostrato. Ma le funzioni continue
approssimano le funzioni L1 (T), e, se f ∈ L1 (T) e g ∈ C(T) è tale che ||f − g|| ≤ ε
allora, dato che la (*) vale per le funzioni continue:
1
2π
da cui
Z
1
k(t)ft t − f ∗ k =
2π
Z
k(t)(f − g)t dt − (f − g) ∗ k
¯¯ Z
¯¯
¯¯ 1
¯¯
¯¯
¯¯
¯¯ 2π k(t)ft dt − f ∗ k ¯¯ ≤ 2ε||k||1
1
Questo dimostra la (*); passiamo alla (**): ricordiamo che f è continua su un
compatto (T), quindi uniformemente continua. Cioè, per ogni ε > 0 esiste δε tale
che se |s − t| < δε allora |f (s) − f (t)| < ε. Allora, ricordando le proprietà del
226
Capitolo 7. Spazi di Hilbert e teoria di Fourier
nucleo di Fejér (proposizione 7.3.7), se 0 < δ < π:
¯ Z
¯
Z
¯1
¯
1
|f ∗ KN (s) − f (s)| = ¯¯
Kn (t)f (t − s)dt −
f (s)KN (t)dt¯¯
2π
2π
Z
1
≤
|f (t − s) − f (s)|KN (t)dt
2π
ÃZ
δ
1
|f (t − s) − f (s)|KN (t)dt+
=
2π
0
Z 2π−δ
+
|f (t − s) − f (s)|KN (t)dt+
δ
!
Z
2π
|f (t − s) − f (s)|KN (t)dt
+
1
<
2π
ÃZ
2π−δ
Z
δ
|f (t − s) − f (s)|KN (t)dt+
εKN (t)dt +
Z
0
!
2π
+
2π−δ
δ
εKN (t)dt
2π−δ
µ
¶
Z 2π−δ
1
2δεc +
Ms KN (t)dt
<
2π
δ
<Cε
(ove Ms = maxt∈T |f (t − s) − f (s)| e
R
|KN (t)| ≤ c).
qed
Osserviamo che l’algebra L1 (T) non ha elemento neutro, ma che il nucleo di
Fejér può essere considerato una “identità approssimante”.
I coefficienti di Fourier fb(n) di una funzione f ∈L1 (T) soddisfano un “teorema
di unicità”:
7.3.9 Teorema Se f ∈ L1 (T) e per ogni n ∈ N fb(n) = 0 allora f = 0.
Dimostrazione: Dato che si tratta di un polinomio trigonometrico, i coefficienti
di f ∗KN = 0 sono tutti nulli essendo multipli dei fb(n)) e, dato che f ∗KN −→ f ,
ne segue f = 0.
qed
In altri termini, se due funzioni hanno eguali coefficienti di Fourier, debbono
coincidere: la serie di Fourier determina univocamente la funzione stessa. Inoltre
la successione {fb(n)} è infinitesima:
227
7.3. Serie di Fourier
7.3.10 Lemma (Riemann–Lebesgue) Se f ∈ L1 (T) allora
lim fb(n) = 0
|n|−→∞
Dimostrazione: Se p è un polinomio trigonometrico che approssima f ∈ L1 (T)
per meno di ε:
||f − p||1 < ε
e se |n| è maggiore del grado di p, allora
|fb(n)| = |f[
− p(n)| ≤ ||f − p||1 < ε
qed
Osserviamo che la serie di Fourier non converge necessariamente: possiamo,
usando il teorema di Banach–Steinhaus, dare un esempio di funzione la cui serie
di Fourier è non convergente in un punto di T: ricordiamo che la serie
Sf =
∞
X
fb(n)eitn
n=−∞
converge se converge (in norma ||.||1 ) la successione delle sue ridotte N -sime
SN (f ) =
N
X
fb(n)eitn
n=−N
Evidentemente la mappa SN : C(T) −→ R
f 7−→ SN (f )(0) =
N
X
fb(n)
n=−N
è un funzionale lineare continuo sullo spazio di Banach C(T); come esercizio si
può dimostrare che la successione di funzionali lineari {SN } non è uniformemente
limitata e quindi, per il teorema di Banach–Steinhaus, esiste f ∈ C(T) tale che
{SN (f )(0)} non è limitata e quindi la serie di Fourier diverge in 0.
Ora consideriamo lo spazio di Hilbert L2 (T): osserviamo che la famiglia di
funzioni {eint } in L2 (T) forma un sistema ortonormale completo: è completo per
il teorema di unicità delle serie di Fourier, dato che
Z
1
int
(f, e ) =
f (t)eint dt = fb(n)
2π
ed è ortonormale in virtù delle identità
Z
1
eint eimt dt = δnm
2π
Da quello che sappiamo sulle basi ortonormali negli spazi di Hilbert segue il
228
Capitolo 7. Spazi di Hilbert e teoria di Fourier
7.3.11 Teorema Se f ∈ L2 (T) allora
Z
X
1
2
b
•
|f (n)| =
|f (t)|2 dt
2π
n
• ||f − SN (f )||1 −→ 0
• Se {an }n∈Z è una successione in l2 (Z) (i.e.
un’unica f ∈ L2 (T) tale che an = fb(n).
P
|an |2 < ∞) allora esiste
• Se g ∈ L2 (T):
1
(f, g) =
2π
In altri termini, l’operatore
Z
∞
X
f (t)g(t)dt =
fb(n)b
g (n)
n=−∞
U : L2 (T) −→ l2 (Z)
che ad una funzione f fa corrispondere la successione dei suoi coefficienti di
Fourier (si noti che U (f ) ∈ l2 (Z) per l’identità di Parceval) è unitario.
Osserviamo inoltre che l’operatore di shift Sen := en+1 è unitario su l2 (Z) e
che
¡ −1
¢
U SU (f ) (z) = zf (z)
7.4
Integrale di Fourier
Ora consideriamo le funzioni integrabili su L1 (R); di nuovo la misura di Lebesgue
è invariante per traslazioni
Z ∞
Z ∞
f (t − s)dt =
f (t)dt
−∞
−∞
per ogni s ∈ R.
Consideriamo sullo spazio L1 (T) la norma di Banach
Z
||f ||1 =
|f (t)|dt
R
(supponiamo che le funzioni abbiano valori complessi).
Osserviamo che, a differenza di L1 (T), L1 (R) non contiene tutte le funzioni
che ha interesse considerare: ad esempio non contiene le funzioni Lp (R) (dato
229
7.4. Integrale di Fourier
che la misura è infinita). In particolare non abbiamo qualcosa come i polinomi
trigonometrici in R: tuttavia, se poniamo
ϕ(t) = 2π
∞
X
f (t + 2πn)
n=−∞
otteniamo una funzione ϕ ∈ L1 (T):
||ϕ||1 ≤ ||f ||1
e quindi possiamo calcolarne i coefficienti di Fourier:
Z
Z
Z
∞
X
1
−int
−int
ϕ(n)
b
=
ϕ(t)e
dt =
f (t + 2πm)e
dt =
f (x)einx dx
2π T
R
m=−∞ T
S
(infatti R = ∞
m=−∞ [m, m + 2π)). Osserviamo che in questa formula, n “agisce”
su x per moltiplicazione: possiamo allora definire, per ogni ξ ∈ R∗ (ovviamente
R∼
= R∗ non appena si fissi un numero reale non nullo), la trasformata di Fourier
di f ∈ L1 (R):
Z
b
f (ξ) =
f (x)eiξ(x) dx
R
Quindi ϕ
b è semplicemente la restrizione agli interi di fb. Analizziamo meglio il
legame che esiste fra trasformata di Fourier e coefficienti di Fourier: se ϕ ∈ L1 (T)
associata a f è definita come sopra, consideriamo la
ϕy (t) = 2π
∞
X
yf (ty + 2πy)
n=−∞
Allora, per definizione:
µ ¶
n
b
ϕ
cy (n) = f
y
Supponendo che la serie di Fourier di ϕy converga a ϕy (0) in 0 abbiamo che
ϕy (0) =
∞
X
ϕ
cy (n)
n=−∞
e quindi la formula di Poisson
µ ¶
∞
X
n
b
2πy
f (2πny) =
f
y
n=−∞
−∞
∞
X
Come nel caso delle serie di Fourier valgono le seguenti proprietà della trasformata di Fourier:
230
Capitolo 7. Spazi di Hilbert e teoria di Fourier
7.4.1 Proposizione Siano f, g ∈ L1 (R);
• f[
+ g(ξ) = fb(ξ) + gb(ξ).
• ∀z ∈ C
c (ξ) = z fb(ξ).
zf
• Se la traslata di x ∈ R della funzione f è la funzione fx (y) := f (y − x)
allora
fbx (ξ) = fb(ξ)e−iξ(x)
• |fb(ξ)| ≤ ||f ||1
Se f ∈ L1 (R) allora fb è uniformemente continua: infatti
¯
¯Z
¯
¯
−i(ξ+η)(x)
−iξ(x)
b
b
¯
−e
)dx¯¯
|f (ξ + η) − f (ξ)| = ¯ f (x)(e
Z
≤ |f (x)||e−iξ(x) | |e−iη(x) |dx
e |e−iξ(x) | = 1, sicché l’integrando |f (x)||e−iη(x) | tende a zero per η −→ 0 (|f (x)|
è limitato).
Definiamo ora una convoluzione sullo spazio L1 (R). Esattamente come nel
caso di L1 (T) si dimostra il seguente
7.4.2 Lemma Se f, g ∈ L1 (R) allora, per quasi ogni y ∈ R, la funzione x 7−→
f (x)g(y − x) è integrabile.
Possiamo quindi, per ogni f, g∈L1 (R) definire la loro convoluzione f ∗g∈L1 (R)
come
Z
f ∗ g(y) =
f (x)g(y − x)dx
R
Come nel caso delle serie di Fourier:
||f ∗ g||1 ≤ ||f ||1 ||g||1
7.4.3 Proposizione Rispetto alla convoluzione, lo spazio L1 (R) diviene un’algebra associativa commutativa, ed inoltre
f[
∗ g(ξ) = fb(ξ)b
g (ξ)
231
7.4. Integrale di Fourier
7.4.4 Esempio Calcoliamo la convoluzione di una funzione f ∈ L1 (R) con una
funzione g ∈ L1 (R) della forma:
Z
1
g(x) =
h(ξ)eiξ(x) dξ
2π R∗
(queste funzioni sono l’analogo dei polinomi trigonometrici7 ) ove h ∈ L1 (R∗ ). Si
ha che
Z
Z
Z
1
f ∗ g(x) = f (y)g(x − y)dy =
f (y) h(ξ)eiξ(x−y) dξdy
2π
Z
Z
1
=
h(ξ)eiξ(x) f (y)e−iξ(y) dydξ
2π
Z
1
h(ξ)fb(ξ)eiξ(x) dξ
=
2π
Quindi, se fb ∈ L1 (R∗ ) otteniamo la formula di inversione di Fourier :
Z
1
f (x) =
fb(ξ)eiξ(x) dξ
2π
(il secondo membro di questa espressione si dice antitrasformata di Fourier ).
Vogliamo ora costruire l’analogo del nucleo di Fejér nel contesto della trasformata di Fourier: consideriamo la funzione
µ
¶
Z 1
1 sin x2
1
K(x) =
=
(1 − |ξ|)eiξ(x) dξ
x
2π
2π
−1
2
La famiglia di funzioni
Ky (x) = yK(xy)
(y ∈ R) si dice nucleo di Fejér .
7.4.5 Proposizione Il nucleo di Fejér soddisfa alle proprietà seguenti:
•
1
2π
Z
Ky (x)dx = 1
7
Osserviamo che R∗ gioca il ruolo che Z ha nelle serie di Fourier: le variabili continue ξ
sostituiscono quelle discrete n, gli integrali su R∗ sostituiscono le somme su Z e cosı̀ via. Esistono comunque polinomi trigonometrici anche nel caso delle funzioni reali: vengono considerati nell’approssimazione delle funzioni quasi-periodiche, importanti ad esempio in Meccanica
Celeste.
232
Capitolo 7. Spazi di Hilbert e teoria di Fourier
• Per y −→ ∞:
||Ky ||1 = O(1)
• Per ogni δ > 0:
Z
lim
y−→∞
|x|>δ
|Ky (x)|dx = 0
Dimostrazione: Calcoliamo la norma ||.||1 di K(x), usando la nostra conoscenza del nucleo di Fejér per le serie trigonometriche: sappiamo che
Ã
!
Z δ
(n+1)x 2
sin
1
1
2
lim
dx = 1
x
N −→∞ 2π −δ N + 1
sin 2
R
R
R
R
Dato che Ky (x)dx = yK(yx)dx = K(yx)d(yx) = K(x)dx possiamo
prendere y = N + 1, ottenendo
Ã
!2
sin (n+1)x
1
2
Ky (x) =
x
2π(N + 1)
2
e quindi
µ
sin δ
δ
¶2
1
2π
Z
δ
−δ
1
N +1
Ã
!2
Z δ
sin (n+1)x
2
dx <
Ky (x)dx
sin x2
−δ
Ã
!2
Z π
sin (n+1)x
1
1
2
dx
<
2π −π N + 1
sin x2
R
Rδ
Per δ −→ 0 il numero K(x) = limy−→∞ −δ Ky (x)dx è compreso fra sin2 δ/δ 2 e
R
1. Quindi, per arbitrarietà di δ, K(x)dx = 1.
Questo calcolo implica le (1)–(3).
qed
A questo punto, come nel caso delle serie di Fourier, si trova che
lim ||f ∗ Ky (x) − f ||1 = 0
y−→∞
e si dimostra il
7.4.6 Teorema Se f ∈ L1 (R) allora
¶
Z yµ
1
|ξ| b
f = lim
1−
f (ξ)eiξ(x) dξ
y−→0 2π −y
y
(in norma ||.||1 ).
da cui si deduce un “teorema di unicità”:
233
7.4. Integrale di Fourier
7.4.7 Teorema Se f ∈ L1 (R) e per ogni ξ ∈ R∗ fb(ξ) = 0 allora f = 0.
In altri termini, se due funzioni hanno eguali trasformate di Fourier, debbono
coincidere: la trasformata di Fourier determina univocamente la funzione stessa.
Inoltre la funzione fb è nulla all’infinito:
Vogliamo ora un analogo del teorema di approssimazione di Weierstrass:
7.4.8 Teorema Le funzioni la cui trasformata di Fourier ha supporto compatto
sono un sottospazio denso in L1 (R).
Dimostrazione: Ogni funzione f ∈ L1 (R) si approssima con una famiglia {f ∗
Ky } di funzioni: dimostriamo che gli elementi di questa famiglia hanno trasformata di Fourier a supporto compatto.
Per la formula di inversione di Fourier applicata al nucleo di Fejér:
µ
¶
|ξ|
cy (ξ) = max 1 − , 0
K
y
e, dato che f[
∗ g = fbgb:
f\
∗ Ky (ξ) =
(³
1−
|ξ|
y
´
fb(ξ)
0
se |ξ| ≤ y
se |ξ| > y
Quindi queste trasformate di Fourier hanno supporto compatto.
qed
Possiamo ora dedurre il
7.4.9 Lemma (Riemann–Lebesgue) Se f ∈ L1 (R) allora
lim fb(ξ) = 0
|ξ|−→∞
Dimostrazione: Se g ha trasformata di Fourier a supporto compatto e approssima f ∈ L1 (T) per meno di ε:
||f − g||1 < ε
allora
|fb(ξ) − gb(ξ)| = |f[
− g(ξ)| ≤ ||f − g||1 < ε
Ma |b
g (ξ)| −→ 0 per |ξ| −→ ∞ avendo supporto compatto, quindi anche fb è nulla
all’infinito.
qed
Sia A(R∗ ) lo spazio delle funzioni che sono trasformate di Fourier di funzioni
1
L (R).
234
Capitolo 7. Spazi di Hilbert e teoria di Fourier
7.4.10 Teorema A(R∗ ) è un’algebra (rispetto alla moltiplicazione F G(ξ) = F (ξ)G(ξ))
di funzioni continue nulle all’infinito.
Ora consideriamo lo spazio di Hilbert L2 (R): cerchiamo un sistema ortonormale
in L2 (R), in analogia a quanto fatto nel caso di T; sia f : R −→ C una funzione
misurabile tale che
|f (x)| ≤ ce−a|x|
ove C e a sono costanti positive. Ad esempio, la funzione di Gauss
G(x) = e−
x2
2
verifica questa ipotesi.
7.4.11 Lemma Se f e xf sono in L1 (R) allora fb è derivabile e
[
fb0 = −ixf
Dimostrazione: Basta derivare fb:
Z
Z
d
0
−iξ(x)
b
f (ξ) =
f (x)e
dx = −i xf (x)e−iξ(x) dx
dx
qed
In generale, se f, xf, x2 f, ..., xn f ∈ L1 (R) allora fb sarà derivabile n volte:
\n f
fb(n) = (−ix)
7.4.12 Teorema Le funzioni
f (x), xf (x), x2 f (x), ..., xn f (x), ...
sono un sistema completo in L2 (R).
Dimostrazione: Assumiamo il contrario: allora, per il teorema di Hahn–Banach,
deve esistere una funzione non nulla h ∈ L2 (R) tale che, per ogni n ∈ N:
Z
xn f (x)h(x)dx = 0
R
Ovviamente f h ∈ L1 (R) e quindi anche ea1 |x| f h ∈ L2 (R) per ogni a1 < a. Ora sia
g(ξ) := fch
235
7.4. Integrale di Fourier
Allora, per il lemma, la funzione g è derivabile infinite volte: f ∈C ∞ (R), e tutte le
sue derivate sono nulle in 0. Ma la funzione g si prolunga ad una funzione analitica
nella striscia del piano complesso {ζ = ξ + iη | |η| < a}, perché l’integrale
Z
f (x)h(x)e−iζ(x) dx
converge e coincide, sulla parte reale della striscia, con g; quindi g è una funzione
analitica con tutte le derivate nulle in 0, sicché g(0) = 0 e, per il teorema di
unicità della trasformata di Fourier:
f (x)h(x) = 0
q.o.
Dunque h = 0 in L2 (R), che è assurdo.
qed
Questo dimostra la completezza del sistema di funzioni {xn f (x)}, ma noi
vorremmo in più un sistema ortogonale.
Nel prossimo capitolo vedremo come la trasformata di Fourier sia un isomorfismo di L2 (R) in sé, e mostreremo come costruire un sistema ortonormale: avremo
bisogno, per questo, di considerare spazi di funzioni differenziabili, che non sono
spazi di Banach, e che necessitano di una teoria a parte.
Capitolo 8
SPAZI VETTORIALI TOPOLOGICI
Gli spazi di Hilbert e Banach hanno come esempi principali gli spazi di funzioni sommabili e gli spazi di funzioni continue: tuttavia esiste un’altra classe di
spazi vettoriali molto importanti in Analisi, gli spazi di funzioni differenziabili,
per i quali non è possibile trovare una struttura hilbertiana o di Banach. Per
ovviare a questo inconveniente di solito si considerano sottospazi di questi spazi
che siano di Hilbert, ad esempio nella teoria delle equazioni a derivate parziali si considerano gli spazi di Sobolev. Tuttavia è possibile dare una teoria per
spazi vettoriali topologici non di Banach, i cui esempi sono gli spazi delle funzioni differenziabili: la teoria della dualità di questi spazi conduce al concetto di
distribuzione, che generalizza quello di funzione e di misura.
8.1
Topologie e seminorme
Gli spazi di Hilbert e, più in generale, gli spazi normati, sono al tempo stesso
spazi vettoriali e spazi topologici, e la loro struttura vettoriale è compatibile con
quella topologica, nel senso che le funzioni di somma fra vettori e moltiplicazione
per uno scalare sono continue; questo suggerisce la seguente definizione:
8.1.1 Definizione Se X è uno spazio vettoriale sul campo fissato1 K e T una
topologia sull’insieme X, la coppia (X, T ) si dice uno spazio vettoriale topologico
se le applicazioni di addizione e prodotto per uno scalare sono continue.
Una base U0 di intorni dell’elemento zero 0 ∈ X gode delle proprietà seguenti
• U0 determina la topologia di X: infatti se x0 ∈X, la continuità della somma
implica immediatamente che {x0 + U |U ∈ U0 } è una base di intorni di x0 ,
ovvero, la traslazione per un certo vettore di un intorno dello zero fornisce
un intorno del vettore dato.
1
Per noi il campo K sarà sempre C o R.
236
237
8.1. Topologie e seminorme
• Ogni intorno dello zero U ∈ U0 è un insieme assorbente, il che significa che
∀x ∈ X ∃k ∈ R \ {0} kx ∈ U
il che segue immediatamente dalla continuità del prodotto per uno scalare.
è ovvio che possiamo scegliere una base U0 di intorni dello zero di X tale che
ogni suo elemento sia un insieme equilibrato, vale a dire tale che
∀U ∈ U0 ∀k ∈ R |k| ≤ 1 ⇒ kU ⊂ U
8.1.2 Definizione Uno spazio vettoriale topologico di dice localmente convesso
se esiste una base U0 di intorni dello zero convessi, cioè tali che
∀U ∈ U0 ∀x, y ∈ X ∀a, b ∈ R+
a + b = 1 ⇒ ax + by ∈ U
Una conseguenza immediata di questa definizione è che in uno spazio localmente convesso esiste sempre una base di intorni dello zero convessi ed equilibrati.
Finora gli unici esempi che conosciamo di spazi vettoriali topologici sono gli
spazi normati, nei quali la topologia è indotta da una metrica; vedremo fra breve
tuttavia degli esempi di spazi vettoriali topologici non normati: gli spazi delle
funzioni differenziabili.
In generale, se F (S) è un insieme di funzioni da un insieme qualsiasi S in R
o C munito di somma e prodotto per scalari definiti punto per punto, la stessa
base di intorni rende F (S) uno spazio localmente convesso.
In generale uno spazio vettoriale topologico non è di Hausdorff (lo sono
certamente gli spazi normati, perché metrizzabili):
8.1.3 Proposizione In ogni spazio vettoriale topologico X esiste un sottospazio
X0 tale che
• Ogni intorno non vuoto di un punto x ∈ X contiene l’insieme x + X0 .
• Lo spazio quoziente X/X0 (con la topologia quoziente2 è di Hausdorff.
Dimostrazione: Definiamo
X0 :=
\
U
U ∈U0
come intersezione degli intorni (non vuoti!) dello zero; allora X0 è ovviamente
(per continuità delle operazioni di somma e prodotto) un sottospazio di X che
verifica la (1).
2
Che ovviamente lo rende uno spazio vettoriale topologico.
238
Capitolo 8. Spazi vettoriali topologici
Se x, y∈X/X0 deve esistere un intorno U ⊂ X/X0 dello zero che non contenga
x − y e, per continuità della somma, deve quindi esistere un intorno V ⊂ X/X0
dello zero tale che V − V ⊂ U : allora x + V e y + V sono intorni disgiunti che
contengono x e y.
qed
Se la topologia di uno spazio vettoriale topologico è indotta da una distanza
d(x, y), allora possiamo definire la funzione q : X −→ R+ come
q(x) := d(0, x)
osserviamo che in questa situazione lo spazio è certamente separabile (si sfrutta
la densità di Q+ in R+ ).
Un’altra osservazione immediata è che se la funzione q determina la metrica,
cioè se vale la
∀x, y ∈ X d(x, y) = q(x − y)
allora la funzione q è simmetrica, subadditiva e non degenere, cioè verifica le
relazioni
(Q)
q(x) = q(−x)
q(x + y) ≤ q(x) + q(y)
q(x) = 0 ⇒ x = 0
Viceversa, se X è uno spazio vettoriale topologico metrizzabile e q : X −→ R
una funzione soddisfacente alle relazioni (Q) e tale che d(x, y) = q(x − y) per una
distanza che induca la topologia di X allora q si dice quasinorma compatibile per
X.
8.1.4 Definizione Uno spazio vettoriale topologico localmente convesso, metrizzabile e completo si dice spazio di Fréchet.
L’esempio principale è quello degli spazi di funzioni differenziabili; le topologie
che vi introdurremo sono definite in termini di seminorme.
Osserviamo che la definizione di seminorma, di funzionale di Minkowski ed il
teorema di Hahn–Banach che abbiamo discusso nel capitolo precedente valgono
per ogni spazio vettoriale reale (o complesso), quindi possiamo darle per uno
spazio vettoriale topologico.
Se S è una famiglia di seminorme in uno spazio vettoriale X, possiamo
considerare la topologia T (S) generata dalla sottobase di aperti
Up,ε (x) := {y ∈ X | p(x − y) < ε}
al variare di x ∈ X, p ∈ S e ε > 0. Si dice che S è una sl sottobase di seminorme
per X.
Osserviamo che
239
8.1. Topologie e seminorme
8.1.5 Proposizione La topologia T (S) su X è di Hausdorff se e solo se
∀x ∈ X ∀p ∈ S
p(x) = 0 ⇒ x = 0
8.1.6 Definizione Se X è uno spazio vettoriale topologico la cui topologia coincida con T (S), l’insieme S si dice base di seminorme per X se
• Per ogni p ∈ S, λ ∈ R+ : λp ∈ S.
• Per ogni p1 , p2 ∈ S esiste p ∈ S tale che
∀x ∈ X
p1 (x) ≤ p(x) e p2 (x) ≤ p(x)
8.1.7 Teorema X è uno spazio vettoriale localmente convesso se e solo se è uno
spazio vettoriale topologico la cui topologia sia definita da una base di seminorme
ed è di Hausdorff. Se S e S 0 sono basi di seminorme per le topologie T e T 0 su
X allora la topologia T 0 è più fine di T se e solo se ogni seminorma di S è
maggiorata da qualche seminorma di S 0 .
Dimostrazione: Osserviamo intanto che se S0 è una famiglia di seminorme
l’insieme dei multipli positivi delle somme finite di elementi di S0 è una base di
seminorme per T (S0 ). ora sia S una base di seminorme; una base di intorni dello
0 ∈ X è data dagli aperti
US (0) := {Bp }p∈S
ove Bp := {x ∈ X | p(x) < 1}. Ovviamente si tratta di una base di intorni, e, per
ogni x, x0 ∈ X, λ, λ0 ∈ R e p ∈ S:
p(λx − λ0 x0 ) ≤ |λ|p(x − x0 ) + |λ − λ0 |p(x0 )
il che prova che la topologia definita da US (0) rende X uno spazio vettoriale
topologico, localmente convesso perché le p sono seminorme.
Viceversa, se X è localmente convesso e U(0) è una base invariante per
omotetie di intorni dello 0 convessi ed equilibrati, i funzionali di Minkowski
S := {pB }B∈U(0)
sono ovviamente una base di seminorme per la topologia di X perché gli elementi
di U(0) sono aperti e x ∈ B ⇐⇒ pB (x) < 1.
Dimostriamo la seconda parte del teorema: che la condizione sia sufficiente
è ovvio. Ma T è meno fine di T 0 se e solo per ogni intorno convesso equilibrato
dello zero U ∈ T contiene un intorno convesso equilibrato dello zero U 0 ∈ T 0 ,
sicché
pU 0 (x) < 1 ⇒ pU (1) < 1
240
Capitolo 8. Spazi vettoriali topologici
Per ogni ε > 0 si ha allora che pU ((pU 0 (x) + ε)−1 x) < 1 e quindi
∀x ∈ X
pU (x) < pU 0 (x) + ε
Per arbitrarietà di ε si ha che pU ≤ pU 0 .
qed
Se Ω ⊂ Rn è un aperto, lo spazio vettoriale C ∞ (Ω) delle funzioni infinitamente
differenziabili su Ω è uno spazio vettoriale topologico, la cui topologia è indotta
dalle seminorme
pKi (f ) := max |∂ i f (x)|
x∈K
ove K ⊂ Ω è un compatto e i = (i1 , ..., ih ) un multiindice rispetto al quale si
effettuano le derivate parziali che figurano nella definizione (cioè si deriva ik volte
rispetto alla variabile xk ).
8.1.8 Teorema Lo spazio C ∞ (Ω) è di Fréchet.
Dimostrazione: Dimostriamo che la topologia di C ∞ (Ω) è indotta da una
famiglia numerabile di seminorme. Sia
½
¾
1
Km := x ∈ Ω | d(x, ∂Ω) ≥
e d(x, 0) ≤ m
m
S
o
Ovviamente Km è compatto, Km ⊂−→ Km+1 e m Km = Ω. Definiamo le
seminorme
pm (f ) := sup sup |∂ i f (x)|
x∈Km |i|≤m
Se K ⊂ Ω è un qualsiasi compatto allora la funzione δ(x) := d(x, ∂Ω) è continua
e positiva su K, dunque ha un minimo δ0 su K; analogamente la funzione ∆(x) =
d(x, 0) assume un massimo ∆0 su K. Allora scegliamo m in modo che
1
< δ0
m
e
∆0 < m
Con questa scelta di m si ha che Km ⊂ K e, se |i| ≤ m, la seminorma
pK,i è
P
p
maggiorata da pm . Che poi ogni seminorma pm sia maggiorata da m
i=0 Km ,i è
ovvio.
Quindi la topologia di C ∞ (Ω) è generata dalle {pm }, ed in particolare lo
spazio è metrizzabile.
Ora proviamo che C ∞ (Ω) è completo. Se {fn } è una successione di Cauchy,
il che significa che è di Cauchy rispetto a qualsiasi seminorma pm che genera
la topologia di C ∞ (Ω). Ma allora la restrizione di {fn } a Kn è una successione
di Cauchy di funzioni definite sul compatto Km : ora sfruttiamo il fatto che lo
241
8.1. Topologie e seminorme
spazio delle funzioni differenziabili C ∞ (K) su un compatto K ⊂ Rn è di Banach
rispetto alla norma
||f ||C ∞ := sup sup |∂ i f (x)|
x∈K
i
come si constata facilmente (la convergenza in questo spazio è la convergenza
uniforme della f e di tutte le sue derivate parziali). Dunque esiste una funzione
Fm ∈ C ∞ (K) alla quale la successione ristretta a Km converge. Per definizione
di Km le funzioni Fm cosı̀ definite coincidono sulle intersezioni Km ∩ Kl e quindi
inducono una funzione F ∈ C ∞ (Ω) tale che, per definizione,
lim pm (fn − Fm ) = 0
n−→∞
qed
In C (Ω) è contenuto lo spazio
delle funzioni differenziabili a supporto
compatto. Non si tratta di un sottospazio chiuso, quindi non è certo completo per
la topologia indotta da quella di C ∞ (Ω). Definiamo ora su Cc∞ (Ω) una topologia
più forte di quella indotta da C ∞ (Ω).
Se Km è il sistema di compatti definito nella dimostrazione del teorema
precedente, ad ogni successione N = {Nn } di numeri naturali associamo la
seminorma
∞
X
pN (f ) :=
Nm
sup
sup |∂ i f (x)|
∞
Cc∞ (Ω)
m=1
x∈Km \Km−1 |i|≤Nm
(assumiamo K0 := ∅).
8.1.9 Teorema Lo spazio Cc∞ (Ω) è completo e non metrizzabile.
Dimostrazione: Consideriamo una successione di Cauchy {fn }; dimostriamo
∞
allora che tutte le funzioni fn appartengono a CK
(Ω), ove K è un fissato compatto
∞
∞
e CK (Ω) denota lo spazio delle funzioni f ∈ C (Ω) a supporto in K: si tratta di
un sottospazio di Fréchet di C ∞ (Ω), quindi la successione {fn } dovrà convergere
∞
ad un elemento di CK
(Ω) ⊂ C ∞ (Ω) col che avremo la prima parte del teorema.
Per assurdo supponiamo dunque che i supporti delle {fn } non stiano in nessun
compatto K fissato. Possiamo supporre (a meno di rinumerare le {fn }) che sia
supp fm ∈
/ Km , i.e. che esista xm ∈
/ Km con fm (xm ) 6= 0. Allora se
¾
½
|fm (xm )|
∞
V := f ∈ Cc (Ω) | ∀m ≥ 1 |f (xm )| ≤
m
∞
l’intersezione V ∩ CK
(Ω) è aperta (dato che ogni compatto K contiene solo un
numero finito di xm e quindi questa intersezione è intersezione finita di aperti) i.e.
V è aperto in Cc∞ (Ω). Se pV è il funzionale di Minkowski di V allora, dato che V
242
Capitolo 8. Spazi vettoriali topologici
è equilibrato e convesso, pV è una seminorma continua in Cc∞ (Ω), precisamente
la
¯
¯
¯ mf (xm ) ¯
¯
pV (f ) = sup ¯¯
fm (xm ) ¯
m
∞
Quindi m ≤ pV (fm ) e la successione di Cauchy {fn } non converge in CK
(Ω) il
che è assurdo.
Dunque lo spazio Cc∞ (Ω) è completo nella sua topologia. Dimostriamo che
però non è metrizzabile. Se lo fosse, infatti, presa una sua successione {fm } tale
che supp fm ∈
/ Km dalla continuità della moltiplicazione per uno scalare si deduce
che esiste un numero δm > 0 tale che d(0, δm fm ) < 1/m e quindi la successione
{δm fm } tende a zero; ma si è visto nelle dimostrazione della prima parte che
questo non è possibile a meno che tutte le funzioni {fn } appartengano ad un
∞
medesimo spazio CK
(Ω) per un compatto K fissato. L’assurdo prova che Cc∞ (Ω)
non è metrizzabile.
qed
∞
n
p
n
Si può dimostrare che lo spazio Cc (R ) è denso in L (R ) per 1 ≤ p < ∞
ed in C ∞ (Rn ). Limitiamoci qui a fornire un esempio di funzione appartenente a
Cc∞ (R):
(
exp x22−1 se |x| < 1
f (x) =
0 se |x| ≥ 1
Funzioni di questo tipo sono considerate nella costruzione di partizioni dell’unità
e nello studio delle trasformate di Fourier e delle convoluzioni negli spazi di
funzioni differenziabili.
8.2
Dualità e topologie deboli
8.2.1 Definizione Due spazi vettoriali X e Y su K si dicono in dualità se esiste
una forma bilineare
h, i : V × W −→ K
tale che
∀x ∈ X (∀y ∈ Y
∀y ∈ Y (∀x ∈ X
hx, yi = 0) ⇒ x = 0
hx, yi = 0) ⇒ y = 0
Evidentemente una dualità fra X e Y induce due applicazioni lineari
X −→ Y ∗
x 7−→ (y 7−→ hx, yi)
e
Y −→ X ∗
y 7−→ (x 7−→ hx, yi)
243
8.2. Dualità e topologie deboli
La forma bilineare h, i si dice fortemente non degenere se queste mappe sono
isomorfismi: in questo caso X = Y ∗ .
Se X e Y sono in dualità possiamo considerare una topologia su X, la
σ(X, Y )-topologia, che è per definizione la topologia debole rispetto alle applicazioni
{x 7−→ hx, yi}y∈Y
Questa topologia è indotta dalla base di seminorme {pF }F ⊂Y
X
pF (x) :=
|hy, xi|
finito
ove
y∈F
8.2.2 Lemma Se X è uno spazio vettoriale topologico localmente convesso e
F un funzionale lineare, allora F è continuo se e solo se per ogni base S di
seminorme della topologia di X esiste p ∈ S tale che
∀x ∈ X
|F (x)| ≤ p(x)
Dimostrazione: Che la condizione sia sufficiente è ovvio. Se poi F è un funzionale lineare continuo, la x 7−→ |F (x)| è una seminorma continua per X, quindi
vale la condizione dell’enunciato.
qed
8.2.3 Proposizione Se X e Y sono spazi vettoriali in dualità e F è un funzionale lineare su X allora sono equivalenti le
• ∃y ∈ Y ∀x ∈ X F (x) = hy, xi.
• F è continuo nella σ(X, Y )-topologia.
Dimostrazione: Che (1) implichi (2) è ovvio. Se vale la (2), per il lemma deve
esistere un F = {y1 , ..., yn } ⊂ Y finito tale che
∀x ∈ X
|F (x)| ≤ pF (x)
i.e.
∀x ∈ X
hy1 , xi = ... = hyn , xi = 0
da cui F (x) = 0 per dualità. Quindi se M è il sottospazio vettoriale di Kn
generato dai vettori {(hy1 , xi, ..., hyn , xi)}x∈X deve esistere un funzionale lineare
f ∈ M ∗ tale che il diagramma
x NNN / (hy1 , xi, ..., hyn , xi)
NNN
NNN
NNN
NN'
²
f
F (x)
244
Capitolo 8. Spazi vettoriali topologici
sia commutativo. Ma ogni tale funzionale f è determinato univocamente da un
vettore v = (v1 , ..., vn ) ∈ Rn in modo che
f (r1 , ..., rn ) =
n
X
vi c i
i=1
e quindi
F (x) =
n
X
vi hyi , xi = hy, xi
i=1
qed
Ovviamente possiamo definire per uno spazio vettoriale topologico qualsiasi,
proprio come avevamo fatto per gli spazi normati, lo spazio X ∗ duale topologico
dei funzionali lineari continui su X.
Per ogni funzionale f ∈ X ∗ esiste la forma bilineare fra X e X ∗ :
x 7−→ hf, xi := f (x)
che è una dualità fra X e X ∗ :
∀x ∈ X
hf, xi = 0 ⇒ f = 0
8.2.4 Definizione Su uno spazio vettoriale topologico la topologia debole è la
σ(X, X ∗ )-topologia e la topologia *-debole è la σ(X ∗ , X)-topologia.
Infatti dato che X ,→ X ∗∗ la dualità fra X e X ∗ induce una dualità fra X ∗ e
X: si noti che ciascuna di queste dualità è fortemente non degenere se e solo se
lo spazio X è riflessivo.
Il nome della topologia debole viene dal fatto (evidente) che si tratta di
una topologia più debole di quella di X. Per la caratterizzazione precedente dei
funzionali lineari e continui abbiamo che
8.2.5 Proposizione Un funzionale lineare su X è continuo se e solo se è debolmente continuo.
8.2.6 Definizione Se X e Y sono spazi vettoriali in dualità, il polare di un
sottoinsieme E ⊂ X è il sottoinsieme di Y :
E o := {y ∈ Y | ∀x ∈ X Rehy, xi ≤ 1}
(La parte reale è ovviamente superflua nel caso K = R).
Ovviamente:
245
8.2. Dualità e topologie deboli
8.2.7 Proposizione Il polare è un insieme convesso, chiuso nella σ(Y, X)-topologia,
contenente lo zero e tale che E ⊂ E oo .
In particolare, se X è localmente convesso, il polare E o ⊂ X ∗ è *-debolmente
chiuso e se F ⊂ X ∗ il polare F o ⊂ X è debolmente chiuso. Se E ⊂ X allora
o
evidentemente E = E o .
Prima di affrontare il risultato principale sui polari, diamo alcuni lemmi sulla
convessità, che sono in realtà corollari del teorema di Hahn–Banach, applicato a
spazi vettoriali topologici.
8.2.8 Lemma Sia X uno spazio vettoriale topologico localmente convesso e K
un chiuso convesso in X contenente l’origine. Allora se 0 ∈ K, per ogni x0 ∈
/K
esiste un funzionale lineare continuo F su X tale che Re f (x0 ) > 1 ma
∀x ∈ X
Re f (x) < 1
(nel caso K = R la parte reale è superflua).
Dimostrazione: Dato che per ipotesi {K è aperto, deve esistere un intorno V
di 0 tale che x0 + V ⊂ {K; ma la topologia di X è localmente convessa, quindi
V può scegliersi convesso ed equilibrato, sicché x0 + V ∩ K = ∅ implica
1
1
x0 + V ∩ K + V = ∅
2
2
1
Ora, U := K + 2 U è aperto (essendo unione di aperti) e convesso, dato che, se
k1 , k2 ∈ K, v1 , v2 ∈ V e a + b = 1 (a, b > 0):
µ
¶
µ
¶
1
1
av1 + bv2
a k1 + v1 + b k2 + v2 = ak1 + bk2 +
∈U
2
2
2
Ma x0 ∈
/ U e, se M := Rx0 e pU è il funzionale di Minkowski di U , allora per
f0 : M −→ R
rx0 7−→ rpU (x0 )
(r ∈ R) si ha che
f0 (x0 ) = pU (x0 ) > 1
(perché x0 ∈
/ U) e
∀x ∈ M
f0 (x) ≤ pU (x)
Ora per il teorema di Hahn–Banach esiste un funzionale lineare f su X che
estende f0 ed è maggiorato dalla seminorma pU . Ma per definizione pU ≤ 1 su
U , quindi su U la tesi è verificata. Infine usiamo la linearità di f per ottenere:
|f (x)| ≤ (pU (x) + pU (−x)) = p(x)
i.e. la continuità di f .
qed
246
Capitolo 8. Spazi vettoriali topologici
8.2.9 Teorema del bipolare Se X è uno spazio vettoriale topologico localmente convesso e K ⊂ X è un insieme convesso contenente l’origine di X allora la
chiusura di K nella topologia di X coincide con la chiusura nella topologia debole
e si ha
deb
K = K = K oo
(i polari si riferiscono alla dualità fra X e X ∗ ).
oo
Dimostrazione: Dato che K ⊂ K = K oo e K oo è debolmente chiuso, basta
dimostrare che K oo ⊂ K.
Sia x ∈
/ K; allora, per il lemma, esiste f ∈ X ∗ tale che
∀x ∈ K
Rehf, xi < 1
o
/ K oo .
i.e. f ∈ K = K o e Rehf, x0 i > 1 cioè x0 ∈
qed
Osserviamo che se f : X −→ Y è una mappa lineare continua fra spazi
vettoriali topologici, possiamo definirne al solito modo la trasposta come
f ∗ :Y ∗ −→ X ∗
ψ 7−→ (x 7−→ ψ(f (x)))
che è ovviamente lineare e continua (consideriamo i duali topologici).
8.2.10 Teorema Se f : X −→ Y è una mappa lineare continua e iniettiva fra
spazi vettoriali topologici allora
ker f ∗ = (im f )o
Dimostrazione: Se consideriamo le dualità h, i fra X e X ∗ , e Y e Y ∗ , ovviamente:
∀x ∈ X ∀ψ ∈ Y ∗ hψ, f (x)i = hf ∗ (ψ), xi
perciò, se ψ ∈ (im f )o allora per ogni x ∈ X: hf ∗ (ψ), xi = 0 e quindi f ∗ (ψ) = 0;
viceversa, se ψ ∈ ker f ∗ allora per ogni x ∈ X; hf ∗ (ψ), xi = 0, dunque ψ⊥ im f .
qed
8.2.11 Corollario Una mappa lineare continua f : X −→ Y fra spazi vettoriali
topologici, ove Y sia localmente convesso, è biunivoca se e solo se im f è denso
in Y .
Dimostrazione: Per il teorema di Hahn–Banach: se M 6= Y è un sottospazio
vettoriale di Y allora esiste un funzionale lineare continuo non identicamente
nullo che si annulla identicamente su M ; quindi se im f non è denso, esiste un
funzionale ψ ∈ Y ∗ non nullo che si annulla su im f , i.e. tale che f ∗ (ψ) = 0.
qed
247
8.2. Dualità e topologie deboli
Il seguente fondamentale teorema sancisce la compattezza *-debole della palla
associata al funzionale di Minkowski p:
{f ∈ X ∗ | ∀x ∈ X |f (x)| ≤ p(x)}
8.2.12 Teorema (Alaoglu–Banach–Bourbaki) Se X è uno spazio vettoriale topologico localmente convesso e W un intorno convesso ed equilibrato dello
zero allora il polare W o di W in X ∗ è σ(X, X ∗ )-compatto.
Dimostrazione: Sia p il funzionale di Minkowski di W allora per x∈W : p(x) <
1, e quindi se |f (x)| ≤ p(x) la parte reale di hf, xi è ≤ 1 e f ∈ W o ; ma W è
equilibrato, cioè |hf, xi| ≤ p(x) e quindi
W o = {f ∈ X ∗ | ∀x ∈ X |f (x)| ≤ p(x)}
Dimostriamo che si tratta di un insieme *-debolmente compatto. Se, per x ∈ X:
Kx := {z ∈ C | |z| ≤ p(x)}
Si tratta ovviamente di un compatto in C, quindi, per il teorema di Tychonoff,
l’insieme
Y
K :=
Kx
x∈X
pure è compatto (nella topologia prodotto, che è quella debole rispetto alle
proiezioni px : K −→ Kx ). Se
Ψ : W o −→ K
f 7−→ (x ∈ X 7−→ f (x) ∈ Kx )
κ
evidentemente,
Q se πx : K −→ C è la proiezione che alla funzione (X −→
S
x {Kx }) ∈
X Kx associa il numero κ(x) ∈ C, allora
\ \
Ψ(W o ) =
(πzx+wy − zπx − wπy )−1 ({0})
x,y∈X z,w∈C
Ma le proiezioni πx sono continue (per definizione) e quindi lo è la funzione
πzx+wy − zπx − wπy : K −→ C; ne segue che la controimmagine tramite essa
dell’insieme chiuso {0} (cioè Ψ(W o )) è un chiuso in K, che è compatto, dunque
a sua volta un compatto. Infine osserviamo che Ψ è biunivoca e quindi 3 è un
omeomorfismo. Dunque, essendolo Ψ(W o ), anche W o è compatto.
qed
3
Una funzione biunivoca e continua da un compatto ad uno spazio di Hausdorff è un
omeomorfismo.
248
8.3
Capitolo 8. Spazi vettoriali topologici
Compattezza e convessità
8.3.1 Definizione Un insieme B ⊂ X in uno spazio vettoriale topologico si dice
limitato se per ogni intorno dello zero U ⊂ X esiste un numero C > 0 tale che
B ⊂ CU .
Dato che esiste una base di intorni chiusi dello zero, la chiusura di un insieme
limitato è limitato: in generale non si tratta di un insieme compatto, a differenza
del caso di dimensione finita (teorema di Heine–Borel). Tuttavia:
8.3.2 Teorema Un insieme compatto in uno spazio vettoriale topologico è limitato.
Dimostrazione: Se K ⊂ X è compatto e U un intorno equilibrato dello zero
allora
∞
[
K⊂
nU = X
n=0
quindi, per compattezza, esiste un insieme finito di interi {n1 , ..., nk } tali che
¶
µ
K ⊂ n1 U ∪ ... ∪ nk U = max nj U
j=1,...,k
qed
Il viceversa non è vero: ad esempio, se X è normato, l’essere un insieme
chiuso e limitato compatto implicherebbe la locale compattezza di X e quindi
dim X < ∞ (corollario 6.1.15).
8.3.3 Teorema Uno spazio X localmente convesso di Hausdorff è normato se e
solo se possiede un intorno dello zero limitato.
Dimostrazione: Se X è normato, ogni palla centrata nello zero è limitata.
Viceversa, se X è Hausdorff e localmente convesso, e se contiene©un intorno
U
ª
1
dello zero, che possiamo supporre equilibrato, allora la famiglia n U fornisce
una base di intorni dello zero in X: infatti se V è un intorno dello zero, che
possiamo assumere equilibrato, c’è un intero n > 0 tale che U ⊂ nV . Dato che
X è Hausdorff si ha
\ 1
U = {0}
n
n>0
e quindi il funzionale di Minkowski pU associato a U è in realtà una norma.
qed
In alcuni casi importanti, tuttavia, un insieme limitato ha effettivamente
chiusura compatta: ad esempio negli spazi C ∞ (Ω) e Cc∞ (Ω); per dimostrarlo
dobbiamo prima trarre una conseguenza dal teorema di Ascoli–Arzelà 3.5.2:
8.3. Compattezza e convessità
249
8.3.4 Teorema Se K è un compatto contenuto in un aperto limitato Ω di Rn
allora la mappa di restrizione, che ad una funzione f in Ω assegna la sua restrizione f |K a K trasforma insiemi limitati di C 1 (Ω) in insiemi compatti di
C(K).
Dimostrazione: Per il teorema di Ascoli–Arzelà basta dimostrare che la restrizione a K di un insieme limitato in C 1 (Ω) è equicontinuo in K (che sia limitato
è ovvio): possiamo in effetti limitarci alle palle di centro l’origine in C 1 (Ω).
Se dunque f ∈ C 1 (Ω) allora è un fatto elementare che per ogni x0 ∈ Ω esista
un r0 > 0 tale che se |x − x0 | ≤ r0 allora x ∈ Ω e
¯
¯¶
µ
¯ ∂f (y) ¯
¯
¯ |x − x0 | ≤ ||f ||1 |x − x0 |
|f (x) − f (x0 )| ≤ sup sup ¯
∂xj ¯
y∈Ω j=1,...,n
Quindi ogni palla centrata nell’origine di C 1 (Ω) è equicontinua in Ω e quindi
l’immagine di questa palla per tramite della mappa di restrizione è pure un
insieme equicontinuo in K.
qed
8.3.5 Teorema Ogni insieme chiuso e limitato in C ∞ (Ω) è compatto.
Dimostrazione: Esprimiamo Ω come unione numerabile di compatti K0 ⊂
K1 ⊂ ... tali che, se Ωi è l’interno di Ki allora Ki ⊂ Ωi+1 ; dato che in uno spazio
metrico un insieme è compatto se e solo se ha un punto di accumulazione, ci
basterà dimostrare questa proprietà. Ci servirà il
8.3.6 Lemma Per ogni i ≥ 1 ed ogni successione S limitata in C ∞ (Ki ) esiste
una sottosuccessione S1 ⊂ S tale che le restrizioni delle funzioni f ∈ S1 a Ωi−1
formino una successione convergente in C ∞ (Ki ).
Dimostriamo il lemma: che S sia limitata in C ∞ (Ki ) vuol dire che per ogni
multiindice p la successione sul campo fissato4 K e T una topologia di Hausdorff
sull’insieme V
½ p ¾
∂ f
∂xp
è equilimitata in C 1 (Ki ) e quindi, per il teorema di Ascoli–Arzelà, possiede una
∂ pf
a Ωi−1 siano
sottosuccessione S1 tale che per ogni f ∈ S1 , le restrizioni delle
∂xp
convergenti in C 1 (Ki−1 ) e, essendo la convergenza uniforme, le derivate qualsiasi
degli elementi di S1 convergono in C ∞ (Ki−1 ). Questo dimostra il lemma.
4
Per noi il campo K sarà sempre C o R.
250
Capitolo 8. Spazi vettoriali topologici
Sia ora S una successione limitata in C ∞ (Ω); la restrizione S|Ω1 dà luogo ad
una successione limitata in C ∞ (K1 ) che, per il lemma, ammette una sottosuccessione convergente in C ∞ (K0 ). Lo stesso discorso possiamo ripetere per K2 , K3 , ...
ottenendo una successione di sottosuccessioni della S:
S = S0 ⊃ S1 ⊃ S2 ⊃ ...
tale che Si |Ωi−1 converga in C ∞ (Ki−1 ); se {f1 , f2 , ...} sono i limiti di queste
sottosuccessioni in C ∞ (K0 ), C ∞ (K1 ), ... allora esistono elementi gi ∈ Si tali che
¯ p
¯
¯∂
¯ 1
sup sup ¯¯ p (gi − fi )¯¯ ≤
i
p x∈Ωi−1 ∂x
Evidentemente la successione S 0 := {gi } converge in C ∞ (Ω) ed il suo limite è
la funzione f le cui restrizioni a Ωi−1 coincidono con le fi ; quindi S 0 ⊂ S è la
sottosuccessione convergente voluta.
qed
La nozione di compattezza si rivela particolarmente interessante se combinata
con quella di convessità: se K è un compatto convesso in uno spazio vettoriale topologico localmente convesso X, per ogni f ∈ X ∗ , la funzione reale continua x 7−→ Rehf, xi assume un massimo α su K; l’iperpiano M determinato
dall’equazione lineare
Rehf, xi = α
è tangente a K, cioè, se per ogni x, y ∈ K tali che, se a, b > 0 e a + b = 1,
ax + by ∈ M allora x, y ∈ M .
Ovviamente M ∩ K è convesso e ogni convesso F ⊂ K tangente a K si dice
una faccia di K. Ad esempio, la faccia M ∩ K è compatta. Specifichiamo meglio
queste nozioni.
8.3.7 Definizione Una faccia di un convesso K è un punto k ∈ K tale che per
ogni a, b ∈ [0, 1] con a + b = 1 e k 0 , k 00 ∈ K tali che
k = ak 0 + bk 00
e
k 6= k 0 , k 6= k 00 , k 0 6= k 00
allora k 0 e k 00 giacciono su uno stesso segmento.
8.3.8 Proposizione Se K non è ridotto ad un sol punto esiste un iperpiano
tangente M tale che M ∩ K 6= K.
Dimostrazione: Basta osservare che se k, k 0 ∈K sono distinti, scegliendo f ∈X ∗
tale che
f (k 0 − k) = 1
8.3. Compattezza e convessità
251
(il che è possibile per il lemma 8.2.8) e
M = {x ∈ X | Rehf, xi = α}
ove α è il massimo di Rehf, xi su K. Se k 0 ∈ M ∩ K allora Rehf, ki = α = 1 e
K∈
/ M ∩ K.
qed
0
Se F ⊂ K è una faccia del convesso K e f ⊂ F è una faccia del convesso F
allora F 0 è una faccia di K (per definizione!).
8.3.9 Definizione I punti estremali di un convesso K costituiscono l’insieme
¯
)
(
¯
∀k 0 , k 00 ∈ K ∀a, b ∈ [0, 1] a + b = 1
¯
Extr(K) := k ∈ K ¯
¯ e k = ak 0 + bk 00 ⇒ ab = 0 oppure k 0 = k 00
In altri termini, x è un punto estremale se {x} è una faccia di K.
8.3.10 Teorema (di Krejn–Millman) Se X è uno spazio localmente convesso e K ⊂ X un sottoinsieme convesso e compatto allora
• Ogni iperpiano tangente a K contiene un punto estremale.
• L’inviluppo convesso dell’insieme Extr(K) dei punti estremali di K è denso
in K (si dice che genera K).
Dimostrazione: (1) Sia M un iperpiano tangente a K; mostriamo che F =
M ∩ K contiene una faccia chiusa minimale e quindi un punto estremale. Sia
F l’insieme delle facce chiuse di K contenute in F . Ovviamente è un insieme
parzialmente ordinato rispetto alla relazione di inclusione, ma, di più, soddisfa
anche le ipotesi del lemma di Zorn. Infatti, se L ⊂ F è un sottoinsieme totalmente
ordinato di F mostriamo che esiste un F0 ∈ F contenuto in ogni elemento di L;
per farlo usiamo la compattezza di K.
Si noti che L, T
essendo totalmente ordinato, verifica la proprietà dell’intersezione finita, i.e. L = F0 6= ∅. Ma F0 ∈ F, i.e. è una faccia chiusa: proprio
l’elemento minimale richiesto dalle ipotesi del lemma di Zorn (ne stiamo applicando una versione “dualizzata” in cui si richiede che ogni sottoinsieme totalmente
ordinato abbia un minimo per dedurre l’esistenza di un elemento minimale). L’elemento minimale fornito dal lemma di Zorn è il punto estremale di K richiesto
dalla tesi.
(2) Sia K0 l’inviluppo convesso di Extr(K), ovvero il più piccolo convesso di
X contenente Extr(K) (i.e. l’intersezione di tutti questi convessi); allora K0 è
252
Capitolo 8. Spazi vettoriali topologici
formato dalle combinazioni convesse finite di punti estremali di K. Supponiamo
che 0 ∈ K0 (a meno di traslare possiamo sempre farlo).
Per il teorema del bipolare K = K oo e quindi basta dimostrare
K ⊂ K0oo
per avere la tesi (dato che K0 ⊂ K implica K0oo ⊂ K), ovvero basta dimostrare
che
K0o ⊂ K o
Sia dunque f ∈ K0o , i.e. f ∈ X ∗ tale che
∀x ∈ K0
Rehf, xi ≤ 1
e consideriamo il minimo β della funzione (reale e continua) x 7−→ Rehf, xi
sull’insieme compatto K; vogliamo dimostrare che f ∈ K o , ovvero che β ≤ 1.
Ma l’iperpiano di equazione Rehf, xi = β è tangente a K, quindi (per la (1)),
contiene un punto estremale xo ∈ Extr(K) ⊂ K0 . Allora
β = Rehf, x0 i ≤ 1
(dato che su K0 Rehf, xi ≤ 1).
qed
Un risultato fondamentale sugli insiemi compatti e convessi è il seguente
teorema, di grande utilità nella ricerca di soluzioni a svariati tipi di equazioni
differenziali, che enunciamo senza dimostrazione
Teorema (Del punto fisso di Schauder). Se X è uno spazio vettoriale
localmente convesso e K ⊂ X un sottoinsieme compatto e convesso allora ogni
mappa continua f : K −→ K possiede un punto fisso, i.e. esiste x0 ∈ K tale che
f (x0 ) = x0 .
Notiamo che la funzione f nel teorema di Schauder può essere non lineare:
nel risultato seguente diamo un teorema di punto fisso per una famiglia qualsiasi
di applicazioni lineari che commutino fra loro.
8.3.11 Teorema (Markov–Kakutani) Se X è uno spazio vettoriale topologico e K ⊂ X un sottoinsieme convesso e compatto, e se F è una famiglia di
applicazioni lineari continue f : X −→ X tali che
• ∀f ∈ F f (K) ⊂ K.
• ∀x ∈ X ∀f, g ∈ F f (g(x)) = g(f (x)).
253
8.3. Compattezza e convessità
allora esiste un punto fisso in K comune a tutte le funzioni della famiglia F:
∃x0 ∈ K ∀f ∈ F
f (x0 ) = x0
Dimostrazione: Siano f ∈ F e n ∈ N e poniamo
f (n) :=
1
(I + f + ... + f n )
n+1
(col prodotto f g denotiamo la composizione di applicazioni) e
Kn,f = f (n) (K)
Consideriamo la famiglia K = {Kn,f }n∈N,f ∈F . Dato che K è convesso, la (1)
implica che Kn,f ⊂ K e la (2) che
f (n) g (m) (K) = g (m) f (n) (K)
Quindi
f (n) g (m) ⊂ Kn,f ∩ Km,g
(†)
Ma K è compatto e f ∈ F continua, sicché gli elementi di K sono chiusi e la
famiglia K verifica
la proprietà dell’intersezione
T
T finita, come afferma la (†).
Quindi, K =
6 ∅. Esiste dunque un x0 ∈ K: se f ∈F mostriamo che f (x0 ) =
x0 . Basta far vedere che per ogni intorno U dello 0 in X si ha
Ma x0 ∈
T
f (x0 ) − x0 ∈ U
K, quindi esiste xN ∈ K tale che
x0 =
1
(I + f + ... + f N )xN
N
i.e.
1 N +1
1
(T
xN − xN ) ∈ (K − K)
N
N
(K − K è l’insieme degli elementi di X della forma k − k 0 con k, k 0 ∈ K). Quindi
basta dimostrare che esiste un N tale che
1
(K − K) ⊂ U
N
f (x0 ) − x0 =
Questo si vede facilmente, dato che K − K è compatto (ad esempio perché è
immagine, tramite la mappa continua (x, y) 7−→ x − y, del compatto K × K)
e quindi è limitato; la famiglia {nU }n∈N è un ricoprimento di X perché U è un
insieme assorbente, quindi esiste N tale che K − K ⊂ N U .
qed
Si noti che lo spazio X non è stato supposto localmente convesso.
254
8.4
Capitolo 8. Spazi vettoriali topologici
Distribuzioni
Consideriamo lo spazio delle funzioni C ∞ (Ω) infinitamente differenziabili in
un aperto Ω ⊂ Rn : sappiamo che è uno spazio di Fréchet, mentre il suo sottospazio Cc∞ (Ω) delle funzioni a supporto compatto non è metrizzabile pur essendo
completo. In ambedue i casi si tratta di spazi non normabili: vogliamo studiare
su essi la teoria della dualità.
8.4.1 Definizione Se Ω ⊂ Rn è un aperto, una distribuzione in Ω è un elemento
del duale topologico Cc∞ (Ω)∗ .
La nostra conoscenza della topologia di Cc∞ (Ω) ci permette immediatamente
di dare un criterio perché un funzionale lineare sia una distribuzione
8.4.2 Proposizione Se f ∈ Cc∞ (Ω)∗ , le tre seguenti affermazioni sono equivalenti:
• f è una distribuzione.
• Per ogni compatto K ⊂ Ω esistono un intero m ≥ 0 ed una costante C > 0
tali che
¯ p
¯
¯∂
¯
∞
¯
∀ϕ ∈ Cc (Ω) supp ϕ ⊂ K ⇒ |f (ϕ)| ≤ C sup sup ¯ p ϕ(x)¯¯
|p|≤m x∈Ω ∂x
• Se la successioni {∂ p /∂xp (ϕn )} ⊂ Cc∞ (Ω) convergono uniformemente a zero
(per ogni multiindice p) e se i supporti delle {ϕn } sono contenuti in K ⊂ Ω
(compatto) allora f (ϕn ) −→ 0.
8.4.3 Esempio Se X è uno spazio vettoriale topologico localmente convesso
di funzioni Ω −→ C, contenente Cc∞ (Ω), e tale che la topologia di X ristretta a
Cc∞ (Ω) sia meno fine della topologia di Cc∞ (Ω), allora, per ogni funzionale lineare
continuo f ∈ X ∗ , f |Cc∞ (Ω) è una distribuzione. Evidentemente, se Cc∞ (Ω) è denso
in E allora se f 6= g sono elementi di X ∗ , le loro restrizioni sono distribuzioni
diverse, per il teorema di Hahn–Banach.
8.4.4 Esempio Se consideriamo lo spazio X = Cc (Ω) delle funzioni continue
complesse a supporto compatto, abbiamo che ogni funzionale µ continuo su X 5
induce una distribuzione Tµ .
5
Cioè ogni misura di Radon complessa, per il teorema di Riesz–Markov che sarà dimostrato
a pagina 289.
255
8.4. Distribuzioni
In realtà, nell’esempio precedente, la mappa µ 7−→ Tµ è iniettiva (cioè una
misura può considerarsi una particolare distribuzione): questo segue dal fatto che
ogni funzione continua può approssimarsi con funzioni C ∞ a supporto compatto.
Stabiliamo dunque questo risultato.
Preliminarmente consideriamo un esempio di funzione a supporto compatto
e infinitamente differenziabile:
³
´
(
1
a exp − 1−|x|
se |x| < 1
2
ρ(x) :=
0
se |x| ≥ 1
ove la costante a è definita come
a= R
in modo che si abbia
1
´
³
1
dx
exp
−
1−|x|2
|x|<1
Z
ρ(x)dx = 1
Rn
La funzione ρ è analitica in ogni punto della palla aperta {|x| < 1} ed è ovviamente C ∞ in {|x| > 1}; verifichiamo che è C ∞ anche sul bordo {|x| = 1}. Dato
che la funzione è invariante per rotazioni basta verificarne la regolarità nel caso
n = 1, i.e. basta verificare che la funzione
(
¡ ¢
exp − 1t se t > 0
f (t) =
0 se t ≤ 0
è C ∞ . Ma questo è ovvio:
µ
¶
µ
¶
µ
¶
1
1
1
exp −
= exp −
exp −
1 − t2
2(1 − t)
2(1 + t)
Se ε > 0, una funzione C ∞ a supporto in {|x| ≤ ε} è
ρε (x) :=
ρ(εx)
εn
8.4.5 Teorema Se Ω è un aperto in Rn , ogni funzione in C(Ω) è limite di una
successione di funzioni in Cc∞ (Ω).
Dimostrazione: Consideriamo una successione di aperti {Ωi } la cui unione sia
Ω e tali che, per i ≥ 1, Ωi−1 sia compatto e contenuto in Ωi . Possiamo allora
considerare la successione numerica {di }, ove
di := d(Ωi−1 , {Ωi ) > 0
256
Capitolo 8. Spazi vettoriali topologici
e la funzione continua
1 se d(x, {Ωi ) > 3di
4
gi (x) :=
di
0 se d(x, {Ωi ) <
2
Scegliamo allora εi := di /4 e consideriamo la funzione
Z
hi (x) :=
ρεi ((x − y)gi (y)dy
Rn
Ora sia x ∈ Ωi−1 : allora, per x − y ∈ supp ρεi , si ha
d(y, {Ωi ) ≥ d(x, {Ωi ) − |x − y| ≥ di −
e quindi gi (y) = 1, i.e.
di
3di
=
4
4
Z
ρεi (x − y)dy = 1
hi (x) =
Pertanto hi |Ωi−1 = 1. Dato che le {hi } sono ovviamente a supporto compatto e
che convergono a 1 ∈ C ∞ (Ω).
Ora sia f ∈ C(Ω): è immediato che possiamo approssimarla con funzioni continue a supporto compatto: infatti hi f ∈ Cc (Ω) e, dato che f hi = f su Ωi−1 la
funzione f hi converge a f in C(Ω); se K ⊂ Ω è compatto, per i grande abbastanza
si ha K ⊂ Ωi−1 e quindi supp f ∩ K = supp(f hi ) ∩ K.
Vediamo infine che l’approssimazione può farsi effettivamente con funzioni
C ∞ : per questo basta mostrare che le funzioni f hi ∈ Cc (Ω) sono approssimabili
con funzioni Cc∞ (Ω), il che si vede considerando
Z
Fi,ε (x) :=
ρε (x − y)f (y)hi (y)dy
Rn
Derivando sotto il segno di integrale si trova immediatamente che queste sono
funzioni in Cc∞ (Ω); dimostriamo che, per ε −→ 0, la Fi,ε converge uniformemente
a f hi , col che avremo la tesi del teorema.
Dato che le f hi sono continue a supporto compatto, sono uniformemente
continue, quindi per ogni η > 0 esiste un ε > 0 tale che
e quindi, dato che
R
∀x, y |x − y| < ε ⇒ |f (x) − f (y)| < η
ρε = 1:
f (x)hi (x) − Fi,ε (x) =
Z
ρε (x − y)(f (x)hi (x) − f (y)hi (y))dy
257
8.4. Distribuzioni
pertanto
Z
|f (x)hi (x) − Fi,ε (x)| ≤ sup |f (x)hi (x) − f (y)hi (y)|
|x−y|<ε
ρε (x − y)dy ≤ η
qed
∞
Osserviamo che, se la funzione f è C nel teorema precedente, la stessa
dimostrazione ci permette di approssimarla con funzioni Cc∞ date dalle f hi .
Quindi
8.4.6 Corollario Cc∞ (Ω) è denso in C ∞ (Ω).
Avvertiamo che nel teorema seguente, col termine “misura di Radon” intendiamo
un funzionale lineare e continuo su Cc (Ω), mentre in precedenza (definizione
4.5.1) avevamo usato un’altra definizione: il già citato teorema di Riesz–Markov
9.2.2, mostrerà l’equivalenza di queste definizioni.
8.4.7 Teorema Se T è una distribuzione su Ω allora le seguenti affermazioni
sono equivalenti:
• T è una misura di Radon.
• T è continuo nella topologia su Cc∞ (Ω) indotta da quella di Cc (Ω).
• Per ogni compatto K ⊂ Ω esiste una costante C > 0 tale che
∀ϕ ∈ Cc∞ (Ω)
supp ϕ ⊂ K ⇒ |hT, ϕi| ≤ C sup |ϕ(x)|
x∈Ω
• Se una successione di funzioni {ϕn } converge uniformemente a zero e
se i supporti delle {ϕn } sono contenuti in un compatto K ⊂ Ω allora
hT, ϕn i −→ 0.
Dimostrazione: In vista della proposizione 8.4.2, l’unica cosa che dobbiamo
dimostrare per avere il teorema è che T è una (distribuzione indotta da una)
misura di Radon se e solo se vale la (1): che la condizione sia necessaria è ovvio;
se poi vale la (1), possiamo estendere T (che è continuo nella topologia indotta
da Cc (Ω)) in modo unico ad un funzionale lineare continuo su Cc (Ω) per densità
di Cc∞ (Ω) in Cc (Ω).
qed
Quindi le misure di Radon sono casi particolari di distribuzioni (storicamente
infatti i primi esempi di distribuzioni sono state le misure di Dirac); in particolare
258
Capitolo 8. Spazi vettoriali topologici
anche le funzioni possono essere viste come distribuzioni. Infatti, se f ∈ L1 (K),
con K ⊂ Ω compatto, allora il funzionale
Z
T (ϕ) :=
ϕ(x)f (x)dx
Ω
è una distribuzione (modulo uguaglianza q.o.).
Usualmente lo spazio delle distribuzioni su Ω si denota come D0 (Ω).
8.4.8 Definizione Una distribuzione T ∈ D0 (Ω) si dice svanire in un aperto
A ⊂ Ω se
∀ϕ ∈ Cc∞ (Ω) supp ϕ ⊂ U ⇒ hT, ϕi = 0
Vogliamo definire il concetto di supporto anche per le distribuzioni: per questo
necessitiamo del
8.4.9 Teorema L’unione degli aperti di Ω nei quali una distribuzione svanisce
è un aperto nel quale la distribuzione svanisce.
che è immediata conseguenza del
8.4.10 Lemma Se {Uα }α∈A è una famiglia di aperti di Ω e {Tα }α∈A una famiglia di distribuzioni sugli {Uα } e se,Sper ogni α, β ∈A, Tα |Uα ∩Uβ = Tβ |Uα ∩Uβ allora
esiste un’unica distribuzione T su α Uα tale che, per ogni α ∈ A: T |Uα = Tα .
n
Dimostrazione: Intanto ricordiamo
S che Ω ⊂ R è paracompatto e quindi esiste
un raffinamento {Vβ }β∈B di U := α Uα localmente finito. Sappiamo poi che
esiste una partizione C ∞ dell’unità subordinata al ricoprimento {Vβ }: se ϕ ∈
Cc∞ (U ), allora
X
ϕ=
gβ ϕ
β∈B
Poniamo, se αβ è tale che Vβ ⊂ Uαβ ,
hT, ϕi :=
X
hTαβ , gβ ϕi
β∈B
(la somma ha senso perché ha senso quella precedente). Questa definizione non
dipende dal raffinamento scelto, perché sulle intersezioni di elementi di {Uα }
le distribuzioni {Tα } coincidono. Dimostriamo che non dipende nemmeno dalla
partizione dell’unità {gβ }: se infatti {hγ } è un’altra partizione dell’unità subordinata al raffinamento {Wγ } localmente finito di {Uα } allora per ogni γ esiste
un indice αγ tale che Wγ ⊂ Uαγ e quindi
X
X
X
X
hTαβ , gβ ϕi =
hTαβ , gβ hγ ϕi =
hTαγ , gβ hγ ϕi =
hTαγ , hγ ϕi
β
β,γ
β,γ
γ
259
8.4. Distribuzioni
Vediamo ora che T è effettivamente una distribuzione, cioè che è un funzionale
continuo: se ϕ∈Cc∞ (K) converge a zero uniformemente (K ⊂ U compatto) allora
esiste un sottoinsieme finito B 0 ⊂ B tale che
∀β ∈ B 0
gβ ϕ = 0
e quindi gβ ϕ −→ 0 in Cc∞ (Uαβ ), i.e. hTαβ , gβ ϕi −→ 0. Quindi T è continuo in
Cc∞ (U )∗ .
L’unicità segue facilmente dal fatto che le distribuzioni {Tα } coincidono sulle
intersezioni di elementi della famiglia {Uα }.
qed
In virtù del teorema appena dimostrato, ha senso la
8.4.11 Definizione Se T è una distribuzione in Ω, il suo supporto supp T è il
complementare dell’unione di tutti gli aperti nei quali T svanisce.
8.4.12 Esempio La misura di Dirac δx0 è il funzionale che a f ∈ Cc∞ (Ω) associa
f (x0 ): il supporto della misura
R di Dirac δx0 è il singolo punto {x0 }. Il supporto
della distribuzione T (ϕ) = ϕ(x)f (x)dx è il complementare dell’insieme sul
quale f è q.o. nulla.
Dato che Cc∞ (Ω) è denso in C ∞ (Ω), possiamo identificare il duale E 0 (Ω) di
C ∞ (Ω) con un sottospazio di D0 (Ω) = Cc∞ (Ω)∗ .
Come è naturale attendersi si ha il
8.4.13 Teorema Una distribuzione T ∈ D0 (Ω) appartiene a E 0 (Ω) se e solo se
ha supporto compatto.
Dimostrazione: Se T ∈ E 0 (Ω) è una distribuzione allora, per definizione della
topologia di C ∞ (Ω), esistono un compatto K ⊂ Ω, un intero m ≥ 0 ed una
costante C > 0 tali che
¯ p
¯
¯∂
¯
∞
∀ϕ ∈ C (Ω) |hT, ϕi| ≤ C sup sup ¯¯ p ϕ(x)¯¯
x∈K ∂x
|p|≤m
e quindi, se supp ϕ ⊂ {K allora hT, ϕi = 0, i.e. supp T ⊂ K.
Viceversa, se T ∈ D0 (Ω) è una distribuzione a supporto compatto K, e se
f ∈ Cc∞ (Ω) è una funzione identicamente 1 in un intorno U di K 6 allora
∀ϕ ∈ C ∞ (Ω) hT, ϕi = hT, gϕi
6
La cui costruzione è semplicissima: se W = Ω \ U , allora {U, W } è un ricoprimento aperto
di Ω localmente finito (!) e quindi esiste una partizione dell’unità {gU , gW } ad esso subordinata:
dato che gW = 0 in U e gU + gW = 1 deve essere gW = 1 in U ; si tratta della nostra funzione
g.
260
Capitolo 8. Spazi vettoriali topologici
(supp(1 − g)ϕ ⊂ { supp T ). Ma su Cc∞ (supp g) le topologie indotte da C ∞ (Ω) e
Cc∞ (Ω) coincidono allora gϕ −→ 0 in Cc∞ (Ω) per C ∞ (Ω) e quindi la distribuzione
T è continua su Cc∞ (Ω) rispetto alla topologia indotta da C ∞ (Ω): dunque T ∈
E 0 (Ω).
qed
∞
Osserviamo ora che, per ogni m ≥ 1, C (Ω) è un sottospazio dello spazio
delle funzioni m volte differenziabili C k (Ω); un ragionamento analogo a quello
del teorema 8.4.5 mostra che Cc∞ (Ω) è denso in Ccm (Ω); ha quindi senso la
8.4.14 Definizione Una distribuzione T appartenente allo spazio Dm (Ω) =
Ccm (Ω)∗ si dice di ordine minore di m. Se T ∈ D0 (Ω) è una distribuzione ed
esiste un intero m ≥ 0 tale che T sia di ordine minore di m allora T si dice di
ordine finito.
8.4.15 Esempio Le distribuzioni di ordine (minore di) zero sono le misure di
Radon.
Sulle distribuzioni possiamo calcolare gli operatori differenziali, usandone la
dualità; ricordiamo che un operatore differenziale è una espressione della forma
X
∂p
P =
ap p
∂x
|p|≤m
con ap ∈ C ∞ (Ω) e p = (p1 , ..., pr ) è un multiinidice con |p| = p1 + ... + pr .
Ovviamente P è un operatore lineare e continuo di C ∞ (Ω) in se stesso. Vogliamo
definire il suo operatore “aggiunto”
P ∗ : D0 (Ω) −→ D0 (Ω)
Sulle distribuzioni della forma ψ = f (x)dx otteniamo, se ϕ ∈ C ∞ (Ω),
µ p
¶
Z
X Z
∂
∗
ap (x)
hP ψ, ϕi = ψ(x)P ϕ(x)dx =
ϕ(x) ψ(x)dx
∂xp
|p|≤m
Possiamo ora integrare per parti ottenendo (non ci sono integrali sul bordo ∂Ω
perché supp ϕ ⊂ Ω)
X Z
∂p
ϕ(x)(−1)|p| p (ap (x)ψ(x)) dx
∂x
|p|≤m
ottenendo
P ∗ψ =
X
|p|≤m
ϕ(x)(−1)|p|
∂p
(ap (x)ψ(x))
∂xp
261
8.4. Distribuzioni
Se vogliamo esprimerlo come operatore differenziale, scriviamo
∗
P ψ=
X
|p|≤m
dove
X
∂p
∂p
ϕ(x)(−1)
(ap (x)ψ(x)) =
bp (x) p
∂xp
∂x
|p|
|p|≤m
µ ¶ q−p
X
∂
|q| q
a (x)
bp (x) =
(−1)
p ∂xq−p q
p≤q
e dove q ≤ p significa q1 ≤ p1 , ..., qr ≤ pr e
µ ¶ µ ¶
µ ¶
q
q
q
:= 1 ... r
p
p1
pr
Abbiamo quindi un operatore differenziale lineare continuo P ∗ sullo spazio delle
distribuzioni.
8.4.16 Teorema Una distribuzione a supporto compatto ha ordine finito.
Dimostrazione: Sia T ∈ E 0 (Ω); se U ⊂ Ω ha chiusura compatta e supp T ⊂ U
allora T |U è di ordine finito. Infatti è evidente dalle definizioni che la topologia
di Cc∞ (Ω) è l’intersezione delle topologie di Ccm (Ω) e quindi la restrizione di T a
U è continua in Cc∞ (U ) nella topologia indotta da Ccm (U ) per qualche m ≥ 0, e
quindi è continua su Cc∞ (U ) ⊂ Cc∞ (U ); ma la topologia di Ccm (U ) è più fine di
quella indottavi da Ccm (U ), dunque T è continua su Cc∞ (U ) rispetto alla topologia
indotta da Ccm (U ): ioè T |U ∈ Dm (U ).
Ma T = 0 su { supp T e quindi T è di ordine finito in tutto Ω.
qed
Concludiamo questa introduzione alla dualità negli spazi C m (Ω) dimostrando
la proprietà fondamentale delle distribuzioni di ordine finito.
8.4.17 Teorema Se T è una distribuzione di ordine finito m < ∞ in Ω allora,
per ogni intorno aperto U di supp T esiste una famiglia di misure di Radon
{µp }p∈Nm ;|p|<m in Ω tali che
T =
X ∂p
µp
∂xp
|p|≤m
e tali che per ogni p ∈ Nn , |p| ≤ m: supp µp ⊂ U .
262
Capitolo 8. Spazi vettoriali topologici
Dimostrazione: Sia N = Nn,m il numero di multiindici p con |p| ≤ 1: esiste
allora una inclusione naturale nel prodotto
Ψm : Ccm (Ω) −→ (Cc (Ω))N
µ p ¶
∂ ϕ
ϕ 7−→
∂xp p∈Nn ,|p|≤m
Si tratta ovviamente di una applicazione lineare che, pur non essendo suriettiva, è un isomorfismo (su im Ψm ) fra spazi vettoriali topologici7 . Dato che
∼
=
Ψm : Ccm (Ω) −→ im Ψ, ogni funzionale lineare continuo su Ccm (Ω) ne determina
univocamente uno su im Ψm , che può quindi, per il teorema di Hahn–Banach,
estendersi ad un funzionale sull’intero spazio Cc (Ω)N . Ma il duale di un prodotto
diretto di spazi vettoriali topologici è canonicamente isomorfo al prodotto dei
duali8 e quindi un funzionale lineare continuo su Cc (Ω)n può identificarsi con un
insieme di N misure di Radon (λp ) su Ω tali che
X
h(λp ), (ϕp )i =
hλp , ϕp i
p∈N;|p|≤m
Questo funzionale estende il funzionale ϕ 7−→ hT, ϕi su im Ψm ; quindi, per ϕp :=
∂ pϕ
(se ϕ ∈ Ccm (Ω)):
∂xp
X
∂p
T =
(−1)|p| p λp
∂x
|p|≤m
Ora dobbiamo verificare la condizione sui supporti delle misure λp ; consideriamo
una funzione g ∈ C ∞ (Ω) che sia identicamente 1 in un intorno U di supp T
ed identicamente zero fuori da qualche chiuso contenuto in U e consideriamo il
prodotto gT : ovviamente gT = T (per definizione, hgT, ϕi = hT, gϕi) i.e.
T = gT =
X
∂p
λp
∂xp
(−1)|p| g
|p|≤m
ϕ converge a zero in Ccm (Ω) se e solo se ciascuna delle sue derivate di ordine ≤ m converge
a zero in Cc (Ω)
8
Se X1 , ..., Xn sono spazi vettoriali topologici, basta considerare l’isomorfismo
7
∗
X1∗ × ... × Xn∗ −→ (X1 × ... × Xn )
Ã
(ϕ1 , ..., ϕn ) 7−→
(x1 , ..., xn ) 7−→
n
X
i=1
!
hϕi , xi i
8.5. Trasformata di Fourier di funzioni differenziabili
263
e, per l’identità di Leibniz:
X µp ¶
∂ p λp
∂ p (gϕ)
∂ p−q g ∂ q ϕ
|p|
|p|
hg p , ϕi = (−1) hλp ,
i
=
(−1)
i
hλ
,
p
p−q ∂xq
q
∂x
∂xp
∂x
q≤p
¶
p−q
X ∂q µ
∂ g
=
h q (−1)|p−q| p−q λp , ϕi
∂x
∂x
q≤p
e quindi
∂ p λp X ∂ q
g p =
∂x
∂xq
q≤p
µ
|p−q| ∂
(−1)
p−q
g
∂xp−q
¶
λp
Sostituendo nell’espressione precedente per la T :
µ
¶
p−q
q
X X
g
|p−q| ∂
|p| ∂
(−1)
T =
λ
(−1)
q
p−q p
∂x
∂x
q≤p
|p|≤m
∂ p−q g
con i supporti delle misure
λp sono contenuti in supp g ⊂ U .
∂xp−q
qed
Da questo teorema segue che le distribuzioni di ordine ≤ m sono somme finite
di derivate al più di ordine m di misure di Radon.
8.5
Trasformata di Fourier di funzioni differenziabili
Vogliamo esemplificare alcune idee qui introdotte proseguendo la discussione
della trasformata di Fourier iniziata alla fine del capitolo precedente: tratteremo
direttamente il caso in n dimensioni.
Consideriamo quindi in Rn la dualità con Rn∗ data dal prodotto euclideo
hx, yi =
n
X
xi y i
i=1
n
1
n
Evidentemente,
se (e1 , ...,
P
Pen ) iè unan∗base di R e (e , ..., e ) una base duale, se
n
x = i xi ei ∈ R e ξ = i ξi e ∈ R :
hξ, xi =
n
X
ξ i xi
i=1
In Rn consideriamo poi la misura di Lebesgue (che è determinata univocamente
una volta che si fissi, ad esempio, una base, imponendo che il volume dell’ipercubo
264
Capitolo 8. Spazi vettoriali topologici
avente per vertici i vettori della base sia 1), che determina univocamente la misura
di Lebesgue su Rn∗ .
Definiamo ora uno spazio di funzioni “intermedio” fra Cc∞ (Rn ) e C ∞ (Rn ): si
tratta dello spazio di Schwartz S(Rn ) delle funzioni f ∈ C ∞ (Rn ) tali che, per
ogni coppia di polinomi P, Q ∈ C[X1 , ..., Xn ]
¯
¯
µ ¶
¯
¯
∂
¯
sup ¯P (x)Q
f (x)¯¯ < ∞
∂x
x∈Rn
Oltre ad essere (come è ovvio) uno spazio vettoriale, S(Rn ) è localmente convesso
rispetto alla famiglia di seminorme
¯
¯
µ ¶
¯
¯
∂
¯
p(f ) := sup ¯P (x)Q
f (x)¯¯
∂x
x∈Rn
Osserviamo che gli elementi di S(Rn ) si dicono anche funzioni a decrescenza
rapida nel senso che tutte le loro derivate tendono a zero (per |x| −→ ∞) più
velocemente di ogni potenza di |x|−1 . Infatti la condizione p(f ) < ∞ equivale
alla
¯ p
¯
¯
¯
k¯ ∂
lim |x| ¯ p f (x)¯¯ = 0
|x|−→∞
∂x
per ogni multiindice p ed ogni intero k ≥ 0. Una famiglia di seminorme per la
topologia di S(Rn ) è
¯ p
¯¶
µ
¯
¯
k¯ ∂
|f |m,k = sup sup (1 + |x|) ¯ p f (x)¯¯
∂x
|p|≤m x∈Rn
Cosı̀ lo spazio S(Rn ) è metrizzabile; osserviamo che la sua topologia è più fine di
quella indotta da C ∞ (Rn ).
Una successione {fi } ⊂ S(Rn ) tende infatti a zero se e solo se le funzioni
¯ p
¯
¯
¯
k¯ ∂
(1 + |x|) ¯ p fi (x)¯¯
∂x
convergono uniformemente (ovunque in Rn ) a zero per ogni k e p. In particolare
questo implica la convergenza uniforme delle derivate e quindi della successione
{fi } in C ∞ (Rn ).
8.5.1 Teorema S(Rn ) è uno spazio di Fréchet.
Dimostrazione: Dobbiamo mostrare la completezza della topologia di S(Rn );
se {fi } è una successione di Cauchy in S(Rn ), a maggior ragione lo è in C ∞ (Rn )
8.5. Trasformata di Fourier di funzioni differenziabili
265
e quindi converge ad una f ∈ C ∞ (Rn ). Dato che la successione è di Cauchy, per
ogni m e k, esiste un intero N = Nm,k tale che
∀i ≥ N
|fi − fN |m,k ≤ 1
e quindi
∀i |fi |m,k ≤ 1 + sup |fj |m,k
j=1,...,N
i.e. esiste una costante Mm,k tale che
∀i |fi |m,k ≤ Mm,k
In altri termini
∀x ∈ R
n
¯ p
¯
¯∂
¯
Mm,k
¯
sup ¯ p fi (x)¯¯ ≤
(1 + |x|)k
|p|≤m ∂x
Ma le derivate delle fi convergono uniformemente alle corrispondenti derivate
della f e quindi
¯ p
¯
¯∂
¯
Mm,k
n
∀x ∈ R
sup ¯¯ p f (x)¯¯ ≤
(1 + |x|)k
|p|≤m ∂x
Quindi f ∈ S(Rn ); che, infine, la convergenza avvenga anche nella topologia di
S(Rn ) è ovvio.
qed
Ovviamente, sebbene abbiamo considerato la scelta di una base per definire
la topologia di S(Rn ) la definizione è intrinseca.
Osserviamo che, se f ∈ S(Rn ) allora anche
x 7−→ e−2πihξ,xi f (x)
(per ξ fissato) è a decrescenza rapida. Possiamo ripetere allora una definizione
che già conosciamo per L1 (R):
8.5.2 Definizione La trasformata di Fourier di una funzione f ∈ S(Rn ) è la
funzione
Z
fb(ξ) :=
e−2πihξ,xi f (x)dx
Rn
Notiamo il fattore 2π: nel caso n = 1 lo avevamo inglobato nel prodotto
scalare (che era semplicemente il prodotto di numeri reali).
Ricordiamo le seguenti proprietà seguenti della trasformata di Fourier:
266
Capitolo 8. Spazi vettoriali topologici
8.5.3 Proposizione Se f, g ∈ S(Rn ):
• f[
+ g = fb + gb.
c = afb per a ∈ C.
• af
• fb(ξ) = fb(−ξ) (complessa coniugata).
• Se fy (x) := f (x − y) allora fby (ξ) = fb(ξ)e−2πihξ,yi .
8.5.4 Esempio Calcoliamo la trasformata di Fourier della funzione
f (x) = e−ax
2
in S(R) (con a costante). Per definizione
Z
2
b
f (ξ) =
e−ax −2πiξx dx
R
e l’integrando è una funziona olomorfa intera, che tende a zero lungo ogni retta
parallela all’asse reale del piano complesso; quindi, per il teorema di Cauchy9 ,
l’integrale non cambia valore se l’integrazione è svolta non lungo l’asse R ma
lungo un suo traslato Ry {x + iy}x∈R per y fissato: quindi
Z
Z
2 −2πiξx
2
−ax
fb(ξ) =
e
dx =
e−a(x+iy) −2πiξ(x+iy) dx
Ry
R
Z
2
2
= eay +2πξy e−ax −2aixy−2πiξx dx
ZR
2
2
= eay +2πξy e−ax −2ix(ay+πξ) dx
R
Ora consideriamo y costante in modo che nell’esponente della funzione integranda
la parte immaginaria, ponendo cioè y = −πξ/a e ricordando che
p
R scompaia
−ax2
π/a (cfr. appendice al paragrafo 8.5.1):
e
dx
=
R
r
Z
(πξ)2
(πξ)2
(πξ)2
π
2
a
−2
−ax
−
a
fb(ξ) = e a2
e
dx = e a
a
R
In particolare, per a = π:
2
−πx2 (ξ) = e−πξ
e[
9
Alcuni richiami di Analisi Complessa, compreso questo teorema, sono dati in appendice al
prossimo capitolo.
8.5. Trasformata di Fourier di funzioni differenziabili
267
8.5.5 Teorema La trasformata di Fourier b : S(Rn ) −→ S(Rn∗ ) è un isomorfismo di spazi di Fréchet.
Dimostrazione: Dimostriamone per prima cosa la continuità: se P, Q∈C[X1 , ..., Xn ]
allora, per l’identità di Leibniz e la derivazione sotto il segno di integrale:
µ ¶
Z
∂ b
Q
f (ξ) = e−2πihξ,xi Q(−2πix)f (x)dx
∂ξ
e, integrando per parti:
P (ξ)fb(ξ) =
Z
µ
−2πihξ,xi
e
P
1 ∂
2πi ∂x
¶
f (x)dx
Combinando queste formule:
µ ¶
µ
¶
Z
∂ b
1 ∂
−2πihξ,xi
P (ξ)Q
f (ξ) = e
P
(Q(−2πix)f (x)) dx
∂ξ
2πi ∂x
e quindi, per ogni ξ ∈ Rn∗ :
¯
¯
¯ Z ¯ µ
µ ¶
¶
¯
¯
¯
¯
1 ∂
¯P (ξ)Q ∂ fb(ξ)¯ ≤ ¯P
(Q(−2πix)f (x)) ¯¯dx ≤
¯
¯
¯
∂ξ
2πi ∂x
¯ µ
¯¶ Z µ
¶
¶n+1
µ
¯
¯
1
1
∂
n+1 ¯
¯
(Q(−2πix)f (x)) ¯
dx
≤ sup (1 + |x|) ¯P
2πi ∂x
1 + |x|
x∈Rn
Da qui la continuità.
Consideriamo ora l’operatore e: S(Rn∗ ) −→ S(Rn ) definito dalla
Z
ge(x) :=
e2πihξ,xi g(ξ)dξ
Rn∗
Lo stesso calcolo effettuato per b ci mostra che e è continuo: dimostriamo che si
tratta dell’operatore inverso di b, col che avremo la tesi del teorema.
Sia quindi g ∈ S(Rn∗ ):
Z
ZZ
2πihξ,xi
b
g(ξ)f (ξ)e
dξ =
g(ξ)f (y)e2πihξ,x−yi dydξ
Z
Z
= f (y)e
g (x − y)dy = f (x − y)e
g (y)dy
(abbiamo usato il teorema di Fubini: (y, ξ) 7−→ f (y)g(ξ) è integrabile in Rm ×Rn∗
rispetto alla misura dx ⊗ dξ). Dunque
Z
Z
2πihξ,xi
g(ξ)fb(ξ)e
dξ = f (x − y)e
g (y)dy
268
Capitolo 8. Spazi vettoriali topologici
Dato che vogliamo dimostrare che la composizione e ◦ b è idS(Rn ) (l’altra identità
b ◦ e = idS(Rn∗ ) segue in modo analogo), è sufficiente dimostrare che se ge
converge alla misura di Dirac concentrata nell’origine di S(Rn )∗ allora {fn } ⊂
S(Rn∗ ) converge funzione 1: basta considerare, ad esempio
{e−
Infatti limk e−
|ξ|2
k
|ξ|2
k
}k≥1
=1e
√
]
|ξ|2
2
lim e− k dξ = lim kπe−k(|πξ|) dξ = δ0
k−→∞
k−→∞
qed
La formula
f
g fb(x) =
Z
f (x − y)e
g (y)dy
è uno dei modi di esprimere la formula di inversione di Fourier .
8.5.6 Teorema Se f, h ∈ S(Rn ):
Z
Z
h(ξ)dξ
fb(ξ)b
f (x)h(x)dx =
(Formula di Parseval)
RN ∗
Rn
Z
Z
|f (x)| dx =
2
(Formula di Plancherel)
Rn
Rn∗
|fb(ξ)|2 dξ
Dimostrazione: Se nella formula di inversione di Fourier consideriamo x = 0
ed effettuiamo il cambiamento di variabile y 7−→ −y otteniamo
Z
Z
b
(∗)
g(ξ)f (ξ)dξ = f (y)e
g (−y)dy
Allora per g ∈ S(Rn∗ ) tale che ge(−y) = h(y) (una tale scelta è possibile per il
teorema precedente) otteniamo
h(ξ)
g(ξ) = b
e quindi, sostituendo nella (*), otteniamo la formula di Parseval.
La formula di Plancherel è la formula di Parseval nel caso f = h.
qed
è denso in
Sappiamo che lo spazio Cc (R ) è denso in L (R ); inoltre
n
p
n
Cc (R ) e quindi lo è in L (R ). Questo fatto e la formula di Plancherel implicano
immediatamente che
n
p
n
Cc∞ (Rn )
8.5. Trasformata di Fourier di funzioni differenziabili
269
8.5.7 Corollario La trasformata di Fourier si può estendere ad una isometria
fra spazi di Hilbert
b: L2 (Rn ) −→ L2 (Rn∗ )
Le formule di Parseval e Plancherel si scrivono in L2 (Rn ) come
(x, y) = (b
x, yb)
e
||x||2 = ||b
x||2
Sono ovviamente equivalenti per le identità di polarizzazione.
Costruiamo ora un sistema ortogonale per L2 (R) (per semplicità consideriamo
il caso n = 1): precisamente ne troveremo uno nel quale la trasformata di Fourier
è una matrice (infinita) diagonale.
Partiamo dall’osservazione che l’equazione
(†)
f 00 (x) − x2 f (x) = cf (x)
è trasformata in sé dalla trasformata di Fourier, se f ∈ S(R). In effetti sappiamo
che (indichiamo con l’apice la derivata rispetto a x):
[ = (fb)0
−ixf
Inoltre
fb0 = iξ fb
Infatti, integrando per parti (la f è nulla all’infinito).
Z
Z
0
iξ(x)
f (x)e
dx = iξ f (x)eiξ(x) dx
Quindi la (†) è mutata in sé dalla trasformata di Fourier.
Consideriamo ora soluzioni della (†) della forma
f = p(x)e−
x2
2
ove p è un polinomio. Sostituendo nella (†) troviamo che
p00 (x) − 2xp0 (x) = (c + 1)p(x)
Se p(x) = a0 + a1 x + ... + an xn otteniamo le identità
k(k − 1)ak − 2(k − 2)ak−2 = (c + 1)ak−2
(per k = 2, ..., n). Dato che an 6= 0 (per definizione è il coefficiente direttore del
polinomio) si ha
c = −(2n + 1)
e
an−1 = 0
270
Capitolo 8. Spazi vettoriali topologici
Evidentemente ak = 0 se k è un intero di parità diversa da n, mentre se k e n
hanno la stessa parità allora ak 6= 0, e, per induzione:
ak−2 =
k(k − 1)
ak
2k − 2n − 4
Quindi sono tutti definiti in termini di an ; non scriviamo esplicitamente una
formula per p (cosa che sarebbe assai facile a questo punto), ma osserviamo che
le funzioni
x2
fn (x) = pn (x)e− 2
sono in L2 (R), ove pn (x) è semplicemente il polinomio p in grado n: la scelta di
un tale polinomio si riduce infatti a quella di una costante (il suo coefficiente
direttore) che possiamo fissare e del suo grado, che è l’intero n.
Queste funzioni sono ortogonali: siano n 6= m; allora, dato che fn e fm
soddisfano la (†):
fn00 (x) − x2 p0n (x) = −(2n + 1)fn (x)
e
00
fm
(x) − x2 p0m (x) = −(2m + 1)fm (x)
Sottraendo queste equazioni si ottiene
0
(fn0 fm − fm
fn )0 = 2(m − n)fm fn
che, integrata, dà luogo alla
Z
Z
¯∞
1
1
¯
0
0
fn fm =
(fn0 fm − fm
fn )0 =
=0
(fn0 fm − fm
fn )¯
2(m − n)
2(m − n)
−∞
I polinomi pn si dicono polinomi di Hermite.
Sappiamo già che le {fn } costituiscono un sistema completo, quindi una base ortonormale per lo spazio di Hilbert L2 (R). Si potrebbe dimostrare che la
trasformata di Fourier ammette queste funzioni come autovettori:
fbn = cn fn
√
√
con cn = ± 2π oppure cn = ±i 2π
8.5.1
Appendice: l’integrale di Gauss
Vogliamo calcolare l’integrale di Gauss
Z ∞
2
e−ax dx
−∞
271
8.5. Trasformata di Fourier di funzioni differenziabili
Dato che e−ax = e−a(−x) si osserva per prima cosa che
Z ∞
Z ∞
2
−ax2
e
dx = 2
e−ax dx
2
2
−∞
0
Calcoliamo quindi questo secondo integrale: se
Cr := {(x, y) ∈ R2 | x2 + y 2 ≤ r2 e x, y ≥ 0}
e Qr è il quadrato
Qr := {(x, y) ∈ R2 | 0 ≤ x, y ≤ r}
allora, dato che e−a(x +y ) > 0 e Cr ⊂ Qr ⊂ Cr√ 2 :
Z
Z
Z
−a(x2 +y 2 )
−a(x2 +y 2 )
(∗)
e
dx ⊗ dy <
e
dx ⊗ dy <
2
Cr
2
e−a(x
2 +y 2 )
Cr √ 2
Qr
dx ⊗ dy
Inoltre, per il teorema di Fubini:
µZ r
¶2
Z
Z r
Z r
−a(x2 +y 2 )
−ax2
−ay 2
−ax2
(∗∗)
e
dx ⊗ dy =
e
e
dydx =
e
dx
Qr
0
0
0
Infine, usando le coordinate polari in Cr :
Z
Z r
Z
´
π
π ³
π r −aρ2
2
2
−a(x2 +y 2 )
e
ρdρ =
e−aρ d(aρ2 ) =
1 − e−ar
e
dx ⊗ dy =
2 0
4a 0
4a
Cr
da cui otteniamo
Z
Z
−a(x2 +y 2 )
e
dx ⊗ dy = lim
lim
r−→∞
Cr
r−→∞
e−a(x
2 +y 2 )
Cr √ 2
dx ⊗ dy =
π
4a
Quindi, passando al limite nella (*) ed usando la (**):
µZ r
¶2
π
−ax2
e
dx =
lim
r−→∞
4a
0
Abbiamo quindi il valore dell’integrale di Gauss:
r
r
Z
π
π
−ax2
e
=
dx = 2
4a
a
R
In maniera del tutto analoga, se A è una matrice simmetrica invertibile n × n,
si trova
r
Z
πn
−hAx,xi
e
dx =
det A
Rn
(le condizioni sulla matrice sono indispensabili per l’integrabilità della funzione)
che generalizza la formula dell’integrale di Gauss.
272
8.6
Capitolo 8. Spazi vettoriali topologici
Distribuzioni temperate
Osserviamo che le immersioni continue
Cc∞ (Rn ) −→ S(Rn ) −→ C ∞ (Rn )
sono dense, e quindi danno luogo alle immersioni continue
E 0 (Rn ) −→ S 0 (Rn ) −→ D0 (Rn )
ove S 0 (R∗ ) := S(Rn )∗ è lo spazio delle distribuzioni temperate.
8.6.1 Esempio
• Una distribuzione a supporto compatto è temperata.
• Ogni funzione continua f che tenda all’∞ più lentamente di ogni polinomio
induce una distribuzione f dx temperata: infatti una distribuzione è temperata se e solo se è continua nella topologia su Cc∞ (Rn ) indotta da quella di
S(Rn ); per lo stesso motivo ogni funzione f ∈ Lp (con 1 ≤ p ≤ ∞) induce
una distribuzione f dx temperata.
8.6.2 Teorema Una distribuzione è temperata se e solo se è somma (finita)
di derivate di funzioni continue che tendono all’∞ più lentamente di qualsiasi
polinomio.
Dimostrazione: La sufficienza della condizione è ovvia; Se T è una distribuzione temperata allora esistono m, h ≥ 0 ed una C > 0 tali che
¯
¯
p
¯
¯
∂
2
h
∞
n
¯
∀ϕ ∈ Cc (R ) |hT, ϕi| ≤ C sup sup ¯¯(1 + |x| )
ϕ(x)
¯
∂xp
|p|≤m x∈Rn
Se
ϕh := (1 + |x|2 )h ϕ(x)
ovviamente ϕh ∈Cc∞ (Rn ). è poi ovvio che la mappa ϕ 7−→ ϕh è lineare e biunivoca
da Cc∞ (Rn ) in se stesso; per induzione:
¯ p
¯
¯
X ¯¯ ∂ p
¯∂
¯
¯
1
¯
¯
¯
¯
¯ ∂xp ϕ(x)¯ ≤ Cp,h (1 + |x|2 )h
¯ ∂xp ϕh (x)¯
q≤p
quindi
¯ p
¯
¯∂
¯
|hT, ϕi| ≤ C sup sup ¯¯ p ϕh (x)¯¯
x∈Rn ∂x
0
|p|≤m
273
8.6. Distribuzioni temperate
Consideriamo ora il monomio differenziale
D :=
∂
∂
...
∂x1 ∂xn
Ovviamente (per x = (x1 , ..., xn ) ∈ Rn ):
Z x1 Z xn
ϕ(x) =
...
Dϕ(y)dy1 ...dyn
−∞
−∞
e quindi
sup |ϕ(x)| ≤ ||Dϕ||L1
x∈Rn
Sostituendo nella stima precedente:
|hT, ϕi| ≤ C
¯¯ µ ¶p
¯¯
¯¯ ∂
¯¯
sup ¯¯¯¯
ϕh (x)¯¯¯¯
∂x
00
|p|≤m+n
L1
Un modo di interpretare questa stima è considerare la mappa iniettiva
¡
¢N
J : Cc∞ (Rn ) −→ L1 (Rn )
µµ ¶p ¶
∂
ψ 7−→
ψ
∂x
|p|≤m+n
(ove N è il numero delle n-ple p tali che |p| ≤ m+n) ed affermare che il funzionale
lineare (si ricordi che ogni funzione ϕ ∈ Cc∞ (Rn ) è univocamente rappresentabile
come ϕh )
Jϕh 7−→ hT, ϕi
è continuo su JCc∞ (Rn ) rispetto alla topologia indotta da (L1 (Rn )N ; Quindi, per
il teorema di Hahn–Banach, si estende ad un funzionale su tutto L1 (Rn ))N . Ma,
dato che L1 (Rn )∗ = L∞ (Rn ), allora (per il teorema di Riesz 6.4.8) (L1 (Rn ))N ∗ =
L∞ (Rn )N e quindi esistono N funzioni hp ∈ L∞ (Rn ) (|p| ≤ m + n) tali che
µ ¶p
X
∂
hT, ϕi =
ϕh i
hhp ,
∂x
|p|≤m+n
i.e.
T =
X
µ
|p|
(1 + |x| ) (−1)
2 h
|p|≤m+n
∂
∂x
¶p
hp
Se, per ogni p poniamo
Z
gp (x) :=
Z
x1
...
0
xn
hp (y1 , ..., yn )dy1 ...dyn
0
274
Capitolo 8. Spazi vettoriali topologici
allora, dato che le hp sono essenzialmente limitate, le gp sono continue e
|gp (x)| ≤ |x1 |...|xn | ||hp ||L∞
Ma, dato che hp = Dgp :
X
T =
µ
(1 + |x| )
2 h
|p|≤m+n
∂
∂x
¶p
kp
ove kp = (−1)|p| Dgp . Per induzione su h segue infine che
µ ¶p
X µ ∂ ¶p
∂
2 h
(1 + |x| )
kp (x) =
(P (x)kp (x))
∂x
∂x
q≤p
per qualche polinomio P che dipende da p, q, h, e quindi la tesi.
qed
8.6.3 Definizione L’applicazione lineare duale della trasformata di Fourier in
S(Rn ) è la trasformata di Fourier nello spazio delle distribuzioni temperate.
Osserviamo che, essendo L2 (Rn )∗ = L2 (Rn ), questo concetto è autoduale sullo
spazio delle funzioni a quadrato integrabile.
Applicando l’operatore di dualità * al teorema 8.5.5 si ha il
8.6.4 Teorema La trasformata di Fourier è un isomorfismo fra gli spazi vettoriali topologici S 0 (Rn ) e S 0 (Rn∗ ).
Ricordiamo che lo spazio di Banach L1 (Rn ) è un’algebra associativa e commutativa rispetto alla convoluzione: ricordiamo in particolare che, se f, g ∈C( Rn ),
la loro convoluzione è la funzione
Z
f ∗ g(x) :=
f (x − y)g(y)dy
Rn
Le seguenti proprietà sono state già enunciate nel caso di L1 (R): dimostriamole
in dettaglio nel caso di funzioni continue a supporto compatto.
8.6.5 Proposizione Se f, g, h ∈ Cc (Rn ) allora
• f ∗g =g∗f
• f ∗ (g ∗ h) = (f ∗ g) ∗ h
• (f + g) ∗ h = f ∗ h + g ∗ h
8.6. Distribuzioni temperate
275
• Se fy (x) := f (x − y) allora (f ∗ g)y = fy ∗ g = f ∗ gy
Dimostrazione: Le (1) e (2) seguono dall’invarianza della misura di Lebesgue
per traslazioni d(ax + c) = adx:
Z
Z
f ∗ g(x) =
f (x − y)g(y)dy =
f (−y)g(y + x)dy
Rn
Rn
Z
=−
g(x − y)f (y)d(−y) = g ∗ f (x)
Rn
e, per il teorema di Fubini 10 :
Z
Z
Z
f ∗ (g ∗ h)(x) =
f (x − y)g ∗ h(y)dy =
f (x − y)
g(y − z)h(z)dzdy
Rn
Rn
Rn
Z
=
f (x − y)g(y − z)h(z)dz ⊗ dy
Rn ×Rn
Z Z
=
f (x − z − y)g(y)dyh(z)dz
Rn Rn
Z
=
f ∗ g(x − z)h(z)dz = (f ∗ g) ∗ h(x)
Rn
La (3) si riduce alla linearità dell’integrale, e la (4) è pure un molto semplice:
intanto
Z
fy ∗ g(x) =
f (x − y − z)g(z)dz = (f ∗ g)y (x)
Rn
e quindi
fy ∗ g = (f ∗ g)y = (g ∗ f )y = gy ∗ f = f ∗ gy
qed
Evidentemente basta che solo una delle funzioni f, g sia a supporto compatto
perché la definizione abbia senso. Esistono comunque condizioni più generali per
l’esistenza della convoluzione di due funzioni.
8.6.6 Teorema Se p, q, r sono tali che 1 ≤ p, q, r ≤ ∞ e
1
1 1
= + −1
r
p q
allora, per ogni f, g ∈ Cc (Rn ):
||f ∗ g||Lr ≤ ||f ||Lp ||g||Lq
10
Possiamo applicarlo perché le funzioni a supporto compatto sono integrabili rispetto alla
misura di Lebesgue in Rn .
276
Capitolo 8. Spazi vettoriali topologici
Dimostrazione: Poniamo h(x) := f ∗ g(x) e s = p(1 − 1/q); per la disuguaglianza di Hölder:
µZ
|h(x)| ≤
|f (x − y)|
(1−s)q
Rn
|g(y)| dy
q
¶ 1q
¯¯ s ¯¯
¯¯|f | ¯¯
Lt
ove t è tale che 1/t + 1/q = 1. Ma allora st = p e quindi
Z
sq
q
|h(x)| ≤ ||f ||Lp
|f (x − y)|(1−s)q |g(y)|q dy
Rn
Consideriamo ora la funzione
F : Rn −→ Lα (Rn )
¡
¢
y 7−→ x 7−→ |f (x − y)|1−s)q |g(y)|q
(per α opportuno): evidentemente F è continua a supporto compatto e, per la
proprietà del modulo dell’integrale11
¯¯ Z
¯¯ Z
¯¯
¯¯
¯¯ ≤
¯¯
||F (y)||dy
F
(y)dy
¯¯
¯¯
Rn
Rn
otteniamo
¯¯ q ¯¯
¯¯|h| ¯¯
Lα
¯¯ (1−s)q ¯¯ ¯¯ q ¯¯
¯¯
¯¯ p ¯¯|g| ¯¯ 1
≤ ||f ||sq
Lp |f |
L
L
vale a dire
(1−s)q
q
||h||qLα ≤ ||f ||sq
Lp ||f ||Lα(1−s)q ||g||Lq
Allora, per α = r/q
||h||Lr ≤ ||f ||sLp ||f ||L1−s
(1−s)r ||g||Lq
cioè la tesi, dato che
µ
(1 − s)r =
p
1−p−
q
¶
µ
r = pr
¶
1 1
+ −1 =p
p q
qed
n
p
n
Dato che Cc (R ) è denso in L (R ) segue il
11
Osserviamo che stiamo integrando una funzione continua a valori in uno spazio di Banach
Lα : dovrebbe essere ovvio che la definizione di questo integrale procede come nel caso di
funzioni a valori reali; ad esempio, essendo la funzione continua, possiamo definire l’integrale
come limite (nella norma di Lα ) di somme integrali alla Riemann; in generale l’integrazione ha
valori in uno spazio di Banach ha perfettamente senso e si dice integrazione alla Bochner .
277
8.6. Distribuzioni temperate
8.6.7 Corollario Se p, q, r sono tali che 1 ≤ p, q, r ≤ ∞ e
1
1 1
= + −1
r
p q
allora, per ogni f ∈ Lp (Rn ) e g ∈ Lq (Rn ):
Z
f (x − y)g(y)dy
Rn
definisce un elemento di Lr (Rn ) che si denota f ∗ g ed è tale che
||f ∗ g||Lr ≤ ||f ||Lp ||g||Lq
In particolare: per q = 1 deduciamo che la mappa lineare
ϕ : Lp (Rn ) −→ Lp (Rn )
g 7−→ f ∗ g
è continua e ||ϕ|| ≤ ||f ||L1 , mentre per p = q = 1 deduciamo cha la mappa
bilineare
L1 (Rn ) × L1 (Rn ) −→ L1 (Rn )
(f, g) 7−→ f ∗ g
è continua e ||f ∗ g||L1 ≤ ||f ||L1 ||g||L1 . Cioè lo spazio di Banach L1 (Rn ) dotato
dell’operazione di convoluzione è un’algebra di Banach commutativa (cfr. capitolo
seguente).
Osserviamo ora che se f, g ∈ C 1 (Rn ), le formule di Leibniz e di derivazione
sotto il segno di integrale implicano che f ∗ g è derivabile rispetto a x e
∂
∂f
∂g
(f ∗ g) =
∗g =f ∗
∂xi
∂xi
∂xi
Ora, se A ⊂ Rn e f, g∈C(Rn ) (ed una delle due ha supporto compatto), definendo
(
f (x) se x ∈ A \ supp g
fA (x) :=
0 altrimenti
abbiamo allora, per x ∈ A
f ∗ g(x) =
Z
Rn
fA (x)g(y)dy = fA ∗ g(x)
Applicando questa osservazione a ∂f /∂xi otteniamo, per ogni x ∈ A:
¯
¯
¯
¯
¯ ∂
¯ ∂f
¯
¯
¯
¯ ≤ sup ¯
¯
f
∗
g(x)
(y)
¯ ∂xi
¯ ∂xi ¯ ||g||L1
¯
y∈A\supp g
Se supp g e A sono compatti la parte destra di questa disuguaglianza è finita,
quindi
278
Capitolo 8. Spazi vettoriali topologici
8.6.8 Proposizione Se 0 ≤ m ≤ ∞ e g ∈ L1 (Rn ) ha supporto compatto allora
la convoluzione f 7−→ f ∗ g è lineare e continua da C m (Rn ) in sè.
Osservando che
supp(f ∗ g) ⊂ supp f + supp g
(somma vettoriale in Rn ) si trae facilmente il
8.6.9 Corollario Se 0 ≤ m ≤ ∞ e g ∈ L1 (Rn ) ha supporto compatto allora la
convoluzione f 7−→ f ∗ g è lineare e continua da Ccm (Rn ) in sè.
Dimostriamo ora che la trasformata di Fourier si comporta come un morfismo
di algebre fra prodotto punto per punto e convoluzione.
8.6.10 Teorema
fcg = fb ∗ gb
e
f[
∗ g = fbgb
Dimostrazione: Usiamo ovviamente il teorema di Fubini
Z
Z Z
−2πihξ,xi
f[
∗ g(ξ) = f ∗ g(x)e
dx =
f (y)g(x − y)e−2πihξ,xi dydx
Z
Z
−2πihξ,yi
= f (y)e
g(x − y)e−2πihξ,x−yi dydx
=fb(ξ)b
g (ξ)
Il viceversa segue per il teorema 8.5.5: ogni funzione di Schwartz è della forma b
h
c [
cosı̀ che fcg = b
∗ k = h ∗ k = fb ∗ gb.
kb
h = h[
qed
In analogia a quanto abbiamo fatto per la trasformata di Fourier, vogliamo
ora definire una operazione di convoluzione fra distribuzioni.
8.6.11 Definizione Se T ∈ S 0 (Rn ) è una distribuzione temperata allora la distribuzione temperata Tb definita da
∀ϕ ∈ S(Rn )
hTb, ϕi = T (ϕ)
b
è la sua trasformata di Fourier.
Dato che la trasformata di Fourier è un isomorfismo fra gli spazi di Schwartz,
vale la formula di inversione per le trasformate di Fourier delle distribuzioni
temperate: prima osserviamo che, se Tf è l’unica distribuzione associata alla
funzione f :
Z
Tf (ϕ) = f ϕ
279
8.6. Distribuzioni temperate
allora
cf
Tfb = T
Infatti, se f, ϕ ∈ S(Rn ) allora, per il teorema di Parceval:
Z
Tfb(ϕ) =
fbϕ =
Z
b
fbϕ
b=
Z
fϕ
b = Tf (ϕ)
b
8.6.12 Teorema La trasformata di Fourier è l’unica estensione debolmente continua dell’isomorfismo b : S(Rn ) −→ S(R∗n ) agli spazi delle distribuzioni temperate corrispondenti. Si tratta di una mappa lineare e biunivoca.
Dimostrazione: Sia T ∈ S 0 (Rn ); allora, se ϕn −→ ϕ i S(Rn ): ϕ
cn −→ ϕ
b e
quindi T (c
ϕn ) −→ T (ϕ)
b e, per definizione Tb(ϕn ) −→ Tb(ϕ). Quindi la T 7−→ Tb è
debolmente continua.
qed
8.6.13 Esempio La trasformata di Fourier della derivata della δξ0 è:
δc
b =
ξ0 (ϕ) = δξ0 (ϕ)
Z
ϕ(x)e−2πihξ0 ,xi
−2πihξ,xi
i.e. δc
.
ξ0 è la funzione e
Infine definiamo anche la convoluzione di una distribuzione temperata T con
una funzione di Schwartz f (se f è una funzione denotiamo con fe la funzione
fe(x) = f (−x)):
∀ϕ ∈ S(Rn ) hT ∗ f, ϕi := hT, fe ∗ ϕi
Dimostriamo che gode delle proprietà attese da una convoluzione.
8.6.14 Teorema La funzione T 7−→ T ∗ f è debolmente continua ed estende la
convoluzione in S(Rn ). Inoltre
(T ∗ f ) ∗ g = T ∗ (f ∗ g)
e
T[
∗ f = fbTb
280
Capitolo 8. Spazi vettoriali topologici
Dimostrazione: La debole continuità è ovvia, come pure il fatto che estenda
la convoluzione usuale:
Z
Z
Tf ∗ g(ϕ) =hTf , ge ∗ ϕi = f (y) g(−x)ϕ(y − x)dxdy
Z
Z
Z
Z
= f (y) g(−y − x)ϕ(−x)dxdy = f (y) g(z − y)ϕ(z)dzdy
Z Z
=
f (y)g(z − y)dyϕ(z)dz = Tf ∗g (ϕ)
La debole densità di S(Rn ) in S 0 (Rn ) implica che le due identità per la convoluzione di funzioni si estendano alle convoluzioni.
qed
Capitolo 9
ALGEBRE DI BANACH E C*-ALGEBRE
In questo capitolo introduciamo le algebre di operatori: in realtà definiamo
una classe più generale di oggetti, le algebre di Banach, che combinano una
struttura di spazio vettoriale normato e di algebra associativa: gli esempi che ci
interessano sono le C*-algebre di operatori, delle quali ci occuperemo nei capitoli
seguenti; comunque nel caso commutativo, queste algebre sono algebre di funzioni, e come esempio chiave analizzeremo in dettaglio il caso dell’algebra delle
funzioni continue su uno spazio di Hausdorff compatto, dimostrandone tutte le
principali proprietà. In appendice al capitolo diamo dei rapidi cenni di analisi
complessa, per rendere indipendente la nostra esposizione autosufficiente.
9.1
Algebre di Banach
Osserviamo che se A : X −→ Y è un operatore lineare e B ∈ B(Y, Z) allora
l’operatore composto
B ◦ A(x) := B(Ax)
è lineare (ovvio) e limitato:
||B ◦ A(x)|| ≤ ||B|| ||Ax|| ≤ ||A|| ||B|| ||x||
cioè
||BA|| ≤ ||A|| ||B||
Se X = Y = Z lo spazio vettoriale B(X) := B(X, X) è un’algebra rispetto
al prodotto dato dalla composizione di operatori ed è normata nel senso della
seguente
9.1.1 Definizione Un’algebra (associativa sui complessi) A si dice normata se,
come spazio vettoriale, è normato e la norma è compatibile col prodotto:
∀a, b ∈ A
||ab|| ≤ ||a|| ||b||
281
282
Capitolo 9. Algebre di Banach e C*-algebre
Se un’algebra normata A è uno spazio di Banach rispetto alla sua norma, si dice
algebra di Banach.
Osserviamo che un’algebra di Banach, dal punto di vista algebrico, è semplicemente un’algebra associativa, non necessariamente commutativa e non necessariamente dotata di un elemento identità.
9.1.2 Esempio
(1) Se X è uno spazio di Banach, allora B(X) è un’algebra di Banach.
(2) Ogni algebra di dimensione finita è un’algebra di Banach, dato che uno
spazio di dimensione finita è di Banach rispetto a qualsiasi norma si possa
immaginare.
(3) Se dim X < ∞ allora B(X) è l’algebra degli endomorfismi di uno spazio
vettoriale, cioè l’algebra completa delle matrici Mn (C): una norma che
tipicamente si considera sullo spazio delle matrici (reali o complesse) è
||A|| = n max |aij |
i,j
ove ((aij )) = A sono le entrate della matrice. Ovviamente rispetto a ||.||
Mn (C) è uno spazio normato: è inoltre un’algebra di Banach, dato che
¯
¯
¯
¯X
X
¯
¯
|aik | |bkj |
aik bjk ¯ ≤ n max
||AB|| = n max ¯
i,j
i,j ¯
¯
k
k
|A| |B|
|A| |B|
≤ n
+ ··· +
= |A| |B|
n
n
n
n
|
{z
}
n volte
Introduciamo un po’ di terminologia: ovviamente una sottoalgebra di un’algebra normata A è un sottospazio vettoriale che sia anche un’algebra rispetto al
prodotto indotto da A: avrà interesse particolare considerare sottoalgebre chiuse.
Un morfismo ϕ : A −→ B di algebre normate è un operatore lineare e continuo
che sia anche un omomorfismo di algebre: ϕ(ab) = ϕ(a)ϕ(b). Evidentemente le
algebre normate formano una categoria.
Sia A un’algebra normata e S ⊂ A; se a(S) denota la sottoalgebra generata
da S allora a(S) è una sottoalgebra normata di A. Infatti la mappa
A × A −→ A
(A, B) 7−→ AB
283
9.1. Algebre di Banach
è continua (su A × A si mette la topologia prodotto). Per vederlo basta osservare
che
An Bn − An B + An B − AB = An (Bn − B) + (An − A)B
e quindi che
||An Bn − AB|| ≤ ||An || ||Bn − B|| + ||An − A|| ||B||
≤ c||Bn − B|| + ||An − A|| ||B|| xn −→∞ / 0
(dato che An −→ A).
Quindi {An }, {Bn } ⊂ a(S) implica AB ∈ a(S): cioè la chiusura di una sottoalgebra è una sottoalgebra.
Un caso interessante è quando X = H è uno spazio di Hilbert: ad un elemento
A dell’algebra di Banach A = B(H) si associa la funzione
hx, yi := (x, Ay)
che è una forma sesquilineare limitata su A:
|hx, yi| ≤ ||A|| ||x|| ||y||
(per la diseguaglianza di Schwartz). Viceversa, se h, i è una forma sesquilineare
limitata sullo spazio di Hilbert H allora, fissato x ∈ H, la mappa y 7−→ hx, yi è
un funzionale lineare limitato di norma N tale che
||hx, −i|| ≤ N ||x||
Ma allora, per il teorema di Riesz, esiste x0 ∈ H tale che
∀y ∈ H hx, yi = (x0 , y)
In modo analogo, fissando y, si ottiene la forma antilineare x 7−→ hx, yi e di
nuovo, per il teorema di Riesz (o meglio per il complesso coniugato del teorema
di Riesz...), deve esistere y 0 ∈ H tale che
∀x ∈ H hx, yi = (x, y 0 )
Dunque ogni forma sesquilineare limitata è del tipo h, i ed esiste un operatore
A ∈ B(H) tale che y 0 = Ay e hx, yi = (x, Ay) con ||A|| ≤ ||h, i||.
Si noti che in realtà ||h, i|| = ||A||: infatti
||h, i|| = sup |hx, yi| = ||A||
x,y∈H1
284
Capitolo 9. Algebre di Banach e C*-algebre
dato che M |(x, Ay)| ||y|| ≤ 1 (denotiamo con H1 l’insieme dei vettori di H di
norma minore o uguale a 1).
Dalla discussione precedente si ha che la forma
hx, yi∗ := hx, yi
è sesquilineare limitata e si dice forma aggiunta di h, i. Ovviamente
||h, i|| = ||h, i∗ ||
e l’operatore A∗ tale che, per ogni x, y ∈ H: hx, yi∗ = (x, A∗ y) si dice operatore
aggiunto dell’operatore A.
Per ogni A ∈ B(H) esiste dunque un unico operatore aggiunto A∗ ∈ B(H) tale
che
(Ax, y) = (y, Ax) = (x, A∗ y)
La corrispondenza A 7−→ A∗ è una involuzione di algebre in B(H): cioè B(H) è
una *-algebra.
9.1.3 Proposizione Se A è un’algebra normata con involuzione *:
(1) (aA + bB)∗ = aA∗ + bB ∗ .
(2) (A∗ )∗ = A.
(3) (AB)∗ = B ∗ A∗ .
9.1.4 Definizione Una *-algebra normata è un’algebra A normata che sia anche una *-algebra in modo che
∀A ∈ A
||A|| = ||A∗ ||
Abbiamo appena visto che B(H) è una *-algebra normata. In realtà la norma
in B(H) possiede una proprietà ben più notevole. Infatti, dato che
||A||2 = sup ||Ax||2
||x||=1
e
||Ax||2 = (Ax, Ax) = (x, A∗ Ax) ≤ ||A∗ Ax||
(per la disuguaglianza di Schwartz) allora
||A||2 ≤ sup ||A∗ Ax|| = ||A∗ A|| ≤ ||A∗ || ||A|| = ||A|| ||A|| = ||A||2
||x||≤1
e quindi
||A∗ A|| = ||A||2
285
9.1. Algebre di Banach
9.1.5 Definizione Una *-algebra di Banach A tale che, per ogni a ∈ A:
||a∗ a|| = ||a||2
(∗)
si dice C*-algebra e la proprietà (∗) si dice identità-C*.
In una C*-algebra A ogni *-sottoalgebra chiusa è una sotto-C*-algebra.
9.1.6 Esempio
(1) La C*-algebra B(H) non è commutativa: infatti due operatori in generale
non sono commutabili (a meno che H = C e quindi B(H) = M1 (C) =
C \ {0}).
(2) Consideriamo le funzioni continue (a valori complessi) C(X) definite su
uno spazio topologico compatto X. Si tratta di uno spazio vettoriale che,
rispetto alla norma
||f || = max |f (x)|
x∈X
è uno spazio di Banach. Se poi consideriamo le operazioni
(f · g)(x) := f (x)g(x)
(f ∗ )(x) := f (x)
allora C(X) diviene una C*-algebra commutativa.
In seguito dimostreremo che, in un certo senso, si tratta del modello più
generale di C*-algebra commutativa. Osserviamo che la funzione 1 che vale
identicamente 1 su X sta in C(X) e ne costituisce l’identità:
∀f ∈ C(X) f · 1 = 1 · f = f
(3) Un altro esempio di C*-algebra commutativa strettamente imparentato con
C(X) è quello delle funzioni continue a supporto compatto definite su uno
spazio topologico localmente compatto X: Cc (X). La norma è la medesima
di C(X) (dato che il luogo dei punti ove un elemento di Cc (X) è diverso
da zero è compatto ha senso parlare di massimo su tutto X), come pure le
operazioni di prodotto e *. Osserviamo che tuttavia Cc (X) non possiede una
identità, dato che la funzione identicamente 1 (unico candidato possibile)
non ha supporto compatto.
9.1.7 Definizione Un elemento a ∈ A di una *-algebra si dice normale se a∗ a =
aa∗ , e si dice autoaggiunto se a∗ = a.
286
Capitolo 9. Algebre di Banach e C*-algebre
Considereremo sempre algebre di Banach con unità I.
9.1.8 Definizione Se A è un’algebra di Banach, un elemento A ∈ A si dice
invertibile se esiste B ∈ A tale che
AB = BA = I
Si scrive in tal caso A−1 = B.
Un’algebra di Banach possiede sempre elementi invertibili, come segue ad
esempio dal
9.1.9 Lemma Per ogni B ∈ A tale che ||I − B|| < 1 si ha che B ∈ A−1 .
Dimostrazione: Scriviamo A := I − B. Allora l’ipotesi è che ||A|| < 1 e
possiamo prendere la serie formale
X
(I − A)−1 :=
An
n≥0
Si tratta in realtà di una serie convergente, dato che converge assolutamente (cfr.
proposizione 6.1.9): infatti la serie numerica
X
X
X
X
||An || =
||AAn−1 || ≤
||A|| ||An−1 || ≤ ... ≤
||A||n
n≥0
n≥0
n≥0
n≥0
P
converge dato che ||A|| < 1. Quindi la serie n≥0 An converge ad un elemento
C ∈ A, e si ha
Ã
!
N
N
X
X
n
CB =
lim
A B = lim
(An B)
N −→∞
= lim
N −→∞
n=0
N
X
N −→∞
n=0
An (IA ) = lim (I − AN +1 ) = I − 0 = I
n=0
N −→∞
(abbiamo usato la continuità del prodotto in A ed il fatto che se una serie
converge il suo termine generico tende a zero).
In modo analogo si trova BC = I.
qed
Osserviamo che
¯¯ X ¯¯ X
X
¯¯
¯¯
1
||An || ≤
||A||n =
An ¯¯¯¯ ≤
||(I − A)−1 || = ¯¯¯¯
1 − ||A||
n≥0
n≥0
n≥0
287
9.1. Algebre di Banach
ed in modo analogo
||(I − A)
−1
¯¯ X ¯¯
¯¯
¯¯
||A||
An ¯¯¯¯ ≤
− I|| = ¯¯¯¯
1 − ||A||
n≥1
Da ciò segue la continuità della mappa A 7−→ A−1 nel punto I ∈ A, e questo
significa che se consideriamo l’insieme A−1 degli elementi invertibili di un’algebra
di Banach, questo è un gruppo topologico (rispetto alla moltiplicazione in A) per
la topologia della norma (cfr. capitolo ??: evidentemente è localmente compatto
solo se l’algebra di Banach ha dimensione finita.
9.1.10 Esempio Se A = Mn (C) allora A−1 è il gruppo lineare generale GLn (C)
formato dalle matrici invertibili a coefficienti complessi.
9.1.11 Corollario Se A è un’algebra di Banach e B ∈ A−1 allora per ogni ε > 0
esiste un intorno Uε di B in A tale che
∀A ∈ Uε
||A−1 − B −1 || < ε
Dimostrazione: Infatti A−1 = A−1 BB −1 e quindi A−1 −B −1 = (A−1 B −I)B −1
i.e.
||A−1 − B −1 || ≤ ||A−1 B − I|| ||B −1 ||
Ma A−1 B = (B −1 A)−1 e quindi basta esibire un intorno di B tale che, per ogni
suo elemento A si abbia ||A−1 B − I|| < ε.
Consideriamo A = B(X −I) di modo che B −1 A = I −X e quindi se ||X|| < 1
allora B −1 A è invertibile e quindi A è invertibile. Cosı̀ scegliamo X in modo che
soddisfi alla
||A−1 B − I|| = ||(I − X)−1 − I|| ≤
||X||
< ε||B −1 ||
1 − ||X||
ottenendo
||B −1 A − I|| = ||B −1 (A − B)|| ≤ ||B −1 || ||A − B||
Ma allora, per ||A − B|| ≤ ||B −1 ||−1 δε , abbiamo il risultato voluto.
qed
Consideriamo un esempio di algebra di Banach che può non essere una C*algebra. Sia L1 (Rn ) lo spazio di Banach delle funzioni integrabili rispetto alla
misura di Lebesgue. I risultati del capitolo precedente sulle convoluzioni e le
trasformate di Fourier possono riassumersi con il
288
Capitolo 9. Algebre di Banach e C*-algebre
9.1.12 Teorema Lo spazio di Banach L1 (Rn ) è un’algebra di Banach commutativa rispetto alla convoluzione.
Dimostrazione: Ricordiamo che la convoluzione di due elementi di L1 (Rn )
come
Z ∞
f ∗ g(x) :=
f (y)g(x − y)dy
−∞
Sappiamo (proposizione 7.4.3) che la convoluzione rende L1 (R) un’algebra associativa; dimostriamo dunque che è un’algebra di Banach. Infatti
¯
Z Z
Z ¯Z
¯
¯
¯
¯
|f (y)| |g(x − y)|dydx
||f ∗ g||1 = ¯ f (y)g(x − y)dy ¯ dx ≤
Z Z
Z
Z
=
|g(x − y)|dx|f (h)dy = |g(x)|dx |f (y)|dy = ||f ||1 ||g||1
qed
Lo stesso ragionamento potevamo farlo nel caso L (T), per quello che sappiamo sulle serie di Fourier; osserviamo che sia L1 (T) che L1 (Rn ) non hanno
un elemento neutro (tuttavia posseggono delle “identità approssimate, o “nuclei
approssimanti: ne abbiamo costruite una famiglia, quando abbiamo considerato
il nucleo di Fejér).
Notiamo infine che l’algebra di Banach L1 (Rn ) (cosı̀ come L1 (T)) possiede
una involuzione:
f ∗ (x) := f (−x)
1
Tuttavia L1 (Rn ) è una *-algebra ma non una C*-algebra in generale.
9.2
L’algebra C(X)
In questo paragrafo ci concentriamo sulla C*-algebra commutativa C(X) delle
funzioni continue definite su uno spazio di Hausdorff compatto. Per essere precisi
dovremmo specificare se le funzioni in C(X) sono reali oppure complesse: i risultati che otterremo possono formularsi in ambedue i casi. Nel seguito, comunque,
con C(X) intenderemo sempre le funzioni continue complesse, denotando con
CR (X) quelle reali.
Consideriamo uno spazio topologico di Hausdorff localmente compatto X e
l’algebra di Banach commutativa Cc (X) delle funzioni reali continue a supporto
compatto su X.
9.2.1 Definizione Un funzionale I : Cc (X) −→ R lineare si dice positivo se
per ogni f ∈ Cc (X): f ≥ 0 ⇒ I(f ) ≥ 0.
9.2. L’algebra C(X)
289
Il seguente teorema è stato anticipato quando abbiamo considerato le distribuzioni di ordine zero (cfr. esempio 8.4.4 e seguenti).
9.2.2 Teorema (Riesz–Markov) Se I è un funzionale lineare positivo sull’algebra Cc (X) delle funzioni reali continue a supporto compatto definite su uno
spazio di Hausdorff localmente compatto X allora esiste un’unica misura di Borel
µ su X tale che
Z
∀f ∈ Cc (X)
I(f ) =
f dµ
X
Dimostrazione: Dovremo usare alcune delle nozioni di teoria della misura (capitolo ??). Precisamente, per costruire la nostra misura di Borel considereremo
una misura esterna topologicamente regolare (definizione 4.5.5), usando il criterio
4.5.7.
Per ogni aperto S ⊂ X definiamo l’insieme
MS := {f ∈ Cc (X) | f ∈ Cc (X, [0, 1]), supp f ⊂ S}
e la funzione
µS := sup I(f )
f ∈MS
Si tratta di una funzione a valori in [0, ∞] definita su tutti gli aperti di X,
monotona, finita sugli insiemi limitati e che soddisfa l’ipotesi (5) del teorema
4.5.7. Dimostriamo che si tratta di una funzione numerabilmente subadditiva
sugli aperti: sia S = ∪Si e sia f ∈Cc (X, [0, 1]) e supp f ⊂ S; consideriamo ora una
partizione dell’unità (teorema 2.3.5), cioè una famiglia di funzioni non-negative
ϕ1 , ..., ϕn ∈ MSi tali che
∀x ∈ supp f
n
X
ϕi (x) = 1
i=1
Allora f =
P
i
ϕi f e quindi
I(f ) =
n
X
I(ϕi f ) ≤
n
X
µSi ≤
i=1
i=1
Passando al sup per ogni f ∈ Cc (X) si trova
µS ≤
∞
X
i=1
µSi
∞
X
i=1
µSi
290
Capitolo 9. Algebre di Banach e C*-algebre
cioè la subadditività numerabile di µ.
Ora dimostriamo che µ soddisfa alle altre ipotesi del teorema 4.5.7 col che
potremo dedurne che si estende ad una misura di Borel (quasi-regolare) su X.
Se S = S1 ∪ S2 con S1 ∩ S2 = ∅ e se f1 ∈ MS1 e f2 ∈ MS2 , allora f1 + f2 ∈ MS , cioè
I(f1 ) + I(f2 ) ≤ µ(S)
Al variare di f1 ∈ MS1 e di f2 ∈ MS2 otteniamo dunque
µS1 + µS2 ≤ µS
quindi
µS1 + µS2 = µS
Con ciò la funzione µ soddisfa tutte le ipotesi necessarie perché possa estendersi
ad una misura boreliana µ su X.
Ora mostriamo che
Z
∀f ∈ Cc (X) I(f ) =
f dµ
X
Dato che ogni f ∈ Cc (X) è differenza di funzioni non negative, possiamo limitarci
al caso f ≥ 0 e, per linearità, possiamo anche assumere che f ≤ 1.
Sia dunque S un aperto limitato tale che supp f ⊂ S e sia
Sk := {x ∈ X | nf (x) > k − 1}
(si noti che S0 = S e Sk = ∅ per k > n). Ovviamente
Sk+1 ⊂ Sk
e definiamo quindi
1
ϕk (x) := nf (x) − k + 1
0
Allora
se x ∈ Sk+1
se x ∈ Sk \ Sk+1
se x ∈ X \ Sk
1X
ϕk
n k=1
n
f=
e si ha supp ϕk ⊂ S k ⊂ Sk−1 e ϕk = 1 su Sk+1 . Quindi
∀k ≥ 1 µSk+1 ≤ I(ϕk ) ≤ µSk−1
9.2. L’algebra C(X)
291
Z
e
∀k ≥ 1 µSk+1 ≤
ϕk dµ ≤ µSk
X
Ne segue che
−µS1 ≤
n µ
X
k=1
¶
Z
I(ϕk ) −
ϕk
≤ µS0 + µS1
X
¯
¯
Z
¯ 2
¯
¯ ≤ µS
¯I(f ) −
f
dµ
¯ n
¯
X
R
Ma n era arbitrario e quindi troviamo I(f ) = f dµ.
da cui
qed
Questo teorema è di cruciale importanza perché ci fa vedere come le misure
possano considerarsi funzionali lineari sullo spazio Cc (X): in particolare ci fornisce una caratterizzazione dei funzionali lineari positivi su CR (X) se X è uno
spazio di Hausdorff compatto, cosa che ora torneremo a supporre.
Il risultato preliminare che ci occorre afferma che ogni funzionale lineare limitato su CR (X) è differenza di due funzionali lineari positivi: in realtà questo
risultato non dipende dalla natura dello spazio CR (X), ma può formularsi in una
maggiore generalità.
9.2.3 Definizione Uno spazio vettoriale L di funzioni (qualsiasi!) a valori reali
definite su X si dice reticolo vettoriale se per ogni f, g∈L anche max(f, g), min(f, g)∈
L.
Imponendo la solita norma ||f || = supx∈X |f (x)| un reticolo vettoriale diviene
uno spazio normato.
9.2.4 Lemma Se L è un reticolo vettoriale di funzioni reali limitate definite
su un insieme X e se 1 ∈ L allora per ogni funzionale lineare limitato F su L
esistono due funzionali lineari positivi F+ e F− tali che F = F+ − F− e
||F || = F+ (1) + F− (1)
Dimostrazione: Se f ∈ L è non-negativa poniamo
F+ (f ) := sup F (ϕ)
0≤ϕ≤f
Allora
(1) F+ (f ) ≥ 0.
292
Capitolo 9. Algebre di Banach e C*-algebre
(2) F+ (f ) ≥ F (f ).
(3) ∀c ≥ 0 F+ (cf ) = cF+ (f ).
Se f, g ∈ L sono non-negative e 0 ≤ ϕ ≤ f e 0 ≤ ψ ≤ g allora
F+ (f + g) ≥ F (ϕ) + F (ψ)
e, passando al sup su tutte le ϕ e ψ:
F+ (f + g) ≥ F+ (f ) + F+ (g)
Ma, se 0 ≤ χ ≤ f + g allora 0 ≤ max(chi, f ) ≤ f e quindi 0 ≤ χ − max(χ, f ) ≤ g,
sicché
F (χ) = F (max(χ, f )) + F (χ − max(χ, f )) ≤ F+ (f ) + F+ (g)
Passando ancora al sup su tutte le χ:
F+ (f + g) ≤ F+ (f ) + F+ (g)
cioè F+ (f + g) = F+ (f ) + F+ (g).
Ora sia f ∈ L qualsiasi e M, N ≥ 0 costanti tali che f + M, f + N ≥ 0; allora
F+ (f + M + N ) = F+ (f + M ) + F+ (N ) = F+ (f + N ) + F+ (M )
cioè
F+ (f + M ) − F+ (M ) = F+ (f + N ) − F+ (N )
Quindi il valore di F+ (f + M ) − F+ (M ) non dipende dalla scelta di M : definiamo
dunque F+ (f ) := F+ (f + M ) − F+ (M ) ed il funzionale F+ è lineare 1 .
Per le (1) e (2) sia F+ che il funzionale lineare F− := F+ − F sono positivi e
si ha ovviamente F = F+ − F− .
Ora dimostriamo la relazione fra le norme: si ha sempre che
||F || ≤ ||F+ || + ||F− || = F+ (1) + F− (1)
Per avere la disuguaglianza nel verso opposto consideriamo una funziona 0 ≤
ϕ ≤ 1 di L; allora |2ϕ − 1| ≤ 1 e
||F || ≥ F (2ϕ − 1) = 2F (ϕ) − F (1)
passando al sup per ogni ϕ otteniamo
||F || ≥ 2F+ (1) − F (1) = F+ (1) + F− (1)
qed
1
Da F+ (cf ) = cF+ (f ) per c ≥ 0 e dato che F+ (−f ) + F+ (f ) = F+ (0) = 0 abbiamo che
F+ (cf ) = cF+ (f ) per ogni c.
9.2. L’algebra C(X)
293
9.2.5 Teorema (Riesz) Se X è uno spazio di Hausdorff compatto e CR (X) lo
spazio delle funzioni reali continue su X allora ad ogni funzionale limitato F su
CR (X) corrisponde un’unica misura di Radon finita con segno ν su X tale che
Z
∀f ∈ CR (X) F (f ) =
f dν
X
e ||F || = |ν|(X).
Dimostrazione: Sia F = F+ − F− come nel lemma. Allora per il teorema di
Riesz–Markov 9.2.2 esistono delle misure finite µ1 e µ2 tali che
Z
Z
F+ (f ) =
f dµ1
F− (f ) =
f dµ2
X
X
Ponendo ν := µ1 − µ2 otteniamo una misura di Radon finita con segno tale che
Z
F (f ) =
f dν
X
Ora calcoliamo la norma di F : si ha intanto che
Z
|F (f )| ≤
|f |d|ν| ≤ ||f || |ν|(X)
X
Quindi ||F || ≤ |ν|(X). Ma
|ν|(X) ≤ µ1 (X) + µ2 (X) = F+ (1) + F− (1) = ||F ||
i.e. ||F || = |ν|(X).
L’unicità è ovvia.
qed
Possiamo riformulare il teorema di Riesz dicendo che il duale topologico dello
spazio di Banach CR (X) è isomorfo allo spazio delle misure di Radon finite con
segno su X con la norma ||ν|| = |ν|(X).
Questo fatto rende immediate molte proprietà non banali dello spazio delle
misure, ad esempio il fatto che sia uno spazio di Banach. Un risultato del tutto
analogo vale per C(X) relativamente allo spazio delle misure di Radon complesse.
Utilizziamo questi risultati per stabilire una proprietà fondamentale delle algebre C(X) e CR (X) (nel seguito con X denoteremo sempre uno spazio compatto
di Hausdorff). Osserviamo per prima cosa che l’algebra C(X) separa i punti di
X, vale a dire:
∀x1 6= x2 ∃f ∈ C(X) f (x1 ) 6= f (x2 )
Questo segue immediatamente dal lemma di Urysohn 2.3.2.
294
Capitolo 9. Algebre di Banach e C*-algebre
9.2.6 Esempio La proprietà di separare i punti di X è goduta da molte sottoalgebre di C(X):
(1) L’algebra dei polinomi definiti sull’intervallo della retta reale [0, 1] ha certamente questa proprietà.
(2) Un esempio meno immediato è il seguente: consideriamo lo spazio
Y
X=
Dα
α∈A
ove
Dα := {z ∈ C | |z| ≤ rα }
e gli rα sono numeri positivi. Per il teorema di Tychonoff si tratta di uno
spazio compatto, che è manifestamente di Hausdorff. Se consideriamo le
proiezioni di X sui suoi fattori:
pα (x) := xα ∈ Dα
si tratta di funzioni continue, cioè pα ∈C(X), che quindi generano una certa
C*-sottoalgebra (con unità) P in C(X) (si tratta semplicemente dell’intersezione di tutte le C*-sottoalgebre (con unità) di C(X) che contengono P).
Un generico elemento di P si scrive
X m ...m ,l ...l
mk
l1
Cα11...αn n,β11...βkk pα1 (x)m1 ...pαn (x)mn pβ1 (x) ...pβk (x)
...mn ,l1 ...lk
appartenenti a C).
(con li , mi ≥ 0 ed i coefficienti Cαm11...α
n ,β1 ...βk
Questa sottoalgebra separa i punti: infatti se x 6= y sono elementi di X
allora esiste un α tale che pα (x) 6= pα (y).
In ambedue gli esempi precedenti, le sottoalgebre in questione sono in realtà
dense nelle rispettive algebre di funzioni continue, e questo segue dal teorema di
Stone–Weiestrass che ora vogliamo dimostrare: daremo un elegante argomento
di de Branges, sebbene il teorema possa dimostrarsi con tecniche essenzialmente
elementari.
9.2.7 Lemma (de Branges) Se R è una sottoalgebra di CR (X) e K = {µ ∈
R⊥ | ||µ|| ≤ 1}, per ogni punto µ estremale di K e per ogni funzione continua
f : R −→ (0, 1) f è costante sul supporto della misura µ.
Dimostrazione: Se µ = 0 certamente supp µ = ∅ ed il lemma è banale. Cosı̀
sia µ 6= 0, quindi ||µ|| = 1; definiamo le misure (di Radon) con segno
Z
Z
ν(E) :=
f dµ
e
λ(E) := (1 − f )dµ
E
E
9.2. L’algebra C(X)
295
(E boreliano). Dato che f ∈ R segue che ν, λ ∈ R⊥ e quindi non sono nulle (dato
che f 6= 0). Dunque
ν
λ
µ = ||ν||
+ ||λ||
||ν||
||λ||
è una combinazione convessa di elementi di K, dato che
Z
Z
||ν|| + ||λ|| =
f d|µ| + (1 − f )d|µ| = |µ|(X) = ||µ|| = 1
X
X
Ma µ è un punto estremale e quindi µ = ν/||ν||, i.e. ν = ||ν||µ:
Z
Z
f dµ =
||ν||dµ
E
E
per ogni boreliano E. Dunque f = ||ν|| |µ|-q.o. Ma f è continua, quindi f = ||ν||
sul supporto di µ.
qed
9.2.8 Teorema (Stone–Weierstrass) Se X è uno spazio compatto di Hausdorff e R è una *-sottoalgebra di CR (X) tale che
(1) I ∈ R.
(2) R separa i punti di X.
allora R = C(X).
Dimostrazione: Consideriamo K = {µ ∈ R⊥ | ||µ|| ≤ 1}: si tratta di un insieme non vuoto, convesso e *-debolmente compatto (teorema di Alaoglu 8.2.12),
quindi, per il teorema di Krejn–Milman 8.3.10, contiene un estremale µ.
Supponiamo che il supporto di µ contenga almeno due punti distinti x, y:
allora esiste f ∈ R con 0 < f < 1 che separa i punti. Ma per il lemma di de
Branges questo è impossibile; quindi supp µ = {x}, dunque
Z
1dµ = 0
X
(perché R contiene le costanti) i.e. µ = 0. Ma allora K = {0} e quindi R⊥ = {0}.
Per concludere la dimostrazione applichiamo infine il teorema di Hahn–Banach:
se la chiusura di R non fosse tutta C(X) dovrebbe esistere un funzionale lineare
non nullo in R, mentre abbiamo dedotto che R⊥ = {0}.
qed
Il teorema di Stone–Weiestrass può formularsi anche per l’algebra C(X) delle
funzioni complesse:
296
Capitolo 9. Algebre di Banach e C*-algebre
9.2.9 Teorema (Stone–Weierstrass complesso) Se X è uno spazio compatto di Hausdorff e R è una *-sottoalgebra di C(X) (cioè contiene, con ogni
funzione f la coniugata f ∗ := f ) tale che
(1) I ∈ R.
(2) R separa i punti di X.
allora R = C(X).
Dimostrazione: Basta dimostrare che l’algebra reale
R0 := {f ∈ R | f = f ∗ }
delle funzioni autoconiugate (cioè a valori reali!) è densa in CR (X), e quindi che
soddisfa le ipotesi del teorema di Stone–Weierstrass reale. Evidentemente 1 ∈ R0 ,
quindi R0 contiene le costanti reali; che separi i punti è immediato: se x1 6= x2
sono punti di X, esiste una funzione complessa F che li separa, quindi delle due
funzioni reali
F +F
F −F
f=
e
g=
2
2i
almeno una separa i punti x1 e x2 .
qed
Come controesempio, vedremo in seguito che l’algebra A(D) delle funzioni
complesse continue nel disco chiuso D = {z ∈ C | |z| ≤ 1} olomorfe al suo
interno non soddisfa le ipotesi del teorema di Stone–Weierstrass (il coniugio non
è olomorfo).
Dimostriamo infine che lo spazio C(X) gode di una notevole proprietà universale, postulata da Urysohn e dimostrata da Banach e Mazur: questa proprietà
si articola in due risultati estremamente interessanti.
9.2.10 Teorema Ogni spazio di Banach B è isomorfo ad un sottospazio chiuso
di C(X) per un opportuno spazio topologico compatto X. Se B è separabile può
assumersi X = [0, 1].
Dimostrazione: Utilizzeremo in modo essenziale le nozioni generali introdotte
nel capitolo sugli spazi vettoriali topologici.
Sia X la palla unitaria in V ∗ : sappiamo dal teorema di Alaoglu 8.2.12 che si
tratta di un insieme *-debolmente compatto. Allora l’applicazione che ad ogni
elemento di B fa corrispondere un funzionale lineare su X si estende ad una
mappa
B −→ C(X)
9.2. L’algebra C(X)
297
che è un isomorfismo di B su un sottospazio chiuso di C(X).
Supponiamo ora che B sia separabile; allora X ⊂ B ∗ è uno spazio topologico
metrizzabile. Costruiamo esplicitamente una funzione f da C[0, 1] allo spazio
metrico convesso compatto X: a questo punto la funzione
B −→ C[0, 1]
x 7−→ (t 7−→ (f (t)(x))
sarà, per la prima parte della dimostrazione, l’immersione isometrica di B in
C[0, 1] desiderata.
Possiamo supporre che il diametro dello spazio metrico compatto X sia 1;
sempre per compattezza possiamo scrivere
X=
n
[
Xi
i=1
ove gli Xi sono chiusi e hanno diametro 1/2. Per ogni i possiamo allora scrivere
Xi =
ni
[
Xij
j=1
ove gli Xij sono chiusi e hanno diametro 1/4. In generale, iterando il procedimento, perverremo ad una successione {Xi1 ...ik } di chiusi di diametri 2−k .
Costruiamo ora la funzione f : [0, 1] −→ X con un procedimento iterativo:
dividendo [0, 1] in 2n1 − 1 intervalli ∆i , definiamo f su ∆i come una curva
continua che congiunga un punto xk di Xk con un punto xk+1 di Xk+1 . (lo spazio
X è convesso dunque ciò è possibile). Iteriamo il procedimento dividendo ∆2k−1 in
2n2 − 1 intervalli ∆i,2k−1 e definendo su questi f come il cammino che congiunga
un punto xkh ∈ Xkh con un punto xk,h+1 ∈ Xk,h+1 . Iterando il procedimento
indefinitamente la funzione f resta cosı̀ definita su un sottoinsieme denso di
[0, 1] ed ivi continua, i.e. sarà possibile prolungarla ad una funzione continua
f : [0, 1] −→ X.
qed
9.2.11 Teorema (Fréchet) Ogni spazio metrico separabile X è isometrico ad
un sottospazio di uno spazio di Banach separabile.
Dimostrazione: Sia D = {xn }n∈N = {x0 , x1 , ...} un insieme denso numerabile
in X; definiamo allora una mappa
Φ : X −→ M
298
Capitolo 9. Algebre di Banach e C*-algebre
ove M è lo spazio delle successioni numeriche limitate (che è uno spazio metrico
rispetto alla distanza d({xn }, {yn }) := supn |xn − yn |), nel modo seguente:
Φ(x) := {yn := d(x, xn ) − d(x0 , xn )}n∈N\{0}
(che Φ(x) sia una successione numerica limitata segue dalla disuguaglianza triangolare: ∀n ≥ 1 |yn | ≤ d(x, x0 )). Siano ora x.x0 ∈ X e Φ(x) = {yn } e Φ(x0 ) = {yn0 }.
Allora
||Φ(x) − Φ(x0 )|| = sup |yn − yn0 |
n
= sup |(d(x, xi ) − d(x0 , xi )) − (d(x0 , xi ) − d(x0 , xi ))|
n
= sup |d(x, xi ) − d(x0 , xi )|‘d(x, x0 )
n
Quindi, se 0 < ε < d(x, x0 ) esiste xn ∈ M tale che d(x, xn ) < ε/2 sicché:
d(x0 , xn ) ≥ d(x0 , x) − d(x, xn ) > d(x0 , x) −
ε
>0
2
vale a dire
|yn − yn0 | = |d(xn , x) − d(x, x0 )| >
ε
ε ε
> d(x0 , xn ) − > d(x0 , x) − − = d(x, x0 ) − ε
2
2 2
da cui ||Φ(x) − Φ(x0 )|| > d(x, x0 ) − ε e, per arbitrarietà di ε:
d(x, x0 ) ≤ ||Φ(x) − Φ(x0 )||
Abbiamo cioè dimostrato che ||Φ(x)−Φ(x0 )|| = d(x, x0 ) e quindi X è isometrico ad
un sottospazio M0 separabile dello spazio M delle successioni numeriche limitate.
Allora lo spazio di Banach generato da M0 in M è separabile e contiene X.
qed
Conclusione:
9.2.12 Teorema (Banach–Mazur) Ogni spazio metrico separabile è isometrico ad un sottospazio di C[0, 1].
9.3
Spettro e risolvente
Come in precedenza, d’ora in avanti tutte le algebre e gli spazi normati, salvo
esplicita avviso contrario, saranno supposti complessi: in questo e nel paragrafo
seguente sarà chiaro il perché di questa assunzione.
299
9.3. Spettro e risolvente
9.3.1 Definizione Se A è un’algebra di Banach definiamo lo spettro di A∈A
come
σ(A) := {λ ∈ C | A − λI ∈
/ A−1 }
ed il risolvente di A come
P (A) := C \ σ(A) = {λ ∈ C | A − λI ∈ A−1 }
Stabiliamo anche la notazione:
R(λ) := (A − λI)−1
9.3.2 Proposizione Lo spettro di un elemento di un’algebra di Banach è compatto in C.
Dimostrazione: Per continuità di λ 7−→ A − λI l’insieme P (A) è aperto e
quindi σ(A) è chiuso; ovviamente P (A) è limitato: dimostriamo che lo è anche
σ(A).
||λ−1 A|| < 1 ⇒ I − λ−1 A ∈ A−1
quindi per |λ| > ||A|| si ha che λ ∈ P (A) e
σ(A) ⊂ {λ ∈ C | |λ| ≤ ||A||}
che è limitato.
qed
Dimostreremo in séguito che per ogni A ∈ A: α(A) 6= ∅.
Osserviamo che se |λ| > ||A|| allora
||(A − λI|−1 || ≤ |λ|−1
1
1 − ||λ−1 A||
è analitica. Vogliamo dare, più in generale, una definizione di analiticità per
funzioni a valori in uno spazio di Banach:
9.3.3 Definizione Se D ⊂ C è un aperto e A : D −→ X è una funzione a
valori in uno spazio di Banach, si dice che A è analitica in z ∈ D se esiste la sua
derivata A0 : D −→ X nella topologia della norma:
¯¯
¯¯
¯¯ (A(z + h) − A(z))
¯¯
0
¯
¯
lim ¯¯
− A (z)¯¯¯¯ = 0
|h|−→0
h
I casi interessanti saranno quando X è della forma B(X, Y ) o Y ∗ . Diamo ora
una utile caratterizzazione del concetto di analiticità di una funzione a valori in
uno spazio di Banach: ci serve un risultato di Analisi Complessa2
2
Per alcuni richiami sulla teoria delle funzioni olomorfe si veda l’Appendice al capitolo, pag.
319 e seguenti).
300
Capitolo 9. Algebre di Banach e C*-algebre
9.3.4 Lemma Se f : D −→ C è olomorfa nell’aperto D e se la palla {||z 0 −z|| ≤
r}z∈D è contenuta in D allora, per ogni h, k ∈ C con |h|, |k| ≤ r2 si ha la
¯
¯
¯ f (z + h) − f (z) f (z + k) − f (z) ¯
¯
¯ ≤ M |h − k|
−
¯
¯
h
k
ove M non dipende da h né da k.
Dimostrazione: Utilizziamo la formula integrale di Cauchy 9.6.6: abbiamo che
||ξ − z 0 || ≥
r
2
per z 0 ∈ {z, z + h, z + k} e ζ ∈ γ := {w ∈ C | |w − z 0 | = r}. Cioè la curva chiusa γ è
completamente contenuta nel dominio D. Applichiamo a questa curva la formula
di Cauchy:
I
1
f (ξ)
0
f (z) =
dξ
2πi Γ ξ − z 0
al primo membro della disuguaglianza dell’enunciato, ottenendo
¯
!
à Ã
µ
¶ ! ¯¯
¯ 1 I
1
1
1
1
1
1
¯
¯
−
f (ζ)
dζ ¯
−
−
¯
¯
¯ 2πi Γ
h ζ − (z + h) ζ − z
k ζ − (z + k) ζ − z
¯
¯
¯ 1 I
¯
z − (z + k) − z + (z + h)
¯
¯
=¯
f (ζ)
dζ ¯
¯ 2πi Γ
(ζ − (z + h))(ζ − z)(ζ − (z + k)) ¯
¯
¯
¯ 1 I
¯
1
¯
¯
=¯
f (ζ)
dζ ¯
¯ 2πi Γ
(ζ − z)(ζ − (z + h))(ζ − (z + k)) ¯
≤ |h − k| sup f (ζ)
|ζ−z|=r
4r
r3
Cioè la disequazione voluta.
qed
9.3.5 Definizione Se Y è uno spazio di Banach, un E ⊂ Y ∗ sottospazio vettoriale chiuso si dice sottospazio determinante se, considerando la restrizione della
mappa canonica j : Y ,→ Y ∗∗ a E si ha che
∀y ∈ Y
||j|E (y)|| = ||y||
301
9.3. Spettro e risolvente
9.3.6 Lemma Se X e Y sono spazi di Banach, F è un sottoinsieme di B(X, Y )
e E un sottospazio determinante di Y ∗ allora, se per ogni x ∈ X e y ∈ E l’insieme
{hy, Axi | A ∈ F}
è limitato, F è limitato in B(X, Y ) (cioè è equilimitato in norma).
Dimostrazione: Se J : X ,→ X ∗ è l’immersione canonica allora
∀x ∈ X
sup |hJ(Ax), yi| < ∞
y∈E
Allora, per il teorema di Banach–Steinhaus 6.5.14:
sup ||J|E (Ax)|| = sup ||J(Ax)|| = sup ||Ax|| < ∞
x∈X
x∈X
x∈X
e quindi, ancora per il teorema di Banach–Steinhaus, la tesi.
qed
9.3.7 Teorema Una funzione A : D −→ B(X, Y ) è analitica se e solo se per
ogni F ∈ X ∗ la funzione
D −→ C
z 7−→ hF |A(z)i
è olomorfa (scriviamo hF |xi = F (x) per la valutazione del funzionale F sull’elemento x).
Dimostrazione: Evidentemente una funzione A analitica soddisfa la condizione
del teorema: dimostriamo il viceversa.
La funzione z 7−→ hF |A(z)xi è analitica a valori in C, quindi soddisfa le
ipotesi del lemma 9.3.4. Consideriamo ora la famiglia
µ
¶¾
½
A(z + h) − A(z) A(z + k) − A(z)
1
F :=
−
h−k
h
k
(per h, k ∈ C con |h|, |k| < 2r ). Per il lemma 9.3.4 questa famiglia soddisfa le
ipotesi del lemma 9.3.6 e quindi F è limitato in norma. Questo vuol dire che la
successione
½
¾
A(z + h) − A(z)
h
è di Cauchy e quindi converge alla derivata A0 (z) nella norma di B(X, Y ).
qed
302
Capitolo 9. Algebre di Banach e C*-algebre
Osserviamo che, ovviamente
dn
hy, A(z)xi = hy, A(n) (z)xi
n
dz
L’importanza di questo teorema sta nel fatto che ci consente di estendere al caso
di funzioni a valori in uno spazio di Banach molti dei risultati della teoria delle
funzioni di una variabile complessa. Osserviamo a questo proposito, che se Γ
è una curva chiusa regolare nel piano complesso e x : Γ −→ E una funzione
continua a valori in uno spazio di Banach E ha perfettamente senso il vettore
I
x(z)dz
Γ
dato che la continuità della x implica che le somme parziali (alla Riemann, ad
esempio) che definiscono l’integrale formano una successione di Cauchy, dunque
convergono in E ad un elemento ben determinato che è poi il valore dell’integrale.
Il teorema di Cauchy 9.6.5, cioè che se D è compatto e Γ := ∂D è una curva
regolare chiusa, e se A : D −→ B(X, Y ) è analitica in D \ Γ e continua in D
allora
I
A(z)dz = 0
Γ
non è completamente immediato: si tratta di osservare che, per il teorema precedente:
¶ À I
¿ µI
∗
A(z)dz x = hy, A(z)xi dz = 0
∀x ∈ X ∀y ∈ Y
y,
Γ
Γ
Il teorema di Hahn–Banach permette allora di inferire il teorema di Cauchy. Si
estendono immediatamente al nostro contesto le formule di Cauchy 9.6.6 e le sue
conseguenze, ad esempio il principio di continuazione analitica, in virtù del quale
si può definire il dominio di analiticità di una funzione analitica a valori in uno
spazio di Banach come il più grande aperto connesso di C ove la funzione sia
definita ed analitica.
Similmente le formule di Taylor 9.6.16, Caychy–Hadamard 9.6.11 e Laurent
9.6.29 si generalizzano immediatamente al caso di funzioni olomorfe a valori in
B(X, Y ).
Torniamo ora alle algebre di Banach.
9.3.8 Teorema Se A è un’algebra di Banach (con unità) allora la funzione R :
P (A) −→ A:
R(λ) := (A − λI)−1
è analitica.
303
9.3. Spettro e risolvente
Dimostrazione: Se z ∈ P (A) allora
A − λI = A − zI − (z − λ)I = (A − zI)(I − (λ − z)R(z))
Cioè se (A−zI) e I −(λ−z)R(z) sono invertibili allora lo è (A−λI); ma (A−zI)
è invertibile e I − (λ − z)R(z) lo è se
||A − zI|| < ||R(z)||−1
In questo caso, λ ∈ P (A) e
³X
´
X
R(λ) =
(λ − z)n R(z)n R(z) =
(λ − z)n R(z)n+1
e quindi λ 7−→ (A − λI)−1 è analitica.
qed
Applicando allora il teorema di Liouville 9.6.26 abbiamo che
9.3.9 Corollario σ(A) 6= ∅.
Osserviamo che
(A − λI)
−1
−1
−1
= (−λ(I − λ A))
= −λ
∞
X
An
n=0
λn
P n n
La serie
z A converge per |z| < ||A||−1 ed il suo raggio di convergenza è
1/ supλ∈σ(A) |λ|.
9.3.10 Definizione Il raggio spettrale di un elemento A ∈ A è il numero
spr(A) := lim ||An ||1/n
n−→∞
9.3.11 Teorema Per ogni elemento A di un’algebra di Banach A:
spr(A) = lim ||A||n ||1/n = inf ||An ||1/n
n−→∞
n∈N
Dimostrazione: Per continuità e monotonia del logaritmo basta dimostrare
che an := log ||An ||1/n converge al proprio estremo inferiore, i.e. che
an
an
−→ inf
n
n
an è subadditiva (cioè an+m ≤ an + am ) dato che
an+m = log ||An Am || ≤ log(||An || ||A||m ) = an + am
304
Capitolo 9. Algebre di Banach e C*-algebre
Ma la subadditività di una successione implica che questa converga al proprio
estremo inferiore: infatti fissato q tale che n = qm + r (r = 0, ..., q − 1) si ha
an ≤ aqm + ar ≤ maq + ar
(applicando m volte la subadditività) e quindi
an
maq ar
≤
+
n
n
n
Il secondo membro converge al variare di n dunque
³ ma
ar ´ aq
q
lim
=
+
n
n
q
i.e, per ogni q:
lim
aq
an
an
aq
aq
≤
⇒ lim ≤ inf
≤ lim
q q
n
q
n
q
e quindi la successione an /n converge al proprio inf.
qed
9.3.12 Esempio
(1) Sia H = l2 (N) e {ei } una base ortonormale. Definiamo gli operatori diagonali come
Den := dn en
con dn ∈ C, che soddisfano alle condizioni imposte dalla
! ¯¯
¯¯ ÃX
¯¯2 X
¯
¯
2
¯
¯
|dn |2 |xn |2 ≤ ||d||2∞ ||xn ||2
xn en ¯¯¯¯ =
||Dx|| = ¯¯D
n∈N
cioè ||D|| = ||d||∞ = supn |dn |. Il raggio spettrale di un operatore diagonale
è la sua norma:
spr(D) = ||D||
(2) Se consideriamo lo shift Sen := en+1 , dato che (essendo una isometria) è
||S|| = 1 abbiamo che
spr(S) = 1
(3) Una generalizzazione sono gli operatori di shift pesato
T en := tn en+1
(con {tn } ∈ l∞ ) tali che ||T || = ||t||∞ .
305
9.3. Spettro e risolvente
(4) Consideriamo gli operatori di Volterra (cfr. esempio 3.2.10). Siano X =
L2 [0, 1], K ∈ C([0, 1]2 ) e definiamo K : X −→ X come
Z
(Kx)(t) :=
t
K(t, s)x(s)ds
0
La funzione K si dice nucleo dell’operatore. (In particolare si può considerare un operatore di Volterra sullo spazio X = C[0, 1]). Ovviamente
||K|| ≤ ||K||∞ ⇒ ||K n || ≤
||X||n∞
(n − 1)!
(il fattore numerico è il volume del dominio di integrazione) e quindi
spr(K) = 0
P n
Infatti la serie
K è assolutamente convergente in B(X) e quindi defini−1
sce (I − K) e, dato che se λ 6= 0 λK è pure un operatore di Volterra, il
risolvente di K contiene tutti i numeri complessi non nulli e
σ(K) = {0}
L’operatore K è invertibile se
∀t ∈ [0, 1] K(t, t) 6= 0
Infatti in questo caso, se x ∈ N (K):
Z
t
K(t, s)x(s)ds = 0
0
derivando per t (K rispetto alla prima variabile):
Z
t
K 0 (t, s)x(s)ds + K(t, t)x(t) = 0
0
da cui (per l’ipotesi su K):
Z
0
t
K 0 (t, s)
x(s)ds + x(t) = 0
K(t, t)
i.e. x ∈ N (I + H) ove H è l’operatore di Volterra con nucleo K 0 /K e quindi,
x = 0.
306
9.4
Capitolo 9. Algebre di Banach e C*-algebre
Morfismi e quozienti
Le algebre di Banach non sopportano strutture algebriche troppo forti: in
particolare debbono sempre possedere elementi non invertibili (e quindi ideali) a
meno di non ridurli ai soli numeri complessi.
9.4.1 Teorema (Mazur) Un’algebra di Banach con unità e in cui ogni elemento sia invertibile è isomorfa a C.
Dimostrazione: Un elemento A ∈ A ha spettro non vuoto e quindi esiste λ ∈
σ(A); in particolare (A − λI) non è invertibile, quindi deve essere nullo. Abbiamo
cioè dimostrato che ogni elemento non nullo di A è multiplo dell’identità. Quindi
A∼
= C.
qed
Un’algebra in cui ci siano elementi non invertibili possiede delle notevoli
sottoalgebre: gli ideali.
9.4.2 Definizione Un ideale sinistro di un’algebra di Banach A è un sottospazio
vettoriale J ⊂ A tale che
∀B ∈ J ∀C ∈ A CB ∈ J
Si scrive J C A.
Se un’algebra di Banach ha unità I ovviamente nessun ideale (non banale, cioè
non uguale a A) può contenerla e, viceversa, un ideale non banale ha intersezione
vuota con l’insieme A−1 degli elementi invertibili di A.
In ogni algebra di Banach v’è abbondanza di elementi invertibili, infatti
B := {B ∈ A | ||I − B|| < 1} ⊂ A−1
In particolare se J C A è un ideale proprio (cioè non banale) allora J ∩ B = ∅ e
quindi J è contenuto nell’insieme chiuso {B, che deve quindi contenere anche la
chiusura J di J. Dunque se J C A allora J ⊂ A, anzi
9.4.3 Proposizione Se J è un ideale sinistro (destro, bilatero) allora J è un
ideale sinistro (destro, bilatero).
Dimostrazione: Se {Bn } ⊂ J converge a B ⊂ J allora, per ogni A ∈ A la
{ABn } ⊂ J converge (per continuità del prodotto) a AB ∈ J.
qed
307
9.4. Morfismi e quozienti
D’ora in avanti conveniamo che il termine “ideale” voglia dire “ideale sinistro”; se un ideale sarà destro o bilatero lo diremo esplicitamente.
Rispetto all’inclusione gli ideali sinistri (destri, bilateri) di un’algebra di Banach formano un reticolo (con 0 = {0} ideale zero e 1 = A ideale banale): inoltre
questo insieme parzialmente ordinato soddisfa
S le ipotesi del lemma di Zorn, dato
che se {Jα } è una catena di ideali allora α Jα è un ideale, il che significa che
ogni ideale è contenuto in un ideale (proprio!) massimale3 .
Ovviamente, dato che la chiusura di un insieme contiene l’insieme stesso:
9.4.4 Corollario Ogni ideale massimale è chiuso.
Sappiamo che possiamo definire il quoziente di un’algebra A per un ideale J
ottenendo ancora un’algebra A/J. Effettuiamo questa costruzione per le algebre
di Banach.
L’insieme A/J è senz’altro un’algebra associativa: dobbiamo verificare se sia
un’algebra di Banach. Denotando gli elementi di A/J come A + J (sono classi
di equivalenza rispetto alla relazione A ≡ B ⇐⇒ A − B ∈ J), poniamo
||A + J|| := inf ||B||
B∈A+J
9.4.5 Proposizione Se J è un ideale chiuso allora A/J è un’algebra di Banach.
Dimostrazione: Scrivendo B = A − C con C ∈ J abbiamo che inf ||A − C|| =
d(A, J) ove d è la distanza indotta dalla norma dello spazio di Banach A. Dunque
se ||A + J|| = 0 si ha che d(A, J) = 0 e quindi (per chiusura di J) A ∈ J i.e.
A + J = J, l’elemento 0 ∈ A/J. Le altre proprietà della norma sono ovvie dalla
definizione di distanza d(A, J).
Verifichiamo infine che la norma indotta su A è completa. Sia
∞
X
||An + J|| < ∞
n=0
una serie assolutamente convergente in A/J; prendiamo nella classe An + J degli
elementi Bn tali che ||Bn || < ||An || + εn con
∞
X
εn < ∞
n=0
3
Questa e diverse altre asserzioni valgono nelle algebre associative qualsiasi e negli anelli:
in particolare l’esistenza di un ideale massimale che contenga un ideale dato è nota in Algebra
come Lemma di Krull .
308
Capitolo 9. Algebre di Banach e C*-algebre
P
(ad esempio basta considerare ε = 2−1 ). Dunque
||Bn || è assolutamente conP
vergente e, dato che A è di Banach, la serie Bn converge ad un elemento B ∈A,
in modo che
¯¯
¯¯
N
X
¯¯
¯¯
¯¯ −→ 0
¯¯B −
B
n
¯¯
¯¯
n=1
e (per definizione la norma della classe di un elemento A + J ∈ A/J è minore o
uguale alla norma di A in A):
¯¯
¯¯ ¯¯
¯¯
N
N
X
X
¯¯
¯¯ ¯¯
¯¯
¯¯(A + J) −
Bn ¯¯¯¯
(An + J)¯¯¯¯ ≤ ¯¯¯¯B −
¯¯
n=1
n=1
Quindi ogni serie assolutamente convergente in A/J converge in A/J.
Infine, se A + J, B + J ∈ A/J esistono rappresentanti Aε ∈ A + J e Bε ∈ B + J
tali che ||Aε || ≤ ||(A + J)|| + ε e ||Bε || ≤ ||(B + J)|| + ε. Quindi
||(A + J)(B + J)|| = ||(AB) + J|| ≤ ||Aε Bε ||
≤ ||Aε || ||Bε || ≤ ||A + J|| ||B + J|| + 2ε
qed
Naturalmente un ideale J è massimale se e solo se A/J = C per il teorema
di Mazur.
9.4.6 Lemma Se A è un’algebra di Banach con unità allora
A−1 = {{A | ∃J ideale massimale proprio e A ∈ J}
Se fissiamo un elemento A ∈ A l’insieme degli ideali che contengono A è pure
parzialmente ordinato e soddisfa le ipotesi del lemma di Zorn, quindi il teorema
di Mazur può formularsi come
9.4.7 Teorema Un’algebra di Banach con unità che non abbia ideali non banali
è isomorfa a C.
Naturalmente un’algebra può non avere ideali bilateri pur possedendo moltissimi ideali sinistri, mentre in un’algebra commutativa i concetti di ideale sinistro,
destro e bilatero coincidono.
Tutte le costruzioni algebriche che si effettuano sugli anelli possono darsi
anche per le algebre di Banach: ad esempio un morfismo ϕ : A −→ B fra algebre
di Banach è un operatore lineare continuo fra gli spazi di Banach A e B tale che
∀A ∈ A ∀B ∈ B
ϕ(AB) = ϕ(A)ϕ(B)
9.4. Morfismi e quozienti
309
Ovviamente le algebre di Banach formano in questo modo una categoria.
I concetti di nucleo e immagine di un morfismo sono ovvi: il nucleo ker(ϕ) è
l’insieme degli elementi di A la cui immagine è zero e l’immagine im(ϕ) l’insieme
degli elementi di B che siano immagine di un elemento di A.
L’insieme degli omomorfismi fra due algebre di Banach A e B si denota
hom(A, B).
Un omomorfismo si dice isomorfismo se è un operatore lineare continuo e
biunivoco (quindi una isometria). Si possono formulare e dimostrare esattamente
come nel caso algebrico i teoremi di isomorfismo: ad esempio
9.4.8 Teorema Se ϕ : A −→ B un morfismo fra algebre di Banach allora ker(ϕ)
è un ideale bilatero e l’algebra A/J è isomorfa alla sottoalgebra im(ϕ) ⊂ B.
9.4.9 Definizione Un modulo su un’algebra di Banach A è uno spazio di Banach M dotato di un morfismo
µ : A −→ B(M, M)
che si dice azione di A su M.
Si scrive in genere A·M in luogo di µ(A)(M ). Quindi gli elementi di un modulo
si possono moltiplicare per gli elementi dell’algebra. Ad esempio un C-modulo
X non è altri che uno spazio di Banach.
Osserviamo che un ideale J, cosı̀ come l’insieme quoziente A/J sono Amoduli.
9.4.10 Definizione Un’algebra di Banach priva di ideali bilateri non banali si
dice semplice.
9.4.11 Esempio
(1) C è semplice.
(2) Le algebre (di dimensione finita) Mn (C) sono algebre semplici (teorema
5.5.14).
(3) Il teorema di Mazur implica che un’algebra semplice commutativa (con
unità) è isomorfa a C.
Consideriamo dunque un ideale massimale J nell’algebra di Banach (con
unità) A; dato che il quoziente A/J è C possiamo definire la mappa
∀A ∈ A ϕ(A) := λ
310
Capitolo 9. Algebre di Banach e C*-algebre
con A + J = λI, ovvero A + J = ϕ(A)I. La mappa ϕ non è altri che il morfismo
naturale dato dalla proiezione di A sul quoziente A/J:
ϕ : A −→ C
che è ovviamente suriettivo. Viceversa, se ϕ : A −→ C è un morfismo allora ker ϕ = ϕ−1 (0) è un ideale bilatero che deve essere massimale, dato che
A/ ker ϕ = im ϕ è una sottoalgebra di C e quindi {0} (da cui A = ker ϕ) oppure
C stessa (da cui ker ϕ massimale). Quindi
9.4.12 Teorema Esiste una corrispondenza biunivoca
{J C A | J 6= A} ←→ {ϕ : A −→ C | ϕ morfismo}
Si noti che il funzionale ϕ associato ad un ideale massimale è continuo (perché
l’ideale è chiuso) ed ha norma 1.
9.4.13 Esempio Gli ideali massimali dell’algebra di Banach C(X) delle funzioni
continue su uno spazio compatto di Hausdorff sono tutti della forma
Mx := {f ∈ C(X) | f (x) = 0}
In effetti, se ϕ : C(X) −→ C allora ϕ(1) = 1 e ϕ ha lo stesso nucleo del funzionale
δx : X −→ C
che vale 1 su x e zero altrove (misura di Dirac concentrata in x), quindi ϕ = δx .
Ma il nucleo di δx è esattamente Mx .
Si noti che la corrispondenza x 7−→ Mx è biunivoca, fra X e l’insieme degli
ideali massimali, dato che se x 6= y per il lemma di Urysohn esiste una funzione
f con f (x) 6= f (y) e quindi δx 6= δy .
9.4.14 Teorema Se A ∈ A algebra di Banach, allora
{ϕ(A)}ϕ∈hom(A,C) = σ(A)
Dimostrazione: Se ϕ ∈ hom(A, C) allora, per ogni A ∈ A si ha che ϕ(A −
ϕ(A)I) = 0 e quindi A − ϕ(A)I ∈ ker ϕ; dunque (A − ϕ(A)I) non è invertibile,
i.e. ϕ(A) ∈ σ(A).
Viceversa, se λ ∈ σ(A), A − λI) non è invertibile ed è pertanto contenuto in
un ideale massimale proprio J. Ma allora la proiezione canonica ϕ : A −→ A/J
è tale che ϕ(A − λI) = 0 i.e. ϕ(A) = λI.
qed
311
9.4. Morfismi e quozienti
9.4.15 Corollario Se A è un’algebra di Banach, A ∈ A e ϕ ∈ hom(A, C):
(1) |ϕ(A)| ≤ spr(A) ≤ ||A||
(2) Se ϕ ∈ B(A, C) con ϕ(I) = 1 allora ||ϕ|| = 1.
9.4.16 Teorema In un’algebra di Banach lo spettro è debolmente compatto.
Dimostrazione: Basta, per il teorema di Alaoglu 8.2.12, far vedere che σ(A) è
contenuto nella palla unitaria. Si ha intanto che, per ogni ϕ ∈ σ(A): ϕ(I) = 1, e
dunque possiamo prendere
\
A∗1 ∩ {f ∈ A∗ | f (I) = 1} ∩
{f ∈ A∗ | f (AB) − f (A) − f (B) = 0}
A,B∈A
che è esattamente σ(A) (per definizione!). Abbiamo cosı̀ scritto σ(A) come intersezione di un insieme *-debolmente compatto (la palla unitaria) e di insiemi
*-debolmente chiusi (per continuità delle f ∈ A∗ e dell’operazione di valutazione
di un funzionale su un elemento dell’algebra); cioè σ(A) è debolmente chiuso in
un debolmente compatto, dunque è debolmente compatto.
qed
Il morfismo
b : A −→ C(σ(A))
A 7−→ (ϕ 7−→ ϕ(A))
si dice trasformata di Gel’fand . Dato che i funzionali ϕ sono lineari, moltiplicativi
e continui, la trasformata di Gel’fand è un operatore lineare:
b + bB)(ϕ)
b
\
aA
+ bB(ϕ) = ϕ(aA + bB) = aϕ(A) + bϕ(B) = (aA
un morfismo di algebre:
d
bB)(ϕ)
b
AB(ϕ)
= ϕ(AB) = ϕ(A)ϕ(B) = (A
ed è continuo:
b = sup |A(ϕ)|
b
||A||
= sup λ = spr(A) ≤ ||A||
ϕ∈σ(A)
λ∈σ(A)
(per definizione di σ(A) = {ϕ(A)}ϕ∈σ(A) ).
9.4.17 Definizione Un elemento A di un’algebra di Banach A si dice topologicamente nilpotente se spr(A) = 0.
312
Capitolo 9. Algebre di Banach e C*-algebre
9.4.18 Corollario Gli elementi topologicamente nilpotenti di un’algebra di Banach A costituiscono il nucleo della trasformata di Gel’fand. In particolare sono
un ideale.
Il nucleo della trasformata di Gel’fand si dice nilradicale dell’algebra A.
9.4.19 Esempio Consideriamo il disco unitario del piano complesso D := {z ∈
C | |z| ≤ 1} e l’algebra
o
A(D) := {f ∈ C(D) | f ∈ O(−→ D)}
delle funzioni olomorfe nell’interno di D e continue in D; rispetto alla norma del
sup si tratta ovviamente di un’algebra di Banach, e, essendo compatta l’immagine
di un compatto per tramite di una mappa continua:
σ(A(D)) = {Φz : A(D) −→ D}z∈C = D
ove Φz (f ) := f (z). In questo caso la trasformata di Gel’fand è la mappa identica,
quindi, ad esempio, il nilradicale è {0}. Osserviamo esplicitamente che non esiste
una operazione * in quest’algebra, e che la sua immagine in C(σ(A(D))) per
tramite della trasformata di Gel’fand non esaurisce tutta l’algebra delle funzioni
continue: questo fatto, dato che, come si vede facilmente, A separa i punti e
contiene le costanti, fornisce un esempio che mostra come la condizione di essere
una *-sottoalgebra è essenziale nelle ipotesi del teorema di Stone–Weierstrass
complesso. Se invece del prodotto punto per punto, consideriamo su A(D) il
prodotto
Z
1
(f · g)(z) :=
f (z − tz)g(tz)zdt
0
otteniamo un’algebra di Banach priva di unità; in questi casi, come vedremo
meglio in seguito, possiamo sempre estenderla ad un’algebra con unità, ponendo
B := A ⊕ C. Allora ogni elemento della forma A ⊕ 0 (con A ∈ A(D)) ha raggio
spettrale zero, sicché σ(A(D)) si riduce ad un sol punto.
9.4.20 Esempio Nell’algebra delle matrici
¶¾
½µ
z z0
0 z
z,z 0 ∈C
(rispetto al solito prodotto matriciale) il nilradicale non si riduce al solo zero.
In tutti questi esempi le difficoltà presentate da queste algebre sono dovute
al fatto che non sono C*-algebre.
9.5. Teorema di Gel’fand–Najmark
9.5
313
Teorema di Gel’fand–Najmark
In questo paragrafo dimostreremo un teorema che in un certo senso è definitivo per la teoria delle C*-algebre abeliane.
9.5.1 Teorema (Gel’fand–Najmark) Se A è una C*-algebra abeliana allora
la trasformata di Gel’fand è
(1) uno *-morfismo di C*-algebre;
(2) una isometria (in particolare è iniettivo);
(3) suriettiva.
Dimostrazione: Cominciamo col dimostrare che se valgono le (1)–(2) allora vale anche la (3); infatti l’immagine della trasformata di Gel’fand è una
*-sottoalgebra chiusa (per le (1) e (2)) di C(σ(A)) che contiene l’unità 1 di
b e separa i punti di σ(A): se ϕ1 , ϕ2 ∈ σ(A) deve esistere
C(σ(A)) (infatti 1 = I)
b 1 ) 6= A(ϕ
b 2 ). Quindi, per il teorema
A ∈ A tale che se ϕ1 (A) 6= ϕ2 (A) allora A(ϕ
di Stone–Weierstrass:
Ab = C(σ(A))
Ma Ab è chiusa e quindi Ab = C(σ(A)).
Possiamo dunque limitarci a dimostrare le (1) e (2).
9.5.2 Definizione Un elemento A ∈ A di una C*-algebra qualsiasi, si dice normale se A∗ A = AA∗ .
Osserviamo che in un’algebra commutativa ogni elemento è normale: ora la
(2) del teorema di Gel’fand–Najmark sarà conseguenza del
9.5.3 Lemma Se A è un elemento normale in una C*-algebra A con unità allora
spr A = ||A||.
Prima di dimostrare il lemma vediamo anche l’idea della dimostrazione della
c∗ = A∗.
b Dato che
(1), ovvero che A
b
c∗ (ϕ) = A
b∗ (ϕ) = A(ϕ)
= ϕ(A)
ϕ(A∗ ) = A
basta dimostrare che per ogni ϕ ∈ σ(A): ϕ(A∗ ) = ϕ(A).
Ora si osservi che, per ogni A ∈ A:
1
1
A = (A + A∗ ) + i (A − A∗ ) =: A1 + iA2
2
2i
314
Capitolo 9. Algebre di Banach e C*-algebre
(decomposizione che vale in ogni *-algebra) e che A1 e A2 sono ovviamente
autoaggiunti; allora
ϕ(A) = ϕ(A1 ) + iϕ(A2 )
e quindi basta dimostrare che ϕ(Ai ) ∈ R per avere che ϕ(A∗ ) = ϕ(A), i.e. che se
A = A∗ allora ϕ(A) ∈ R.
Dunque la (1) sarà dimostrata se proveremo il
9.5.4 Lemma Se A è una C*-algebra con unità e A ∈ A è autoaggiunto allora
σ(A) ⊂ R.
Dunque per dimostrare il teorema di Gel’fand–Najmark non resta che dimostrare i lemmi 9.5.3 e 9.5.4.
Dimostrazione: (Lemma 9.5.3) Sappiamo che ||A∗ A|| = ||A||2 e quindi che
||An ||2 = ||An∗ An || e quindi, se A è normale: ||An ||2 = ||(A∗ A)n ||. Quindi per
studiare il limite lim ||An ||1/n basta studiare il
lim ||(A∗ A)n || n = spr(A∗ A) = spr(A2 )
1
n−→∞
Ma se B = B ∗ , per calcolare lim ||B n ||1/n basta considerare una sottosuccessione,
ad esempio n = 2m , in modo che
m
m−1
||B 2 || = ||(B 2
m−1
)2 || = ||B 2
||2
(essendo B autoaggiunto). Iterando questo calcolo si trova
m
m
||B 2 || = ||B||2
e quindi spr(B) = ||B|| (convergendo la sottosuccessione ad un certo limite,
anche la successione converge al medesimo limite).
qed
∗
Dimostrazione: (Lemma 9.5.4) Sia A = A in A e z ∈ σ(A). Vogliamo dimostrare che la parte immaginaria Im z è nulla. Intanto si noti che, ogni algebra con
unità:
σ(A − λI) = σ(A) − λ
(per definizione di spettro!). Quindi basta dimostrare che se i Im z ∈ σ(A − Re zI)
allora Im z = 0, cioè basta supporre che sia λ0 ∈ R e iλ0 ∈ σ(A) e dimostrare che
λ0 = 0.
Ma, per ogni λ ∈ R:
||A + iλI||2 = ||(A + iλI)∗ (A + iλI)|| = ||(A − iλI)(A + iλI)||
= ||A2 + λ2 I|| ≤ ||A||2 + λ2
9.5. Teorema di Gel’fand–Najmark
315
cioè,
∀z ∈ σ(A) |z + iλ|2 ≤ ||A||2 + λ2
Ma se iλ0 ∈ σ(A) allora |λ0 + λ|2 ≤ ||A||2 + λ2 e, per ogni λ ∈ R:
|λ0 + λ|2 = λ20 + 2λλ0 − ||A||2 ≤ 0
il che è assurdo, a meno che λ0 = 0.
qed
Con ciò i due lemmi sono dimostrati, e quindi lo è anche il teorema di
Gel’fand–Najmark.
Osserviamo che se un’algebra di Banach A non ha unità, possiamo estenderla
come B : A ⊕ C col prodotto
(A ⊕ z)(B ⊕ w) := (AB + zB + wA) ⊕ zw
e con la norma data dal sup delle norme di A e C. B ha palesemente un’unità,
che è 0 ⊕ 1.
9.5.5 Definizione Se A è una C*-algebra anche non commutativa e priva di
unità, la rappresentazione regolare sinistra di A è il morfismo di C*-algebre
L : A −→ B(A)
A 7−→ (B 7−→ AB)
9.5.6 Proposizione Se L : A −→ B(A) è la rappresentazione regolare sinistra
di A allora lo spazio L(A) ⊕ C ⊂ B(A) è una sotto-C*-algebra (con unità) di
B(A).
Dimostrazione: L(A) ⊕ C è una *-algebra il cui *-operatore è definito come
(L(A) + zI)∗ := L(A∗ ) + zI
Vogliamo dimostrare che L(A) è chiusa4 e che è una sotto-C*-algebra di B(A):
con ciò la proposizione sarà provata.
A questo scopo basta dimostrare le
(1) ∀A ∈ A ||L(A)|| = ||A||.
(2) ∀B ∈ L(A) ⊕ C ||B ∗ B|| = ||B||2 .
4
Questo implicherà che L(A) ⊕ C è una sottoalgebra di Banach di B(A): infatti se X è
uno spazio di Banach e M, N suoi sottospazi, con M chiuso e N di dimensione finita, allora
M + N = M + N.
316
Capitolo 9. Algebre di Banach e C*-algebre
La (1) si dimostra osservando che
||L(A)L(B)|| = ||AB|| ≤ ||A|| ||B||
e quindi ||L(A)|| ≤ ||A||; inoltre, per B = A∗ si ha che
||AB|| = ||AA∗ || = ||A||2 = ||A|| ||A∗ || = ||A|| ||B||
con B 6= 0 ovviamente e quindi si ha anche ||L(A)|| ≥ ||A||.
Dimostriamo infine la (2); dato che
||B||2 = sup ||BC||2
C∈A1
e B = L(A) + zI da cui BC = AC + zC, troviamo che
||AC + zC||2 = ||BC||2 = ||(BC)∗ BC|| = ||(AC + zC)∗ BC||
= ||C ∗ (A∗ (BC) + z(BC))|| = ||C ∗ L(A∗ )(BC) + zBC||
= ||C ∗ B ∗ (BC)|| ≤ ||C|| ||B ∗ BC|| ≤ ||BB ∗ ||
(dato che ||C|| = 1). Passando al sup:
||B||2 ≤ ||BB ∗ || ≤ ||B ∗ || ||B|| ≤ ||B||2
qed
Ne segue che una C*-algebra A si immerge in una C*-algebra Ae con unità.
e
Ovviamente A è commutativa se e solo se lo è A.
Dunque possiamo applicare il teorema di Gel’fand–Najmark anche al caso di
algebre prive di unità, estendendole ed ottenendo
e
b: Ae −→ C(σ(A))
Vediamo come la trasformata di Gel’fand riflette l’effetto del passaggio da A a
e intanto l’algebra Ae possiede un funzionale lineare che A non ha, definito come
A:
ϕ∞ (A ⊕ z) := z
e \ {ϕ∞ }, che è localmente comPossiamo quindi considerare lo spazio Y = σ(A)
patto di Hausdorff; per definizione, la compattificazione ad un punto di Y è
esattamente X = σ(B). L’immagine della restrizione della trasformata di Gel’fand a A ⊂ B è l’algebra C0 (Y ) delle funzioni continue nulle all’infinito su Y .
In effetti
A ∈ A ⇐⇒ ϕ∞ (A) = 0
e quindi la restrizione della trasformata di Gel’fand di Ae a A:
A −→ C(σ(A))
bX
A 7−→ A
è la trasformata di Gel’fand di A. pertanto
317
9.5. Teorema di Gel’fand–Najmark
9.5.7 Corollario Se A è una C*-algebra commutativa esiste uno spazio topologico di Hausdorff localmente compatto X tale che A ∼
= C0 (X) (isomorfismo di
C*-algebre). Se A possiede unità, allora X è compatto.
Si può ulteriormente precisare questo risultato usando il linguaggio delle categorie. Le C*-algebre formano ovviamente una categoria (i cui morfismi sono i morfismi di C*-algebre) che contiene la sottocategoria delle C*-algebre
commutative A0 . Per quanto detto in precedenza, l’estensione da A a Ae è un
funtore
F : A0 −→ A
dalla categoria delle C*-algebre commutative alla categoria A delle C*-algebre
commutative con unità. Inoltre, se consideriamo la categoria T degli spazi topologici localmente compatti di Hausdorff (i cui morfismi sono le mappe continue)
esiste anche un funtore
G : T −→ T0
dato dalla compattificazione di Alexandroff, che ad ogni oggetto X di T fa corrispondere la sua compattificazione ad un punto, e che quindi manda la categoria
T nella categoria T0 degli spazi compatti di Hausdorff.
9.5.8 Teorema Esiste una equivalenza naturale fra i funtori F e G che induce
una equivalenza fra le categorie A e T e A0 e T0 .
Dimostrazione: La trasformazione naturale fra i funtori F e G è indotta dalla
trasformata di Gel’fand: infatti il diagramma
A
F
²
A0
/T
²
G
/T
0
è commutativo, ove le frecce orizzontali sono le trasformate di Gel’fand. L’unica
cosa che resta da mostrare è che la trasformata di Gel’fand è un morfismo di
funtori, cioè che per ogni morfismo di C*-algebre induce una mappa continua
fra i relativi spettri e che ogni mappa continua fra gli spettri proviene in questo
modo da un morfismo di C*-algebre.
Se η : A −→ B è un morfismo fra la C*-algebra con unità A e la C*-algebra
commutativa B allora η(A) è una sotto-*-algebra di B con unità η(I) e quindi
possiamo supporre che sia
η(A) = B
318
Capitolo 9. Algebre di Banach e C*-algebre
i.e. η(I) = I, dunque, per ogni ϕ ∈ σ(B): ϕ ◦ η ∈ σ(A). Evidentemente la mappa
η ∗ : σ(B) −→ σ(A)
ϕ 7−→ η ∗ (ϕ) := ϕ ◦ η
è continua (su σ(A) e σ(B) le topologie sono quelle deboli rispetto alle mappe
σ(A) −→ C e σ(A) −→ C, che quindi sono continue per definizione): infatti5
[
b ◦ η ∗ = η(A)
A
Ma σ(A) e σ(B) sono compatti di Hausdorff, quindi l’insieme
E := η ∗ (σ(B))
è chiuso in σ(A). Dimostriamo allora che
E 6= σ(A) ⇐⇒ ker η 6= 0
Infatti E 6= σ(A) se e solo se σ(A) \ E è aperto e non vuoto, se e solo se esiste
f ∈ C(σ(A)) non nulla che ristretta ad E sia zero (per il lemma di Urysohn
b0 (per il teorema di Gel’fand–
2.3.2). Ma per ogni f ∈ C(σ(A)) si ha che f = A
b0 (η ∗ (ϕ)) = 0, se e
Najmark) e quindi F |E = 0 se e solo se per ogni ϕ ∈ σ(B): A
\
solo se η(A
0 )(ϕ) = 0 se e solo se η(A0 ) = 0 (di nuovo per il teorema di Gel’fand–
Najmark). Questa catena di equivalenze dimostra che E 6= σ(A) ⇐⇒ ker η 6=
0.
In altri termini, η ∗ è suriettiva se e solo se ker η = 0. Ma η ∗ è suriettiva se e
solo se η è isometrica, dato che
[ = sup |η(A)(ϕ)|
[
b ∗ (ϕ))| = sup |A(ψ)|
b
||η(A)|| = ||η(A)||
= sup |A(η
= ||A||
ϕ∈σ(B)
ϕ∈σ(B)
ψ∈σ(A)
In particolare se ker η = 0 allora ||η(A)|| = ||A||.
Questo dimostra che ogni morfismo di *-algebre determina in modo unico una
mappa continua fra gli spettri.
qed
Il seguente risultato afferma che su una C*-algebra commutativa con unità
esiste una sola struttura normata.
9.5.9 Teorema Se η : A −→ B è uno *-omomorfismo di C*-algebre allora:
fα
Nella topologia debole su uno spazio X indotta dalle mappe {X −→ Xα } un’applicazione
f : Y −→ X è continua se e solo se per ogni α l’applicazione fα ◦ f : Y −→ Xα è continua.
5
9.6. Appendice: elementi di analisi complessa
319
(1) ∀A ∈ A ||η(A)|| ≤ ||A||.
(2) ∀A ∈ A ||η(A)|| ≤ ||A|| ⇐⇒ ker η = 0.
(3) η(A) è chiusa (in norma, cioè è una C*-sottoalgebra di B.
Dimostrazione: Se A è commutativa possiamo supporre che anche B lo sia,
dato che η(A) è una *-sottoalgebra commutativa di B e quindi η(A) è una C*sottoalgebra commutativa di B.
A meno di estendere A ad una Ae con unità (e con ηe(I) := I), per ipotesi si
ha che:
||η(A)||2 = ||η(A)∗ η(A)|| = ||η(A∗ )η(A)|| = ||η(A∗ A)||
Ma A∗ A, essendo un elemento normale, appartiene ad una sottoalgebra commutativa: la chiusura dell’algebra generata dai polinomi in A∗ A e quindi
||η(A)||2 ≤ ||A∗ A|| = ||A||2
il che dimostra (1) e (2).
Si osservi ora che se η è un morfismo di C*-algebre allora certamente η(A) è
una *-sottoalgebra; inoltre, dato che ker η ⊂ A è uno *-ideale (bilatero) chiuso
in norma, ed il quoziente A/ ker η ∼
= im η è certamente una C*-algebra e quin0
di il morfismo η : A/ ker η −→ B ottenuto componendo η con la proiezione
A −→ A/ ker η è una isometria. Da ciò risulta che η 0 (A/ ker η) = η(A) è una
C*-sottoalgebra di B.
qed
9.5.10 Corollario Se A è una *-algebra che sia una C*-algebra rispetto a due
norme di Banach ||-||1 e ||-||2 allora le C*-algebre (A, ||-||1 ) e (A, ||-||2 ) sono
isomorfe.
Dimostrazione: Si applichi il teorema allo *-isomorfismo i : (A, ||-||1 ) −→
(A, ||-||2 ).
qed
9.6
Appendice: elementi di analisi complessa
Raccogliamo qui alcuni richiami sulle nozioni essenziali di Analisi Complessa
in una variabile: stabiliamo solo i teoremi che abbiamo utilizzato in questo capitolo, e non nella loro massima generalità: per questo si rimanda ai testi specialistici,
come l’ottimo [18].
320
Capitolo 9. Algebre di Banach e C*-algebre
9.6.1
Funzioni e integrali complessi
9.6.1 Definizione Una funzione f : U −→ C definita in un aperto U del piano
complesso si dice olomorfa nel punto z0 ∈ U se esiste finito il limite
f (z0 + δz) − f (z0 )
|δz|−→0
δz
f 0 (z0 ) := lim
Scriviamo
f (z) = u(z) + iv(z)
(u = Re(f ) e v = Im(f )), osservando le che funzioni u e v dipendono dalle variabili reale x e y tali che z = x + iy. Allora possiamo dare la seguente
caratterizzazione:
9.6.2 Teorema (Cauchy–Riemann) Una funzione f : U −→ C è olomorfa
in z0 se e solo se
∂u
∂v
∂u
∂v
=
e
=−
∂x
∂y
∂y
∂x
Dimostrazione: Consideriamo il limite che definisce l’olomorfia di f e, scrivendo z = x + iy, poniamo δz = δx (il limite dipende solo dal fatto che il modulo di
δz tende a zero, indipendentemente dall’argomento):
u(x0 + δx, y0 ) − u(x0 , y0 )
v(x0 + δx, y0 ) − v(x0 , y0 )
+ i lim
δx−→0
δx−→0
δx
δx
f 0 (z0 ) = lim
Quindi se f è olomorfa in z0 le derivate parziali di u e v rispetto a x esistono e
f 0 = ux +iuy (indichiamo le derivate parziali con un indice che denota la variabile
rispetto alla quale si deriva).
Analogamente, per δz = iδy:
f 0 (z0 ) = −iuy (x0 , y0 ) + vy (x0 , y0 )
Confrontando le due espressioni di f 0 (z0 ) cosı̀ ottenute, abbiamo el equazioni di
Cauchy–Riemann nel punto z0 .
Viceversa, supponiamo che le u e v ammettano derivate parziali rispetto alle
x e y e che valgano le relazioni di Cauchy–Riemann: allora,
u(x0 + δx0 , y0 + δy0 )−u(x0 , y0 ) =
= ux (x0 , y0 )δx + uy ((x0 , y0 )δy + o((δx)2 + (δy)2 )
v(x0 + δx0 , y0 + δy0 )−v(x0 , y0 ) =
= vx (x0 , y0 )δx + vy ((x0 , y0 )δy + o((δx)2 + (δy)2 )
9.6. Appendice: elementi di analisi complessa
321
Quindi, per δz = δx + iδy e le relazioni di Cauchy–Riemann:
f (z0 + δz) − f (z0 )
δx + iδy
iδx − δy
= ux (x0 , y0 )
+ vx (x0 , y0 )
+
δz
δx + iδy
δx + iδy
o((δx)2 + (δy)2 )
+
δx + iδy
o((δx)2 + (δy)2 )
= ux (x0 , y0 ) + ivx (x0 , y0 ) +
δz
e quindi la funzione f è olomorfa in z0 .
qed
9.6.3 Esempio Sono olomorfe: le funzioni lineari (complesse), le funzioni razionali complesse e la funzione f (z) = exp z, mentre non è olomorfa la funzione
g(z) = |z|2 .
Ci limiteremo qui a considerare come insiemi di definizione delle funzioni
olomorfe i domini regolari U cioè gli aperti connessi del piano complesso la cui
frontiera sia una curva regolare (non necessariamente connessa, cioè i nostri domini potranno avere dei “buchi”). Il numero di componenti connesse della curva
∂U si dice ordine di connessione del dominio 6 : se la curva che delimita il dominio
è connessa (e quindi il dominio non ha “buchi”), è semplicemente connesso.
Evidentemente se Γ è una curva regolare nel piano complesso è chiaro cosa
debba intendersi con
Z
f (z)dz
Γ
per una funzione f : Γ −→ C: l’integrale si calcola infatti per mezzo di una
qualsiasi rappresentazione parametrica c = c(t) (con c : [a, b] −→ C continua e
regolare) della curva Γ:
Z
Z b
f (z)dz =
f (c(t))c0 (t)dt
Γ
a
9.6.4 Esempio Vogliamo calcolare l’integrale
Z
dz
Γρ z − z0
ove Γρ è il cerchio di centro z0 e raggio ρ. Rappresentando la curva in coordinate
polari per mezzo della funzione c(t) = z0 + eit , troviamo:
Z
Z 2π
Z 2π
dz
iρeit dt
=
=i
dt = 2πi
ρeit
Γρ z − z0
0
0
6
Si tratta del primo numero di Betti di U incrementato di uno.
322
Capitolo 9. Algebre di Banach e C*-algebre
Una ipotesi che faremo spesso è che f : U −→ C sia una funzione olomorfa
in U e continua in U : esprimeremo questa ipotesi con la notazione f ∈ O(U ).
9.6.5 Teorema di Cauchy Se f ∈ O(U ) nel dominio semplicemente connesso
U e se derivata f 0 : U −→ C continua, allora per ogni curva chiusa Γ contenuta
in U :
Z
f (z)dz = 0
Γ
Dimostrazione: Per definizione:
Z
Z
Z
f (z)dz = (udx − vdy) + i (udy + vdx)
Γ
Γ
Γ
(diamo per nota la teoria elementare delle forme differenziali nel piano ed il
teorema di Gauss–Green) ove, per ipotesi e per il teorema precedente, le u e v
sono parzialmente derivabili dunque, per il teorema di Gauss–Green (la curva
regolare connessa Γ è la frontiera di un dominio semplicemente connesso G del
piano)
Z
ZZ
ZZ
f (z)dz =
(−vx − uy )dxdy + i
(ux − vy )dxdy
Γ
G
G
Ma questi integrali sono zero per le relazioni di Cauchy–Riemann.
qed
Il caso realmente interessante è quando Γ = ∂U .
Osserviamo che, dalla definizione e dalla sua caratterizzazione, non discende
immediatamente la continuità della derivata di una funzione olomorfa: abbiamo
dunque dovuto supporla nelle ipotesi del teorema di Cauchy7 .
Il teorema di Cauchy può estendersi ad un dominio non semplicemente connesso, osservando che un tale dominio può sempre rendersi semplicemente connesso a meno di effettuarne dei tagli8 :
Supponiamo cioè che U sia delimitato da una curva Γ con n + 1 componenti
connesse Γ0 , ..., Γn (quattro nella figura) e consideriamo dei segmenti che uniscano
le componenti “interne” al dominio con la componente “esterna”9 . Se γ1 , ..., γn
7
In realtà, questa supposizione è superflua, come dimostrato da Goursat nel 1904: per questa
versione più generale del teorema di Cauchy (che infatti ne rivela la natura topologica) si veda
[18] §5.
8
Precisamente il numero di tagli che bisogna effettuare per renderlo semplicemente connesso
è pari al primo numero di Betti del dominio stesso.
9
Dovrebbe essere chiaro al lettore come rendere rigoroso questo ragionamento intuitivo.
9.6. Appendice: elementi di analisi complessa
323
sono questi segmenti, il dominio che si ottiene dopo il taglio è semplicemente
connesso e ha come frontiera Γ ∪ γ1 ∪ ... ∪ γn .
Allora il teorema di Cauchy applicato a questo nuovo dominio implica che (tenendo conto delle diverse orientazioni fra le componenti “interne” e quelle “esterne”
della curva Γ, e del fatto che i segmenti γ1 , ..., γn sono presenti due volte e con
segni opposti nell’integrazione):
Z
n+1 Z
X
f (z)dz =
f (z)dz
i=1
Γ0
Γi
il che si esprime (tenendo conto che l’orientazione su Γ0 è opposta a quella delle
restanti componenti connesse) ancora come
Z
f (z)dz = 0
Γ
9.6.6 Teorema (Formula di Cauchy) Se f ∈O(U ) nel dominio regolare semplicemente connesso U allora, per ogni z0 ∈ U :
Z
1
f (z)
f (z0 ) =
dz
2πi ∂U z − z0
Dimostrazione: Consideriamo un disco Dr = {z | |z − z0 | < ρ} di centro z0
e completamente contenuto in U (ciò è possibile perché U è aperto. Allora la
funzione
f (z)
ϕ(z) =
z − z0
324
Capitolo 9. Algebre di Banach e C*-algebre
è olomorfa in U \ {z0 } (che non è un dominio regolare, dato che una componente
connessa della sua frontiera si riduce al solo punto {z0 }), e quindi è pure olomorfa
in U \ Dr che è un dominio regolare (non semplicemente connesso, ma tale che
il suo bordo sia ∂U ∪ ∂Dr ): allora per il teorema di Cauchy in questo dominio:
Z
Z
ϕ(z)dz =
ϕ(z)dz
∂U
∂Dr
Questo vale per ogni scelta di r tale che Dr ⊂ U : quindi l’integrale a primo
membro non dipende da r: in particolare la relazione precedente vale per r −→ 0
e quindi, dato che un elemento sul bordo ∂Dr = {z | |z − z0 | = r} si scrive come
z = z0 + reit al variare di t ∈ [0, 2π), otteniamo
Z
Z
ϕ(z)dz = lim
∂U
r−→0
Z
ϕ(z)dz = lim
r−→0
∂Dr
0
2π
f (z0 + reit ) it
re dt = 2πif (z0 )
reit
qed
Il teorema precedente, del pari del teorema di Cauchy, vale per un dominio
regolare qualsiasi, anche non semplicemente connesso.
Se il dominio U è un disco aperto di centro z0 e raggio r evidentemente la
formula di Cauchy diviene
9.6.7 Teorema (Formula del valor medio)
Z
1
f (z0 + reit )dt
f (z0 ) =
2πr |z−z0 |=r
Dunque i valori di una funzione olomorfa all’interno di un disco sono determinati dai valori che assume sul bordo: esaminando ulteriormente questo fenomeno
giungeremo al principio del massimo per funzioni olomorfe.
9.6.2
Sviluppi in serie di potenze
Le funzioni olomorfe sono talvolta chiamate analitiche: questo perché possiamo confonderle con le funzioni sviluppabili in serie di potenze.
9.6.8 Definizione Una serie di potenze è una serie della forma
∞
X
an (z − z0 )n
n=0
con cn ∈ C costanti, z0 ∈ C e z variabile complessa.
9.6. Appendice: elementi di analisi complessa
325
Ricordiamo10 che una serie di funzioni si dice uniformemente convergente in
un dominio U se per ogni ε > 0 esiste un nε tale che per ogni n ≥ nε si abbia:
¯
¯
n
X
¯
¯
¯<ε
¯f (z) −
f
(z)
k
¯
¯
k=1
e che una condizione necessaria per la convergenza uniforme è la possibilità
di maggiorare i termini della serie di funzioni con quelli di una serie numerica
assolutamente convergente (criterio di Weierstrass).
In generale sarà interessante stabilire il dominio di convergenza uniforme di
una serie di potenze:
9.6.9 Definizione Il raggio di convergenza di una serie di potenze è il valore
ρ tale che, per ogni disco di centro z0 e raggio r < ρ la serie converga uniformemente in quel disco e per ogni r > ρ la serie non converga in nessun punto
esterno al disco chiuso di centro z0 e raggio r.
9.6.10 Definizione Se una serie di potenze converge in un aperto U , la funzione
che a z ∈ U associa il valore della serie in z si dice analitica.
Cioè le funzioni analitiche sono le funzioni definite da serie di potenze convergenti.
9.6.11 Teorema (Cauchy–Hadamard) Il raggio di convergenza ρ di una serie di potenze vale11
1
ρ=
limn−→∞ |an |1/n
(inverso del massimo limite della successione |an |1/n .)
Dimostrazione: Se 0 < r < ρ allora
limn−→∞ |an rn |1/n = r lim |an |1/n < 1
n−→∞
Dunque la serie numerica
∞
X
|an rn |
n=0
converge (per il criterio della radice per serie numeriche), e per ogni z tale che
|z − z0 | < r:
|an (z − z0 )n | ≤ |an rn |
10
11
Assumiamo la conoscenza della teoria elementare delle serie di funzioni.
Il valore di ρ è in [0, ∞] con la convenzione simbolica che 1/0 = ∞ e 1/∞ = 0.
326
Capitolo 9. Algebre di Banach e C*-algebre
Cosı̀ il termine generico della serie di potenze è maggiorato dal termine generico
di una serie assolutamente convergente.
Rimane il caso ρ < ∞. Consideriamo in questo caso z tale che |z − z0 | > ρ e
quindi
1 < |z − z0 |limn−→∞ |an |1/n = limn−→∞ |an (z − z0 )n |1/n
Quindi il termine generico della serie di potenze non è infinitesimo e, come noto,
questo implica che la serie non può convergere.
qed
9.6.12 Esempio Consideriamo la serie
∞
X
(z − z0 )n
n=0
(i coefficienti sono tutti 1). Per il criterio del rapporto per la convergenza delle
serie numeriche, la serie converge nel cerchio di centro z0 e raggio 1 a qualche
funzione analitica f : allora, per definizione di convergenza di una serie:
n
X
1 − (z − z0 )n
1
(z − z0 ) = lim
f (z) = lim
=
n−→∞ q − (z − z0 )
n−→∞
1 − (z − z0 )
k=0
n
(per la formula di sommazione di una serie geometrica con un numero finito di
addendi).
Il teorema fondamentale sulla convergenza delle serie di potenze è il
9.6.13 Teorema (Abel) Se una serie di potenze
∞
X
an (z − z0 )n
n=0
converge in un punto z1 6= z0 allora converge assolutamente in ogni punto interno
al disco di centro z0 e raggio |z1 − z0 | ed in un disco chiuso di centro z0 e raggio
r < |z1 − z0 | la serie converge uniformemente.
Dimostrazione: Se z è tale che |z − z0 | < |z1 − z0 | definiamo q < 1 come
q=
|z − z0 |
|z1 − z0 |
Poiché la serie converge in z1 il suo termine generico è infinitesimo, i.e. esiste una
costante M tale che
|aN | |z1 − z0 |n ≤ M
9.6. Appendice: elementi di analisi complessa
327
e quindi
¯ X
¯X
¯
∞
∞ ¯
X
¯ z − z0 ¯n
¯
¯ ∞
n
n
¯
¯
¯
|an | |z − z0 | ≤ M
an (z − z0 ) ¯¯ ≤
¯ z1 − z0 ¯
¯
n=0
n=0
=M
∞
X
n=0
|q|n =
n=0
M
1−q
(q < 1 e quindi la serie geometrica converge). Questo dimostra la convergenza
della serie.
Per vedere l’uniforme convergenza nel disco di centro z0 e raggio r < |z1 − z0 |
usiamo il criterio di Weierstrass: infatti la serie
M
∞
X
n=0
rn
|z1 − z0 |n
(che ovviamente converge perché è una serie geometrica con r/|z1 − z0 | < 1)
maggiora la serie di potenze per costruzione.
qed
Nel suo dominio di convergenza, una funzione analitica può integrarsi e derivarsi un numero arbitrario di volte, ottenendo sempre funzioni analitiche nel
medesimo dominio. Inoltre i termini generici di una serie di potenze soddisfano
in modo ovvio le relazioni di Cauchy–Riemann: quindi
9.6.14 Corollario Una funzione analitica è olomorfa.
Quello che ci proponiamo di dimostrare è che vale anche il viceversa.
9.6.15 Teorema Una funzione olomorfa è analitica nel suo dominio di olomorfia.
Dimostrazione: Sia f : U −→ C olomorfa nell’aperto U ; se z0 ∈ U allora esiste
un disco Dr di centro z0 e raggio r interamente contenuto in U . Usando la formula
integrale di Cauchy ed i teoremi di passaggio al limite sotto il segno di integrale
328
Capitolo 9. Algebre di Banach e C*-algebre
(usando la teoria di Lebesgue oppure la convergenza uniforme delle serie):
Z
Z
1
f (w)
1
f (w)
f (z) =
dw =
dw
2πi ∂Dr w − z
2πi ∂Dr w − z0 − (z − z0 )
Z
1
f (w)
´ dw
³
=
2πi ∂Dr (w − z ) 1 − z−z0
0
w−z0
µ
¶n
Z
∞
1
f (w) X z − z0
dw
=
2πi ∂Dr w − z0 n=0 w − z0
Z
∞
X
1
f (w)
=
dw (z − z0 )n
n+1
2πi
(w
−
z
)
0
∂Dr
n=0
Quindi, intorno a z0 la funzione f è analitica.
qed
Lo sviluppo in serie di una funzione analitica è ovviamente unico: i coefficienti
dello sviluppo sono
Z
1
f (w)
an =
dw
2πi ∂Dr (w − z0 )n+1
e devono quindi coincidere con i termini della serie di Taylor della funzione f
intorno a z0 :
dn
f (z0 ) = n!an
dz n
Dunque
9.6.16 Teorema Una funzione olomorfa è infinitamente derivabile e
Z
n!
f (w)
(n)
f (z) =
dw
2πi ∂Dr (w − z0 )n+1
in un opportuno disco Dr di centro z0 e raggio r.
9.6.17 Esempio La funzione
f (z) =
1
1 + z2
è analitica in tutto il piano complesso eccettuati i punti12 ±i. Considerando la
formula di sommazione di una serie geometrica che abbiamo stabilito in precedenza
∞
X
f (z) =
(−1)n z 2n
n=0
12
Osserviamo che non si tratta di un dominio regolare, ma basta prendere C a cui si tolgano
due dischi chiusi intorno a questi punti per ottenere un dominio regolare.
9.6. Appendice: elementi di analisi complessa
329
troviamo che f che deve quindi essere l’espansione di Taylor in ogni disco del
piano complesso che non contenga i punti ±i.
Applichiamo ora le formule precedenti per calcolare l’espansione di Taylor
√
intorno al punto 1 in un disco di raggio r = 2. Scrivendo
µ
¶
1
1
1
1
f (z) =
=
−
1 + z2
2i z − i z + i
ed utilizzando ancora la formula di sommazione della serie geometrica:
f (z) =
∞
X
sin π4 (n + 1)
(−1)n
(z − 1)n
(n+1)/2
2
n=0
√
(abbiamo usato le rappresentazioni polari 1 ± i = 2e±iπ/4 ). Il√raggio di convergenza di questa serie è, per la formula di Cauchy–Hadamard, 2.
9.6.3
Continuazione Analitica
Il seguente principio è di fondamentale importanza: stabilisce infatti una
proprietà determinante delle funzioni olomorfe.
9.6.18 Teorema Se f ∈ O(U ) nell’aperto connesso U allora, se l’insieme degli
zeri di f contiene un punto di accumulazione, f = 0.
Dimostrazione: Supponiamo per assurdo che esista una successione {zn }n∈N
di zeri di f (i.e. f (zn ) = 0) convergente ad uno zero z di f . Intorno a z possiamo
scrivere
∞
X
f (w) =
an (w − z)n
n=0
Consideriamo il più piccolo intero m tale che am 6= 0. Allora
f (zn )
= lim (am + a − m + 1(zn − z) + ...) = am
n−→∞ (zn − z)m
n−→∞
0 = lim
Questo assurdo dimostra che f deve essere identicamente nulla intorno a z, e
quindi l’insieme dei punti di accumulazione dell’insieme degli zeri di f è aperto
(osserviamo che questo insieme non è vuoto, perché contiene z e non esaurisce
tutto U perché f non è identicamente nulla). Ma questo insieme è anche chiuso, dato che contiene (per definizione) i suoi punti di accumulazione. Quindi U
contiene un insieme chiuso e aperto e questo è impossibile, dato che lo si era
supposto connesso.
qed
330
Capitolo 9. Algebre di Banach e C*-algebre
9.6.19 Corollario Se f ∈ O(U ) in un aperto connesso del piano complesso C e
se |f | è una funzione costante in U allora anche f è costante in U .
Dimostrazione: Osserviamo che, se f = u + iv, per le relazioni di Cauchy–
Riemann:
f 0 f = (ux + ivx )(u − iv) = (uux + vvx ) + i(uvx − vux )
∂u2 + v 2
∂u2 + v 2
∂|f |
∂|f |
=
−i
=
−i
=0
∂x
∂y
∂x
∂y
(infatti (uvx − vux = −uuy − vvy )). ma il implica che se un prodotto di funzioni
olomorfe è nullo, almeno una delle due funzioni deve essere identicamente zero,
e quindi f = 0 oppure f è costante in U .
qed
9.6.20 Corollario (Principio di identità delle funzioni olomorfe) Se
f, g ∈ O(U ) e se l’insieme dove f = g ha un punto di accumulazione allora f = g
su tutto U .
In particolare, mentre una funzione olomorfa è certamente infinitamente differenziabile, non è detto che una funzione C ∞ sia olomorfa: può benissimo darsi
che una funzione infinitamente differenziabile sia, ad esempio, nulla in un intero
intervallo, ma non identicamente nulla in tutto l’insieme di definizione.
Se un insieme A è unione di due insiemi B e C e se sono date due funzioni
f : B −→ X e g : C −→ X tali che fB∩C = g|B∩C allora esiste una sola funzione
f ∪ G : A −→ X che ristretta a B e C coincide con f e g. Usando questa ovvia
definizione possiamo dare un altro corollario del teorema:
9.6.21 Corollario Se f1 ∈ O(U1 ) e f2 ∈ O(U2 ) e se f1 |V = f2 |V ove V è un
aperto connesso contenuto in U1 ∩ U2 allora la funzione f 1 ∪ f2 è univocamente
ben definita e analitica.
L’applicazione di questo corollario per estendere il dominio di definizione di
una funzione si dice continuazione analitica. Ad esempio, non appena una serie
di potenze sia definita sull’asse reale, possiamo estenderla in modo unico ad una
funzione olomorfa in un aperto del piano complesso.
9.6. Appendice: elementi di analisi complessa
331
9.6.22 Esempio Le classiche funzioni
sin x =
∞
X
x2n+1
(−1)n
(2n + 1)!
n=0
∞
X
x2n
(−1)n
cos x =
(2n)!
n=0
exp x =
∞
X
xn
n=0
n!
danno luogo a funzioni olomorfe in opportuni aperti del piano complesso.
Evidentemente, il dominio (connesso) di olomorfia di una funzione può rendersi massimale in virtù del principio di continuazione analitica.
9.6.23 Definizione Una funzione olomorfa si dice intera se il suo dominio di
olomorfia è l’intero piano complesso C.
Torniamo ora a considerare funzioni olomorfe ed il loro comportamento al
bordo dei dischi chiusi.
9.6.24 Teorema (Principio del massimo) Se f ∈O(U ) nel dominio regolare
U allora la funzione reale |f | (se non è costante) assume il suo valore massimo
sul bordo ∂U = U \ U di U .
Dimostrazione: La funzione reale che stiamo considerando
p
|f (z)| = u2 (x, y) + v 2 (x, y)
è continua in U . Dunque assume un massimo M in qualche punto z0 = (x0 , y0 )∈U .
Supponiamo per assurdo che z0 ∈ U non sia un punto del bordo di U : esiste allora
un disco Dr di centro z0 e raggio r interamente contenuto in U , per il quale la
formula del valor medio, ed il fatto che per ogni z ∈ U |f (z)| ≤ M , implicano che
¯ Z 2π
¯ Z 2π
¯
¯
it
|f (z0 + reit )|dt ≤ 2πM
f (z0 + re )dt¯¯ ≤
2πM = ¯¯
0
0
cioè che
Z
2π
|f (z0 + reit )|dt = 2πM
0
da cui, per continuità di f in U e per la definizione di massimo M :
∀z
|z − z0 | = r ⇒ |f (z)| = M
Quindi f è costante in modulo su in intorno di f e, per continuazione analitica,
è costante in tutto U , il che è assurdo.
qed
332
Capitolo 9. Algebre di Banach e C*-algebre
Possiamo ora dimostrare il teorema che, in un certo senso, inverte il teorema
di Cauchy:
9.6.25 Teorema (Morera) Una funzione continua f : U −→ C definita in un
dominio regolare semplicemente connesso tale che, per ogni curva regolare chiusa
Γ ⊂ U si abbia
Z
f (z)dz = 0
Γ
è necessariamente olomorfa in U .
Dimostrazione: Consideriamo, per z0 , z ∈ U e per un cammino γ ⊂ U che
connetta z0 e z (i.e. se γ : [a, b] ∈ U allora γ(a) = z0 e γ(b) = z), la funzione
Z
F (z) := f (w)dw
γ
Dimostriamo che si tratta di una funzione olomorfa: se scriviamo f = u + iv e
F = U + iV , allora (per le relazioni di Cauchy–Riemann):
Z
Z
Ux = ux dξ − vx dη = vy dξ + uy dη = Vy
γ
Zγ
Z
Uy = uy dξ − vy dη = − vx dξ + ux dη = −Vx
γ
γ
Quindi F soddisfa alle equazioni di Cauchy–Riemann e dunque è olomorfa.
Ovviamente
Z
Z
0
F (z) = Ux (x, y) + iVx (x, y) = ux dξ − vx dη + i vx dξ + ux dη
γ
γ
Z
= f 0 (z)dw = f (z)
γ
qed
Il teorema si generalizza in modo ovvio a domini non semplicemente connessi.
9.6.26 Teorema (Liouville) Una funzione intera e limitata (in modulo) è
costante.
Dimostrazione: Usiamo la formula di Taylor per la derivata di f ∈ O(C):
Z
1
f (w)
0
f (z) =
dw
2πi ∂Dr (w − z)2
9.6. Appendice: elementi di analisi complessa
333
(ove Dr è il solito disco di centro z e raggio r). Ora sfruttiamo la limitatezza di
|f |:
Z
1
|f (w)|
M
0
|f (z)| ≤
dw ≤
2
2πi ∂Dr r
R
Ma r può essere scelto arbitrariamente grande (perché f è intera) e |f 0 | è indipendente da R: quindi |f 0 | = 0 su tutto il piano complesso, quindi |f | è
costante.
qed
Ad esempio, la funzione sin z, continuazione analitica della funzione reale sin x
non può essere limitata (come accade nel caso reale), perché ovviamente non è
costante.
Una notevole applicazione è la seguente:
9.6.27 Teorema fondamentale dell’Algebra Un polinomio a coefficienti complessi e di grado positivo ammette sempre almeno uno zero.
Dimostrazione: Un polinomio complesso è una funzione della forma
p(z) = an z n + an−1 z n−1 + ... + a0
Si noti che, per |z| abbastanza grande, possiamo scrivere
µ
¶
|an−1 |
n
|p(z)| ≥ |z | |an | − n−1 − ... − |a0 | > |an | |z n |
z
Ora supponiamo che p non abbia zeri nel piano complesso: allora la funzione
1/p(z) è intera e, per la disuguaglianza precedente:
1
1
≤ lim
=0
|z|−→∞ |p(z)|
|z|−→∞ |an | |z n |
lim
Quindi |1/p(z)| è limitata e, per il teorema di Liouville, deve essere costante, il
che è assurdo.
qed
9.6.4
Residui
9.6.28 Definizione Una serie di potenze bilatera
∞
X
n=−∞
si dice serie di Laurent.
an (z − z0 )n
334
Capitolo 9. Algebre di Banach e C*-algebre
Per determinare il dominio di convergenza di una serie di Laurent, spezziamola come
∞
X
an (z − z0 ) =
n=−∞
n
∞
X
an (z − z0 ) +
n=0
n
∞
X
n=1
a−n
1
(z − z0 )n
Il dominio di convergenza della serie di Laurent sarà l’intersezione dei domini di
convergenza delle due serie che figurano a secondo membro; nel caso della prima
di queste serie si tratta di un disco di centro z0 e raggio ρ. Mostriamo che nel
caso della seconda serie il dominio è il complementare di un disco di centro z0 .
Poniamo
1
ζ=
z − z0
in modo che
∞
∞
X
X
1
a−n ζ n
a−n
=
n
(z
−
z
)
0
n=1
n=1
Si tratta quindi di una serie di
di centro 0; sia R1 il suo raggio di converPpotenze
∞
genza: evidentemente la serie n=1 a−n (z−z0 )−n ha come dominio di convergenza
il complementare del disco di centro z0 e raggi R.
Dunque una serie di Laurent definisce una funzione olomorfa nella corona
circolare CR,ρ = {z ∈ C | R < |z − z0 | < ρ}. Ovviamente può benissimo accadere
che sia ρ <≤ R e quindi CR,ρ = ∅: in questo caso la serie di Laurent non definisce
alcuna funzione olomorfa.
9.6.29 Teorema (Laurent) Una funzione f ∈ O(CR,ρ ) è univocamente determinata in CR,ρ dal suo sviluppo in serie di Laurent.
Dimostrazione: Se z ∈CR,ρ consideriamo due cerchi Γ1 e Γ2 di centro z0 e raggi
tali che R < r2 < |z − z0 | < r1 < Er. Per la formula di Cauchy (in un dominio
non semplicemente connesso) si trova
Z
Z
1
f (w)
f (w)
1
f (z) =
dw −
dw
2πi Γ1 w − z
2πi Γ2 w − z
Ora, sul cerchio Γ1 vale la
|z − z0 |
<1
|w − z0 |
quindi
¶n
∞ µ
1
1
1 X z − z0
1
1
=
=
z−z0 =
w−z
(w − z0 ) − (z − z0 )
w − z0 1 − w−z
w − z0 n=0 w − z0
0
9.6. Appendice: elementi di analisi complessa
335
Integrando e scambiando il segno di integrale con quello della serie (per la teoria
di Lebesgue o per uniforme convergenza)13 :
1
2πi
con, per n ≥ 0:
Z
X
f (w)
an (z − z0 )n
dw =
w−z
n=0
∞
Γ1
1
an =
2πi
In modo analogo, dalla
Z
Γ1
f (w)
dw
(w − z0 )n+1
|w − z0 |
<1
|z − z0 |
sul cerchio Γ2 si trova
1
−
2πi
Z
∞
Γ2
con, per n ≥ 0:
a−n
X
1
f (w)
a−n
dw =
w−z
(z − z0 )n
n=1
1
=
2πi
Z
Γ2
f (w)
dw
(w − z0 )−n+1
Le an e a−n cosı̀ ottenute sono olomorfe in CR,ρ e quindi, i corrispondenti integrali non dipendono dai cammini di integrazione: dunque possiamo combinare le
formule per an e a−n ottenendo
Z
1
f (w)
an =
dw
2πi Γ (w − z0 )n+1
con n ∈ Z e Γ qualsiasi curva regolare chiusa contenuta nell’anello CR,ρ . Quindi
f (z) =
∞
X
an (z − z0 )n
n=−∞
ove la serie converge nella corona circolare CR,ρ ed uniformemente nella corona
circolare chiusa {z ∈ C | r2 ≤ |z − z0 | ≤ r1 }.
Dimostriamo infine l’unicità dell’espansione di Laurent della f ; supponiamo
che sia
∞
X
f (z) =
bn (z − z0 )n
n=−∞
13
Il ragionamento è il medesimo che abbiamo svolto nel dimostrare l’analiticità delle funzioni
olomorfe.
336
Capitolo 9. Algebre di Banach e C*-algebre
ove esista almeno un n ∈ Z tale che an 6= bn . Quindi in CR,ρ abbiamo che
f (z) =
∞
X
an (z − z0 ) =
n
n=−∞
∞
X
bn (z − z0 )n
n=−∞
Considerando il cerchio Γr di centro z0 e raggio R < r < ρ, queste serie vi
convergono uniformemente e, moltiplicandole per (z−z0 )n−m−1 (per m∈Z fissato)
ed integrando termine a termine otteniamo:
Z
Z 2π
n−m−1
n−m
(z − z0 )
dz = ir
ei(n−m)t dt = 2πiδnm
Γr
0
Cosı̀, dopo aver integrato le serie in an e bn , avremo solo un termine non nullo
per ciascuna serie, e precisamente
am = b m
Ma m può scegliersi arbitrariamente, e quindi le serie debbono coincidere.
qed
9.6.30 Definizione Se una funzione olomorfa f è definita in un dominio U
privato di un punto z0 interno a U , si dice che z0 è singolare per f .
Dato che U è aperto esiste un disco D centrato in z0 e completamente contenuto in U tale che la funzione sia olomorfa in D \ {z0 } e quindi in una corona
circolare di centro z0 e contenuta in D. Possiamo dunque limitarci a studiare i
punti singolari come se fossero centri di corone circolari.
9.6.31 Definizione Un punto singolare z0 per una funzione olomorfa f si dice:
(1) singolarità eliminabile se la serie di Laurent di f intorno a z0 non contiene
termini di esponente negativo (i.e. se an = 0 per n < 0);
(2) polo di ordine m se la serie di Laurent di f intorno a z0 non contiene
termini di esponente minore di −m (i.e. se an = 0 per n < −m);
(3) singolarità essenziale se la serie di Laurent di f intorno a z0 contiene termini di esponente negativo arbitrariamente basso (i.e. se per ogni n < 0
esiste un m < n con am 6= 0);
Se z0 è una singolarità eliminabile, la funzione f può estendersi ad una funzione olomorfa in z0 : infatti facendo tendere z a z0 (da qualunque direzione) otteniamo come limite della serie di Laurent il valore a0 ; definendo allora f (z0 ) = a0
otteniamo l’estensione voluta.
337
9.6. Appendice: elementi di analisi complessa
Se z0 è una singolarità essenziale, il comportamento della funzione olomorfa in
un suo intorno può essere estremamente bizzarro, in particolare, profondi teoremi
dovuti a Casorati, Weierstrass e Picard dimostrano che non è possibile controllare
in alcun modo il comportamento di f intorno ad una singolarità essenziale.
Infine, se z0 è un polo di ordine m possiamo scrivere, in una corona circolare
centrata in z0 :
∞
X
f (z) =
an (z − z0 )n
n=−m
In questo caso non possiamo eliminare la singolarità, dato che per z che tende a
z0 il valore di |f (z)| cresce arbitrariamente: infatti
X
a−m
a−1
f (z) =
+
...
+
+
an (z − z0 )n
(z − z0 )m
z − z0 n=0
∞
= (z − z0 ) (a−m + ... + a−1 (z − z0 )
m
m−1
)+
∞
X
an (z − z0 )n
n=0
= (z − z0 )m ϕ(z) +
∞
X
an (z − z0 )n
n=0
ove ϕ è olomorfa in z0 . è immediato ora che per z −→ z0 |f (z)| cresce arbitrariamente.
9.6.32 Definizione Il residuo di una funzione olomorfa in una sua singolarità
z0 è il valore del coefficiente a−1 nel suo sviluppo di Laurent intorno a z0 .
Per unicità della serie di Laurent il residuo è ben definito ed è pari a
Z
1
f (w)dw
Resz0 f (z) := c−1 =
2πi Γ
per ogni curva regolare chiusa Γ nel dominio di olomorfia di f che racchiuda il
punto z0 (e nessun altro punto singolare di f ).
Il calcolo dei residui è estremamente utile, e, nel caso di poli, può effettuarsi
in modo semplice.
Sia infatti z0 un polo di ordine m: i.e.
f (z) = (z − z0 ) (a−m + ... + a−1 (z − z0 )
m
m−1
)+
∞
X
an (z − z0 )n
n=0
Moltiplicando ambo i membri per (z − z0 ) , derivando (m − 1) volte e passando
al limite per z −→ z0 si ottiene
m
Resz0 f (z) =
1
dm−1
((z − z0 )m f (z))
lim
(m − 1)! z−→z0 dz m−1
338
Capitolo 9. Algebre di Banach e C*-algebre
9.6.33 Definizione Una funzione olomorfa in un dominio U e che abbia in
questo dominio al più singolarità polari si dice meromorfa in U .
Ad esempio una funzione razionale (un quoziente di polinomi) è meromorfa
nel piano complesso.
9.6.34 Teorema dei Residui Se f è meromorfa nel dominio regolare chiuso
U con un numero finito di singolarità z1 , ..., zn ∈ U allora
Z
X
1
f (z)dz =
Resz0 f (z)
2πi ∂U
z ∈U
0
(la somma è finita perché le uniche singolarità non eliminabili della f sono i poli
z1 , ..., zn ).
Dimostrazione: Poiché i punti z1 , ...zn sono isolati possiamo trovare dei dischi
D1 , ..., Dn centrati in essi e che non contengano altri punti singolari (di più: i
dischi Di sono a due a due disgiunti): l’idea è di applicare il teorema di Cauchy
al dominio U \ ∪ni=1 Di , nel quale la funzione è olomorfa, ottenendo
1
2πi
Z
Z
n
n
X
X
X
1
f (z)dz =
f (z)dz =
Reszk f (z) =
Resz0 f (z)
2πi
∂U
∂D
k
z ∈U
k=1
k=1
0
qed
Non ci soffermiamo sulle applicazioni di questo teorema, in particolare al
calcolo di integrali definiti per mezzo di una scelta opportuna dei domini di integrazione: per questo rimandiamo ai testi specialistici. Concludiamo con qualche
semplice ma notevole conseguenza.
9.6.35 Corollario Se f è una funzione meromorfa nel dominio regolare U e
g ∈ O(U ) allora, per z0 ∈ U :
µ 0
¶
f (z)
Resz0
g(z) = νz0 (f )g(z0 )
f (z)
ove νz0 (f ) è l’ordine di f in z0 (minimo intero per il quale il coefficiente dello
sviluppo di Laurent non è nullo).
Dimostrazione: Supponiamo che U sia un disco centrato in z0 (possiamo
assumerlo senza ledere la generalità). Sia
f (z) = (z − z0 )n h(z)
339
9.6. Appendice: elementi di analisi complessa
con h(z) olomorfa e mai nulla in U . Allora n = νz0 (f ) e
f 0 (z)
n(z − z0 )n−1 h(z) + (z − z0 )n h0 (z)) g(z)
g(z) =
f (z)
(z − z0 )n
h(z)
0
g(z)
h (z)
=n
+
g(z)
z − z0
h(z)
ma h0 g/h è olomorfa, quindi il suo residuo è zero in z0 e
µ 0
¶
Z
f (z)
1
ng(z)
Resz0
dz = ng(z0 )
g(z) =
f (z)
2πi ∂U z − z0
qed
9.6.36 Corollario (Teorema dell’indicatore logaritmico) Sia U un dominio regolare, una funzione f meromorfa in U e z1 , ..., zn gli zeri di f in U e
p1 , ..., pm i poli di f in U : supponendo che f non abbia zeri su ∂U e che g sia
olomorfa in U allora
1
2πi
Z
∂U
m
n
X
X
f 0 (z)
g(pk )νpk (f )
g(z)dz =
g(zk )νzk (f ) −
f (z)
k=1
k=1
In particolare, per g = z si ha
1
2πi
Z
∂U
n
m
X
X
f 0 (z)
zdz =
zk νzk (f ) −
pk νpk (f )
f (z)
k=1
k=1
e per g = 1:
1
2πi
Z
∂U
n
m
X
X
f 0 (z)
dz =
νzk (f ) −
νpk (f ) = #{zeri di f } − #{poli di f }
f (z)
k=1
k=1
Capitolo 10
TEORIA SPETTRALE
In questo capitolo affrontiamo la teoria spettrale nelle C∗ -algebre: questa è
una profonda generalizzazione della teoria spettrale delle matrici (l’algebra delle
matrici complesse è una C∗ -algebra), che consente di trattare gli elementi di una
C∗ -algebra come dei numeri: possiamo cioè calcolare su di essi classi di funzioni
sempre più generali. Cominceremo con le funzioni analitiche, per passare a quelle
continue ed infine a quelle boreliane: questo rende in grado, nelle applicazioni,
di dare senso a leggi fisiche in cui gli osservabili siano operatori in uno spazio
di Hilbert piuttosto che valori assunti da funzioni differenziabili, come nel caso
classico. Discuteremo come esempi alcuni classici tipi di operatori: gli operatori
compatti, gli operatori di Hilbert–Schmidt e gli operatori nucleari.
10.1
Teorema della Mappa Spettrale
Iniziamo generalizzando l’ultimo risultato ottenuto nel capitolo precedente:
10.1.1 Proposizione Se (A, ||-||1 ) è una C*-algebra, che sia un’algebra di Banach rispetto alla norma ||-||2 allora
∀A ∈ A
||A||1 ≤ ||A||2
che segue immediatamente dal
10.1.2 Lemma Se A è una *-algebra di Banach e C una C*-algebra, e ρ : A −→
B è uno *-omomorfismo allora
∀A ∈ A
||ρ(A)|| ≤ ||A||
Dimostrazione: Se A ∈ A:
||ρ(A)||2 = ||ρ(A)∗ ρ(A)|| = ||ρ(A∗ A)|| = spr(ρ(A∗ A))
340
10.1. Teorema della Mappa Spettrale
341
(essendo ρ(A∗ A) autoaggiunto in B e quindi normale). Ora, se A ∈ A−1 e η :
A −→ B è un morfismo (con η(I) = I) allora
η(A−1 )η(A) = η(A−1 A) = I
i.e. η(A−1 ) ⊂ B −1 (si noti che non vale l’inclusione opposta). Quindi A−λI ∈A−1 ,
cioè η(A − λI) ∈ B −1 ovvero η(A) − λI ∈ B −1 . In altri termini, se λ ∈ P (A) allora
λ ∈ P (η(A)) e quindi σ(η(A)) ⊂ σ(A):
spr ρ(A∗ A) ≤ spr(A∗ A) ≤ ||A∗ A|| ≤ ||A||2
(vale solo il segno ≤ perché A non è necessariamente una C*-algebra). Ne
concludiamo che
||ρ(A)|| ≤ ||A||
qed
Osserviamo che, se A ⊂ B e A è unitaria (con la stessa unità di B) allora
per A ∈ A−1 invertibile, A−1 è l’inverso di A anche in B; potrebbe tuttavia aversi
A−1 ∈B\A, nel qual caso si avrebbe A−λI ∈B−1 \A−1 . Si deve quindi considerare
PA (A), il risolvente relativo ad A (di A). Ovviamente
PA (A) ⊂ PB (A)
σB (A) ⊂ σA (A)
e
(ma non necessariamente il viceversa).
Se A è un’algebra di Banach commutativa con unità e se {Ai } è un suo
insieme di generatori, allora la funzione
Y
Φ : σ(A) −→
σ(Ai )
i
ϕ 7−→ {ϕ(A1 )}
è (per definizione delle topologie su σ(A) e sul prodotto) continua, sebbene in generale non sia suriettiva. L’immagine
dello spettro di A per tramite della mappa
Q
Φ è quindi un compatto in σ(A).
10.1.3 Definizione L’immagine Φ(σ(A)) si dice spettro congiunto di A e si
denota con jσ({Ai }).
Dato che gli {Ai } generano A, la mappa
Φ : σ(A) −→ jσ(A)
è iniettiva: infatti da ϕ1 = ϕ2 sugli {Ai } allora ϕ1 = ϕ2 sull’algebra generata
dagli {Ai } (cioè i polinomi nelle {Ai }) e quindi, la chiusura di questa algebra
342
Capitolo 10. Teoria spettrale
è A per definizione, per continuità dei ϕi , ϕ1 = ϕ2 su A. Dunque la mappa in
questione è un omeomorfismo1 .
Ad esempio, se A è generata da un solo elemento A, allora
Φ : σ(A) −→ σ(A) ⊂ C
è un omeomorfismo. Se A ∈ A (algebra di Banach con unità) consideriamo
A := hA, Ii
(con le parentesi acute denotiamo l’algebra generata dagli elementi che racchiudono: in questo caso l’algebra generata da A e I) che è esattamente la chiusura
(uniforme) dell’algebra dei polinomi in A.
Dunque A è una sottoalgebra di Banach commutativa con unità e si ha
σ(A) = σA (A) ⊂ σA (A)
10.1.4 Teorema Se A ∈ A (algebra di Banach con unità) e A è la sottoalgebra
0
generata da A e I in A allora PA (A) è un aperto e, se P∞
(A) è la componente
2
connessa del punto ∞ in PA (A), allora
0
PA (A) = P∞
(A) ∪ U
(ove U denota le rimanenti componenti connesse) e
0
σA (A) = C \ P∞
(A)
Dimostrazione: è facile rendersi conto che
0
P∞
(A) ⊂ PA (A)
Infatti la mappa PA (A) 3 λ 7−→ (A − λI)−1 è olomorfa, e
X
||A|| < |λ0 | ⇒ (A − λI)−1 =
(λ − λ0 )n RA (λ)n+1
Ã
!n+1
X
X Ak
1
=
(λ − λ0 )n −
λ k λk
Ma, per definizione di A:
−
1
2
1 X Ak
∈A
λ k λk
Essendo continua da un compatto in un compatto di Hausdorff ed iniettiva.
Cioè la componente connessa che contiene i punti di modulo opportunamente grande.
10.1. Teorema della Mappa Spettrale
343
quindi per ogni λ che soddisfi la relazione precedente, la serie
X
(λ − λ0 )n RA (λ0 )n+1 ∈ A
0
converge e, per continuazione analitica, si trova che P∞
(A) ⊂ PA (A).
0
0
(A) allora
/ P∞
Viceversa dimostriamo che PA (A) ⊂ P∞ (A), cioè che se λ ∈
λ∈
/ PA (A).
Per assurdo sia λ∈PA (A), i.e. (A−λI)−1 ∈A cioè esistano i polinomi complessi
pn ∈ C[z] tali che
||pn (A) − (A − λI)−1 || −→ 0
il che, per continuità del prodotto, implica
||(A − λI)pn (A) − I|| −→ 0
Ma se
qn (z) := (z − λ)pn (z) − 1
evidentemente ||qn (A)|| −→ 0, e tuttavia
∀p ∈ C[z] ∀ϕ ∈ σ(A) ϕ(p(A)) = p(ϕ(A))
(per linearità e moltiplicatività delle ϕ), quindi (si rammenti che ||ϕ|| = 1):
|p(ϕ(A))| ≤ ||p(A)||
ovvero, per ogni z ∈ σA (A): |p(z)| ≤ ||p(A)||.
Supponiamo ora che λ appartenga ad una componente connessa che non sia
0
P∞ (A): per il principio del massimo 9.6.24, in questa componente connessa (che
per definizione è chiusa ma anche aperta): |p(z)| ≤ ||p(A)||; in particolare ciò è
vero nel punto λ. Ma
||qn (A)|| −→ 0
mentre qn (λ) = 1 il che viola il principio del massimo per qn (che ovviamente
sono olomorfe, essendo polinomi!). L’assurdo è derivato dall’aver supposto falsa
0
l’inclusione PA (A) ⊂ P∞
(A).
qed
10.1.5 Proposizione Se A è una C*-algebra con unità I, A ∈ A e A ∈ B ⊂ B
(C*-sottoalgebra con unità I) allora
σA (A) ⊂ σB (A)
Se A è autoaggiunto vale il segno di uguaglianza.
344
Capitolo 10. Teoria spettrale
Dimostrazione: Se A é autoaggiunto allora σA (A) ⊂ R è compatto e quindi
0
c’è solo la componente connessa P∞
(A).
Nel caso generale, certamente A∗ A è autoaggiunto e quindi
σB (A∗ A) = σA (A∗ A)
Ora osserviamo che se A ∈ B è invertibile in A allora basta dimostrare che il
suo inverso appartiene a B; infatti ciò equivale a PA (A) = PB (A) i.e. a σA (A) =
σB (A).
Ma in questo caso A∗−1 = A−1∗ e (A∗ A)−1 = A−1 A−1∗ in A e, essendo A∗ A
autoaggiunto, A∗ A ∈ B (l’unità I è la stessa sia in A che B). Quindi
A−1 = (A∗ A)−1 A∗
e, dato che (A∗ A)−1 , A ∗ ∈B, anche A−1 ∈ B.
qed
Consideriamo ora una C*-algebra A con unità I ed un suo elemento A; si
definisce
A = C ∗ (A, I) := hA, A∗ , Ii
i.e. come la chiusura uniforme dei polinomi in A e A∗ :
X
p(A) =
cnm An A∗m
ove le {cnm } sono nulle tranne che per un numero finito di coppie (n, m). A è
ovviamente una C*-algebra commutativa con unità I e quindi, per il teorema di
Gel’fand–Najmark:
∀ϕ ∈ σ(A) ϕ(A∗ ) = ϕ(A)
Si ha cioè l’omeomorfismo
σ(A) ∼
= σA (A) = σA (A)
Dunque la trasformata di Gelfand è uno *-isomorfismo isometrico di A su C(σ(A)).
D’altro canto abbiamo anche l’omeomorfismo ϕ : σ(A) ∼
= σ(A) (che manda
λ 7−→ ϕλ in ϕλ (A) = λ) e quindi, per funtorialità, si ha uno *-isomorfismo
isometrico che rende commutativo il diagramma seguente:
/ C(σ(A))
HH
HH
∗
HH
HH ϕ
# ²
A HH
C(σ(A))
345
10.1. Teorema della Mappa Spettrale
(dove ϕ∗ (f )(λ) = f (ϕλ )). Se definiamo una mappa C(σ(A)) −→ A come
f 7−→ f (A)
allora f (I) = I (per unitarietà dello *-isomorfismo ϕ∗ ) e, se f (λ) = λ allora
b λ ) = λ deve essere ϕλ (B) =
f (A) = A: infatti in questo caso, se B è tale che B(ϕ
λ = ϕλ (A) i.e. ϕλ (B − A) = 0 e quindi B = A.
Quindi la freccia diagonale C(σ(A)) ←→ A nel diagramma commutativo
precedente è l’unica estensione isometrica della mappa C[z] −→ A di valutazione
di un polinomio su A (p 7−→ p(A)) alla chiusura (uniforme) dello spazio dei
polinomi e di A, per il teorema di Stone–Weierstrass.
La mappa C(σ(A)) −→ A che abbiamo ottenuto si dice calcolo funzionale
continuo per un operatore normale A. Infatti ci consente di calcolare il valore di
una funzione continua su un operatore normale, analogamente a quanto accade
per i polinomi.
10.1.6 Teorema della Mappa Spettrale Se A è un operatore normale in una
C*-algebra A, per ogni f ∈ C(σ(A)) si ha che
σ(f (A)) = f (σ(A))
Dimostrazione: A questo punto è una facile verifica:
σ(f (A)) = {ϕ(f (A))}ϕ∈σ(A) = {f[
(A)(ϕ)}ϕ∈σ(A)
= {f[
(A)(ϕλ )}λ∈σ(A) = {f (λ)}λ∈σ(A) = f (σ(A))
qed
Se la C*-algebra A è commutativa, allora ogni operatore è normale e quindi
il teorema della mappa spettrale ci consente di calcolare funzioni continue su elementi di A: da questo punto di vista, gli operatori di A sono una generalizzazione
dei numeri complessi.
10.1.7 Esempio Se f è una funzione olomorfa intera, allora
∀λ ∈ C f (λ) =
∞
X
c n λn
n=0
(la somma converge assolutamente in tutto il piano complesso) e quindi
∀A ∈ A f (A) =
∞
X
cn An
n=0
converge assolutamente, quindi (A è uno spazio di Banach) converge in A.
346
Capitolo 10. Teoria spettrale
Se A è commutativa, possiamo valutare su f (A) un funzionale moltiplicativo
ϕ (si rammenti che un tale funzionale è continuo):
∀ϕ ∈ σ(A) ϕ(f (A)) = f (ϕ(A))
In realtà non è necessario limitarsi a funzioni intere. Più precisamente, sia f ∈
O(Ω) ove Ω è un dominio regolare (cioè un aperto connesso il cui bordo sia
una curva regolare Γ) del piano complesso, con chiusura Ω compatta, contenente
σ(A), e sia A(Ω) l’insieme delle funzioni olomorfe su Ω e continue su Ω = Ω ∪ Γ;
si tratta di una sottoalgebra di Banach di C(Ω) per la norma
||f ||A(Ω) = max |f (z)| = max |f (z)|
z∈Γ
z∈Ω
Per la formula di Cauchy 9.6.6:
1
∀z ∈ Ω f (z) =
2π
I
Γ
f (w)
dw
w−z
dunque è naturale definire l’integrale di Dunford
I
1
f (A) :=
f (λ)RA (λ)dλ
2π Γ
(RA (λ) denota al solito il risolvente). Dato che la funzione f (λ)RA (λ) è olomorfa
in Ω, questo integrale non dipende da Γ.
10.1.8 Lemma Se A ∈ A (algebra di Banach con unità) allora l’integrale di
Dunford induce un morfismo continuo f 7−→ f (A) tale che
• Se f (z) = 1 su Ω allora f (A) = I.
• Se f (z) = z su Ω allora f (A) = A.
P
• Se f (z) = n≥0 cn z n è una serie assolutamente convergente in Ω allora
f (A) =
∞
X
cn An
n=0
Dimostrazione: La mappa f −
7 → f (A) è ovviamente lineare e limitata, dato
che
1
||f (A)|| ≤
|Γ| max ||R(λ)|| ||f ||A(Ω)
2π
347
10.1. Teorema della Mappa Spettrale
(|Γ| denota la lunghezza della curva Γ), ed è un omomorfismo di algebre: di più,
verifichiamo che se Γ1 e Γ2 sono curve regolari chiuse in Ω, allora
∀f1 , f2 ∈ A(Ω) f1 (A)f2 (A) = f1 f2 (A)
Intanto, dato che f2 (A) non dipende dalla scelta di Γ1 , possiamo supporre che
sia Γ2 ⊂ Ω1 (le curve regolari chiuse delimitano domini regolari) e quindi
µ
f1 (A)f2 (A) =
µ
=
1
2πi
1
2πi
¶2 I
I
f1 (λ1 )R(λ1 )dλ1
Γ1
f2 (λ2 )R(λ2 )dλ2 =
Γ2
¶2 I
f1 (λ1 )f2 (λ2 )
Γ1
R(λ1 ) − R(λ2 )
dλ1 dλ2
λ1 − λ − 2
(si ricordi che R(λ1 ) − R(λ2 ) = (λ1 − λ2 )R(λ1 )R(λ2 )). Ma la funzione
λ2 7−→
R(λ1 ) − R(λ2 )
λ1 − λ2
è olomorfa in Ω2 e quindi, per la formula integrale di Cauchy:
µ
¶2 I
I
1
R(λ1 ) − R(λ2 )
f1 (A)f2 (A) =
dλ2 dλ1
f1 (λ1 )
f2 (λ2 )
2πi
λ1 − λ2
Γ1
Γ2
µ
¶2 I
I
1
f2 (λ2 )R(λ2 )
=−
f1 (λ1 )
dλ2 dλ1
2πi
λ1 − λ2
Γ1
Γ2
¶
µ
I
I
1
f1 (λ1 )
1
f2 (λ2 )R(λ2 )
dλ1 dλ2
=−
2πi Γ2
2πi Γ1 λ1 − λ2
I
1
=−
f2 (λ2 )f1 (λ2 )R(λ2 )dλ2
2πi Γ2
= f1 f2 (A)
Ora la (3) del teorema è immediata. La (2) è un facile calcolo:
1
f (A) = −
2πi
I
1
λR(λ)dλ = A +
2πi
Γ
I
(A − λI)R(λ)dλ = A
Γ
mentre la (1) si dimostra osservando che, essendo una funzione identicamente 1
intera, possiamo scegliere Γ come una circonferenza di centro l’origine del piano
348
Capitolo 10. Teoria spettrale
complesso e raggio arbitrariamente grande, ottenendo quindi
¯¯ I
¯¯
I
¯¯
1 ¯¯¯¯
I
¯¯
1 · R(λ)dλ −
||f (A) − I|| =
dλ
¯
¯
¯¯
−1
2π
Γ
Γ λ
¯¯ I µ
¶ ¯¯
¯¯
I
1 ¯¯¯¯
¯¯
R(λ)
+
=
−
dλ
¯¯
2π ¯¯
λ−1
Γ
! ¯¯
¯¯ I õ
¶−1
¯¯ 1
dλ ¯¯¯¯
A
= ¯¯¯¯
I − −1
−I
2π Γ
λ
λ ¯¯
¯¯ µ
¯¯ I
¶−1
¯¯
¯¯ 1
A
1
¯
¯
≤ max ¯¯ I − −1
− I ¯¯¯¯
dλ
λ∈Γ
λ
2π Γ |λ|
||A||
≤ max
λ∈Γ |λ| − ||A||
che tende a zero per |λ| −→ ∞.
qed
Questo teorema si estende immediatamente al caso in cui σ(A) sia sconnesso: infatti se σ(A) = σ1 (A) ∪ σ2 (A) sono le componenti connesse, possiamo
considerare l’integrale di Dunford
I
1
f (A) = −
f (λ)R(λ)dλ
2πi Γ
ove Γ è una curva regolare chiusa, che delimiti3 un dominio regolare contenente
σ1 (A) e il cui complementare (illimitato) contenga σ2 (A), e l’algebra A(Ω) è
quella delle funzioni olomorfe in Ω continue in Ω. In questo caso, se f = 1, allora
f (A) è un proiettore (continuo), cioè f (A)2 = f (A) che commuta con A e tale
che Af (A) = f (A).
Dunque, se σ(A) è sconnesso, A possiede un idempotente e quindi una proprietà topologica dello spettro ne implica una algebrica dell’algebra.
10.1.9 Teorema della Mappa Spettrale Olomorfo Se A è un’algebra di Banach con unità, A ∈ A e Γ una curva regolare che delimiti un dominio regolare
Ω tale che σA (A) ⊂ Ω, allora per ogni funzione f ∈ A(Ω):
σA (f (A)) = f (σA (A))
Dimostrazione: Se A è commutativa, allora, per ogni ϕ ∈ σ(A):
¶
µI
I
1
1
f (λ)
ϕ(f (A)) = −
f (λ)R(λ)dλ = −
ϕ
dλ = f (ϕ(A))
2πi
2πi Γ ϕ(A) − λ
Γ
3
In tutti questi ragionamenti si assume il teorema di Jordan secondo il quale una curva
siffatta divide in piano in due parti: una limitata ed una illimitata.
10.2. Calcolo funzionale continuo
349
e quindi il teorema segue immediatamente dal lemma.
Se A non è commutativa, possiamo, per ogni A ∈ A considerare l’algebra
commutativa massimale che contiene A (intersezione di tutte le sottoalgebre
commutative B ⊂ A che contengano A). Una costruzione di B è la seguente:
consideriamo l’algebra generata da A, I e dagli elementi
{RA (λ)}λ∈P (A)
Dato che i risolventi commutano fra loro, quest’algebra è commutativa e, per
definizione, tale che
σB (A) = σA (A)
Quindi, dato che il teorema vale per B, vale anche per A.
qed
10.2
Calcolo funzionale continuo
Sia A una C*-algebra con unità I e A un elemento autoaggiunto A = A∗ di
A. Allora
σ(A) ⊂ R
10.2.1 Teorema Se A è una C*-sottoalgebra dell’algebra B(H) degli operatori
continui su uno spazio di Hilbert allora le seguenti condizioni sono equivalenti:
• Per ogni x ∈ H: (x, Ax) ≥ 0 (i.e. A è positivo).
• Esiste B ∈ B(H) tale che A = B ∗ B.
• A è autoaggiunto e σ(A) ⊂ [0, ∞].
Dimostrazione: (3) ⇒ (2): se A = A∗ allora per ogni funzione f ∈ C([0, ∞])
√
possiamo usare il calcolo funzionale continuo: in particolare per f (t) := + t,
abbiamo che
f (A) ∈ A ⊂ A
e, avendo f valori reali: f (A)∗ = f (A) i.e. f (A)2 ) = f 2 (A) = A. Prendiamo
allora semplicemente
B := f (A)
ottenendo B = B ∗ e B ∗ B = f (A)2 = A.
(2) ⇒ (1) è ovvio: per ogni x ∈ H:
(x, B ∗ Bx) = (Bx, Bx) ≥ 0
350
Capitolo 10. Teoria spettrale
(1) ⇒ (3): Se (x, Ax) ∈ R:
(x, Ax) = (x, Ax) = (Ax, a)
quindi A = A∗ è autoaggiunto. Allora σ(A)∈R e, per λ > 0, vogliamo dimostrare
che (A + λI)−1 ∈ B(H) (il che implicherà che (A + λI)−1 ∈ A avendo A e B(H)
la stessa unità I). Ma
λ(x, x) < (x, (A + λI)x) ≤ ||x|| ||(A + λI)x||
e quindi λ||x|| ≤ ||(A + λI)x|| cioè ker(A + λI) = 0. Esiste dunque l’inverso di
(A + λI) e quello che vogliamo dimostrare è che questo operatore è definito in
tutto H.
Di certo il suo dominio è denso, ed inoltre:
Dom(A + λI)−1 = Im(A + λI)
Infatti, dato che ker(A + λI) = 0:
∀x ∈ H (y, (A + λI)x) = 0 ⇒ y = 0
Consideriamo ora z ∈ im(A + λI):
z = lim zn = lim(A + λI)xn
n
z
Dunque {(A + λI)xn } è di Cauchy, da cui
λ|xn − xm || ≤ ||(A + λI)(xn − xm )|| < ε
cioè {xn } pure è di Cauchy, e deve quindi convergere a un x ∈ H.
Questo dimostra che z ∈ im(A + λI), che quindi risulta essere chiuso; dato che
è anche denso in H segue che H = im(A + λI), e quindi l’operatore (A + λI)−1
è definito ovunque.
Ora si noti che
(A + λI)−1 z = (A + λI)−1 (A + λI)x = x
e, dato che λ||x|| ≤ ||z||:
||x|| ≤ ||(A + λI)−1 z||
Ne concludiamo che (A + λI)−1 è lineare e continuo su H, ed è un inverso sinistro
(e anche destro) di A + λI, il che significa che λ ∈ P (A).
Abbiamo quindi dimostrato che σ(A) ⊂ [0, ∞).
qed
10.2. Calcolo funzionale continuo
351
Osserviamo che se A è autoaggiunto, dato che (x, Ax) ∈ R, per la disuguaglianza di Schwartz:
(x, Ax) ≤ ||A||(x, x)
Ma vale ovviamente anche la disugualianza opposta. Quindi è naturale chiedersi
quali a e b possano scegliersi in modo che
a(x, x) ≤ (x, Ax) ≤ b(x, x)
10.2.2 Proposizione Se A ∈ B(H) è autoaggiunto allora una coppia di numeri
reali (a, b) soddisfa alla
∀x ∈ H
a(x, x) ≤ (x, Ax) ≤ b(x, x)
se e solo se l’intervallo [a, b] contiene lo spettro σ(A).
Dimostrazione: L’equivalenza (1) ⇐⇒ (3) del teorema precedente, con la
scelta A − aI e bI − A fornisce immediatamente la tesi.
qed
In particolare si possono considerare a = min σ(A) e b = max σ(A).
10.2.3 Definizione Se A ∈ A (C*-algebra con unità I) allora (essendo A∗ un
operatore autoaggiunto e positivo), il modulo di A è l’operatore autoaggiunto
√
|A| := A∗ A ∈ A
Dato che ker |A| = ker A (infatti (|A|x, |A|x) = 0 ⇐⇒ (x, |A|2 x) = 0 ⇐⇒
(x, A∗ Ax) = 0) si ha il
10.2.4 Teorema Se A è una C*-sottoalgebra di B(H) esiste un’unica isometria
parziale V in H tale che ker V = ker A e
A = |A|V
Il seguente teorema è una generalizzazione della decomposizione polare delle
matrici:
10.2.5 Teorema Se A ∈ B(H) esiste un’unica coppia (V, H) di operatori in H,
ove V è un’isometria parziale e H un operatore autoaggiunto positivo tali che
ker A = ker V = ker H e
A=VH
352
Capitolo 10. Teoria spettrale
Dimostrazione: Ovviamente poniamo H = |A|; dato che, per ogni x ∈ H:
¯¯
¯¯
¯¯ |A|x¯¯2 = ||Ax||2
si ha quindi che la corrispondenza |A|x ←→ Ax è una isometria e
(im |A|)⊥ = ker |A| = ker A
(infatti (im B)⊥ = ker B ∗ sempre). Possiamo dunque estendere la corrispondenza
|A|x ←→ Ax ponendola zero su im |A|⊥ = ker A.
Infine vediamo l’unicità della decomposizione: se fosse A = V H = V 0 H 0
sarebbe anche
A∗ = H 0 V 0∗ ⇒ A∗ A = H 02 ⇒ H 0 = |A|
ed inoltre A = V 0 H = V |A| da cui V = V 0 .
qed
Se A1 , ..., An ∈ A sono tali che
∀i, k = 1, ..., n Ai Ak = Ak Ai
allora la C*-algebra
e
Ai A∗k = A∗k Ai
A = C ∗ hI, A1 , ..., An i
generata da {I, A1 , ..., An } è commutativa e quindi, per il teorema di Gelfand–
Najmark, isomorfa alla C*-algebra C(σ(A)), ove lo spazio σ(A) è omeomorfo
allo spettro congiunto jσ(A1 , ..., An ).
Notiamo che, in generale jσ(A1 , ..., An ) * σ(A1 )× ... × σ(An ) (ad esempio per
A1 = A e A2 = A∗ ); un caso in cui vale invece il segno di = è per A = C[0, 12 ]
con A1 = f1 e A2 = f2 , ove f1 (s, t) = s e f2 (s, t) = t.
Possiamo comunque estendere la teoria svolta per un solo operatore A alla
famiglia di operatori {A1 , ..., An } ottenendo il calcolo funzionale continuo (la
freccia diagonale nel seguente diagramma):
A HH / C(σ(A))
HH
HH
∗
HH
HH ϕ
# ²
C(σ(A))
(dove ϕ∗ (f )(λ) = f (ϕλ )) in più variabili:
f 7−→ f (A1 , ..., An )
come l’unico *-isomorfismo isometrico C(jσ(A1 , ..., An )) ∼
= A tale che
10.2. Calcolo funzionale continuo
353
• Se f = 1 allora f (A1 , ..., An ) = I.
• Se f (λ1 , ..., λn ) = λi allora f (A1 , ..., An ) = Ai .
Osserviamo che, A∗ A = AA∗ e A = A1 + iA2 se e solo se A1 A2 = A2 A1 e
quindi σ(A) = jσ(A1 , A2 ), dato che
jσ(A1 , A2 ) = {(ϕ(A1 ), ϕ(A2 ))}ϕ∈σ(A) ←→ {ϕ(A) = ϕ(A1 ) + iϕ(A2 )}ϕ∈σ(A)
10.2.6 Definizione Lo spettro puntuale di un operatore A ∈ A (C*-algebra con
unità) è l’insieme
σp (A) := {λ ∈ C | ∃x 6= 0 Ax = λx}
e lo spettro continuo di A è l’insieme
σc (A) := {λ ∈ C |∀ε > 0∃x ||Ax − λx|| < ε}
Ovviamente
σ(A) = σp (A) ∪ σc (A)
10.2.7 Esempio Sia X uno spazio topologico separabile e consideriamo una
misura atomica µ su X (o meglio sulla σ-algebra dei boreliani di X), cioè costruita
prendendo una successione {xn } ⊂ X densa e ponendo
µ=
∞
X
cn δxn
n=0
(ove δx è laP
misura di Dirac concentrata in {x} e i cn sono positivi e normalizzati in
modo che n cn = 1). Per il teorema di Riesz–Markov 9.2.2, esiste un funzionale
Fn associato alla misura δxn tale che
Z
Fn (f ) =
f (x)dδxn (x)
X
Se consideriamo l’operatore di moltiplicazione per f : Mf allora
σp (Mf ) = σ(Mf )
354
Capitolo 10. Teoria spettrale
10.2.8 Lemma Se A1 , ..., An ∈ A (C*-algebra con unità I) soddisfano alle
∀i, k = 1, ..., n
Ai Ak = Ak Ai
e
Ai A∗k = A∗k Ai
allora lo spettro congiunto jσ(A1 , ..., An ) è l’insieme
½
¾
||(Ak − λk )B||
n
(λ1 , ..., λn ) ∈ C | ∀ε > 0 ∃B ∈ A \ 0
<ε
||B||
Dimostrazione: Se λ = (λ1 , ..., λn ) ∈ Cn non appartiene a jσ(A1 , ..., An ) deve
aversi
d(jσ(A1 , ..., An ), λ) = δ > 0
Per z ∈ jσ(A1 , ..., An ) consideriamo la funzione
f (z) :=
1
1
=
||λ − z||
d(λ, z)
Allora f : jσ(A1 , ..., An ) −→ C è continua e ||f || < 1/δ, quindi, se C :=
f (A1 , ..., An ) sta in A e
||λ − z||2 =
n
X
|λi − zi |2 ⇒
n
X
|(λi − zi )f (z)|2 = 1
i=1
i=1
Applicando il calcolo funzionale continuo:
n
X
C ∗ (Ai − λi I)∗ (Ai − λi I)C = I
i=1
Dunque, se B ∈ A:
n
X
(CB)∗ (Ai − λi I)∗ (Ai − λi I)CB
B B=
∗
=
i=1
n
X
((Ai λi )B)∗ C ∗ C(Ai − λi I)B
i=1
(dato che C commuta con gli Ai per definizione). Quindi
∗
||B B|| = ||B|| ≤
2
n
X
||C(Ai − λi I)B|| = ||C||
i=1
=
1
δ
n
X
i=1
||(Ai − λi I)B||2
2
n
X
i=1
||(Ai − λi I)B||2
355
10.2. Calcolo funzionale continuo
Questo vale per ogni B e λ ∈
/ jσ(A1 , ..., An ), perciò l’insieme
{(λ1 , ..., λn ) ∈ Cn | ∀ε > 0∃B ⊂ A \ 0 ||(Ak − λk )B|| < ε||B||}
è contenuto in jσ(A1 , ..., An ).
Viceversa, sia λ ∈ jσ(A1 , ..., An ); allora, se g : [0, ∞) −→ R è continua e tale
che
∀t ≥ ε g(t) = 0
e
g(0) = 1
abbiamo che la funzione
f (z) := g(||λ − z||)
verifica la f (A1 , ..., An ) ∈ A \ 0. Dunque
|(zi − λi )f (z)| < ε =⇒ ||(Ai − λi I)B|| ≤ ε||B||
se B = f (A1 , ..., An ) (si rammenti che ||f || = 1).
qed
10.2.9 Teorema Se A ⊂ B è una C*-sottoalgebra e A1 , ..., An ∈ A sono tali che
∀i, k = 1, ..., n
Ai Ak = Ak Ai
allora lo spettro congiunto jσ(A1 , ..., An ) è
n
(λ1 , ..., λn ) ∈ Cn | ∃{xn } ⊂ H1
e
Ai A∗k = A∗k Ai
lim ||Ak xn − λk xn || = 0
o
n−→∞
(ove H1 = {x ∈ H | ||x|| = 1}).
Dimostrazione: Per il lemma sappiamo che
λ ∈ jσ(A1 , ..., An ) ⇐⇒ ∀ε > 0 ∃B ∈ A ||B|| = 1 e ||(Ak − λk )B|| ≤ ε
Se A ⊂ B(H) allora ||B|| = supx∈H1 ||Bx|| quindi
||(Ak − λk I)Bx|| ≤ ε
e, per ogni δ > 0 esiste un xδ ∈ H1 per il quale
||Bxδ || > 1 − δ
Dunque, per
y :=
Bxδ
||Bxδ ||
356
Capitolo 10. Teoria spettrale
troviamo che
||(Ak − λk I)y|| ≤
ε
ε
<
||Bxδ ||
1−δ
ovvero
λ ∈ jσ(A1 , ..., An ) ⇐⇒ ∀ε > 0 ||(Ak − λk )x|| ≤ ε
Per ogni n possiamo quindi scegliere un xn che soddisfi la relazione precedente
per un εn arbitrario.
qed
Osserviamo che, se esiste x ∈ H \ 0 tale che, per ogni k, (Ak − λk I)x = 0,
allora
\
K :=
ker(Ak − λk I) 6= 0
k
Se la dimensione di H non è finita, possiamo scegliere gli {xn } del teorema precedente in modo che formino una base ortonormale; nella costruzione si considerano
le εn (tendenti a zero) e le gn : [0, ∞) −→ R tali che
∀z
εn < ||z − λ|| =⇒ g(z) = 0
e
gn (0) = 1
ma sarebbe lo stesso porre, per n 6= m:
gn (z)gm (z) = 0
con ||gn || = 1, in modo che Bn∗ Bm = 0 e quindi:
n 6= m =⇒ (Bn x, Bm x) = 0
Questo è possibile perché λ non è un punto isolato dello spettro congiunto ed i
punti isolati dello spettro congiunto fanno parte in realtà della sua componente
puntuale, come dimostreremo ora.
10.2.10 Definizione Se A è normale in B(H), il suo spettro essenziale è l’insieme
σess (A) := {λ ∈ σ(A) | λ punto isolato e dim ker(A − λI) < ∞}
10.2.11 Proposizione Se λ è un punto isolato in σ(A) allora λ ∈ σp (A).
Dimostrazione: Ovviamente {λ} è un chiuso (essendo lo spettro uno spazio
di Hausdorff) ed aperto (essendo un punto isolato), il che vuol dire che la sua
funzione caratteristica χ{x} è continua. Quindi χ{x} (A) ∈ A se e solo se χ{x} è un
idempotente autoaggiunto E nell’algebra C(σ(A)). Se A ∈ B(H) è normale allora
10.3. Calcolo funzionale boreliano
357
E è un proiettore sul sottospazio ker(A − λI); infatti (z − λ)χ{x} = 0 e quindi
(A − λI)E = 0.
Applicando il calcolo funzionale continuo si ottiene (ricordando che se x ∈
ker(A − λI) allora A∗ x = λX):
∀p ∈ C[x, y] p(A, A∗ )(x) = p(λ, λ)(x)
Ma, dato che per il teorema di Stone–Weierstrass 9.2.9 esiste una successione
{pn } di polinomi che approssimano la funzione continua χ{x} , si ha
||pn (A) − E|| −→ 0
e, dato che pn (A)X −→ Ex, pn (λ)x −→ x e pn (A)x = pn (λ)x, ne viene Ex = x.
Quindi l’immagine di E è ker(A − λI).
qed
Lo stesso ragionamento può farsi per un numero finito qualsiasi di operatori
A1 , ..., An , che commutino con i loroTaggiunti: in questo caso χ{x} corrisponde ad
un operatore E la cui immagine è i ker(Ai − λi I). Dunque si ha il
10.2.12 Teorema (Weyl)
σess (A) = {λ ∈ C | ∃{xn } base ortonormale ||Axn − λxn || −→ 0}
10.3
Calcolo funzionale boreliano
Prendiamo spunto da un esempio: sia H uno spazio di Hilbert di dimensione
finita (spazio euclideo); allora se A è normale, per ogni λ ∈ C tale che A∗ x = λx:
ker(A − λI)⊥ ⊂ N (A − λI)⊥
Se Pλ è l’operatore di proiezione Eker(A−λI) si ha che
P
•
λ∈σ(A) Pλ = I.
• Se λ 6= λ0 : Pλ Pλ0 = 0.
P
• A = λ∈σ(A) λPλ .
Questo non è che un altro modo di esprimere la nota proprietà di diagonalizzazione delle matrici hermitiane. Il calcolo delle funzioni su tali matrici si riduce
a quello sui suoi autovalori:
X
∀p ∈ C[z] p(A) =
p(λ)Pλ
358
Capitolo 10. Teoria spettrale
Ad esempio se f |σ(A) = χ{λ} allora Pλ = f (A).
Se A è autoaggiunto allora il suo spettro è reale e possiamo definire
X
E(λ) :=
Pλ0
λ0 ≤λ
La proprietà (3) si esprime allora come
Z
A = λdE(λ)
ove la misura E è definita sugli intervalli come
E(λ, λ0 ] := E(λ) − E(λ0 )
Ovviamente
E(λ) = χ(−∞,λ] (A)
Questa funzione è continua solo se la dimensione dello spazio H è finita.
Nel caso generale, che è quello che ci interessa, non possiamo quindi usare
il calcolo funzionale che abbiamo fin qui sviluppato: dobbiamo perciò cercare di
estenderlo ad una classe di funzioni più vasta di quelle continue.
Consideriamo quindi uno spazio di Hilbert H ed un operatore A continuo e
normale su H; allora esiste un isomorfismo isometrico
∼
=
C(σ(A)) −−−−→ A = C ∗ hA, Ii
Ora osserviamo che, per il teorema di Tietze 2.3.4, gli elementi di C(σ(A)) si
ottengono da quelli di Co (C) (funzioni continue e limitate su C) per restrizione
a σ(A), e quindi che il calcolo funzionale continuo induce una mappa (che non è
un isomorfismo):
Co (C) −→ A
al solito ponendo f 7−→ f (A). Quindi, dare un operatore normale è equivalente ad
assegnare un morfismo di C*-algebre (un tale morfismo verrà in sèguito chiamato
rappresentazione della C*-algebra A)
π : A −→ B(H)
(con A := Co (C)) il cui nucleo è
ker π = {f ∈ Co (C) | f |σ(A) = 0}
Infatti, data π, se f0 ∈ Co (C) è tale che f0 (λ) = λ su σ(A), e se
A := π(f0 )
359
10.3. Calcolo funzionale boreliano
si trova che, per ogni altra f ∈ Co (C) con f |σ(A) ∈ C(σ(A)) si ha
π(f ) = f (A)
(questo è vero ovviamente per f costante, e quindi, per linearità e moltiplicatività, sui polinomi ed infine, per continuità, sulle funzioni continue qualsiasi).
Osserviamo che, se A1 , A2 ∈ B(H) sono operatori normali allora
σ(A1 ) = σ(A2 ) ⇐⇒ ker π1 = ker π2
10.3.1 Definizione Due operatori A1 e A2 si dicono unitariamente equivalenti,
e si scrive A1 ∼
= A2 , se esiste un operatore unitario U in H tale che
U A1 U −1 = A2
e
U A2 U −1 = A1
È immediato verificare che se A1 ∼
= A2 allora σ(A1 ) = σ(A2 ) e, di più,
σp (A1 ) = σp (A2 ).
Torniamo ora alla nostra rappresentazione
π(f ) = f (A)
Se A1 ∼
= A2 le rappresentazioni associate si dicono unitariamente equivalenti e si
scrive π1 ∼
= π2 : ciò significa che esiste un operatore unitario U in H tale che
U π1 (f ) = π2 (f )U
Inoltre possiamo definire
(π1 , π2 ) := {T ∈ B(H) | ∀f ∈ Co (C) T π1 (f ) = π2 (f )T }
Gli elementi di questo insieme si dicono operatori di allacciamento. Dato che due
rappresentazioni equivalenti hanno gli stessi nuclei, segue che gli spettri degli
operatori associati sono equivalenti e, di più, gli operatori sono unitariamente
equivalenti.
Vale anche il viceversa: se U A1 U −1 = A2 allora
U An1 U −1 = An2 ⇒ U p(A1 )U −1 = p(A2 )
con p ∈ C[z]. Di nuovo per continuità e per il teorema di Stone–Weierstrass 9.2.9:
U f (A1 )U −1 = f (A2 )
per ogni funzione continua sullo spettro di A1 (che poi coincide con lo spettro di
A2 ). Quindi
U π1 (f )U −1 = π2 (f )
In questo modo lo studio degli operatori e delle rappresentazioni si equivale:
in effetti, rappresentare un’algebra vuol dire proprio presentarla concretamente
come l’algebra degli operatori di qualche spazio.
360
Capitolo 10. Teoria spettrale
Studiamo ora le rappresentazioni di A = C(X), ove X è uno spazio topologico
di Hausdorff compatto in uno spazio di Hilbert H:
π : A −→ B(H)
Vogliamo associare a π delle misure (boreliane) su X.
Preliminarmente osserviamo che, per x, y ∈ H, la mappa
f 7−→ (x, π(f )y)
è un funzionale lineare su A, continuo in virtù della
|(x, π(f )y)| ≤ ||x|| ||y|| ||π(f )|| ≤ ||x|| ||y|| ||f ||
Allora, per il teorema di Riesz–Markov 9.2.2:
∗
Z
F ∈ C(X) ⇐⇒ F (f ) =
f (t)dµ(t)
X
ove µ è una misura boreliana complessa regolare e limitata (cioè è una combinazione lineare finita di misure regolari di probabilità).
Quindi
Z
(x, π(f )y) =
f (t)dµx,y (t)
X
10.3.2 Definizione Gli elementi della famiglia
{µx,y }x,y∈H
si dicono misure spettrali associate alla rappresentazione π.
Consideriamo ora lo spazio B(X) delle funzioni boreliane limitate su X a
valori complessi: sappiamo che, con la norma
||f || := sup |f (x)|
x∈X
è un’algebra di Banach4 : ovviamente l’involuzione
f ∗ (x) := f (x)
la rende una C*-algebra commutativa. Per il teorema di Riesz–Markov esiste
l’estensione
π
e : B(X) −→ B(H)
4
Se {fn } sono boreliane ed equilimitate e convergenti puntualmente in X il loro limite è
una funzione boreliana limitata.
361
10.3. Calcolo funzionale boreliano
(tale che π
e|C(X) = π). Infatti, se µ è la misura che corrisponde al funzionale F
per mezzo del teorema di Riesz–Markov, allora l’integrale
Z
f (t)dµ(t)
X
è definito sugli elementi di B(X) e quindi per ogni funzione boreliana f ed ogni
misura spettrale µx,y ha senso l’espressione
Z
f (t)dµx,y (t)
X
Si tratta di una funzione sesquilineare nelle x e y, dato che
µx,ay1 +by2 = aµx,y1 + bµx,y2
e
µax1 +bx2 ,y = aµy1 ,x + bµx2 ,y
Dato che, per definizione, ||µ| := ||F ||, questa forma sesquilineare è limitata
(||µ|| ≤ ||x|| ||y||), deve esistere π
e tale che
Z
f (t)dµx,y (t) = (x, π
e(f )y)
X
Questa π
e è ovviamente lineare in f , ed è uno *-morfismo, dato che
Z
Z
(x, π
e(f )y) =
e(f )x)
f (t)dµx,y (t) =
f (t)dµy,x (t) = (y, π
X
X
Effettivamente è proprio una rappresentazione, avendosi
π(f g) = π(f )π(g)
sulle funzioni continue, e quindi
Z
Z
f (t)g(t)dµx,y (t) = (x, π(f g)y) = (x, π(f )π(g)y) =
f (t)dµx,π(g)y (t)
X
X
da cui µx,π(g)y) = gµx,y ; integrando quindi una funzione boreliana rispetto a
questa misura si trova
(x, π
e(f g)y) = (x, π
e(f )e
π (g)y)
per ogni boreliana f ed ogni funzione continua g, vale a dire
π
e(f g) = π
e(f )π(g)
362
Capitolo 10. Teoria spettrale
Ma inoltre
Z
∗
(x, π
e(f )e
π (g)y) = (e
π (f ) x, π(g)y) =
X
Ne concludiamo che
Z
g(t)dµπe(f )∗ x,y (t)
Z
f (t)g(t)dµx,y (t) =
X
X
g(t)dµπe(f )∗ x,y (t)
e quindi µπe(f )∗ x,y = f µx,y . Di nuovo integrando sulle boreliane queste misure si
ottiene
π
e(f g) = π
e(f )e
π (g)
stavolta con f, g ∈ B(X).
Questo conclude la verifica che π
e è una rappresentazione della C*-algebra
B(X): si noti che ||e
π (f )| ≤ ||f ||.
10.3.3 Teorema Se {fn } è una successione in B(X) equilimitata e convergente
puntualmente, allora la successione π
e(fn ) converge fortemente.
Dimostrazione: Si tratta di applicare il teorema della convergenza dominata
di Lebesgue 4.3.12: basta infatti dimostrare che, per ogni x ∈ X:
||e
π (fn )(x) − π
e(f )(x)||2 −→ 0
ove f = lim fn . Ora notiamo che
||e
π (fn )(x) − π
e(f )(x)||2 = ||e
π (fn − f )(x)||2 = (e
π (fn − g)(x), π
e(fn − f )(x))
∗
= (x, π
e((fn − f ) (fn − f ))(x)) = (x, π
e(|fn − f |2 )(x))
Ma |fn − f |2 è equilimitata per ipotesi e tende a zero puntualmente: quindi il
teorema della convergenza dominata implica che
Z
Z
2
|(fn − f )(t)| dµx,y (t) =
lim
lim |(fn − f )(t)|2 dµx,y (t) = 0
n
X
X
n
qed
Consideriamo di nuovo la rappresentazione π associata all’operatore normale
A; sappiamo che
π(C(X)) = A
è naturale chiedersi cosa sia π(B(X)): vedremo che questo insieme è contenuto
nella chiusura forte dell’algebra A e per dimostrarlo ci occorrerà un notevole
risultato, il teorema di densità di von Neumann, che verrà dimostrato in séguito.
363
10.3. Calcolo funzionale boreliano
10.3.4 Definizione Se S ⊂ B(H) è un sottoinsieme qualsiasi, il commutante
di S (o centralizzante di S) è l’insieme
S 0 := {T ∈ B(H) | ∀A ∈ S
T A = AT }
Evidentemente il commutante S 0 è un’algebra che contiene l’unità I.
10.3.5 Esempio Se consideriamo un operatore T ∈ B(H) tale che
T π(f ) = π(f )T
possiamo esprimerlo scrivendo T ∈ A0 .
10.3.6 Proposizione Il commutante S 0 di un insieme è un’algebra chiusa nella
topologia debole di B(H).
Dimostrazione: Ricordiamo qualche proprietà della topologia debole su B(H):
se A ∈ B(H) e x, y ∈ H i funzionali lineari
fx,y (A) := hfx,y , Ai
sono continui (||fx,y || ≤ ||x|| ||y||), quindi l’insieme
M0 := {fx,y }x,y∈H
è un sottospazio vettoriale di B(H)∗ . Ricordiamo che la topologia debole su B(H)
è definita in modo equivalente dalle seguenti proposizioni:
• è la più debole topologia su B(H) per la quale gli elementi di M0 sono
funzioni continue.
• è la (σ(B(H), M0 )-topologia.
• è la topologia definita dalle seminorme
¯
¯X
¯
¯
¯
(xi , Axi )¯¯
px−1,...,xn (A) := ¯
i
Torniamo ora alla dimostrazione della proposizione: T ∈ S 0 se e solo se, per ogni
A ∈ S, AT = T A, cioè
∀x, y ∈ X∀A ∈ S
(x, T Ay) = (x, AT y) = (A∗ x, T y)
se e solo se (x, T Ay) − (A∗ x, T y) ∈ M0 , il che equivale a
\
T∈
ker(fx,Ay − fA∗ x,y )
x,y∈H;A∈S
il che significa esattamente che S 0 è debolmente chiusa.
qed
364
Capitolo 10. Teoria spettrale
Notiamo che, in generale, S 0 non è una *-algebra.
10.3.7 Definizione Una *-sottoalgebra A ⊂ B(H) si dice non degenere se
∀x ∈ H
Ax = 0 =⇒ x = 0
Evidentemente
A è non degenere ⇐⇒ (AH)⊥ = 0
Ovviamente se I ∈ A allora A è non degenere.
10.3.8 Proposizione Se A ⊂ B(H) è una *-sottoalgebra e N := {x ∈ H | Ax =
0} allora A|N ⊥ è non degenere.
Dimostrazione: Basta osservare che A(N ⊥ ) ⊂ N ⊥ , dato che
(Ax, y) = (x, A∗ y) = 0 ⇒ Ax⊥N
qed
Possiamo ora enunciare il
10.3.9 Teorema di Densità (von Neumann) Se A ⊂ B(H) è una *-sottoalgebra
non degenere allora
f
A = A00
(la chiusura forte di A è il doppio commutante di A stesso).
La dimostrazione verrà data in séguito (cfr. teorema 11.4.1: qui osserviamo
semplicemente che, con questo risultato a disposizione, possiamo dimostrare che
f
π(B(X)) ⊂ A
Questo segue direttamente dal teorema di densità e dal risultato seguente:
10.3.10 Lemma Se f ∈ B(X) e T ∈ A0 allora
π
e(f )T = T π
e(f )
Dimostrazione: Per ogni T ∈ A0 :
π(f )T = T π(f ) =⇒ (y, π(f )T x) = (y, T π(f )x) = (T ∗ y, π(f )x)
cioè µy,T x = µT ∗ y,x .
qed
00
f
Questo lemma implica che π(B(X)) ⊂ A che è proprio A per il teorema di
densità.
Osserviamo una conseguenza del teorema di densità di von Neumann:
365
10.4. Misure spettrali
10.3.11 Corollario Se A ⊂ B(H) è una *-sottoalgebra non degenere allora
f
d
A =A
(la chiusura forte e la chiusura debole di A coincidono).
Dimostrazione: Infatti si ha sempre la
f
A ⊂A
d
Ma A0 è debolmente chiusa (per ogni A) e quindi il teorema di densità implica
che
f
d
f
A ⊂ A ⊂ A00 = A
qed
La discussione precedente e l’esempio dell’algebra A rendono naturale la
seguente definizione:
10.3.12 Definizione Una *-sottoalgebra debolmente chiusa A ⊂ B(H) che possieda l’unità I si dice algebra di von Neumann.
Per il teorema di densità, una caratterizzazione immediata è
A di von Neumann ⇐⇒ A = A00
o, come si dice, le algebre di von Neumann sono quelle che verificano la proprietà
del doppio commutante.
10.3.13 Esempio Le algebre di matrici Mn (C) sono algebre di von Neumann:
in effetti sappiamo che l’algebra A = Mn (C) è semplice (cfr. teorema 5.5.14) e
che quindi il suo commutante A0 è ridotto alle sole matrici scalari (multipli della
matrice identità):
∀A ∈ Mn (C) AX = XA =⇒ ∃a ∈ C X = aI
Questo stesso enunciato ci dice che (A0 )0 = A (le matrici che commutano con le
matrici scalari sono tutte le matrici).
10.4
Misure spettrali
Consideriamo un operatore normale A su uno spazio di Hilbert H, a l’algebra
A = C ∗ hA, Ii = {ϕ(A)}ϕ∈C(σ(A)) . Ovviamente, se f è una funzione boreliana
in H (essendo uno spazio topologico è anche uno spazio misurabile rispetto alla
σ-algebra di Borel) allora f (A) ∈ A00 .
366
Capitolo 10. Teoria spettrale
Osserviamo che, se ∆ è un boreliano in C allora χ∆ è boreliana e quindi
l’operatore χ∆ (A), avendo valori in R è autoaggiunto. In particolare:
χ∗∆ χ∆ = χ∆
quindi E∆ := χ∆ (A) è un idempotente tale che
∗
E∆
E∆ = E∆
e pertanto è un proiettore; dunque esiste un sottospazio chiuso H∆ ⊂ H tale che
E∆ = EH∆ .
Per definizione, E∆ commuta con tutte le funzioni di A, ed in particolare
⊥
A
AE∆ = E∆ A, da cui segue che AH∆ ⊂ H∆ ; quindi, dato che H = H∆ ⊕ H∆
si decompone in somma diretta di operatori.
Osserviamo tre proprietà interessanti, anche se immediate, della mappa ∆ 7−→
E∆ :
• EC = I (dato che χC = 1).
• Se ∆1 , ∆2 sono boreliani in C allora E∆1∩∆2 = E∆1 E∆2 .
• Se {∆n } è una famiglia numerabile di boreliani disgiunti allora
X
ESn ∆n =
E∆n
n
(La (2) segue da χA χB = χA∩B e la (3) dal fatto che le {χ∆n } sono equilimitate).
Quindi la mappa
E : {Boreliani di C} −→ {Proiettori di H}
ha le proprietà di una misura, con la differenza che non assume valori in C ma
in uno spazio di Hilbert.
10.4.1 Definizione Una funzione E che soddisfi le (1)–(3) si dice misura spettrale associata all’operatore A.
Osserviamo che σ(A|H∆ ) ⊂ σ(A) ∩ ∆. Infatti la restrizione è uno *-omomorfismo,
quindi
σ(A|N ) ⊂ σ(A)
per ogni sottospazio N ; se poi g|∆ = 0 allora g(A)χ∆ (A) = 0 e, per g continua:
g(A|H∆ ) = g(A)|H∆
Quindi σ(A|H∆ ) ⊂ σ(A) ∩ ∆. In realtà l’inclusione non è stretta, ma si ha
σ(A|H∆ ) ⊂ σ(A) ∩ ∆: la dimostrazione è però molto più complicata.
367
10.4. Misure spettrali
10.4.2 Teorema χ{λ} (A) = E{λ} = E{x | Ax=λx} .
Dimostrazione: Se x ∈ ker(A − λI) allora A∗ x = λx (dato che A è normale) e
quindi per ogni funzione continua f :
f (A)x = f (λ)x
In particolare, se f (λ) = 1 si trova f (A)x = x.
Consideriamo le funzioni
(
0
se t < 0 oppure t >
gn (t) := 1−t
se 0 ≤ t ≤ n1
n
1
n
e quindi le
fn (z) = gn (|z − λ|)
che sono equilimitate su σ(A) e tendenti a zero per z 6= λ, mentre sono ovviamente identicamente 1 se z = λ. Dunque la successione {fn } converge a χ{λ} ,
i.e.
fn (A) −→ E{λ}
Ma fn (A)x = x e quindi E{λ} x = x:
ker(A − λI) ⊂ H{λ}
Inoltre (z − λ)χ{λ} (z) = 0: allora applicando il calcolo boreliano si trova che
(A − λI)E{λ} = 0
ovvero
H{λ} ⊂ ker(A − λI)
qed
Dunque il calcolo funzionale boreliano in un punto fornisce gli operatori
E{x | Ax=λx}
e pertanto una funzione f che si annulli su A deve essere della forma
X
f=
cn χ{λn }
n
(con λn ∈
/ σp (A)).
368
Capitolo 10. Teoria spettrale
10.4.3 Corollario Se T è un operatore su H tale che
∀x ∈ H
0 ≤ (x, T x) ≤ (x, x)
allora T è autoaggiunto e 0 ≤ T ≤ I, il suo spettro è quindi contenuto nell’intervallo [0, 1] e si ha la convergenza forte:
f
T n −−−−→ Eker(I−T )
Dimostrazione: Se t ∈ [0, 1], {tn } è equilimitata e convergente a zero, per cui
tn −→ χ{1} (t).
qed
10.4.4 Teorema Se definiamo
E ∧ F := EEH∩F H
allora
E ∧ F = s-lim (EF )n = s-lim (F E)n
n−→∞
n−→∞
(s-lim indica il limite nella topologia forte).
Dimostrazione: Intanto
(∗)
(EF E)n
f
/E∧F
Infatti, per T = EF E = (F E)∗ (F E) si ha 0 < T ≤ I (dato che (x, T x) =
||F Ex||2 ≤ ||x||2 ) e, per il corollario precedente:
lim T n = Eker(I−T )
Allora, se x ∈ (E ∧ F )H segue che EF Ex = x e quindi Ex = x, ovvero x ∈ im E
da cui
||x|| = ||EF Ex|| ≤ ||F x|| ≤ ||x||
cioè, F x = EF x = x, dunque x∈im F . Ma era anche x∈im E, quindi x∈(E∧F )H.
Cosı̀ abbiamo che
x ∈ (E ∧ F )H ⇐⇒ EF Ex = x
e la (*) segue. Ma F xn −→ F x se xn −→ x e quindi si ha il teorema.
qed
369
10.4. Misure spettrali
10.4.5 Corollario Se U ∈ B(H) è un operatore unitario (e quindi normale) con
σ(U ) ⊂ T (circonferenza unitaria del piano complesso) si ha che, se χ{1} (U ) =
Eker(I−U ) =: E0 :
N
N
1 X n
1 X n
E0 = s-lim
U = s-lim
U
N −→∞ N
N −→∞ 2N
n=0
n=−N
Dimostrazione: Consideriamo la funzione
µ
¶
N
1 − z N +1
1
1 X n
z =
fN (z) :=
N + 1 n=0
1−z
N +1
Allora, per z 6= 1:
1 X n
z = lim
lim fN (z) = lim
N
N
N N +1
n=0
N
dato che
µ
1 − z N +1
1−z
¶
1
=0
N +1
¯
¯
N
¯
¯ 1 X
n
¯≤1
¯
z
¯
¯N + 1
n=0
e, essendo fN (1) = 1:
¯
¯
¯fN (z)¯ ≤
1
2
N + 1 |1 − z|
Ma la famiglia {fN } è equilimitata, quindi
s-lim fN (U ) = E0
N
Analogamente
N
1 X ∗n
U = Eker(I−U ∗ ) = E0
s-lim
N
N n=0
Quindi
!
Ã
N
N
1
1 X −n
1 1 X n
U +
U
(E0 + E0 ) = E0 = s-lim
N
2
2 N n=0
N n=0
Ã
!
N
1 X n
1
= s-lim
U
N
2N 2N n=
N
qed
370
Capitolo 10. Teoria spettrale
10.4.6 Corollario Se G è un sottogruppo del gruppo U(H) degli operatori unitari, allora
f
E0 := E{x | ∀U ∈G U x=x} ∈ Conv(G)
(chiusura forte dell’inviluppo convesso di G).
Dimostrazione: Si ha che
^
E0 =
E{x | U x=x}
U ∈G
N
1 X n
U
=
s-lim
N −→∞ N
n=0
U ∈G
^
Ad esempio, nel caso di due elementi U1 , U2 ∈ G si ha
N1
Eker(I−U1 ) ∧ Eker(I−U2 ) = s-lim(E0 (U1 )E0 (U2 ))n = s-lim
n
N
1
2N1 2N2 n
N2
X
U1n1 U2n2
1 =−N1
n2 =−N2
La combinazione lineare sotto il segno di limite è convessa ad elementi in G,
quindi
m
^
f
Eker(I−UN ) ∈ Conv(G)
N =1
V
E{x | U x=x} è limite forte di elementi di questo spazio.
qed
Consideriamo ora un operatore A autoaggiunto su H: il suo spettro è contenuto in un certo intervallo [a, b] ⊂ R; dato che le funzioni fλ := χ(−∞,λ] sono
boreliane limitate, applicando il calcolo funzionale boreliano ad A otteniamo
l’operatore idempotente autoaggiunto
Ma ogni elemento di
U ∈G
fλ (A) = E(λ)
Osserviamo che
• E(λ) = 0 se λ < a.
• E(λ) = I se λ ≥ b.
• Se λ1 ≤ λ2 allora scrivendo (−∞, λ2 ] = (−∞, λ1 ] ∪ (λ1 , λ2 ] otteniamo
E(λ2 ) = E(λ1 ) + E(λ2 ,λ1 ]
In particolare:
E(λ1 ) ≤ E(λ2 )
371
10.4. Misure spettrali
• Se {fλn } è tale che λn −→ λ con λ ≤ λn , allora per ogni t ≤ λ:
fλn (t) = 1 = fλ (t)
e, per ogni t > λ, fλn (t) = 0, sicché la successione {fλn } è equilimitata e
quindi converge puntualmente a χ(−∞,λ] . Ne segue che
s-lim E(λn ) = E(λ)
λn −→λ
vale a dire, E(λ − 0) = s-lim E(λn ) = E(−∞,λ] , pertanto
E(λ) − E(λ − 0) = χ{λ} (A) = Eker(A−λI)
10.4.7 Definizione Una famiglia spettrale sullo spazio di Hilbert H è una funzione
E : R −→ {Operatori autoaggiunti di H}
tale che
• E sia fortemente continua superiormente.
• E sia monotona non decrescente.
• s-limλ−→−∞ E(λ) = 0.
• s-limλ−→+∞ E(λ) = I.
Ad esempio, dato un operatore continuo A ∈ B(H) autoaggiunto, la funzione
E(λ) := χ(−∞,λ] (A)
definisce una famiglia spettrale.
Osserviamo che le (1)–(3) sono le proprietà che caratterizzano le funzioni
di distribuzione associate alle misure di Radon (teorema 4.5.8: possiamo cioè
considerare l’integrale di Stieltjes di una funzione boreliana (limitata) f :
Z
f (λ)dE(λ)
372
Capitolo 10. Teoria spettrale
10.4.8 Teorema Se A è un operatore continuo autoaggiunto sullo spazio di
Hilbert H allora esiste un’unica famiglia spettrale E(λ) tale che
Z
A = λdE(λ)
(integrale di Stieltjes) e per ogni f ∈ B(R) (boreliana) limitata
Z
f (A) = f (λ)dE(λ)
Ciò vale, in particolare, per ogni f ∈ C(σ(A)).
Dimostrazione: Consideriamo una funzione f ∈ C(σ(A)); dato che A = A∗ lo
spettro σ(A) è contenuto in un intervallo [a, b] ⊂ R. Consideriamo una famiglia
finita di valori
λ0 < a < λ1 < ... < λn−1 < b ≤ λn
e le funzioni boreliane
χ(λi−1 ,λi ] = E(λi−1 ,λi ] = E(λi ) − E(λi−1 )
Per λ0i ∈ (λi−1 , λi ]:
X
uniformemente
f (λi )χ(λi−1 ,λi ] −−−−−−−−→ f
sup |λi −λi−1 |−→0
per il teorema di Heine–Cantor. Quindi
¯
¯
X
¯
¯
¯
f (λi )χ(λi−1 ,λi ] (λ)¯¯ ≤ δ
sup ¯f (λ) −
λ
(ove δ è è il valore dell’enunciato del teorema di Heine–Cantor 5 ). Dunque
X
f (λ0i ) (E(λi ) − λi−1 ))
i
converge a f (A):
¯¯
¯¯
X
¯¯
¯¯
0
¯¯ ≤ δ
¯¯f (A) −
)
(E(λ
)
−
λ
))
f
(λ
i
i−1
i
¯¯
¯¯
i
5
Per ogni ε > 0 esiste un δ > 0 tale che per x non dipendente da δ con |x − x0 | < δ si ha
|f (x) − f (x0 )| < ε (continuità uniforme delle funzioni continue in un compatto).
373
10.4. Misure spettrali
cioè
Z
f (A) =
f (λ)dE(λ)
(si noti che questo è l’integrale di una funzione continua, quindi definito alla
Riemann).
Passiamo ora al caso di una funzione boreliana limitata qualsiasi: f ∈ B(R).
Per la limitatezza di f , f (λ) ∈ D||f || (disco di raggio ||f ||); certamente possiamo
scrivere
D||f || ⊂
¦
[
Dj
j
come unione disgiunta finita di boreliani Dj tali che diam Dj ≤ δ (ad esempio
possono prendersi Dj = (z1 , z10 ] × (z2 , z20 ]).
Dato che f è boreliana, gli insiemi ∆j := f −1 (Dj ) sono boreliani e quindi lo
è la funzione
X
f (λj )χ∆j
j
Ma
¯
¯
X
¯
¯
¯f (λ) −
f (λj )χ∆j ¯¯ ≤ δ
¯
j
e quindi, usando il calcolo funzionale boreliano sul primo membro di questa
eguaglianza:
¯¯
¯¯
X
¯¯
¯¯
¯¯ ≤ δ
¯¯f (A) −
f
(λ
)E
j
∆
j
¯¯
¯¯
j
cioè, per definizione dell’integrale di Lebesgue–Stieltjes:
Z
f (A) =
f (λ)dE(λ)
374
Capitolo 10. Teoria spettrale
Dimostriamo ora l’unicità della famiglia spettrale E(λ): se
Z
A = λdF (λ)
con F famiglia spettrale, dato che σ(A) ⊂ [a, b] deve essere
(
0 se λ < a
F (λ) =
I se λ ≥ b
Ma una famiglia spettrale è commutativa (i suoi elementi commutano fra loro
dato che F (λ)F (λ0 ) = F (λ ∧ λ0 )) e quindi
AF (λ) = F (λ)A
poiché A si approssima con combinazioni lineari finite in F (λ) e ne è limite in
norma. Allora, dato che per λ0 ≤ λ si ha F (λ)F (λ0 ) = F (λ0 ), troviamo che
Z λ
X
0
λj (F (λj ) − F (λj−1 ))F (λ) −→
λ0 dF (λ)
−∞
j
e, per x ∈ F (λ)H otteniamo d(x, F (λ)x) è una misura sulla retta reale):
Z λ
Z λ
0
(x, Ax) =
λ d(x, F (λ)x) =
d(x, F (λ)x) = (x, F (λ)x) = (x, x)
−∞
−∞
Dunque
Z
(x, Ax) ≤
λ
−∞
0
λ d(x, F (λ)x) ≤ sup
µZ
λ
−∞
¶
λ d(x, F (λ)x) = λ(x, x)
0
375
10.4. Misure spettrali
Se x ∈ (I − F (λ))H allora
Z
∞
(x, Ax) =
λ0 d(x, F (λ)x) ≥ λ(x, x)
λ
Quindi (aI ≤ A ≤ bI):
¢
¢
¡
¡
σ A|F (λ)H ⊂ σ(A) ∩ (−∞, λ] e σ A|(I−F (λ))H ⊂ σ(A) ∩ [λ, ∞)
(
0
F (λ) =
I
cioè
se λ < a
se λ ≥ b
Se ora F soddisfa alle conclusioni del teorema:
Z
Z
A = λdF (λ) = λdE(λ)
allora A2 =
R
λ2 dE(λ); A2 è approssimato da
P
j
λj Pj ove
Pj := F (λj ) − F (λj−1 )
e quindi Pj Pk = δjk Pj , quindi
!2
Ã
X
X
X
=
λj Pj
λ0j 2 Pj2 =
λ0j 2 Pj
j
j
j
P
Per induzione, An è quindi approssimato da j λ0j n Pj e quindi, per ogni polinomio p ∈ R[x]:
Z
Z
p(A) = p(λ)dE(λ) = p(λ)dF (λ)
Z
i.e.
(x, p(A)x) =
Z
p(λ)d(x, E(λ)x) =
p(λ)d(x, F (λ)x)
Per il teorema di Stone–Weierstrass in C[a, b] abbiamo quindi che questa identità
vale per ogni funzione continua, per cui le misure d(x, E(λ)x) e d(x, F (λ)x) sono
uguali, dunque
∀x ∈ H (x, E(λ)x) = (x, F (λ)x)
e, per le identità di polarizzazione:
∀x, y ∈ H (x, E(λ)y) = (x, F (λ)y)
Ne concludiamo che E = F .
qed
376
Capitolo 10. Teoria spettrale
10.4.9 Corollario Ogni operatore continuo autoaggiunto è limite (in norma) di
combinazioni lineari di operatori il cui spettro sia finito.
Dato che se A ∈ B(H) è qualsiasi allora
1
1
A = (A + A∗ ) + (A − A∗ )
2
2i
segue più in generale che
10.4.10 Corollario Ogni operatore continuo A è limite (in norma) di combinazioni lineari di operatori il cui spettro sia finito.
10.4.11 Corollario Se R ⊂ B(H) è un’algebra di von Neumann allora R coincide con lo spazio di Banach generato dagli insiemi
Rp := {E ∈ R | E ∗ E = E}
Vogliamo infine dimostrare il teorema spettrale per gli operatori unitari in
uno spazio di Hilbert, ricordando che se U ∈ U(H) allora σ(U ) ⊂ T = S 1 , la
circonferenza unitaria del piano complesso.
10.4.12 Teorema Spettrale per Operatori Unitari Se U ∈U(H) allora esiste un’unica famiglia spettrale F (λ) tale che
Z
eiλ dF (λ)
e F (λ) = 0 se λ < 0 e F (2π − 0) = I.
Dimostrazione: Consideriamo
Γλ := {eit }t∈[0,λ] ⊂ T
Ovviamente χΓλ (U ) = F (λ) e
• Se λ < 0 allora F (λ) = 0;
• Se λ ≥ 2π allora F (λ) = I;
• Se λ ≤ λ0 allora F (λ) ≤ F (λ0 );
• Se λ ≤ λn per ogni n ∈ N allora
lim χΓλn = χΓλ
n−→∞
10.5. Operatori compatti, Hilbert–Schmidt e nucleari
377
Da queste asserzioni segue immediatamente che F è una famiglia spettrale e
Z
∀f ∈ C(T) f (U ) = f (eiλ )dF (λ)
L’unicità si dimostra esattamente come nel caso delle funzioni continue sugli
operatori autoaggiunti, verificando prima il risultato sui polinomi e sfruttando
la densità dei polinomi nelle funzioni continue.
qed
Ovviamente, la misura di (0, 2π) secondo dF (λ) è 1 se e solo se
1 ∈ σp (U ) ⇐⇒ ker(I − U ) = 0 ⇐⇒ χ{1} (U ) = 0
10.5
Operatori compatti, Hilbert–Schmidt e nucleari
La teoria spettrale degli operatori continui ci fornisce molte informazioni
su di essi: in questo paragrafo studiamo una sottoclasse importantissima degli
operatori continui e ne analizziamo la teoria spettrale.
10.5.1 Definizione Se X e Y sono spazi di Banach un operatore lineare A :
X −→ Y si dice compatto se per ogni insieme F limitato in X A(F ) è un
insieme a chiusura compatta in Y . L’insieme degli operatori compatti si denota
K(X, Y ).
Equivalentemente, A è compatto se e solo se A(X1 ) (immagine della palla
unitaria di X) ha chiusura compatta in Y .
Si vede immediatamente che un operatore compatto è continuo:
K(X, Y ) ⊂ B(X, Y )
10.5.2 Proposizione K(X, Y ) è un sottospazio chiuso di B(X, Y ).
Dimostrazione: Intanto verifichiamo che è un sottospazio vettoriale: che A ∈
K(X, Y ) implichi λA ∈ K(X, Y ) per ogni λ ∈ C è ovvio; inoltre se A, B ∈ K(X, Y ):
{Ax + Bx}x∈X1 ⊂ {Ax + By}x,y∈X1
la cui chiusura è compatta (dato che la chiusura di AX1 × BX1 lo è in Y × Y e
l’operazione + : Y × Y −→ Y è continua).
Vediamo infine che K(X, Y ) è un sottospazio chiuso di X: se {An } è una
successione in K(X, Y ) convergente (ad un elemento A ∈ B(X, Y )); vogliamo
dimostrare che A ∈ K(X, Y ).
378
Capitolo 10. Teoria spettrale
Consideriamo allora la successione {xn } ⊂ X1 : per compattezza di A1 deve
(1)
(1)
esistere una sottosuccessione {xnk1 } ⊂ {xn } tale che {A1 xnk1 } sia convergente. Questa scelta di sottosuccessioni può farsi per ogni operatore compatto An ,
(i)
ottenendo cosı̀ una famiglia {{xnki }i }k di sottosuccessioni della {xn } tali che
(i)
per ogni n la successione {Ai xnki }i sia convergente in Y . Allora consideriamo la
successione “diagonale”
zi := x(i)
ni
Per definizione {zi }i ⊂ {xn }n e {An zi }i è di Cauchy per ogni n.
Ora scegliamo un indice n tale che sia
||A − An || <
ε
3
Dato che {An zi }i è di Cauchy, deve esistere kε tale che
∀h, k > kε
||An zk − An zh || <
ε
3
e quindi
||A(zh − zk )|| ≤ ||(A − An )(yh − yk )|| + ||An (yh − yk )||
ε ε
≤ ||An (yh − yk )|| ≤ 2 + = ε
3 3
Perciò A è compatto.
qed
10.5.3 Proposizione K(X, Y ) è un B(X)-modulo a destra e un B(Y )-modulo
a sinistra.
Dimostrazione: Basta osservare che, se A : X 0 −→ X e B : Y −→ Y 0 sono
continui e T : X −→ Y è compatto allora l’operatore
X0
A
/X
T
/Y
B
/Y0
è compatto. Ed infatti BT (X1 ) è compatto dato che B è continuo e T (X1 ) è
compatto; quindi (un sottoinsieme compatto in uno spazio normato è chiuso
ABT (X1 ) ⊂ ABT (X1 ) = ABT (X1 )
è quindi ABT (X1 ) è chiuso in un compatto e quindi è compatto.
qed
10.5. Operatori compatti, Hilbert–Schmidt e nucleari
379
10.5.4 Corollario Se T ∈ K(X, Y ), A ∈ B(Y ) e B ∈ B(X) allora
AT, T A ∈ K(X, Y )
Naturalmente se X = Y scriviamo K(X) = K(X, Y ).
10.5.5 Corollario K(X) è un ideale bilatero chiuso nell’algebra B(X).
10.5.6 Esempio Se dim X < ∞ ogni operatore continuo è compatto6 :
K(X) = B(X) = End(X)
Più in generale, un operatore A ∈ B(X) tale che dim im A < ∞ è compatto:
infatti la sua immagine è uno spazio isomorfo a Cn : non vale il viceversa; se
T x := f (x)x0
ove x0 ∈ X e f : X −→ C è un funzionale lineare ma non continuo allora T non
è continuo e quindi non può essere compatto: tuttavia dim im T = 1.
In generale:
{A ∈ B(X) | dim im A < ∞} ⊂ K(X)
Se X è uno spazio di Hilbert questi due sottospazi di B(X) sono effettivamente
uguali, mentre se X è solo uno spazio di Banach, l’inclusione è stretta.
Osserviamo inoltre che, se al solito I è l’operatore identico:
I ∈ K(X) ⇐⇒ dim X < ∞ ⇐⇒ X1 è compatto
In altri termini, se dim X = ∞ un operatore compatto A non è invertibile (questo
è anche evidente dal fato che K(X) è un ideale: se contenesse un invertibile
conterrebbe I e quindi ogni elemento di B(X), e questo è possibile solo, appunto,
nel caso di dimensione finita).
Dato che K(X) C B(X) lo spazio di Banach B(X)/K(X) è un’algebra di
Banach.
10.5.7 Teorema Se H è uno spazio di Hilbert (di dimensione infinita) e se
A ∈ K(H) allora A∗ ∈ K(H).
6
Ad esempio perché X1 è compatto...
380
Capitolo 10. Teoria spettrale
Dimostrazione: Sappiamo che A∗ ∈ B(H); dato che A è compatto (e K(H) C
B(H)) anche A∗ A ∈ K(H). A∗ A è autoaggiunto, quindi possiamo usare il calcolo
funzionale continuo: se f ∈ Cc (R) allora è limite di polinomi privi di termine noto
(i.e. di elementi dell’ideale xR[x] nell’algebra dei polinomi) in σ(A∗ A) e quindi
√
A∗ A = |A|
è compatto. Abbiamo quindi dimostrato che se A è compatto lo è anche |A|
e quindi, considerando la decomposizione polare A∗ = |A|V ∗ di A∗ , di nuovo
essendo K(H) C B(H), deve aversi
A∗ = |A|V ∗ ∈ K(H)
qed
Osserviamo che se A è autoaggiunto allora
Z
∗
A = A = λdE(λ)
´
³
e σ A|E(−ε,ε] H ⊂ [−ε, ε], per cui
¯¯
¯¯
¯¯
¯¯
¯¯ ≤ ε
¯¯A|E
H
(−ε,ε] ¯¯
¯¯
Quindi, se A = A∗ ∈ K(H):
||.||
A − AE(−ε,ε] = A(I − E(−ε,ε] ) −−−→ A
ε−→0
¡
¢
Se Hε := E(−ε,ε] H, allora σ A|Hε⊥ ⊂ σ(A) ∩ {(−ε, ε]: infatti
¢
¡
Hε⊥ = im I − E(−ε,ε] = im(I − E(ε) + E(−ε))
e quindi
A|Hε⊥ = A|(I−E(ε))H ⊕ A|E(−ε)H
Ma se A1 ⊕ A2 = A evidentemente σ(A) ⊂ σ(A1 ) ∪ σ(A2 ) (basta osservare i
risolventi per convincersene immediatamente) e quindi
¢
¡
σ A|(I−E(ε))H ∩ (−ε, ε) = ∅
Cioè 0 sta nel risolvente di A|(I−E(ε))H che risulta perciò essere invertibile.
Si noti che se A è compatto, la sua restrizione ad un sottospazio pure è un
operatore compatto; quindi A|(I−E(−ε,ε] )H è invertibile ed è compatto, il che può
solo avvenire (essendo K C B) se dim Hε⊥ = dim(I − E(−ε,ε] )H < ∞.
10.5. Operatori compatti, Hilbert–Schmidt e nucleari
381
Abbiamo cioè che la restrizione A|Hε⊥ è un operatore autoaggiunto su uno
spazio di dimensione finita e quindi possiamo esprimerlo come
X
λPλ
A|Hε⊥ =
ş
ť
λ∈σ A|H⊥
ε
ove i Pλ sono definiti su spazi di dimensione finita: ma si ha
¯¯
¯¯
¯¯
¯¯
X
¯¯
¯¯
¯¯
¯¯
¯¯ ≤ ε
¯¯ ≤ ε ⇒ ¯¯A −
¯¯A|E
λP
λ
H
(−ε,ε] ¯¯
¯¯
¯¯
¯¯
e quindi, per ε −→ 0:
10.5.8 Teorema Se A è un operatore compatto autoaggiunto:
X
A=
λPλ
λ∈σ(A)
Questa è la forma del teorema spettrale per un operatore compatto: osserviamo che sussiste quindi la decomposizione
M
H=
ker(A − λI)
λ∈σ(A)
10.5.9 Definizione Il numero
ν(λ) := dim Pλ = dim Eker(A−λI)
si dice molteplicità del valore λ.
10.5.10 Corollario Se A è un operatore compatto autoaggiunto allora,
∀λ 6= 0 ν(λ) < ∞
In virtù del teorema, possiamo disporre gli autovalori σ(A) di A in una successione di modulo non crescente, nella quale ogni λ figuri tante volte quanta è
la sua molteplicità
λ1 = ... = λν(λ1 ) , λ2 = ... = λν(λ2 ) , ...
con |λ1 | ≥ |λ2 | ≥ .... Dato che i numeri ν(λ) sono finiti è allora chiaro che
382
Capitolo 10. Teoria spettrale
10.5.11 Corollario Se A è un operatore compatto autoaggiunto allora l’unico
punto di accumulazione in σ(A) può essere lo zero.
In generale possiamo dare la
10.5.12 Definizione Se A ∈ B(H) si dice che
• A è privo di molteplicità se A è normale ed esiste un vettore ciclico per la
C*-algebra generata da A e I.
• A ha molteplicità uniforme pari a n se esiste un operatore normale B privo
di molteplicità e tale che A = B ⊕ ... ⊕ B (n volte).
Il seguente risultato sarà dimostrato più in generale come teorema conclusivo
del §1 del prossimo capitolo:
10.5.13 Teorema Un operatore normale privo di molteplicità è sempre un operatore di moltiplicazione M su L2 (σ(A), µ) (ove µ è una misura regolare di
probabilità):
∀f ∈ L2 (σ(A), µ) M f (z) := zf (z)
Se A1 e A2 sono operatori normali privi di molteplicità allora sono unitariamente
equivalenti se e solo le le misure µ1 e µ2 su σ(A1 ) e σ(A2 ) associate dal teorema
sono equivalenti (cioè µ1 ¿ µ2 e µ2 ¿ µ1 ).
Questo teorema è un caso particolare di un risultato più profondo, che però
non dimostreremo (cfr. [23], pp. 82–97).
10.5.14 Esempio Gli operatori di Volterra sono compatti. Sia H = L2 [0, 1] e,
per f ∈ H:
Z s
(Af )(s) :=
K(s, t)x(t)dt
0
Evidentemente σ(A) = {0}, inoltre, se K ∈ C 1 ([0, 1] × [0, 1]) e, per ogni s, il
nucleo K(s, s) 6= 0 allora σp (A) = ∅. Infatti, se Ax = 0, allora
Z s
K(s, t)x(t)dt = 0
0
e, derivando,
Z
K(s, s)x(s) +
0
s
∂
K(s, t)x(t)dt = 0
∂s
−1
Ma allora K(s, s) ∂K(s, t)/∂s ∈ C([0, 1] × [0, 1]) è il nucleo di un operatore di
Volterra B e
Bx + x = 0 ⇒ x = 0
(a meno che −1 ∈ σp (B) che è assurdo, avendosi σ(A) = {0}. Quindi 0 ∈
/ σp (A).
10.5. Operatori compatti, Hilbert–Schmidt e nucleari
383
10.5.15 Teorema Se A1 e A2 sono operatori compatti allora
A1 ∼
= A2 ⇐⇒ ν1 = ν2
Dimostrazione: Se ν1 = ν2 allora
X
A2 =
λn Pλ2
e
A2 =
X
λn Pλ2
(1)
Se {en } è la base ortonormale di H formata con i vettori che generano gli spazi
ker(A1 − λI) al variare di λ ∈ σ(A1 ) (ed analogamente per A2 ) allora possiamo
definire
(2)
U e(1)
n = en
Si tratta di un operatore unitario e quindi
(1)
(2)
(2)
(1)
U A1 e(1)
n = U λn en = λn en = A2 en = A2 U en
cioè A1 e A2 sono unitariamente equivalenti.
Viceversa, se A1 ∼
= A2 allora esiste U ∈ U(H) tale che A2 = U A1 U −1 e quindi
∀f ∈ C(σ(A1 ) ∪ σ(A2 )) f (A2 ) = U f (A1 )U −1
Per λ 6= 0 si ha Pλ = f (A) (per continuità di f , se f (0) = 0) e quindi
Pλ = U Pλ U −1
(2)
(1)
da cui ν1 = ν2 .
qed
10.5.16 Definizione Se A ∈ K(H) è autoaggiunto e se, per ogni λ ∈ σ(A) si ha
ν(λ) ∈ {0, n} (con n ∈ N costante fissata), allora si dice che A ha molteplicità
uniforme n. Se n = 1 allora A si dice privo di molteplicità.
Ad esempio, si può verificare che A ha molteplicità uniforme n se e solo
se esiste un operatore B ∈ K(H) autoaggiunto privo di molteplicità e tale che
A = B ⊕ ... ⊕ B.
Osserviamo ora che, per ogni x ∈ H, dal teorema di Stone–Weierstrass 9.2.9,
segue che:
{An x}n∈N = {f (A)x}f ∈Cc (R)
10.5.17 Definizione Se A ⊂ B(H), un vettore x ∈ H si dice ciclico per A se
Ax = H.
384
Capitolo 10. Teoria spettrale
10.5.18 Lemma Se A è un operatore autoaggiunto compatto in H allora esiste
un vettore x ∈ H ciclico per {An x}n∈N (i.e. tale che {An x}n∈N = H) se e solo se
A è privo di molteplicità.
Dimostrazione: Poiché A è compatto autoaggiunto possiamo scrivere
X
f (A) =
f (λ)Pλ
i.e. f (A)x =
P
f (λ)Pλ x; dunque
x è ciclico ⇐⇒ ∀y ∈ H∀f ∈ Cc (R) y⊥f (A)x ⇒ y = 0
che vale se e solo se dim Pλ H = 1.
Infatti se x è ciclico allora per ogni λ ∈ σp (A):
f (A)x = f (A)Pλ x = f (λ)Pλ x
e quindi dim Pλ H = 1. Viceversa, se dim Pλ H = 1 allora, essendo ogni punto di
σp (A) \ {0} isolato, esiste una f ∈ C(σ(A)) tale che f (|El) = 1 e f (λ0 ) = 0 con
λ0 ∈ σ(A) \ {λ}. Quindi Pλ = f (A) e, per x ∈ H tale che Pλ x 6= 0 per nessun
λ ∈ σ(A), deve aversi
f (A)x = Pλ x = ||Pλ x||eλ
ove {eλ } è una base ortonormale; quindi
∀λ ∈ σ(A) \ {0} eλ ∈ {f (A)x}f ∈C(σ(A))
e
χ{0} (A)x = c0 e0 ∈ {f (A)x}f ∈C(σ(A))
Si osservi infatti che {eλ }λ∈σp (A) è una base ortonormale di H e, dato che Card σp (A) =
ℵ0 allora esiste cλ ∈ C tale che
¯¯
¯¯ X
X
¯¯
¯¯
2
cλ Eλ ¯¯¯¯ = 1
|cλ | = 1 ⇒ ¯¯¯¯
λ∈σp (A)
λ∈σp (A)
Quindi Pλ x = cλ eλ , cioè x è un vettore ciclico.
qed
Consideriamo ora un operatore autoaggiunto A ∈ B(H) e ricordiamo che
σess (A) := {λ ∈ σ(A) | λ punto isolato e dim ker(A − λI) < ∞}
10.5. Operatori compatti, Hilbert–Schmidt e nucleari
385
10.5.19 Teorema (H. Weyl) Se A ∈ B(H) è un operatore autoaggiunto e K ∈
K(H) è autoaggiunto allora
σess (A + K) = σess (A)
Dimostrazione: Osserviamo che
• λ ∈ σess (A) se e solo se esiste un sistema ortonormale {en } in H tale che
||Aen − λen || −→ 0.
• K∈B(H) è compatto se e solo se per ogni successione {xn } ⊂ H convergente
nella topologia debole, {Kxn } converge in norma.
La (1) è un fatto noto (teorema 10.2.12); dimostriamo la (2). Se K è compatto
e xn converge debolmente a x allora
∀n ||xn || ≤ M
(per il teorema di Banach–Steinhaus 6.5.14) e quindi esiste una sottosuccessione
di {Kxn } convergente; se per assurdo {Kxn } non convergesse dovrebbe possedere
una sottosuccessione {Kxnk } tale che
(∗)
||Kxnk − Kx|| ≥ ε > 0
Passando ad una ulteriore sottosuccessione {yi := xnki } tale che Kyi −→ z ∈ H
(K è compatto!) avremmo z = Kx; infatti
∀x0 ∈ H (x0 , Byi ) = (B ∗ x0 , yi ) −−−−−−→ (B ∗ x0 , x) = (x0 , Bx)
debolmente
cioè Byi −→ Bx per ogni B ∈ B(H). Quindi
debolmente
Kyi −−−−−−→ Kx
il che contraddice la (*). Dunque {Kxn } è convergente e la (2) è dimostrata.
Passiamo ora al teorema: se {en } è un sistema ortonormale, ovviamente converge debolmente a zero (gli elementi (x, en ) sono i coefficienti di Fourier di x,
che sono a quadrato sommabile); quindi, per la (2):
||.||
Ken −→ 0
Ma λ ∈ σess (A) ⇐⇒ ||Aen − λen || −→ 0 e quindi
||(A + K)en − λen || = ||Aen − λen + Ken || ≤ ||Aen − λen || + ||Ken ||
Ma ||Aen − λen || −→ 0 e ||Ken || −→ 0 (per compattezza di K), quindi λ ∈
σess (A + K) (viceversa, se λ ∈ σess (A + K), posto A0 = A + K e K 0 = K lo stesso
ragionamento mostra che λ ∈ σess (A)).
qed
386
Capitolo 10. Teoria spettrale
10.5.20 Teorema (von Neumann) Se A, B ∈ B(H) sono operatori autoaggiunti e σess (A) = σess (B) allora esiste un operatore compatto K ∈ K(H) tale
che
∀ε > 0 tr(K ∗ K) < ε2
e tale che A + K ∼
= B.
Gli operatori come il K coinvolto nel teorema di von Neumann rientrano in
una classe notevole:
10.5.21 Definizione Un A si dice operatore di Hilbert–Schmidt se esiste un
sistema completo ortonormale {eα } in H tale che la serie
X
||Aeα ||2
α
converga.
Notiamo che la definizione implica che solo una quantità numerabile di ||T eα ||2
può essere diversa da zero.
Se A è di Hilbert–Schmidt allora il valore
s
X
||A||HS :=
||Aeα ||2
α
non dipende dalla scelta della base: infatti se {fα } è un’altra base, possiamo
scrivere
X
XX
XX
X
||Afβ ||2 =
|(Afβ , eα )|2 =
|(fβ , A∗ eα )|2 =
||A∗ eα ||2
β
β
α
α
β
α
(identità di Parseval); ma se scriviamo questa formula per eα = fα otteniamo
||A||HS = ||A∗ ||HS e quindi, ancora per la formula, ||A||HS non dipende dalla base
fissata. Osserviamo inoltre che, se ||x|| = 1 allora, se A è di Hilbert–Schmidt:
||Ax|| ≤ ||Ax||HS
cioè ||A|| ≤ ||A||HS . Infine si noti la
||A||HS =
sX
α,β
che segue dalla ||Aeα ||2 =
P
β
|(Aeα , eβ )|2 .
|(Aeα , eβ )|2
10.5. Operatori compatti, Hilbert–Schmidt e nucleari
387
10.5.22 Teorema ||.||HS rende gli operatori di Hilbert–Schmidt un’algebra di
Banach.
Dimostrazione: Se A è di Hilbert–Schmidt anche λA lo è per ogni λ ∈ C;
inoltre, se A e B sono di Hilbert–Schmidt:
sX
sX
X
2
||A + B||HS =
|(A + B)eα , eβ )| ≤
|(Aeα , eβ )| +
|(Beα , eβ )|
α,β
α,β
α,β
=||A||HS + ||B||HS
Dimostriamo che la ||.||HS è una norma di Banach: se {An } è una successione di
Cauchy allora
||An − Am || ≤ ||An − Am ||HS −→ 0
e quindi {An } converge a A ∈ B(H): dimostriamo che A è di Hilbert–Schmidt.
Basta notare che
X
||A||HS ≤
||Aeα ||2 ≤ sup ||An ||HS < ∞
n
α
Infine notiamo che, se A è di Hilbert–Schmidt e B ∈ B(H) allora
X
X
||BA||2HS =
||BAeα ||2 ≤ ||B||2
||Aeα ||2 = ||B|| ||A||HS
α
α
e quindi anche ||AB||HS = ||(AB)∗ ||HS = ||B ∗ A∗ ||HS ≤ ||B|| ||A||HS . In particolare, se B è di Hilbert–Schmidt allora ||B|| ≤ ||B||HS e quindi gli operatori di
Hilbert–Schmidt formano un’algebra di Banach.
qed
Dalla dimostrazione segue che gli operatori di Hilbert–Schmidt sono un ideale
bilatero (ovviamente non chiuso) in B(H): la chiusura di questo ideale è ovviamente ancora un ideale di B(H), e deve quindi coincidere con B(H) oppure con
K(H); vale questo secondo caso: intanto
10.5.23 Proposizione Un operatore di Hilbert–Schmidt è compatto.
Dimostrazione: Basta mostrare che si approssima con operatori di rango finito:
sia {eα } un sistema ortonormale completo in H e A un operatore di Hilbert–
Schmidt. Allora ||Aeα ||2 6= 0 al più per una famiglia numerabile di indici α e, se
n ∈ N allora esiste un insieme di indici finito An tale che
X
α∈A
/ n
||Aeα ||2 <
1
n2
388
Capitolo 10. Teoria spettrale
Ma se definiamo
(
Aeα
An eα =
0
se α ∈ An
se α ∈
/ An
è ovvio che gli An hanno rango finito e approssimano A:
||A − An || ≤ ||A − An ||HS =
sX
α∈A
/ n
||Aeα ||2 <
1
n
qed
Non ogni operatore compatto di è di Hilbert–Schmidt: basti prendere in uno
spazio separabile Aen = n−1/2 en .
10.5.24 Corollario L’algebra degli operatori compatti è la chiusura dell’algebra
degli operatori di Hilbert–Schmidt.
Gli operatori di Hilbert–Schmidt sono ancor più simili agli operatori negli
spazi di dimensione finita di quanto non lo siano i compatti: comunque non
possiamo estendere tutte le proprietà desiderate degli operatori finiti al caso di
Hilbert–Schmidt: ad esempio non riusciamo in generale a definire la traccia di
un operatore. Per farlo dobbiamo ulteriormente restringere la classe di operatori
in esame: l’idea è che, in uno spazio vettoriale di dimensione finita V , vale l’isomorfismo End(V ) = V ∗ ⊗ V ; cioè gli operatori si possono pensare come tensori
e questo permette di definire la traccia di un operatore in modo intrinseco: se
T ∈ End(V ) e se ϕ ⊗ v è la sua immagine per mezzo dell’isomorfismo precedente
allora basta porre tr T = ϕ(v). Naturalmente in dimensione infinita non possiamo aspettarci l’isomorfismo precedente, ma lo spazio V ∗ ⊗ V sarà un sottospazio
dello spazio degli operatori, sottospazio i cui elementi andiamo ora a definire.
10.5.25 Definizione A si dice operatore nucleare se si può esprimere come il
prodotto A = BC di due operatori di Hilbert–Schmidt B e C.
10.5.26 Proposizione Se A = BC è un operatore nucleare e {eα } è un sistema
completo ortonormale in H allora la serie
X
(Ceα , B ∗ eα )
α
converge assolutamente ad un valore che non dipende dal sistema ortonormale
scelto.
10.5. Operatori compatti, Hilbert–Schmidt e nucleari
389
Dimostrazione: Se {fα } è un altro sistema ortonormale allora
X
|(Ceα , fβ )(B ∗ eα , fβ )|
≤
α,β
sX
s
=
|(Ceα , fβ
α,β
X
)|2
s
||Ceα ||2
α
sX
|(B ∗ eα , fβ )|2
α,β
X
||B ∗ eα ||2
α
∗
= ||C||HS ||B ||HS
Quindi la serie doppia esiste e, in particolare
X
X
X
(Ceα , B ∗ eα ) =
(Ceα , fβ )(B ∗ eα , fβ ) =
(Bfβ , eα )(C ∗ fβ , eα )
α
α,β
=
X
β,α
(Bfβ , C ∗ fβ )
β
Di nuovo l’indipendenza dalle basi segue usando questa formula prima con eα =
fα e poi nel caso generale.
qed
Il numero
tr A =
X
(Ceα , B ∗ eα )
α
si dice traccia dell’operatore nucleare A. Dalla dimostrazione della proposizione
segue immediatamente che
10.5.27 Proposizione La traccia è un operatore lineare e continuo dallo spazio
degli operatori nucleari in C ed inoltre
tr AB = tr BA
|| tr AB|| ≤ ||A||HS ||B||HS
tr AA∗ = ||A||2HS
10.5.28 Teorema Lo spazio N (H) degli operatori nucleari su uno spazio di
Hilbert H è uno spazio di Banach rispetto alla norma
||A||N = tr |A|
ove A = |A|U è la decomposizione polare dell’operatore nucleare A. Lo spazio di
Banach N (H) è isomorfo al duale di K(H) ed il duale di N (H) è isomorfo a
B(H).
390
Capitolo 10. Teoria spettrale
Dimostrazione: Per vedere che si tratta di una norma di Banach, notiamo che
||A||N = sup | tr U AV |
U,V
al variare di U, V nelle isometrie parziali: infatti
¯
¯
¯ X
¯X
¯
¯
|(AV eα , U ∗ eα )| = tr |A| = ||A||N
| tr U AV | = ¯ (U AV eα , eα )¯ ≤
¯
¯
α
α
per U e V tali che A = |A|V ∗ U ∗ .
Per ottenere gli isomorfismi basta osservare che un elemento A∈N (H) induce
in modo unico un operatore lineare su K(H) definito come K 7−→ tr AK, e che un
elemento B ∈ B(H) induce in modo unico un operatore lineare su N (H) definito
come A 7−→ tr AB.
qed
Capitolo 11
ALGEBRE DI VON NEUMANN
Nella nostra esposizione della teoria spettrale ci eravamo imbattuti nella definizione di algebra di von Neumann: queste sono le sottoalgebre di operatori
che soddisfano la proprietà del doppio commutante A00 = A, analoga a quella
delle algebre di matrici nel caso di dimensione finita. Per queste algebre esiste
una grandiosa teoria, dovuta a Murray e von Neumann, che generalizza quella
classica delle algebre semisemplici di dimensione finita, làmbita nel capitolo ??.
Diamo qui alcuni frammenti di questa teoria.
11.1
Misure e Rappresentazioni
11.1.1 Definizione Una rappresentazione di una C*-algebra A è un morfismo
di C*-algebre
π : A −→ B(H)
ove H è lo spazio (di Hilbert) della rappresentazione tale che π(IA ) = I.
Si noti che, per definizione: ||π(A)|| ≤ ||A||.
Ricordiamo le definizioni che abbiamo dato nello studio degli operatori normali:
11.1.2 Definizione Se A è una C*-algebra, due sue rappresentazioni π1 : A −→
B(H1 ) e π2 : A −→ B(H2 ) si dicono unitariamente equivalenti e si scrive π1 ∼
= π2
se esiste un operatore unitario U : H1 −→ H2 tale che
U π1 (f ) = π2 (f )U
Si definisce
(π1 , π2 ) := {T ∈ B(H) | ∀f ∈ Co (C) T π1 (f ) = π2 (f )T }
391
392
Capitolo 11. Algebre di von Neumann
e gli elementi di questo insieme si dicono operatori di allacciamento.
Ci occuperemo in questo capitolo, delle rappresentazioni π : C(X) −→ B(H)
(tali che π(1) = I). La teoria (commutativa) della molteplicità spettrale è lo
studio delle rappresentazioni di C(X) ove X è uno spazio compatto di Hausdorff:
vedremo che questo è legato alla teoria della misura sui boreliani di X.
Ricordiamo che, per x, y ∈ H, la mappa
f 7−→ (x, π(f )y)
è un funzionale lineare su C(X), continuo in virtù della
|(x, π(f )y)| ≤ ||x|| ||y|| ||π(f )|| ≤ ||x|| ||y|| ||f ||
Allora, per il teorema di Riesz–Markov 9.2.2:
Z
∗
F ∈ C(X) ⇐⇒ F (f ) =
f (t)dµ(t)
X
ove µ è una misura boreliana complessa regolare e limitata (cioè è una combinazione lineare finita di misure regolari di probabilità).
Quindi
Z
(x, π(f )y) =
f (t)dµx,y (t)
X
11.1.3 Definizione Gli elementi della famiglia
{µx,y }x,y∈H
si dicono misure spettrali associate alla rappresentazione π.
11.1.4 Definizione Una misura regolare di probabilità µ su X si dice basica
per una rappresentazione π : C(X) −→ B(H) se
• Per ogni x ∈ H, µx,x ¿ µ.
• Se µ0 è una misura che soddisfa la (1) allora µ ¿ µ0 .
11.1.5 Teorema Se H è separabile allora esiste ξ ∈ H tale che per ogni x ∈ H:
µx,x ¿ µξ,ξ
Cioè esiste una misura basica per la rappresentazione π.
393
11.1. Misure e Rappresentazioni
Dimostrazione: Se X è compatto di Hausdorff e µ è una misura regolare di
probabilità su X allora ν ¿ µ se e solo se dν(s) = f (s)dµ(s) ove f è la derivata di Radon–Nikodym (teorema di Radon–Nikodym 6.3.6), che è una funzione
||.||
integrabile rispetto a ν e non negativa; si noti che se νn −→ ν allora
dνn L1 dν
−−→
dµ
dµ
e ν ¿ µ. Ora, dato che H è separabile, esiste una successione {ξn } densa in H1
(gli elementi di norma 1) e se {cn } è una successione numerica tale che
∞
X
cn = 1
n=0
la misura
µ :=
∞
X
cn µξn ,ξn
n=0
è basica.
qed
11.1.6 Definizione Se π : A −→ B(H) è una rappresentazione di una C*algebra A, un vettore x ∈ H si dice ciclico per π se
π(A)x = H
(lo spazio degli elementi ottenuti da x operando tramite π è denso in H.)
Il nostro obiettivo è dimostrare che se π : C(X) −→ B(H) è una rappresentazione ed il vettore ξ ∈ H è ciclico per π(C(X))0 (commutante di π(C(X)) in
B(H) allora µξ,ξ è basica: dedurremo questo teorema da un risultato già di per
sé interessante, e cioè l’esistenza di un vettore ciclico per ogni rappresentazione
di C(X) su uno spazio separabile.
Per dimostrare questi risultati servono alcuni preliminari.
11.1.7 Definizione Se A è una C*-algebra e
{πα : A −→ B(Hα )}α∈A
è una famiglia di rappresentazioni di A allora lo spazio
M
H :=
Hα
α∈A
394
Capitolo 11. Algebre di von Neumann
è lo spazio di una rappresentazione π : A −→ B(H) definita come
(π(A)x)(α) := πα (A)xα
(si rammenti la definizione di prodotto di una famiglia di insiemi) che si dice
somma diretta delle rappresentazioni {πα }.
Osserviamo che questa definizione ha perfettamente senso:
¯¯ X ¯¯2
¯¯2
¯¯ X
¯¯
¯¯
¯¯
¯¯
2
¯¯ = ||A||2 ||x||2
¯¯ ≤ ||A|| ¯¯
¯¯
x
(π(A)x)α
α
¯¯
¯¯
¯¯
¯¯
α∈A
α∈A
da cui ||π(A)x|H ≤ ||A|| ||x|| e quindi π(A) ∈ B(H).
Se {Mα }α∈A è una famiglia di sottospazi vettoriali chiusi in H a due a due
ortogonali che generino H:
X
Mα = H
α∈A
e se π : A −→ B(H) è una rappresentazione tale che, per ogni α ∈ A: π(A)Mα ⊂
Mα allora le rappresentazioni π|α : A −→ B(Mα ) ottenute per restrizione sono
tali che
M
π=
πα
α∈A
11.1.8 Definizione Una rappresentazione π : A −→ B(H) si dice non degenere
se la *-sottoalgebra π(A) ⊂ B(H) è non degenere, nel senso che
∀x ∈ H
π(A)x = 0 ⇒ x = 0
11.1.9 Proposizione Se π : A −→ B(H) è una rappresentazione di una C*algebra A allora sono equivalenti le
• π è non degenere;
• π(A)H = H;
• Per ogni x ∈ H, x ∈ π(A)x.
Dimostrazione: Poniamo per brevità B := π(A).
(1)⇒(2): se y⊥BH allora, per ogni B ∈ B e y ∈ H:
0 = (y, Bx) = (B ∗ y, x) ⇒ B ∗ y = 0 ⇒ By = 0 ⇒ y = 0
395
11.1. Misure e Rappresentazioni
(perché B è una *-algebra e vale la (1)).
(2)⇒(1): Se (BH)⊥ = 0 allora Bx = 0 per ogni x ∈ H, i.e. x = 0.
(3) ⇐⇒ (2): La (3) implica che H ⊂ BH ⊂ H e quindi la (2); se vale (2),
consideriamo x ∈ H e Bx, che deve essere B-invariante:
Bx ∈ BH ⇒ ∀B 0 ∈ B
B 0 Bx = (B 0 B)x ∈ Bx
Per la continuità degli operatori in B si ha anche Bx è B-stabile1 . Posto M = Bx
e E = EM :
x ∈ BH ⇐⇒ x = Ex
Ma B(x − Ex) = 0: infatti
B(x − Ex) = Bx − BEx = Bx − EBx = Bx − Bx = 0
(dato che Bx ∈ M ⇒ EBx = Bx). Quindi se B è non degenere, x = Ex.
qed
11.1.10 Teorema Una rappresentazione non degenere di una C*-algebra è somma diretta di rappresentazioni cicliche.
Dimostrazione: Al solito sia π : A −→ B(H) la rappresentazione e B = π(A);
consideriamo, per ξ ∈ H, i sottospazi chiusi
Mξ := π(A)ξ
Per definizione sono spazi invarianti per π ed evidentemente π|Mξ è una rappresentazione ciclica (infatti ξ ∈ πMξ (A) se π è non degenere per la (3) della
proposizione precedente). Ora dimostriamo che
M è π-stabile ⇐⇒ M ⊥ è π-stabile
In effetti se per ogni B ∈ B: BM ⊂ M allora, se x ∈ M ⊥ :
∀y ∈ M
(Bx, y) = (x, B ∗ y) = 0
cioè BM ⊂ M e quindi BM ⊥ ⊂ M ⊥ . Il viceversa è ovvio.
Quindi (per ogni *-sottoalgebra B ⊂ B(H)), se M è un sottospazio B-stabile
si ha
H = M ⊕ M⊥
1
Osserviamo che se B ⊂ B(H) è una *-sottoalgebra e M è chiuso in H, M è B-stabile se e
solo se EM ∈ B 0 . Infatti BE = EBE e EB ∗ = EB ∗ E = B ∗ E (E è autoaggiunto).
396
Capitolo 11. Algebre di von Neumann
Ogni elemento B ∈ B(H) si rappresenta nella forma
µ
¶
A1 A2
B=
A3 A4
con
A1 := EM BEM
A3 := EM BEM ⊥
A2 := EM ⊥ BEM
A4 := EM ⊥ BEM ⊥
e, se B è una *-sottoalgebra (come nel nostro caso B = π(A)) e M è B-stabile:
¶
µ
A1 0
B=
0 A2
Se ora consideriamo ξ ∈ M ⊥ \ {0} (M 6= H) allora Bξ =: Mξ è tale che
Mξ ⊂ M ⊥
Quindi un sottospazio M stabile, chiuso (e proprio) induce una rappresentazione
sul sottospazio ortogonale.
Se S è l’insieme delle famiglie M di sottospazi vettoriali chiusi B-stabili a due
a due ortogonali su H e tali che π|M sia ciclica per ogni M ∈ M allora l’inclusione
M1 ⊂ M2 è una relazione di ordine parziale su S: se S 0 ⊂ S è un sottoinsieme
totalmente ordinato e
[
M0 :=
M
M∈S 0
evidentemente M0 ∈ S è un maggiorante del sottoinsieme S 0 ; quindi l’insieme
parzialmente ordinato (S, ⊂) soddisfa alle ipotesi del lemma di Zorn, che implica
l’esistenza di una famiglia massimale M0 in S. Il sottospazio di H generato dagli
elementi densi di M0 esaurisce tutto H:
X
N :=
M =H
M ∈M 0
M =H
Infatti se esistesse ξ ∈ N ⊥ \ {0} avremmo Bξ = Nξ con Nξ ⊂ N ⊥ , il che darebbe
luogo ad una rappresentazione ciclica: ma allora M0 ∪ {Nξ } sarebbe un elemento
di S contenente M0 , il che ne contraddirebbe la massimalità. Quindi N = H.
Dunque π si esprime come somma di rappresentazioni cicliche.
qed
Se la rappresentazione π è degenere, il sottospazio
M0 := {x ∈ H | ∀A ∈ A π(A)x = 0}
397
11.1. Misure e Rappresentazioni
è B-stabile, quindi lo è pure M := M0⊥ e π|M è non degenere. Cioè
Ã
!
M
π = 0 ⊕ π|M = 0 ⊕
πα
α∈A
con le πα cicliche.
Osserviamo che se H è separabile, la famiglia A nella somma
M
π=
πα
α∈A
è numerabile ed ogni Mα è del tipo En H (con En ∈ B).
11.1.11 Teorema Se A ⊂ B(H) è una *-sottoalgebra commutativa e se H è
separabile allora esiste un vettore ciclico per A.
Dimostrazione: Consideriamo la rappresentazione identica
π : A −→ B(H)
A 7−→ A
Per il teorema precedente
π=
M
πn
n∈N
(con le πn cicliche) e π|Mn = πn . Se ξn è il vettore ciclico di πn si ha Aξ = H;
possiamo scegliere ξn in modo che
||ξn || = 1
Allora consideriamo c ∈ l2 (N) con ||c|| = 1; allora, se
X
ξ :=
cn ξn
n∈N
si ha ||ξ||2 = ||c||2l2 = 1. Dimostriamo che ξ è un vettore ciclico per A0 : in effetti
En ∈ A0 e A ⊂ A0 (per commutatività di A), quindi
A0 ξ ⊃ AEn ξ
cioè A ⊂ A0 ⊂ AEn ξ che, essendo En ξ = cn ξn , è uguale a
cn Aξn = Aξn = Mn
qed
Possiamo finalmente dimostrare il teorema che abbiamo enunciato in precedenza:
398
Capitolo 11. Algebre di von Neumann
11.1.12 Teorema Se π : C(X) −→ B(H) è una rappresentazione ed il vettore
ξ ∈ H è ciclico per A0 (commutante di A = π(C(X)) in B(H) allora µξ,ξ è basica.
Dimostrazione: Basta dimostrare che µx,x < µξ,ξ . Ma se (xn ) ⊂ H converge in
norma a x allora
µxn ,xn −→ µx,x
e quindi per densità di A0 ξ basta far vedere che
(∗)
∀T ∈ A0
µT ξ,T ξ < µξ,ξ
Per dimostrare la (*) notiamo che2
Z
f (s)dµT ξ,T ξ (s) = (T ξ, π(f )T ξ) = (T f, π(g)∗ π(g)T ξ)
= (T π(g)ξ, T π(g)ξ) = ||T π(g)ξ||2
≤ ||T |2 ||π(g)ξ||2 = ||T ||2 (ξ, π(f )ξ)
Z
2
= ||T ||
f (s)dµξ,ξ
Quindi
µT ξ,T ξ ≤ ||T ||2 µξ,ξ
Ma allora per ogni insieme ∆ µξ,ξ -misurabile si ha
µT ξ,T ξ (∆) ≤ ||T ||2 µξ,ξ (∆)
sicché µT ξ,T ξ è dominata da µξ,ξ e, a fortiori, si trova la (*). Da questa, per
densità di A0 ξ deduciamo che µx,x < µξ,ξ .
qed
11.1.13 Teorema Se π è una rappresentazione dell’algebra C(X) delle funzioni
continue su uno spazio compatto metrizzabile in uno spazio di Hilbert H separabile, allora π è ciclica se e solo se esiste una misura regolare µ di probabilità su
X tale che
π∼
= πµ
ove πµ (f ) è la moltiplicazione per f nello spazio di funzioni L2 (X, µ) e tale che
µ sia equivalente3 ad una misura basica di π. Infine, se π1 e π2 sono rappresentazioni cicliche, allora π1 ∼
= π2 se e solo se le classi di equivalenza delle loro misure
basiche coincidono.
Usiamo il fatto che se f è positiva allora esiste g in modo che f = g ∗ g
Si rammenti che due misure sono equivalenti se assolutamente continue l’una rispetto
all’altra.
2
3
399
11.1. Misure e Rappresentazioni
Dimostrazione: Supponiamo che ξ sia un vettore ciclico per A = π(C(X)) ⊂
A0 ; per il teorema precedente la misura µ := µξ,ξ è basica.
Consideriamo poi in L2 (X, µ) l’operatore
Mf ∈ B(L2 (X, µ))
definito, per x ∈ L2 (X, µ), come
(Mf x)(s) := f (s)x(s)
Osserviamo che
Z
Z
2
2
|f (s)x(s)| dµ(s) ≤ ||f ||
|x(s)|2 dµ(s) = ||f ||2 ||x||2
X
X
e quindi Mf manda effettivamente L2 (X, µ) in sé: dato che è lineare e continuo
la mappa
f 7−→ Mf
è una rappresentazione di C*-algebre, che è ciclica.
Infatti X è uno spazio compatto e µ una misura finita, quindi la funzione
identicamente 1 appartiene a C(X) ed è in L2 (X, µ). Pertanto
Mf 1 = f
||.||
2
è una immersione C(X) ,→ L2 (X, µ) e, come noto, C(X) L = L2 (X, µ). Quindi
1 è un vettore ciclico per la rappresentazione Mf .
Ora consideriamo l’operatore U : H −→ K 2 (X, µ) definito come
U π(f )ξ := Mf 1
Vogliamo dimostrare che è unitario e di allacciamento fra π e Mf .
Per dimostrare che è unitario, dato che C(X) è denso in L2 (X, µ), basta far
vedere che è isometrico (nella norma L2 ); ed infatti
||π(f )ξ||2 = (π(f )ξ, π(f )ξ) = (ξ, π(f ∗ f )ξ)
Z
Z
∗
=
(f f )(s)dµ(s) =
|f (s)|2 dµ(s) = ||f ||2L2
X
X
Vediamo ora che si tratta di una equivalenza unitaria fra le rappresentazioni π e
Mf . Intanto
U π(f )ξ = πµ (f )1
cioè
U π(f g)ξ = πµ (f g)1 ⇒ U π(f )π(g)ξ = πm u(f )πµ (g)1 = πµ (f )U π(g)ξ
400
Capitolo 11. Algebre di von Neumann
Ma π(g)ξ è un generico vettore in un sottoinsieme denso di H e quindi, passando
al limite nell’equazione precedente, si ottengono due operatori U π(f ) e πµ (f )U
che coincidono su un sottoinsieme denso, sicché
U π(f ) = πµ (f )U
Questo conclude la dimostrazione della necessità della condizione.
Vediamo ora che la condizione del teorema è pure sufficiente per la ciclicità
della rappresentazione π; infatti è quasi ovvio: se π ∼
= π1 e π1 (A)ξ = Hπ1 allora
esiste un operatore unitario U di allacciamento fra π1 e π2 ed il vettore
ξ := U ξ1
è ciclico per π:
U π1 (A)ξ1 = π(A)U ξ1 = π(A)ξ
(si rammenti che U ∈ (π1 , π2 ) ⇒ U ∗ ∈ (π2 , π1 ).
Dimostriamo infine la seconda parte del teorema. Consideriamo cioè due
misure regolari µ1 e µ2 di probabilità equivalenti:
µ1 =
dµ1
µ2
dµ2
e
µ2 =
dµ2
µ1
dµ1
Definiamo poi un operatore
V : L2 (X, µ1 ) −→ L2 (X, µ2 )
nel modo seguente: per ogni x ∈ L2 (X, µ1 )
s
dµ1
(V x)(s) :=
(s) x(s)
dµ2
Per dimostrare che V x ∈ L2 (X, µ2 ) osserviamo che
|(V x)(s)|2 =
dµ1
(s)|x(s)|2
dµ2
(la derivata di Radon–Nikodym dµ1 /dµ2 appartiene a L2 (X, µ2 )) e quindi
Z
Z
2
|(V x)(s)| dµ2 (s) =
|x(s)|2 dµ1 (s)
X
X
cioè V è una isometria lineare L2 (X, µ1 ) −→ L2 (X, µ2 ) che deve essere unitaria,
in quanto, se
s
dµ2
(s) x(s)
(V 0 x)(s) :=
dµ1
401
11.1. Misure e Rappresentazioni
allora (allo stesso modo di V ) V 0 è una isometria lineare ed è tale che
VV0 =I
V 0V = I
e
(dato che le misure sono equivalenti, le derivate di Radon–Nikodym dell’una
rispetto all’altra sono l’una la funzione reciproca dell’altra.)
Dunque, per ogni s:
s
s
dµ1
dµ1
(V πµ1 (f )x)(s) =
(s)(πµ1 (f )x(s) =
(s)f (s)x(s)
dµ2
dµ2
s
dµ1
= f (s)
(s)x(s) = f (s)(V x)(s) =: (πµ2 (f )(V x))(s)
dµ2
e quindi
∀x ∈ L2 (X, µ1 ) V πµ1 (f )x = πµ2 (f )V x
ovvero
V πµ1 (f ) = πµ2 (f )V
Viceversa, se V è un operatore unitario di allacciamento fra πµ1 e πµ2 allora, se
1 è la funzione identicamente 1 in L2 (X, µ1 ):
V πµ1 (f )1 = πµ2 (f )V 1 =: ξ ∈ L2 (X, µ2 )
Definendo
(ξ, V πµ1 (f )1) := (V 1, V πµ1 (f )1)
si ottiene
Z
(ξ, V πµ1 (f )1) = (1, πµ1 (f )1) =
f (s)dµ1 (s)
X
Z
Z
ξ(s)ξ(s)f (s)dµ2 (s) =
ξ(s)(πµ2 (f )ξ)(s)dµ2 (s)
=
X
X
Dunque
Z
Z
∀f ∈ C(X)
2
f (s)|ξ(s)| dµ2 (s) =
X
f (s)dµ1 (s)
X
e, per il teorema di Riesz–Markov,
µ1 = |ξ|2 µ2
cioè µ1 ¿ µ2 . In modo analogo si trova µ2 ¿ µ1 .
qed
402
11.2
Capitolo 11. Algebre di von Neumann
Sottoalgebre commutative massimali in B(H)
Consideriamo un operatore normale A: il suo spettro è puntuale se i suoi
autovettori formano un sistema totale cioè
Aei = λi ei
Se ora U : H −→ l2 (N) è l’operatore unitario determinato dalla scelta della base
{en } di H, allora l’operatore U AU −1 è diagonale ed i suoi elementi diagonali
sono la successione degli autovalori, ripetuti ciascuno tante volte quanta è la sua
molteplicità. Quindi
l2 (N) = L2 (σ(A), µ)
ove µ è una misura di probabilità totalmente atomica nel senso che è concentrata
nei singoli punti dello spettro. Ad esempio
µ=
X
cn δλn
P
con cn > 0,
cn = 1 e δλ misura di Dirac concentrata in λ; allora f (A) diviene,
per tramite di U , la moltiplicazione per f :
U f (A) = πµ (f )U
ove, per x ∈ L2 (σ(A), µ):
(πµ (f )x)(s) := f (s)x(s)
In questo caso è
x=
X
xn en
n
con xn ∈l2 (N) e quindi U f (A)U −1 è diagonale con autovalori dati dalla successione
{f (λn )}.
11.2.1 Teorema Se X è uno spazio compatto metrizzabile e π una rappresentazione non degenere (π(1) = I) di A = C(X) nello spazio di Hilbert separabile
H allora (l’indice f denota che la chiusura è nella topologia forte)
f
π(A) = R := π(A)00
(si noti che R ⊂ R0 essendo commutativa).
11.2. Sottoalgebre commutative massimali in B(H)
403
Dimostrazione: Intanto notiamo che se π è ciclica allora R = R0 = π
e(L∞ (X, µ))
ove π
e è la rappresentazione
π
e : β(X) −→ B(H)
dell’algebra delle funzioni boreliane limitate definita da
Z
(x, π
e(f )y) :=
f (s)dµx,y (s)
X
Infatti, se f è µ-misurabile e limitata
µx,y =
n
X
ci µxi ,yi
i=1
(per polarizzazione). Ora
ker π
e = {f | f = 0 µ-q.o.}
Infatti che il nucleo di π
e contenga questo insieme è ovvio; se poi f ∈ ker π
e allora,
dato che
µπ(g1 )x,π(g2 )x (s) = g1 (s)g2 (s)µξ,ξ (s)
per un vettore ξ ciclico per π allora
Z
∀g ∈ C(X)
f (s)g(s)dµ = 0
X
e quindi, per il teorema di Lusin 4.6.7, f = 0 µ-q.o.
Quindi se f ∈ L∞ (X, µ) allora π
e(f ) = 0 implica f = 0 (come elemento di
∞
L (X, µ), i.e. a meno di equivalenza q.o.) e quindi la rappresentazione π
e è fedele
(cioè iniettiva). Allora, come *-algebre
L∞ (X, µ) ∼
= π(A)
Quello che vogliamo dimostrare è che π
e(L∞ (X, µ)) = R = R0 . Che sia
π
e(L∞ (X, µ)) ⊂ R ⊂ R0
è ovvio. Quindi basta provare che R0 ⊂ π
e(L∞ (X, µ)); ora, essendo π ciclica, per
una misura basica µ si ha
π = πµ
e quindi4
4
³
´
f
0
π
eµ (L∞ (X, µ)) ⊂ πµ C(X) ⊂ (πf (C(X))0 )
Osserviamo che se S ⊂ B(H) e U : H −→ H1 è unitario e U SU −1 ⊂ B(H1 ) allora
f
f
U S U −1 = U SU −1 e U S 0 U −1 = (U SU −1 )0 .
404
Capitolo 11. Algebre di von Neumann
Se dimostriamo che l’ultimo termine è incluso in π
eµ (L∞ (X, µ)) abbiamo finito.
Consideriamo quindi T ∈ πf (C(X))0 :
fT := T 1 ∈ L2 (X, µ)
(1 è la funzione identicamente 1 in L2 (X, µ)) sicché
T πµ (f )I = πµ (f )T 1 = fT f
cioè T 1 = fT . Osserviamo che, se fT ∈ L∞ (X, µ) allora
T πµ (f )I = f fT = π
e(fT )f = π
e(fT )π(f )I
e, per densità:
T =π
e(fT ) ∈ π
e(L∞ (X, µ))
Quindi ci siamo ridotti a dover dimostrare la fT ∈ L∞ (X, µ).
Per questo notiamo che
T ∈ πµ (C(X))0 ⇒ T ∈ π
eµ (L∞ (X, µ))0
||.||
f
debole
debole
(Infatti S ⊂ S ⊂ S
(ovvio) e se S ⊂ B(H) allora (S
)0 = S 0 : intanto
debole
debole
S⊂S
e S1 ⊂ S2 ⇒ S20 ⊂ S10 implicano che (S
)0 ⊂ S 0 ; inoltre se B ∈ S 0
allora per ogni A ∈ S: AB = BA i,e, ABx = BAx per ogni x ∈ H e, per ogni
debole 0
) ).
y ∈ H: (y, ABx) = (y, BAx) col che B ∈ (S
Dunque
∆ := {s ∈ X | |fT (s)| > ||T ||}
è misurabile (lo è fT ) e quindi la sua funzione caratteristica χ∆ è essenzialmente
limitata; ma L∞ (X, µ) ⊂ L2 (X, µ) (dato che la misura dello spazio è finita) sicché
||χ∆ fT ||2L2 ≤ ||T ||2 ||χ∆ ||2L2
||
Z
Z
Z
2
2
2
||T ||
dµ(s) <
|fT (s)| dµ(s) ≤ ||T ||
dµ(s)
∆
∆
∆
il che è assurdo a meno che la misura di {s ∈ X | |fT (s)| > ||T ||} non sia zero.
Quindi
|fT | ≤ ||T || µ-q.o.
e ne concludiamo che fT ∈ L∞ (X, µ).
qed
11.2. Sottoalgebre commutative massimali in B(H)
405
Se H è uno spazio di Hilbert allora l’insieme delle *-sottoalgebre commutative
di B(H) è parzialmente ordinato dalla relazione di inclusione; dato che verifica le ipotesi del lemma di Zorn se ne deduce che esistono sempre sottoalgebre
massimali commutative di B(H).
11.2.2 Definizione Una sottoalgebra massimale commutativa di B(H) la chiameremo MASA (maximal abelian subalgebras).
Ovviamente, per massimalità, una MASA è *-debolmente chiusa, quindi è
una sottoalgebra di von Neumann.
11.2.3 Teorema Se H è uno spazio di Hilbert separabile e R ⊂ B(H) una
*-sottoalgebra commutativa allora sono equivalenti le
• R è MASA.
• R = R0 .
• R è di von Neumann e possiede un vettore ciclico.
Dimostrazione:
(1) ⇔ (2): Se R = R0 allora R è abeliana (ovvio: R ⊂ R0 ) ed è massimale
poiché, se R ⊂ R1 ⊂ R01 , allora R001 ⊂ R01 ⊂ R0 e quindi, per ogni R1 contenente
R: R = R1 . Viceversa, se R è MASA e R ( R0 allora esiste T ∈ R0 \ R,
quindi, dato che R0 è una *-algebra, T = T1 + iT2 (T1 , T2 autoaggiunti) e quindi
o T1 ∈
/ R oppure T1 ∈
/ R, i.e. esiste un autoaggiunto T non appartenente a
R. Questo autoaggiunto T genera un’algebra commutativa che commuta con R,
(vi commuta T : T ∈ R0 ) e quindi l’algebra generata da R e T contiene R ed è
commutativa, il che contraddice la massimalità di R.
(3) ⇒ (2) segue dal teorema di densità di von Neumann che dimostreremo in
sèguito.
(2) ⇒ (3) segue dall’esistenza di un vettore ciclico per R0 che abbiamo già
dimostrato.
qed
Abbiamo visto fin qui che se π : C(X) −→ B(H) è una rappresentazione non
degenere dell’algebra delle funzioni continue di uno spazio compatto metrizzabile
in uno spazio di Hilbert separabile allora esiste un vettore ξ ciclico per π(C(X))0
ed una misura µ = µξ,ξ basica; inoltre, considerando l’estensione
π
e : L∞ (X, µ) −→ R = π(C(X))00
abbiamo visto che π
e è un *-isomorfismo isometrico in R.
11.2.4 Definizione Se T ∈A0 è un elemento del commutante di una C*-algebra,
si dice che separa i punti se T ξ = 0 ⇒ T = 0; si dice che ξ è separante per A0 .
406
Capitolo 11. Algebre di von Neumann
11.2.5 Teorema π
e è suriettivo ed è un omeomorfismo se su L∞ (X, µ) consideriamo la topologia *-debole e su R la topologia debole degli operatori.
Dimostrazione: Consideriamo
Hξ := π(C(X))ξ
Evidentemente πξ := π|Hξ è ciclica (per definizione!) con vettore ciclico ξ, sicché
πξ (C(X))00 = π
eξ (L∞ (X, µ))
Inoltre
π
g
π )|Hξ
Hξ = (e
(1)
f
e, se T ∈ R = π(C(X)) allora T Hξ ⊂ Hξ ; infatti se f ∈ C(X):
∀x ∈ Hξ
π(f )(x) ∈ Hξ
Più in generale: se A è una *-algebra e M un sottospazio chiuso di H tale che
AM ⊂ M allora AM ⊂ M (infatti questa condizione equivale alla EM ∈ A0 =
(A)0 ). Dunque, dato che
f
T x = lim π(fα )x = lim πξ (fα )x ∈ πξ (C(X))
α
α
si trova
(2)
f
T |Hξ ∈ πξ (C(X))
Infine
(3)
ξ ciclico per R0 ⇒ ξ separante per A0
Infatti se T ξ = 0 allora per ogni B ∈ A ⊂ B(H): BT ξ = 0 e quindi T Bξ = 0
(T ∈ A0 ); ma Aξ = H e quindi T è continuo e nullo su un sottospazio denso,
dunque T = 0.
Possiamo cioè affermare che la mappa
T −→ T |Hξ
è uno *-isomorfismo, e la (1) implica che
f
e(L∞ (X, µ))|Hξ
πξ (C(X)) = π
11.2. Sottoalgebre commutative massimali in B(H)
407
Quindi, per la (2):
π
e
f
C(X) −−→ R −−−−−→ R|Hξ ⊂ πξ (C(X)) = π
eξ (L∞ (X, µ)) = π
e(L∞ (X, µ))|Hξ
restrizione
In altri termini, per ogni T ∈ R esiste fT ∈ L∞ (X, µ) tale che T |Hξ = π(fT )|Hξ ;
ma allora, per la (3):
T =π
e(fT )
e quindi π
e è suriettiva. Ribadiamo che è un isomorfismo:
||f ||L∞ = ||e
π (f )|Hξ || ≤ ||e
π (f )|| ≤ ||f ||L∞
Dimostriamo che si tratta di un omeomorfismo: per g ∈ L1 (X, µ) consideriamo le
seminorme
Z
pg (f ) :=
f (s)g(s)dµ(s)
X
1
Ogni funzione in L (X, µ) è il prodotto di due funzioni in L2 (X, µ), ad esempio
p
p
g(s) = ( |g(s)|z(s))( |g(s)|)
ove z(s) è la fase di g(s) (funzione di modulo 1). Scriviamo cioè
g = x 1 x2
Quindi
¯Z
¯
¯
¯
pg (f ) = ¯¯
x1 (s)x2 (s)f (s)dµ(s)¯¯ = |(x1 , Mf x2 )|
X
Ma esiste un operatore unitario U : L2 (X, µ) −→ Hξ tale che
U Mf = π
eξ (f ) = π
e(f )|Hξ
pertanto
pg (f ) = |(U x! , U Mf x2 )| = |(ξ1 , U Mf U −1 ξ2 )| = |(ξ1 , π(f )ξ2 )|
che è la seminorma che definisce la topologia debole in R.
Viceversa, per x, y ∈ H e f ∈ L∞ (X, µ):
¯
¯Z
¯
¯
f (s)dµx,y (s)¯¯
(x, π
e(f )y) = ¯¯
X
Ma, per il teorema di Radon–Nikodym 6.3.6
µx,y = g(s)µ
e quindi
¯
¯Z
¯
¯
f (s)g(s)dµ(s)¯¯
(x, π
e(f )y) = ¯¯
X
qed
408
Capitolo 11. Algebre di von Neumann
Questo teorema è definitivo per la teoria delle algebre di von Neumann commutative, ed è l’analogo del teorema di Gel’fand–Najmark: ogni algebra di von
Neumann commutativa è generata dalle moltiplicazioni per le funzioni L∞ su
un certo spazio di misura regolare: questi spazi di misura sono sostanzialmente
gli spazi [0, 1] con la misura di Lebesgue con al più una quantità numerabile di
“atomi”, cioè punti di misura positiva, che corrispondono a proiezioni minimali
in R.
Ora consideriamo una famiglia {An } di operatori autoaggiunti che commutino
a due a due, ed il loro spettro congiunto
X := jσ(A1 , A2 , ...) ⊂
Y
σ(An )
n∈N
Sappiamo che
f 7−→ f (A1 , A2 , ...)
è uno *-isomorfismo fra C(X) è la C*-algebra A generata dall’identità e dalla famiglia {An }; possiamo quindi estendere questa rappresentazione (calcolo
funzionale continuo) ad una rappresentazione
L∞ (X) −→ R := A00
f 7−→ f (A1 , A2 , ...)
ottenendo, in virtù del teorema precedente, uno *-isomorfismo isometrico suriettivo. Quindi per ogni B ∈ B(H) che commutati con qualsiasi A esiste f tale che
B = f (A1 , A2 , ...).
11.2.6 Definizione Un insieme {An } è completo se per ogni B ∈ B(H) che
commuti con ogni An si ha per una opportuna f :
B = f (A1 , A2 , ...)
Per i sistemi completi di operatori autoaggiunti a due a due permutabili
abbiamo che
∀B ∈ R0 B ∈ R
i.e. R0 ⊂ R. Ma R ⊂ R0 e quindi
{An } completo ⇐⇒ R = R0
cioè se e solo se R è MASA.
Questo dimostra il
11.2. Sottoalgebre commutative massimali in B(H)
409
11.2.7 Teorema Se {An } è un sistema completo di operatori autoaggiunti a due
a due permutabili su uno spazio di Hilbert separabile H allora esiste un operatore
unitario U : H −→ L2 (X, µ) (X è lo spettro congiunto degli operatori) tale che
∀f ∈ L∞ (X, µ) U f (A1 , A2 , ...)U −1 = Mf
Se R = R00 ⊂ R ⊂ B(H) allora esiste una C*-algebra separabile (in norma)
tale che A ⊂ R tale che A = A00 .
Questo è vero, in realtà, per ogni algebra A di von Neumann e per l’insieme
B(H)1 (palla unitaria) con la topologia debole (rispetto alla quale è un compatto
metrizzabile); in altri termini: per ogni R ⊂ B(H), l’algebra
R1 := R ∩ B(H)1
è separabile (X è compatto, quindi metrizzabile se e solo se soddisfa il primo
assioma di numerabilità) essendolo la palla unitaria in B(H).
Se {Tn } ⊂ R1 è una successione debolmente densa allora, denotando con A
la C*-algebra generata dall’identità e dagli elementi {Tn }, abbiamo che
d
R⊂A ⊂R
(R è debolmente chiusa), cioè
d
R=A
Basta quindi, per separabilità, considerare famiglie totali numerabili; ad esempio
i monomi nelle Tn e nei loro aggiunti, i.e. la successione
A1 := T1
A2 = T1∗
A3 = T2
...
e considerare le funzioni f a supporto compatto definite su N a valori in N:
f (1)
A1
,
f (2)
A2
, ...
il che fornisce una successione totale nel caso commutativo. Nel caso non commutativo bisogna considerare i “monomi non commutativi”, cioè le parole che si
possono formare con le “lettere ” {An }.
Infine, B(H)1 è compatto metrizzabile per il teorema di Alaoglu 8.2.12; vogliamo ora dimostrare che
B(H) = M∗0 = M∗
ove M∗0 è uno spazio normato tale che
M0 ⊂ B(H)∗
410
Capitolo 11. Algebre di von Neumann
||.||
e M = M0 ne è il completamento; definiamo M0 come il sottospazio di B(H)∗
generato dai funzionali
fx,y : B(H) −→ C
A 7−→ (x, Ay)
(per x, y ∈ H). Ovviamente
||fx,y || ≤ ||x|| ||y||
(essendo |fx,y (A)| ≤ ||A|| ||x|| ||y||) e
∀f ∈ M0
f (A) = 0 ⇒ A = 0
Quindi basta osservare che
∀F ∈ M∗0 ∃A ∈ B(H) F (fx,y ) = fx,y (A)
come segue immediatamente dal teorema di rappresentazione di Riesz.
Notiamo inoltre che la topologia debole su B(H)1 è quella definita da M0 , i.e.
è la topologia debole degli operatori, nella quale B(H)1 risulta dunque essere compatto; infatti, in generale, se X è uno spazio normato con la σ(X ∗ , X)-topologia,
su X1 è
σ(X1∗ , X) = σ(X1∗ , N )
ove N è denso in X, il che si dimostra osservando che, per ogni ε > 0 ed x ∈ X
esiste xε tale che ||x − xε || < ε per il quale
∀f ∈ X1∗
|f (x − xε )| < ε
cioè
|px (f ) − pxε (f )| < ε
uniformemente sulle f .
Se H è separabile al posto di M0 basta considerare le combinazioni lineari a
supporto finito e coefficienti in Q + iQ
X
qij fxi ,yj
i,j
ove {xi } è una successione densa. Quindi la topologia debole degli operatori su
B(H) è in questo caso definita dalla famiglia (numerabile) di seminorme
¯
¯ X
¯
¯
qij fxi ,xj (A)¯¯
pk (A) := ¯¯
i+j=k
11.3. Topologie ultradeboli e ultraforti.
411
Da questo segue immediatamente che B(H)1 è metrizzabile rispetto alla distanza
d(A, B) :=
∞
X
k=1
ck
pk (A − B)
1 + pk (A − B)
P
(ove cn > 0 e n cn = 1), che induce la topologia debole degli operatori.
Abbiamo cioè dimostrato che B(H)1 è compatto e metrizzabile (il che è equivalente a dire che è compatto e verifica il secondo assioma di numerabilità, ovvero
che è compatto e separabile).
Osserviamo che se {An } è una successione di autoaggiunti e f ∈ L∞ (X, µ)
allora, per il teorema di Stone–Weierstrass, se
pn (s) := sn ∈ σ(An )
(si ricordi che X ⊂
Q
σ(An )) un insieme totale in C(X) è
{f (s) := sn1 1 sn2 2 ...}
Z
Per calcolare
f (s)dµ(s)
X
su qualsiasi funzione continua f basta quindi conoscere i valori
Z
sn1 1 sn2 2 ...dµ(s) := (ξ, An1 1 An2 2 ...ξ)
X
che, mediando il linguaggio probabilistico, si dicono momenti della misura µ.
11.3
Topologie ultradeboli e ultraforti.
Abbiamo considerato sull’insieme B(H) degli operatori continui di uno spazio
di Hilbert H (non necessariamente separabile) alcune topologie: la topologia della
norma, la topologia debole e la topologia forte. Vogliamo introdurne altre due,
la ultradebole e la ultraforte.
Introdurremo queste topologie per mezzo di seminorme: intanto osserviamo
che la topologia debole e la topologia forte sono pure indotte da seminorme:
px,y (A) := |(x, Ay)|
nel caso debole e
px (A) := ||Ax||
412
Capitolo 11. Algebre di von Neumann
nel caso forte.
Ricordiamo che la topologia forte è effettivamente più fine della topologia
debole, avendosi
px,y (A) ≤ ||x|| ||Ay|| ≤ ||x||py (A)
e che certamente queste topologie non coincidono (a meno che dim H < ∞). Ad
esempio, il morfismo
∗ : B(H) −→ B(H)
di passaggio all’aggiunto è un omeomorfismo per la topologia debole:
px,y (A) = |(x, Ay)| = |(x, Ay)| = |(A∗ x, y)| = |(y, A∗ x)| = py,x (A∗ )
mentre per la topologia forte non è nemmeno una funzione continua: per vederlo
basti considerare l’operatore di shift
Sen := en+1
(lo abbiamo scritto su una base ortonormale) che, per ogni k ≥ 1 dà luogo ad
una isometria S k :
||S k x|| = ||x||
Quindi S k non può convergere a zero fortemente (perché la successione numerica
delle sue norme è costantemente 16= 0), mentre
∗k
||S x|| = (x, S S x) =
2
k
k∗
∞
X
|(em , x)|2 −→ 0
m=k+1
(si noti infatti che S k S k∗ = E{e1 ,...,ek }⊥ ); quindi, per
An := S ∗n
otteniamo una successione fortemente infinitesima ma tale che A∗n non converga
fortemente a zero.
Tornando alle considerazioni precedenti, ricordiamo che la topologia debole è
la (σ(B(H), M0 )-topologia, e quindi se x = {xn } e y = {yn } sono successioni a
quadrato sommabile
||x||l2 =
∞
X
||xn ||2 < ∞
||y||l2 =
n=1
allora
∞
X
n=1
¯
¯X
¯
¯ ∞
¯
(xn , Ayn )¯¯
¯
n=1
||yn ||2 < ∞
413
11.3. Topologie ultradeboli e ultraforti.
converge assolutamente per ogni A ∈ B(H), dato che
¯
¯X
∞
X
¯
¯ ∞
¯
¯
||xn || ||yn || ≤ ||A|| ||x||l2 ||y||l2
(xn , Ayn )¯ ≤ ||A||
¯
n=1
n=1
(abbiamo usato la disuguaglianza di Schwartz in l2 ); quindi, se
∞
X
f (A) :=
(xn , Ayn )
∞
X
fn (A) :=
(xi , Ayi )
e
n=1
i=1
si trova che
|(f − fn )(A)| ≤ ||A||
e quindi
||f − fn || ≤
∞
X
||xi || ||yi ||@ À> 0
i=n
cioè f ∈ M := M0 .
11.3.1 Definizione La topologia ultradebole è la topologia definita dalle seminorme
¯
¯X
¯
¯ ∞
¯
(xi , Ayi )¯¯
p{xn },{yn } (A) := ¯
i=1
L
ove {xn }, {yn } ∈ i H.
Consideriamo ora
e :=
H
∞
M
H
i=1
e la somma diretta delle rappresentaEvidentemente possiamo considerare su H
zione identica πn : B(H) −→ B(H) (π(A) = A):
π=
∞
M
πn
n=1
In altri termini π(A) opera su x = {xn } come
π(A)(x) =
∞
M
Axn
n=1
Dunque
f (A) = (x, π(A)y)
e
p{xn },{yn } (A) = |(x, π(A)y)|
414
Capitolo 11. Algebre di von Neumann
11.3.2 Definizione La topologia ultraforte è quella indotta dalle seminorme
v
u∞
uX
px (A) := ||π(A)x|| = t
||Axn ||2
n=1
ove
P
n
||xn ||2 < ∞.
Ovviamente la topologia ultradebole è (strettamente) più fine della topologia
debole e la topologia ultraforte è strettamente più fine della topologia ultradebole.
Ad esempio, se B(H)N è la palla di centro l’origine e raggio N in B(H) allora
su B(H)N la topologia debole coincide con quella ultradebole e la topologia forte
coincide con quella ultraforte. Infatti se ||A|| ≤ N si ha
∞
X
i=n
||Axi || ≤ N
2
2
∞
X
||xi ||2
i=n
cioè per ogni ε > 0 esiste un nε tale che per ogni A ∈ B(H)N il modulo delle differenze delle seminorme forti ed ultraforti sia minore di ε. Un enunciato analogo
vale nel caso ultradebole.
Ora ricordiamo che, per la proposizione 8.2.3 un funzionale lineare su uno
spazio normato X è continuo nella σ(X, Y )-topologia se è della forma y 7−→ hx, yi
per un fissato x ∈ X; nel nostro caso otteniamo
B(H)∗ = {f 7−→ hf, Ai}f ∈M0
11.3.3 Proposizione I funzionali lineari su B(H) continui nella topologia ultradebole (ultraforte) e debole (forte) coincidono.
Dimostrazione: Basta dimostrare che un funzionale lineare ultrafortemente
continuo è anche ultradebolmente continuo.
Se f è ultrafortemente continuo allora esiste una seminorma ultraforte p tale
che
|f (A)| ≤ p(A) = ||π(A)x||
L
per qualche x ∈ H. Se
M
M := π(B(H))x ⊂
H
allora, per il teorema di rappresentazione di Riesz, esiste un unico g continuo
tale che
g(z) = (z1 , z)
11.3. Topologie ultradeboli e ultraforti.
415
(per un fissato z1 ) e quindi
hf, Ai = g(π(A)x) = z1 , π(A)x)
Analogamente si procede nel caso ultradebole.
qed
Ricordiamo ora che, per il teorema di Hahn–Banach, due topologie su uno
spazio vettoriale hanno gli stessi funzionali lineari e continui se e solo se hanno
gli stessi insiemi chiusi e convessi, e che in uno spazio vettoriale topologico un
chiuso convesso contenente l’origine è intersezione di semispazi della forma
{x | Re < f, x >≤ 1}
11.3.4 Proposizione Con le notazioni precedenti:
M0 ⊂ B(H)∗ ⊂ M
(la continuità dei funzionali è intesa essere quella debole).
Dimostrazione: Sia f un funzionale lineare debolmente continuo:
X
f=
fxi ,yi
cioè tale che
hf, f i =
X
(xi , Ayi )
i
con
(x, Ay) = tr(ATx,y )
(il rango di Tx,y è 1). ove
Tx,y z = y(x, z) = |yihx|z
P
Sugli operatori B a rango finito tr B = α (eα , Beα ) (ed è indipendente dalla
scelta della base (eα )), quindi
X
X
tr(ATx,y ) =
(eα , Ay)(x, eα ) =
(x, eα )(eα , Ay) = (x, Ay)
α
da cui, se T =
P
i
Txi ,yi :
α
X
i
fxi ,yi = tr(AT )
416
Capitolo 11. Algebre di von Neumann
cioè
(†)
f ∈ M0 ⇐⇒ hf, Ai = tr(AT ) = tr(T A) (rk T < ∞)
Applicando a T la decomposizione polare T = V |T | (dato che rk T < ∞ anche
rk V, rk |T | < ∞):
X
T = V |T | =
λi Tfi ,ei
i
dunque (per A = V ∗ nella (†))
||f || = tr |T | =
X
λi
i
Ma M = M0 e quindi gli elementi di M sono serie assolutamente convergenti
negli elementi di M0 :
∞
X
∀f ∈ M f =
fn
con fn ∈ M0 e
P
n
n=1
||fn || < ∞. Ma
fn (A) = tr(Tn A)
(al solito Tn = Vn |Tn | =
P
i
(n)
λi Tf (n) ,e(n) ) e
i
i
X
(n)
λi
<∞
i,n
Dunque considerando le successioni
p (n)
xk := λi ei
si ottiene
X
||yk ||2 =
k
X
eyk :=
||xk ||2 =
f=
X
X
(n)
λi fi
(n)
λi
<∞
i,n
k
sicché
p
fn =
n
X
fxk ,yk
k
è un funzionale ultradebolmente continuo.
qed
11.3. Topologie ultradeboli e ultraforti.
Osserviamo che la
(A)
∀(eα ), (fα ) basi ortonormali
X
417
|(eα , Bfα )| < ∞
α
è equivalente a
X
|(eα , Beα )| < ∞
α
(cioè per tali B ha senso calcolare la traccia di |B|) che pure è equivalente
all’essere B compatto e
X
λν(λ) < ∞
λ∈σ(|B|)
Quindi, se B verifica la (A) allora, per ogni base ortonormale (eα ):
X
tr B =
(eα , Beα )
α
La totalità degli operatori che soddisfano questa condizione definisce un ideale
bilatero che è uno spazio di Banach rispetto alla norma
||B||1 := tr |B|
e che si denota L1 (B(H)). Quindi
∀B ∈ B(H) ∀T ∈ L1 (B(H))
tr(T B) = tr(BT )
e
f ∈ M ⇐⇒ ∃T ∈ L1 (B(H)) hf, Ai = tr(AT ) e ||f || = ||T ||1
da cui segue che M ∼
= L1 (B(H)) come spazi di Banach.
Ora consideriamo un sottospazio N ⊂ B(H) ultradebolmente chiuso: si ha,
per il teorema di Hahn–Banach:
N = N⊥⊥
(osserviamo che se N è un sottospazio si ha sempre No = N⊥ ) e, dato che
N⊥ ⊂ M allora
¢∗
¡
N⊥⊥ = M/N⊥
Inoltre osserviamo che come spazi di Banach:
M/N⊥ ∼
= M/N
e quindi che
N = N⊥⊥ = (M/N)∗
Dunque, definendo il preduale di N come
N∗ := {funzionali lineari ultradebolmente continui su N}
di trova che N ∼
= (N∗ )∗ in modo canonico.
418
11.4
Capitolo 11. Algebre di von Neumann
Teoremi di Densità
Le topologie che abbiamo considerato sullo spazio degli operatori sono cinque:
norma > ultraforte >
ultradebole
> debole
forte
Osserviamo che l’operatore ∗ nella C*-algebra B(H) non è continuo rispetto
alla topologia ultraforte: si definisce comunque la topologia *-(ultra)forte con le
seminorme
p(A) + p(A∗ )
al variare di p nelle seminorme che definiscono la topologia (ultra)forte. Cosı̀ la
convergenza *-forte è caratterizzata da
An −→ 0 ⇐⇒ An xn −→ 0 e A∗n x −→ 0
e la convergenza *-ultraforte da
An −→ 0 ⇐⇒ π(An )xn −→ 0 e π(A∗n )x −→ 0
Dimostriamo ora un risultato fondamentale più volte citato ed utilizzato:
11.4.1 Teorema di Densità (von Neumann) Se A ⊂ B(H) è una *-sottoalgebra
non degenere di B(H) allora
uf
A = A00
Dimostrazione: Dobbiamo solo verificare che
uf
T ∈ A00 ⇒ T ∈ A
cioè che se T ∈ A00 allora per ogni seminorma ultraforte p esiste un A ∈ A tale
che
p(T − A) < 1
Ma la più generale seminorma ultraforte è
p(B) = ||π(B)x||
e quindi dobbiamo dimostrare che
(tesi)
e ∃A ∈ A ||π(T )x − π(A)x|| < 1
∀T ∈ A00 ∀x ∈ H
Ovvero che π(T )x ∈ π(A)x.
Usiamo ora un
419
11.4. Teoremi di Densità
Lemma A. A è non degenere se e solo se π(A) è non degenere.
per dedurre che π(A) è non degenere. Quindi x ∈ π(A)x (sappiamo già che non
degenere vuol dire che per ogni x ∈ H x ∈ Ax). Consideriamo allora l’operatore
di proiezione
E = Eπ(A)x
Il sottospazio π(A)x è ciclico, quindi E ∈ π(A)0 .
Quindi, se B ∈ π(A)00 allora BE = EB: ora usiamo un altro
Lemma B. π(A00 ) = π(A)00 .
per dedurre che B ∈ π(A00 ); in particolare π(T )E = Eπ(T ). Ma allora, dato che
Ex = x essendo x ∈ π(A)x:
π(T )x = π(T )Ex = Eπ(T )x ∈ π(A)x
il che conclude la dimostrazione.
qed
Ora dimostriamo i due lemmi.
Dimostrazione: (A) π(A) è non degenere se e solo se (π(A)x = 0 ⇐⇒ x = 0).
Ma
π(A)x = {Ax1 ⊕ Ax2 ⊕ ... | A ∈ A e x1 ⊕ x2 ⊕ ... = x}
e quindi
π(A)x = 0 ⇐⇒ ∀i Axi = 0
qed
Dimostrazione: (B) Se
x :=
∞
M
xi
i=1
e se
En x := 0 ⊕ 0 ⊕ ... ⊕ 0 ⊕ xn ⊕ 0 ⊕ ...
(proiezione sull’n-simo elemento) allora
Ma
e∼
En H
=H
P
En = I, quindi
X
X
X
X
e Tx = T
∀x =
En x ∀T ∈ B(H)
En x =
Em T x =
Em T En x
n
n
n
m
(per continuità di T ), cioè
(T x)m =
X
n
Em T E n x n
n,m
420
Capitolo 11. Algebre di von Neumann
Dunque associamo a T una matrice infinita (Tnm )n,m∈N ove
Tnm = En T Em : H −→ H
Il che vuol dire che
x1
x1
x2
x2
x = =⇒ T x = ((Tnm ))
..
..
.
.
Ma T ∈ π(A)0 ⇐⇒ ∀A ∈ A T π(A) = π(A)T , e, a livello di matrici:
!
! Ã
Ã
X
X
X
Em = s-lim
En T
En T Em
T = IT I =
m
n
n,m
da cui T = 0 ⇐⇒ ∀n, m ∈ N Tnm = 0.
Dunque la T π(A) = π(A)T diviene
∀n, m ∈ N En T π(A)Em = En π(A)T Em
Ma π(A)En = AEn , cioè
π(A)(0 ⊕ ... ⊕ 0 ⊕ xn ⊕ 0 ⊕ ...) = (0 ⊕ ... ⊕ 0 ⊕ Axn ⊕ 0 ⊕ ...)
e quindi En π(A) = En A. Dato che, per definizione di π(A), En ∈ π(B(H)),
troviamo
En T En A = En T π(A)En ⇒ En T Em A = AEn T Em
Dunque T ∈ π(A)0 ⇐⇒ Tnm ∈ A0 e
e | Tnm ∈ A0 ⇒ RT = T R}
π(A)00 = {R ∈ B(H)
Ma π(B(H))0 ⊂ π(A)0 (infatti A ⊂ B(H)) e quindi
R ∈ π(A)00 ⇒ REn = En R
per cui, se Rn := Rnn sono gli elementi diagonali, si trova
R
∞
M
xi =
∞
M
Ri xi
i=1
i=1
e quindi R è diagonale. Se
Ã
Vnm
∞
M
i=1
!
:= δjn xn
xi
j
421
11.4. Teoremi di Densità
∗
allora Vnn è un’isometria parziale tale che (Vnm
= Vmn )
∗
Vnm
Vmn = Em
cioè En = Vnn . Le Vnm sono le unità matriciali , i.e. matrici che hanno 1 all’incrocio fra n-sima riga e m-sima colonna e 0 altrove. Ogni operatore è quindi della
forma
X
Tnm Vnm
n,m
(con Tnm ∈ B(H)) e Vm0 n0 Vnm = Vm0 m δn0 n .
Tornando alla dimostrazione del lemma, abbiamo trovato che
Vnm ∈ π(B(H))0
(dato che π(A)Vnm ⊕i xi = π(A)(⊕j δjn xm )) e quindi R ∈ π(A)00 , cioè R commuta
con Vnm e pertanto i suoi elementi diagonali coincidono:
R1 = R2 = ...
Infatti, per ogni y ∈ H
e
Rn y = RVnm En y = Vnm REn y = Rm y ∈ En H
dunque Rn = Rm , e quindi
R1 0 0
0 R1 0
π(A)00 = π(B) = 0 0 R
1
..
..
...
.
.
···
· · ·
· · ·
...
ove π(A0 ) ⊂ π(A), dato che da B ∈ A0 e A ∈ A segue BA = AB e quindi
π(A)π(B) = π(AB) = π(BA) = π(B)π(A). Dunque
π(B) ⊂ π(A0 )0
Ma T ∈π(A0 ) se e solo se En π(R1 )T Em = En T π(R1 )Em i.e. R1 En T Em = En T Em .
Ne segue che per ogni B ∈ A0 si ha T = Vnm B e quindi R1 commuta con ogni
elemento di A0 , sicché
π(A)00 = π(A00 )
qed
Dal teorema di von Neumann segue che le seguenti inclusioni sono tutte
uguaglianze:
f
A
uf
d
A ⊂ ud ⊂ (A )00 = A00
A
422
Capitolo 11. Algebre di von Neumann
11.4.2 Teorema di Densità (Kaplanski) Se A è una *-sottoalgebra di B(H)
f
e se R := A allora
f
R1 = A1
f
f
cioè (A )1 = A1 .
Dimostrazione: Si tratta di dimostrare, per una *-sottoalgebra A ⊂ B(H), che
f
(A )1 = A1
f
Iniziamo con la seguente osservazione: se S ⊂ B(H) è un insieme convesso allora
f
d
S = S ; in particolare, se A è una *-sottoalgebra di B(H) consideriamo Aaa (la
sua parte autoaggiunta), A1 (i suoi elementi di norma 1) e l’intersezione Aaa ∩A1 :
si tratta di insiemi convessi, quindi per ognuno di essi le chiusure nelle topologie
forti e deboli coincidono.
Ora, nella topologia debole l’operazione * è un omeomorfismo, quindi, se A
è convessa:
³ d´
d
A
= Aaa
aa
Pertanto, malgrado A 7−→ A∗ non sia fortemente continua, si ha:
³ d´
³ f´
A
= A
aa
||
d
Aaa
aa
=
||
f
Aaa
Consideriamo dunque la topologia uniforme (la topologia della norma): allora
||.||
B ∈ (A
)1 ⇐⇒ ||B|| ≤ 1
∃(An ) ⊂ A
e
B = lim An
(ove il limite è nella topologia uniforme). A meno di moltiplicare gli elementi
An per numeri reali di modulo minore o uguale a 1 possiamo supporre che sia
||B|| = 1 e ||An || −→ 1, cioè
||.||
||An ||−1 An −→ B
ovvero
||.||
(A
||.||
f
)1 = A1
||.||
Ma A ⊂ A ⊂ A e quindi basta dimostrare il teorema per la chiusura uniforme
di A.
e =H⊕H e
Definiamo H
)
(µ
¶ ¯¯
A
A
¯
11
12
Ae = M2 (A) =
¯A ∈ A
A21 A22 ¯ ij
423
11.4. Teoremi di Densità
f
e = M2 (R), si ha
Allora, per R = A e R
f
e = Ae
R
(infatti una successione (An ) ⊂ Ae converge fortemente a T se e solo se Ei An Ej
converge a Ei T Ej per i, j ∈ {1, 2}).
Ora quello che vogliamo dimostrare è che, per ogni T ∈ R1 :
T = s-lim Aα
α
con Aα ∈ A1 . Ma se
Te =
allora
||Te|| =
µ
sup
||x1 ⊕x2 ||=1
0 T
T∗ 0
¶
e
∈R
||T x2 ⊕ T ∗ x1 || = ||T || · 1
Ora usiamo il
f
f
f
11.4.3 Lemma A1 ∩ Aaa = (A )1 ∩ (A )aa .
per dedurre che
eα
Te = s-lim A
α
eα ∈ A1 ∩ Aaa ). e quindi
(con A
eα )12 = T = E1 TeE2 = s-lim E1 A
eα E2
s-lim(A
α
eα )12 ∈ A1 il che conclude la dimostrazione.
e quindi (A
Resta da provare il lemma: basta trovare una funzione
f : Raa −→ R1 ∩ Aaa
tale che
• f è suriettiva;
• f è fortemente continua;
• f (Aaa ) ⊂ A1 ∩ Aaa ;
• la restrizione f |R1 ∩Raa è biunivoca.
424
Capitolo 11. Algebre di von Neumann
In effetti, se questo è vero allora T ∈ R1 ∩ Raa è limite forte di Aα ∈ A1 ∩ Aaa ,
dato che T = f (S) con S ∈ R1 ∩ Raa ⊂ Raa ; ma
f
Raa = (A )aa = Aaa
f
(la seconda uguaglianza è un risultato noto). Quindi esistono Bα ∈ Aaa tali che
S = s-lim Bα
α
e dunque
f (S) = s-lim f BAα )
α
(per la (2)); ma f (Bα ) ∈ A1 (per la (3)) e quindi S è limite forte di Aα ∈ A1 ∩ Aaa
(per la (4) dimostrare il risultato per S o T è la stessa cosa).
Non resta quindi che trovare una funzione con le proprietà (1)–(4). Se
f (t) :=
2t
t∈R
1 + t2
allora f : R −→ [−1, 1] è una funzione continua tale che f (0) = 0 e, ristretta
all’intervallo [−1, 1] è un omeomorfismo, cioè esiste una funzione g tale che
f |[−1,1] = g
Se ora A è autoaggiunto allora f (A) = f (A)∗ e ||f (A)|| ≤ 1 (teorema spettrale),
||.||
sicché f (A) ∈ A . Ma, ricordando che
A1
||.||
= (A
||.||
)1
possiamo assumere f (A)∈A1 , ed analogamente per R, quindi la funzione soddisfa
le (1), (3) e (4). Dimostriamo per essa anche la (2).
Dobbiamo cioè far vedere che per ogni seminorma p della topologia forte
esiste una seminorma p0 (della topologia forte) tale che, se p(Ts ) < 1 allora
p(f (T ) − f (S)) < 1.
Basta per questo prendere p in una sottobase di seminorme:
f (T ) − f (S) = (I + T 2 )−1 2T − (I + S 2 )−1 2S
= (I + T 2 )−1 2T (I + S 2 )(I + S 2 )−1
− (I + T 2 )−1 (I + T 2 )2S(I + S 2 )−1
¡
¢
= 2(I + T 2 )−1 T (I + S 2 ) − (I + T 2 )S (I + S 2 )−1
(si rammenti che S, T commutano col loro calcolo funzionale). Ma
(T (I + S 2 ) − (I + T 2 )S) = T − S + T (S − T )S
425
11.4. Teoremi di Densità
e quindi, dato che ||f (T )|| ≤ 1 e ||(I + T 2 )−1 || ≤ 1 (essendo T autoaggiunto):
||(f (T ) − f (S))x|| ≤ 2||(T − S)z1 || + ||(S − T )z2 ||
(con z1 = (I + S 2 )−1 x e z2 = 2S(I + S 2 )−1 x). Questo conclude la dimostrazione
del lemma, e quindi del teorema.
qed
Traiamo ora qualche conseguenza dai teoremi di densità appena dimostrati.
Sia A ⊂ B(H) una sottoalgebra degenere e si consideri la proiezione
E0 = EAH
Allora A|E0 H è non degenere e
A|(I − E0 )H = 0
µ
¶
0 0
Infatti se A0 = A|E0 H, dato che H = E0 H ⊕ (I − E0 )H allora A =
.
0 A0
Applicando il teorema di densità di von Neumann: A000 = A0 otteniamo
¶
µ
¶
µ
0 0
0 0
= A000 ⊕ 0
A=
=⇒ A =
0 A000
0 A0
come segue dalla decomposizione H = E0 H ⊕ (I − E0 )H.
Dunque per ogni *-sottoalgebra A ⊂ B(H) le chiusure nelle topologie debole,
forte, ultraforte, ultradebole e uniforme coincidono:
f
d
A =A =A
uf
=A
ud
=A
||.||
Scriviamo quindi semplicemente A.
Inoltre A00 = C · I ⊕ A000 e quindi 0 ⊕ I = E0 ∈ A, da cui segue che A ( A00
(strettamente) se A è degenere e A contiene una identità E0 che non è I.
11.4.4 Corollario Se R ⊂ B(H) è un’algebra di von Neumann e J un suo ideale
bilatero chiuso5 e se E0 = EJH allora E0 ∈ J ne è l’identità. In particolare
J è proprio ⇐⇒ J è degenere
(altrimenti E0 = I ∈ R).
5
Abbiamo osservato che le chiusure nelle varie topologie coincidono, quindi non è necessario
specificare quale.
426
Capitolo 11. Algebre di von Neumann
11.4.5 Proposizione Se J ⊂ R è uno *-ideale bilatero chiuso nell’algebra di
Von Neumann R allora esiste un idempotente autoaggiunto E0 ∈ R ∩ R0 =: Z(R)
(centro dell’algebra di von Neumann) tale che J = RE0 .
Dimostrazione: Sappiamo per il corollario che E0 è l’identità di J e quindi
E0 A = AE0 per ogni A ∈ J; dunque, se A ∈ R:
AE0 ∈ J
E0 A ∈ J
)
⇒ E0 AE0 = AE0 ⇒ E0 A = AE0
Dunque RE0 ⊂ J ⊂ RE0 (dato che A = AE0 ).
qed
11.4.6 Corollario Se R ha centro banale6 , cioè R ∩ R0 = C · I allora R è
una C*-algebra semplice, i.e. non possiede ideali bilateri ultradebolmente chiusi
propri).
11.5
Cenni sulla teoria dei fattori
Le algebre di von Neumann con centro banale si dicono fattori e sono di
fondamentale importanza nella teoria: infatti già nei lavori che gettarono le basi della teoria, von Neumann e Murray dimostrarono che ogni algebra di von
Neumann si spezza in (integrale diretto di) fattori, che quindi costituiscono “i
mattoni” con i quali ogni algebra di Von Neumann può essere costruita, e stabilirono una classificazione parziale di questi fattori, la cui struttura è governata
in una certa misura dagli operatori di proiezione che contengono; non possiamo
soffermarci su questa teoria vasta quanto affascinante: ci limitiamo a citare i
risultati fondamentali senza dimostrazione.
Consideriamo le algebre di von Neumann rappresentate come algebre di operatori limitati R autoaggiunte (R ⊂ R∗ ) debolmente chiuse in B(H) e contenenti
l’identità.
Prima di procedere alla discussione dei fattori vediamo perché basta limitarsi
a questo caso; se H è uno spazio di Hilbert separabile e F è l’insieme di tutti
i fattori in B(H) allora esiste su F una σ-algebra boreliana; se (X, A, µ) è uno
spazio di probabilità (che immaginiamo come insieme di indici) e x 7−→ M(x)
una funzione boreliana da X a F, possiamo definire una C*-algebra i cui elementi
siano le mappe boreliane essenzialmente limitate m : x 7−→ m(x) ∈ M(x).
6
Un’algebra di von Neumann contiene sempre almeno C dato che contiene l’identità.
11.5. Cenni sulla teoria dei fattori
427
Questa C*-algebra è in realtà un’algebra di von Neumann che si dice integrale
diretto della famiglia {M(x)}x∈X rispetto alla misura µ,e si scrive
Z
M=
M(x)dµ(x)
X
von Neumann ha dimostrato il seguente
11.5.1 Teorema Ogni algebra di von Neumann M su uno spazio di Hilbert
separabile è algebricamente isomorfa a un integrale diretto di fattori.
Con questo von Neumann mostrò che la teoria dei fattori (da lui sviluppata
con Murray) bastava alla descrizione delle algebre di Von Neumann.
Ricordiamo che se E è una proiezione (in uno spazio di Hilbert) allora è
minimale in un’algebra di von Neumann R di operatori di H se E 6= 0 e per ogni
F ∈ R proiezione, da F ≤ E (i.e. F E = F ) segue che F = E oppure F = 0.
Se E, F sono proiezioni in R, le diciamo equivalenti se esiste qualche V ∈ R
tale che V V ∗ = E e V ∗ V = F , e scriviamo E ∼ F . Se E è equivalente ad una
proiezione F ≤ G si scrive E - G.
11.5.2 Definizione Una proiezione E in un’algebra di von Neumann si dice
infinita se è equivalente ad una proiezione F < E; altrimenti si dice finita.
Se R è un fattore, ogni proiezione non nulla ha una sottoproiezione equivalente
non nulla: in altri termini, in un fattore, due proiezioni E, F soddisfano una
“dicotomia”: o E - F oppure F ≺ E.
Il primo risultato fondamentale è il seguente
11.5.3 Teorema Se un fattore M contiene una proiezione minimale allora è
isomorfo all’algebra B(H0 ) di un certo spazio di Hilbert H0 la cui dimensione
hilbertiana è il numero di proiezioni minimali di M contenute in una famiglia
ortogonale massimale di proiezioni minimali.
Se M è un fattore e E0 ∈ M è una proiezione finita non nulla (ammesso che
esista) possiamo assegnare alla classe di equivalenza delle proiezioni a lei equivalenti “dimensione 1”: confrontata con questa proiezione, ogni altra proiezione
del fattore possiede una dimensione d(E) ∈ [0, ∞].
11.5.4 Definizione Sia M un fattore:
• Se M possiede, come nel teorema precedente, una proiezione minimale E0 ,
assegnamole dimensione 1: quindi, per ogni altra proiezione E abbiamo
che d(E) ∈ {0, 1, 2, 3, ..., n} (ove n ∈ N ∪ {∞}); in questo caso M si dice un
fattore di tipo In .
428
Capitolo 11. Algebre di von Neumann
• Se M non possiede proiezioni minimali e l’elemento I è finito (non è equivalente ad una proiezione E < I), poniamo d(I) = 1: quindi, per ogni altra
proiezione E abbiamo che d(E) ∈ [0, 1] e M si dice un fattore di tipo II1 .
• Se M non possiede proiezioni minimali e l’elemento I è infinito allora per
ogni proiezione E abbiamo che d(E) ∈ [0, ∞] e M si dice un fattore di tipo
II∞ .
• Se M non possiede proiezioni finite non nulle si pone, per ogni E 6= 0:
d(E) = ∞ e M si dice un fattore di tipo III.
11.5.5 Esempio
• Un fattore di tipo In (n < ∞) è l’algebra delle matrici M = Mn (C).
• Un fattore di tipo I∞ è B(H) (spazio di Hilbert separabile). Quest’ultimo
dovrebbe essere l’analogo di dimensione infinita di un fattore di tipo In ;
tuttavia esiste una forte analogia fra i fattori In e II1 , che manca con quelli
di tipo I∞ : l’esistenza di una traccia.
Se M è di tipo In e A ∈ M allora possiamo considerare la sua decomposizione
spettrale e definire la sua traccia come
Z
||A||
τ (A) =
λd(dE(λ))
−||A||
(ove d(E) è la dimensione della proiezione: d(I) = 1). Si tratta di un funzionale
lineare su M ed il nome si giustifica per via della
τ (A) =
1
tr(A)
2
Se M è di tipo II1 possiamo definire allo stesso modo la traccia ed otteniamo di
nuovo un funzionale lineare: la sua additività è tuttavia non banale da dimostrare
(Teorema di Murray).
11.5.6 Teorema (Murray–von Neumann) Se M è un fattore di tipo II1
allora esiste un unico funzionale τ ∈ M∗ tale che
• τ (I) = 1
• τ (AB) = τ (BA)
• τ (A∗ A) ≥ 0
11.5. Cenni sulla teoria dei fattori
11.5.7 Esempio
allora
7
429
Se G è un gruppo (discreto) di ordine numerabile e H = l2 (G)
Lg ϕ(h) = ϕ(g −1 h)
è un operatore unitario in l2 (G).
Consideriamo la chiusura forte L della sottoalgebra di B(l2 (H)) generata dalla
famiglia {Lg }g∈G : vige il seguente
11.5.8 Teorema L è un fattore se e solo se tutte le classi coniugate (a parte
{e}) del gruppo G sono insiemi infiniti. In questo caso L è di tipo II1 .
11.5.9 Esempio Il gruppo S(∞) delle applicazioni biunivoche di N in sé che
spostano solo un numero finito di elementi è un fattore di tipo II1 .
Diamo ora un esempio di fattore di tipo II∞ : partiamo da un fattore M di
e è la somma diretta numerabile di
tipo II1 e supponiamo che M ⊂ B(H); se H
copie di H, allora possiamo far agire una matrice infinita
A11 A12 ...
A21 A22 ...
..
.. . .
.
.
.
ove Aij ∈ M, per moltiplicazione a sinistra sui “vettori infiniti” ad elementi in H.
Denotiamo con M ⊗ B(K) le matrici di questo tipo che sono operatori limitati
e
su H.
11.5.10 Teorema M ⊗ B(K) è un fattore di tipo II∞ e viceversa ogni fattore di
tipo II∞ è di questa forma.
I fattori di tipo III, che sono sfuggiti per molto tempo alla comprensione degli
studiosi, sono più ardui a costruirsi.
Per i fattori esiste una teoria della molteplicità spettrale, che conduce a
risultati di isomorfismo: ne diamo un esempio.
Se R agisce su H (separabile!) e x ∈ H, le proiezioni Ex0 e Ex con immagini
hRxi ⊂ R0 e hR0 xi ⊂ R (R0 è il commutante: si rammenti il teorema di densità
R00 = R).
7
von Neumann, oltre alle motivazioni legate ai fondamenti della Meccanica Quantistica,
gettò le basi della teoria dei fattori per affrontare lo studio delle algebre di gruppo dei gruppi
discreti.
430
Capitolo 11. Algebre di von Neumann
11.5.11 Teorema (Murray–von Neumann) Se M è un fattore di tipo II1 ,
il numero
d(Ex )
c(M, M0 ) := 0 0
d (Ex )
non dipende da x.
Questa costante si dice costante di accoppiamento; se M è di tipo In e M0 di
tipo Im allora il teorema vale ed afferma che
c=
m
n
Se M0 è di tipo II∞ , d0 ha senso solo a meno di un multiplo positivo e quindi
c(M, M0 ) è indefinito.
11.5.12 Teorema Due fattori di tipo II1 che agiscano su uno stesso spazio di
Hilbert separabile sono unitariamente equivalenti se e solo se hanno la stessa
costante di accoppiamento oppure se ambedue i commutanti sono di tipo II∞ .
Questi risultati sono solo la punta dell’iceberg: per una immersione più approfondita nella teoria si può ad esempio consultare [12].
Capitolo 12
TEORIA DELLE RAPPRESENTAZIONI
In questo capitolo studiamo le rappresentazioni delle C∗ -algebre non necessariamente commutative: la teoria commutativa è stata sviluppata nel capitolo
precedente, mentre qui ci occuperemo della ben più complicata situazione nel
caso non commutativo.
12.1
Irriducibilità di rappresentazioni
Ricordiamo la definizione fondamentale
12.1.1 Definizione Una rappresentazione di una C*-algebra A è uno spazio di
Hilbert H dotato di uno *-morfismo di C*-algebre:
π : A −→ C(H)
Se π è isometrica, la rappresentazione si dice fedele.
Dimostreremo in séguito che una C*-algebra ammette rappresentazioni fedeli.
Se A è una C*-algebra e π : A −→ B(H) una rappresentazione, allora, per un
sottospazio vettoriale chiuso M di H sappiamo già che le seguenti affermazioni
si equivalgono:
• M è π-stabile (i.e. π(A)M ⊂ M ).
• M ⊥ è π-stabile.
• EM ∈ π(A)0 .
• π∼
= π|M ⊕ π|M ⊥ .
12.1.2 Definizione Una rappresentazione π si dice topologicamente irriducibile
se non ha sottospazi chiusi e π-stabili oltre a 0 e H.
431
432
Capitolo 12. Teoria delle rappresentazioni
12.1.3 Lemma (Schur) π è irriducibile se e solo se π(A)0 = C · I.
Dimostrazione: π(A)0 è un’algebra di von Neumann e quindi è il sottospazio
di Banach di B(H) generato dagli idempotenti autoaggiunti che sono proiettori
ortogonali sui sottospazi chiusi π-stabili: cioè solo su 0 e H, quindi gli unici tali
proiettori sono 0 e 1, e l’algebra da loro generata è C · 1.
qed
12.1.4 Corollario Se π : A −→ B(H) è una rappresentazione allora sono
equivalenti le
• π è (topologicamente) irriducibile;
uf
• π(A)
= B(H);
f
• π(A1 ) = B(H)1 .
• Ogni x ∈ H \ 0 è ciclico per la rappresentazione π.
Dimostrazione: Per l’equivalenza delle (1)–(3) basta notare che se π è irriducibile allora π(A) è non degenere e quindi π(A)uf = π(A)00 . Ma π(A)0 = C·I e quindi π(A)00 = B(H). In modo analogo, usando il teorema di densità di Kaplanski
11.4.2, seguono le altre equivalenze.
La (4) equivale alla (3), dato che se Mx = π(A)x è π-stabile allora EMx ∈π(A)0 ;
ma se E ∈ π(A)0 e x ∈ H allora Ex = x e quindi π(A)x = Eπ(A)x; dunque
Mx = EH.
Ne segue che se E ∈π(A)0 è idempotente autoaggiunto Ex = x allora Ex ⊂ E;
ma se π è irriducibile Ex è 0 oppure I e quindi se π è irriducibile ogni vettore
non nullo è ciclico, mentre se π non è irriducibile non ogni vettore non nullo è
ciclico.
qed
Osserviamo inoltre che π è topologicamente irriducibile se e solo se per ogni
ε > 0, x ∈ H \ 0 e y ∈ H esiste un A ∈ A tale che
|π(A)x − y| < ε
Per una rappresentazione di un’algebra qualsiasi (non necessariamente normata)
esiste il concetto algebrico di irriducibilità: una tale rappresentazione è irriducibile se gli unici sottospazi π-stabile (anche non chiusi ) sono 0 e H. Ovviamente
l’irriducibilità algebrica implica quella topologica, e, per il lemma di Schur 12.1.3:
π algebricamente irriducibile ⇐⇒ ∀x 6= 0, y ∈ H ∃A ∈ A π(A)x = y
Non dobbiamo comunque preoccuparci delle rappresentazioni algebriche, come
mostra il seguente
12.1. Irriducibilità di rappresentazioni
433
12.1.5 Teorema (Kadison) Una rappresentazione π di una C*-algebra A è
topologicamente irriducibile se e solo se è algebricamente irriducibile.
Dimostrazione: Una delle implicazioni è ovvia: dimostriamo quindi che una
rappresentazione topologicamente irriducibile lo è anche algebricamente.
Il sottospazio π(A) è chiuso in norma per ogni π; denotiamo π(A) ⊂ B(H)
ancora con A e scriviamo moltiplicativamente l’azione della rappresentazione:
Ax = π(A)x; supponiamo ora che
A0 = C · I
Vogliamo dimostrare che per ogni x 6= 0 e y∈H esiste un A∈A tale che Ax = y (il
che, come si è osservato esprime l’irriducibilità algebrica della rappresentazione).
Se y = 0 è A = 0 quindi possiamo supporre anche y 6= 0 e, normalizzando:
||x|| = ||y|| = 1
L’operatore
Ty,x (z) := (x, z)y
è lineare e continuo di norma 1, e tale che Ty,x (x) = y. Dunque esiste un A1 ∈ A1
tale che
1
||A1 x − y|| <
2
sostituendo y1 := −(A1 x − y) a y in questa maggiorazione si trova
||Ty1 ,x || <
1
2
Dunque esiste un A2 nella palla di raggio 1/2 di A tale che
||A2 x − y1 || <
1
22
Iterando il ragionamento otteniamo una successione di operatori An nella palla
di raggio 1/2n tali che
1
||An x − yn−1 || < n
2
ove
n−1
X
yn =
Ai x − y
i=1
Ma
∞
∞
¯¯ X
¯¯ X
¯¯
¯¯
||Ai || ≤ 2
Ai ¯¯ ≤
¯¯
i=1
i=1
434
Capitolo 12. Teoria delle rappresentazioni
e quindi la serie
P
i
Ai converge ad A ∈ A; allora
limn−→∞ yn
=
0
||
||
P
limn−→∞ ni=1 Ai − y = Ax − y
qed
Esistono delle generalizzazioni di questo risultato che ci limitiamo ad enunciare: la prima è dovuta a Dixmier
Teorema. Se π : A −→ B(H) è una rappresentazione irriducibile di una C*algebra A, T ∈ B(H) è un operatore di rango finito in H e N è un sottospazio
vettoriale di dimensione finita di H allora esiste un A ∈ A tale che ||A|| = ||T |N ||
e
π(A)|N = T |N
La seconda a Glimm e Kadison:
Teorema. Se nel teorema precedente T è autoaggiunto (risp. unitario) allora
anche A può scegliersi autoaggiunto (risp. unitario).
Per le dimostrazioni si rimanda a [7], § 2.8.
Sia A una C*-algebra e π1 , π2 rappresentazioni di A negli spazi di Hilbert
H1 , H2 . Definiamo l’insieme degli operatori di allacciamento:
(π1 , π2 ) := {T : H1 −→ H2 | T continuo e ∀A ∈ A T π1 (A) = π2 (A)T }
Notiamo che
π(A)0 = (π, π)
Ricordiamo che le rappresentazioni sono equivalenti, e si scrive π1 ∼
= π2 , se esiste
un operatore unitario U ∈ (π1 , π2 ).
12.1.6 Definizione Se (π1 , π2 ) = 0 le rappresentazioni si dicono disgiunte e si
scrive1 π1 ◦p π2 .
12.1.7 Lemma Se π1 , π2 , π3 sono rappresentazioni di una C*-algebra A allora:
• (π1 , π2 )∗ = (π2 , π1 ).
• (π2 , π3 )(π1 , π2 ) ⊂ (π1 , π3 ).
• (π1 , π2 )∗ (π1 , π2 ) ⊂ π1 (A)0 e (π1 , π2 )(π1 , π2 )∗ ⊂ π2 (A)0 .
1
Seguendo George Mackey.
12.1. Irriducibilità di rappresentazioni
435
Dimostrazione: Sia T ∈ (π1 , π2 ): allora la (1) segue da
(T π1 (A∗ ))∗ = (π2 (A∗ )T )∗
Se R ∈ (π2 , π3 ) allora RT ∈ (π1 , π3 ) il che dimostra la (2). Infine la (1) e la (2)
implicano direttamente la (3).
qed
12.1.8 Lemma (Schur) Se π1 , π2 sono rappresentazioni della C*-algebra A e
se (π1 , π2 ) 6= 0 allora esistono due sottospazi vettoriali chiusi M1 ⊂ H1 e N ⊂ H2
tali che π1 M1 ⊂ M1 e π2 M2 ⊂ M2 e
π 1 | M1 ∼
= π2 |M2
Dimostrazione: Consideriamo un operatore non nullo T ∈ (π1 , π2 ) e la sua
decomposizione polare T = V |T |; dimostriamo che
|T | ∈ π1 (A)0
e
V ∈ (π1 , π2 )
Dato che T è di allacciamento, si ha che
T ∗ T ∈ π1 (A)0
e
T T ∗ ∈ π2 (A)0
e quindi, per ogni x ∈ H1 :
(x, T ∗ T x) = (T x, T x) ≥ 0
dunque T ∗ T ≥ 0; abbiamo allora B = |T | autoaggiunto e positivo tale che
B 2 = T ∗ T , i.e. |T | ∈ π1 (A)0 .
Quindi
V |T |π1 (A) = π2 (A)V |T |
i.e. per ogni x
(V π1 (A) − π2 (A)V )|T |x = 0
Ma la chiusura del sottospazio {|T |x} è (ker T )⊥ , e ker T è un sottospazio π1 stabile, dato che T ∈ (π1 , π2 ). Quindi in H1 :
(V π1 (A) − π2 (A)V ) = 0
e V è di allacciamento, V V ∗ ∈ π2 (A)0 , V ∗ V ∈ π1 (A)0 e
V V ∗ H2 = M2
e
V ∗ V H1 = M1
qed
436
Capitolo 12. Teoria delle rappresentazioni
12.1.9 Definizione Si dice che π1 è una sottorappresentazione di π2 se esiste
una isometria in (π1 , π2 ) e si scrive π1 ≤ π2 .
In altri termini, π1 ≤ π2 se
π1 ∼
= π2 |M
ove M è un sottospazio di H2 .
12.1.10 Definizione Si dice che π1 è quasi-contenuta in π2 se non esistono
sotto-rappresentazioni (a parte 0) di π1 disgiunte da π2 e si scrive π1 <
< π2 .
12.1.11 Definizione Si dice che π1 è quasi-equivalente a π2 se π1 << π2 e
π2 <
< π1 e si scrive π1 ≈ π2 .
Nota. Le nostre rappresentazioni saranno sempre non degeneri.
Se π1 , π2 sono rappresentazioni si A e π1 ∼
= π2 allora
π1 ⊕ π2 (A) = {T ⊕ U T U −1 | T ∈ π1 (A)00 }
Un elemento di questo spazio è limite forte di elementi della forma
¶
µ
π1 (Aα )
0
0
π2 (Aα )
Se π1 ◦p π2 allora
π1 ⊕ π2 (A) = {T ⊕ R | T ∈ π1 (A)00 , R ∈ π2 (A)00 }
12.1.12 Proposizione
(µ
(π1 ⊕ π2 )(A)0 =
µ
Dimostrazione: Se B =
T S
S0 R
)
¶ ¯¯
¯ T ∈ (π1 , π1 ) = π10 , S ∈ (π1 , π2 ),
¯
¯ R ∈ (π2 , π2 ) = π20 , S 0 ∈ (π2 , π1 )
R11 R12
R21 R22
¶
allora per B ∈ (π1 ⊕ π2 )(A)0 :
Ei BEj = Rij ∈ (πi , πj ) = (π1 ⊕ π2 (A))0
Il viceversa è ovvio.
qed
12.1. Irriducibilità di rappresentazioni
437
12.1.13 Teorema Se π1 , π2 sono rappresentazioni (non degeneri) di A allora
π1 ◦p π2 ⇐⇒ π1 ⊕ π2 (A) = π1 (A) ⊕ π2 (A)
Dimostrazione: Osserviamo che
¶
µ
π1 (A)0
0
0
⇐⇒ π1 ◦p π2
(π1 ⊕ π2 )(A) =
0
π2 (A)0
Dato che
di π1 ⊕ π2 (A)00 è diagonale (commuta quindi almeno con
¶
¶ un
µ elemento
µ
I 0
0 0
) allora
e
0 0
0 I
µ
¶
T1 0
00
T ∈ π1 ⊕ π2 (A) ⇐⇒ T =
0 T2
¶
µ
R 0
commuta con T se T1 commuta con R e
ove un elemento della forma
0 S
T2 commuta con S. Quindi
)
(µ
¶ ¯¯
T
0
¯
1
π1 ◦p π2 ⇐⇒ π1 ⊕ π2 (A) = π1 ⊕ π2 (A)00 =
¯ T ∈ πi (A)00
0 T2 ¯ i
qed
Osserviamo che se ker π1 = ker π2 allora esiste uno *-isomorfismo di C*algebre
ρ : π(A) −→ π2 (A)
12.1.14 Definizione Se π è una rappresentazione di una C*-algebra A e n è
un numero cardinale, definiamo
M
nπ :=
πα
α∈A
ove A è un insieme qualsiasi con Card(A) = n e ciascuna πα è una copia della
rappresentazione π.
12.1.15 Teorema Se π1 , π2 sono rappresentazioni di A allora sono equivalenti
le
• π1 ≈ π2 (quasi-equivalenza).
• Esiste un numero cardinale n tale che nπ1 ∼
= nπ2 .
438
Capitolo 12. Teoria delle rappresentazioni
• Esiste uno *-isomorfismo di C*-algebre ρ : π1 (A)00 −→ π2 (A)00 tale che
ρ ◦ π1 = π2
Osserviamo che la (3) equivale anche alla
(π1 ⊕ π2 )(A)00 = {T ⊕ ρ(T ) | T ∈ π1 (A)00 , ρ *-isomorfismo}
Di questo teorema non dimostreremo l’implicazione (3)⇒(2), che richiede alcuni
risultati sulle algebre di von Neumann, essenzialmente quello che enunciamo qui
di seguito:
Teorema. Se R1 e R2 sono algebre di von Neumann e ρ : R1 −→ R2 è uno
*-isomorfismo (suriettivo) allora
• ρ è un omeomorfismo rispetto alle topologie ultradeboli.
• Esiste un operatore unitario U che renda commutativo il seguente diagramma:
ρ
/R 3A
A ∈ R1
2
²
A ⊕ A ⊕ A ⊕ ··· ∈
Rℵ1 0
²
/ Rℵ0 3 A ⊕ A ⊕ A ⊕ · · ·
2
U
12.1.16 Esempio
• ρ(A) = U AU −1
• ρ(A) = A ⊕ A ⊕ A ⊕ ...
• ρ(A) = A|M ove M è un sottospazio stabile e tale che A|M = 0 se e solo se
A = 0, e EM ∈ R0 , con R0 M insieme totale.
Nel terzo esempio, ρ è uno *-isomorfismo se e solo se il minimo proiettore
ortogonale su R0 M (che si dice supporto centrale) è l’operatore identico I.
In un’algebra di von Neumann R consideriamo degli operatori {Eα } idempotenti, a due a due ortogonali, tali che
X
fortemente
Eα −−−−−−→ E ∈ R
α
12.1.17 Definizione ρ è normale se
!
Ã
X
X
Eα =
ρ(Eα )
ρ
α
α
439
12.1. Irriducibilità di rappresentazioni
12.1.18 Proposizione Se ρ : R1 −→ R2 è uno *-isomorfismo fra algebre di
Von Neumann, allora è normale.
P
Dimostrazione: Sia E = α Eα ; allora Eα ≤ E. Se E1 , E2 sono idempotenti
ortogonali fra loro, anche ρ(E1 ) e ρ(E2 ) lo sono, sicché
E1 ≤ E2 ⇒ ρ(E1 ) ≤ ρ(E2 )
Quindi
X
Eα ≤ E
X
e
α
ρ(Eα ) ≤ ρ(E)
α
Ma ρ è uno *-isomorfismo (suriettivo) e quindi:
F :=
X
Ã
ρ(Eα ) ≤ ρ
E=
X
!
Eα
= ρ(E)
α
α
da cui
X
ρ−1 ρ(Eα ) ≤ ρ−1
α
X
ρ(Eα ) ≤ ρ−1 (F )
α
Dunque ρ(E) ≤ F ≤ ρ(E) (gli *-isomorfismi conservano le disuguaglianze di
operatori), cioè F = ρ(E).
qed
Consideriamo un controesempio: sia R = L∞ ([0, 1]), e ω ∈ σ(R); se f ∈ R
poniamo
ρ(f ) := f ⊕ ω(f ) ∈ R ⊕ C
Si tratta di uno *-isomorfismo che tuttavia non è ultradebolmente continuo: si
noti che questo è perfettamente compatibile col risultato precedente, dato che ρ
non è normale e dunque im ρ non è un’algebra di von Neumann.
Affrontiamo ora la dimostrazione del teorema 12.1.15.
(1)⇒(3) Consideriamo lo spazio M π2 -stabile e E = EM ; se T ∈(π1 , π2 ) allora
E ◦ T ∈ (π1 , π2 |M ); viceversa, se T0 ∈ (π1 , π2 |M ) allora T0 ∈ (π1 , π2 ): quindi
E(π1 , π2 ) = (π1 , π2 |M )
ne segue che
(π1 , π2 )H1
π1 ≈ π2 ⇐⇒
(π2 , π1 )H1
)
sono totali nei rispettivi
spazi di Hilbert
440
Capitolo 12. Teoria delle rappresentazioni
P
Ora consideriamo i Ri Xi (con Xi ∈ H1 e Ti ∈ (π1 , π2 )): in virtù dell’equivalenza
precedente, lo spazio di questi elementi è denso in H2 , quindi
X
X
X
π2 (A)y =π2 (A)
Ti Xi =
π2 (A)Ti Xi =
Ti π1 (A)Xi
i
i
e dunque, se
ρ(T )y :=
i
X
Ti T Xi
i
(T ∈ π1 (A)00 ) allora
||ρ(T )y||2 ≤ ||T ||2 ||y||2
(†)
il che significa he ρ(T ) è un operatore lineare ben definito e continuo (ed ovviamente uno *-omomorfismo). Definiamo ora ρ0 scambiando nella definizione di ρ
il ruolo di π1 e π2 ; si noti che allora ρ−1 = ρ0 , quindi ρ è invertibile e risulta uno
*-isomorfismo. Non resta dunque da dimostrare che la (†).
Notiamo che
X
¯¯2 X
¯¯ X
¯¯
(Ti T Xi , Tj T Xj ) =
Ti T Xi ¯¯ =
(T Xi , Ti∗ Tj T Xj )
i,j
i
e quindi che
||T ||2
i,j
X
X
(Xi , Ti∗ Tj Xj ) −
(T Xi , Ti∗ Tj T Xj )
i,j
=
X¡
i,j
||T ||2 (Xi , Ti∗ Tj Xj ) − (T λi , Ti∗ Tj Ti Xj )
¢
i,j
è positiva (il che ci fornisce la diseguaglianza voluta): infatti Ti∗ Tj ∈(π1 , π2 ) quindi
commuta con T , e
´
X³
2
∗
∗
||T || (Xi , Ti Tj Xj ) − (T λi , Ti Tj Ti Xj ) =
i,j
=
X
(Xi , TI∗ Tj (||T ||2 I − T ∗ T )Xj )
i,j
=
X
(B ∗ Xi , Ti∗ Tj BXj ) =
i,j
= ||
X
X
(Ti B ∗ Xi , Tj BXj )
i,j
Ti BXi || ≥ 0
2
i
(ove (||T ||2 I − T ∗ T ) che figura al secondo membro è un elemento positivo dell’algebra di von Neumann che è della forma B ∗ B, con B ∈ π1 (A)00 ).
qed
441
12.2. Stati e rappresentazioni
12.2
Stati e rappresentazioni
Consideriamo due rappresentazioni (come al solito non degeneri) π1 , π2 di una
C*-algebra A: allora
12.2.1 Proposizione
Ch(π1 , π2 )H1 i = H2 ⇐⇒ π1 <
< π2
(ove con ChSi denotiamo il sottospazio vettoriale generato dall’insieme S in uno
spazio di Hilbert).
Dimostrazione: Se
M := Ch(π1 , π2 )H1 i
ovviamente M è π2 -invariante:
T ∈ π2 (A)0 ⇒ T ∈ (π2 , π2 )
ma (π2 , π2 )(π1 , π2 ) ⊂ (π1 , π2 ) i.e. T M ⊂ M .
Dunque M è l’immagine di un operatore G idempotente autoaggiunto che
deve commutare con π2 (A):
M = GH2
e
G ∈ π2 (A)00
Ma π2 (A)M ⊂ M , dato che π2 (A)T X = T π1 (A)X ∈ M , sicché G ∈ π2 (A)0 , e
quindi
G ∈ π2 (A)0 ∩ π2 (A)00 = Z(π2 (A)00 )
Dunque, π1 ⊕ π2 ha la sottorappresentazione
(†)
π2 = π2 |GH2 ⊕ π2 |GH2⊥
che quindi è somma diretta di rappresentazioni quasi-contenute in π1 e disgiunte
da π1 .
Ne segue che, a meno che G = I (e quindi M = H2 ) non può aversi π1 <
< π2
e viceversa.
qed
Osserviamo che, se A = C(X) e π1 , π2 sono sue rappresentazioni in spazi di
Hilbert separabili allora
π1 ≈ π2 ⇐⇒ µb1 = µb2
(le misure associate basiche sono uguali). La decomposizione (†) precedente
diviene, a livello di misure, la decomposizione
µb2 = µ02 + µ002
con µ02 ¿ µb1 e µ002 ⊥µb1 .
442
Capitolo 12. Teoria delle rappresentazioni
Sia ora A una C*-algebra qualsiasi (con unità).
12.2.2 Definizione Un elemento A ∈ B(H) si dice positivo se per ogni x ∈ H:
(x, Ax) ≥ 0
e si scrive A ≥ 0.
Equivalentemente, A ≥ 0 è positivo se e solo se è autoaggiunto ed il suo
spettro è contenuto nel “semiasse positivo” [0, ∞], cioè se esiste B tale che A =
B ∗ B.
Quest’ultima caratterizzazione può scegliersi come definizione di positività in
una C*-algebra qualsiasi.
12.2.3 Definizione La parte positiva di una C*-algebra A è l’insieme
A+ := {B ∗ B | B ∈ A}
ed i suoi elementi si dicono positivi.
12.2.4 Lemma Se A è una C*-algebra con identità I e A1 , A2 ∈ A allora:
• σ(A1 A2 ) \ 0 = σ(A2 A1 ) \ 0.
• Se A1 , A2 ∈ A sono autoaggiunti, da σ(Ai ) ⊂ [0, ∞] segue che σ(A1 + A2 ) ⊂
[0, ∞].
Dimostrazione: (1) Sia λ 6= 0 un elemento del risolvente di A1 A2 :
R := (A1 A2 − λI)−1 ∈ A
Ma
dato che
(A2 A1 − λI)−1 = λ−1 (A2 RA1 − I)
(
(A2 RA1 − I)(A2 A1 − λI) = λI
(A2 A1 − λI)(A2 RA1 − I) = λI
Infatti
(A2 RA1 A2 A1 − λA2 RA1 − A2 A1 + λI) =
= A2 R(A2 A1 − λI)A1 − A2 A1 + λI
= A2 IA1 − A2 A1 + λI = λI
443
12.2. Stati e rappresentazioni
Analogamente per l’altra espressione.
(2) Ricordiamo intanto che
σ(B) ⊂ [0, ∞] ⇐⇒ ∀λ > 0 σ(λB) ⊂ [0, ∞]
Dunque possiamo scegliere λ in modo che ||λA1 ||, ||λA2 || ≤ 1 e
σ(λ(A1 + A2 )) ⊂ [0, ∞] ⇒ σ(A1 + A − 2) ⊂ [0, ∞]
e quindi supporre che sia
||A1 ||, ||A2 || ≤ 1
Dunque σ(Ai ) ∈ [0, 1] i.e. σ(I − Ai ) ∈ [0, 1].
Ora consideriamo Ti = I − Ai ; ovviamente
¯¯ 1
¯¯
¯¯
¯¯
1
¯¯
¯¯
¯¯
¯¯
¯¯ (T1 + T2 )¯¯ ≤ 1 =⇒ ¯¯I − (A1 + A − 2)¯¯ ≤ 1
2
2
il che implica σ(I − 12 (A1 + A2 )) ⊂ [0, ∞]. e quindi
µ
σ
¶
1
(A1 + A − 2) ⊂ [0, 2]
2
e
σ(A1 + A2 ) ⊂ [0, 4]
qed
12.2.5 Teorema
• A+ = {A ∈ A | A = A∗ e σ(A) ⊂ [0, ∞]}
• A+ è un cono, tale che
– A+ ∩ −A+ = 0.
– A+ + A+ ⊂ A + .
– R + · A+ ⊂ A + .
– A+ − A+ = {A ∈ A | A = A∗ }.
Dimostrazione: La (2c) segue dalla (1) in modo ovvio. Dimostriamo la (2d):
sia A = A∗ , e consideriamo le funzioni continue
(
|λ| se ± λ ≥ 0
f± (λ) :=
0
altrove
444
Capitolo 12. Teoria delle rappresentazioni
Ovviamente (f+ − f− )(λ) = λ e f± ≥ 0. Possiamo applicare il calcolo funzionale
continuo (dato che A è autoaggiunto) ottenendo
(f+ − f− )(A) = A
e
f± (A) = A±
ove A± è autoaggiunto con spettro positivo (teorema della mappa spettrale);
dunque, per ogni A autoaggiunto si ha A = A+ − A− ove A± ∈ {B ∈ A | B =
B ∗ e σ(B) ⊂ [0, ∞]}.
Quindi anche la (2d) segue dalla (1): dimostriamo quest’ultima. Che si abbia
A ⊃ {A | A = A∗ e σ(A) ⊂ [0, ∞]}
√
segue di nuovo dal calcolo funzionale continuo con f (λ) = + λ, λ ≥ 0; con
questa funzione si trova che f (A) = B è autoaggiunto e tale che B 2 = A (in
particolare B ∗ B = A).
Dimostriamo quindi l’inclusione opposta. Sia B ∗ B ∈ A+ : ovviamente B ∗ B
è autoaggiunto, e quindi il suo spettro è contenuto in R; calcoliamo su B ∗ B le
funzioni f± introdotte in precedenza, ottenendo:
B ∗ B = f+ (B ∗ B) − f− (B ∗ B) = u2 − v 2
(un operatore a spettro positivo è il quadrato di un operatore autoaggiunto). Ma
A+ A− = 0 e quindi uv = 0 che, con
vB ∗ Bv = v(u2 − v 2 ) = vu2 v − v 4
implica che vB ∗ Bv = −v 4 . Quindi se definiamo
A := Bv
otteniamo A∗ A = −v 4 . Ora, sappiamo dalla (1) del lemma che
σ(A∗ A) \ 0 = σ(AA∗ ) \ 0
pertanto, se σ(A∗ A) ⊂ [0, ∞] allora anche σ(AA∗ ) ⊂ [0, ∞], e, per A = Bv si
trova
σ(A∗ A) = σ(v 4 ) ⊂ [0, ∞] =⇒ σ(A∗ A + AA∗ ) ⊂ [0, ∞]
Dunque, scrivendo A = A1 + iA2 (Ai autoaggiunti) otteniamo
A∗ = A1 − iA2
A∗ A = A21 + A22 + i(A1 A2 − A2 A1 )
AA∗ = A21 + A22 − i(A1 A2 − A2 A1 )
445
12.2. Stati e rappresentazioni
cioè
A∗ A + AA∗ = 2(A21 + A22 )
e σ(A∗ A + AA∗ ) ⊂ [−∞, 0] i.e. σ(A21 + A22 ) ⊂ [−∞, 0]. Ma
σ(A21 ) ⊂ [0, ∞]
e
σ(A22 ) ⊂ [0, ∞]
e, per la (2) del lemma:
σ(A21 + A22 ) ⊂ [0, ∞]
Le due inclusioni dimostrate significano che
σ(A21 + A22 ) = 0
cioè che A21 +A22 è un operatore nilpotente (ed autoaggiunto), dunque A21 +A22 = 0
ovvero A1 = A2 = 0. Ne segue A = 0, e quindi. v = 0. Risulta dunque B ∗ B = u2 .
In definitiva ogni B ∗ B è autoaggiunto con spettro positivo e quindi
A+ = {A | A∗ A e σ(A) ⊂ [0, ∞]}
Questo dimostra la (1).
La (2a) segue immediatamente e, per la (2) del lemma, anche la (2b).
qed
Il cono A+ genera lo spazio degli elementi autoaggiunti.
12.2.6 Definizione f si dice hermitiano se f = f ∗ .
Osserviamo che, per ogni f ∈ A∗ :
1
1
f = (f + f ∗ ) + i (f − f ∗ )
2
2i
e quindi f si decompone in somma di hermitiani.
I funzionali lineari continui hermitiani formano uno spazio di Banach reale
∗
Ah , e, se A ∈ Aaa e f ∈ A∗h allora f (A) ∈ R. Se f ∈ A∗ allora si definisce
f ∗ (A) := f (A∗ )
Evidentemente ||f ∗ || = ||f ||, f ∗∗ = f e la mappa f 7−→ f ∗ è antilineare.
12.2.7 Definizione
• Se A e B sono autoaggiunti e se A − B ∈ A+ allora scriviamo A ≥ B.
• Il cono duale della C*-algebra A è l’insieme
A∗+ := {f ∈ A∗ | ∀A ∈ A+ f (A) ≥ 0}
446
Capitolo 12. Teoria delle rappresentazioni
Ovviamente
A∗+ ⊂ A∗h
e, se f ∈ A+ allora la mappa
(A, B) 7−→ f (A∗ B)
definisce una forma sesquilineare semidefinita positiva: ogni tale forma soddisfa
la disuguaglianza di Schwartz:
|f (A∗ B)|2 ≤ f (A∗ A)f (B ∗ B)
e
f ((αA + βB)2 (αA + βB)) ≥ 0
da cui segue
f (A∗ B) = f (AB ∗ A)
(per B = I si trova f ∈ A∗h ).
12.2.8 Teorema Un funzionale lineare f qualsiasi è positivo se e solo se è
continuo e f (I) = ||f ||.
Dimostrazione: Se f è positivo allora (ricordando che σ(A∗ A) ⊂ [0, ||A||2 ] e
dunque che ||A||2 I − A∗ A ∈ A+ ):
¡
¢
f ||A||2 I − A∗ A = ||A||2 f (I) − f (A∗ A)
cioè f (A∗ A) ≤ ||A||2 − f (I); ma
|f (A)|2 = |f (IA)|2 ≤ f (I)f (A∗ A) ≤ ||A||2 f (I)2
da cui la continuità di f . Che sia f (I) = ||f || segue da f (I) ≤ ||A||.
Viceversa, se f 6= 0 è continuo e f (I) = ||f ||, allora esiste un λ tale che
||λf || = 1, dunque possiamo assumere f (I) = 1. A questo punto la dimostrazione
del teorema si riduce a quella del lemma seguente:
12.2.9 Lemma Se ||f || = f (I) = 1 allora per ogni operatore normale A
f (A) ∈ {Conv σ(A)} =
\
{dischi chiusi contenenti σ(A)}
447
12.2. Stati e rappresentazioni
Dimostrazione: Si tratta di far vedere che per ogni λ∈σ(A) tale che |λ−z| ≤ a
si ha
|f (λ) − z| ≤ a
Ma A è normale, quindi anche (A − zI) lo è, sicché
||A − zI|| = spr(A − zI)
(raggio spettrale), pertanto
|f (A) − z| = |f (A − zI)| ≤ a
qed
12.2.10 Definizione Lo spazio degli degli stati della C*-algebra A è
S(A) := {f ∈ A∗+ | ||f || = 1}
12.2.11 Proposizione S(A)) è convesso, *-debolmente chiuso e compatto.
Dimostrazione: È un convesso dato che lo è A∗+ . Inoltre
S(A) =
\
{f ∈ A∗ | f (A∗ A) ≥ 0} ∩ {f | f (I) − 1 = 0}
a∈A
quindi è intersezione di insiemi *-debolmente chiusi. Infine è
S(A) ⊂ A∗1
(palla unitaria in A∗ ) che è un compatto di Hausdorff nella topologia *-debole
(teorema di Alaoglu 8.2.12); pertanto S(A) è compatto in quanto chiuso in un
compatto.
qed
Una conseguenza del teorema di Hahn–Banach è il
12.2.12 Teorema Se A ⊂ B sono C*-algebre con la stessa unità I e se ω∈S(A)
allora esiste un ω
e ∈ S(B) tale che ω
e |A = ω.
448
Capitolo 12. Teoria delle rappresentazioni
12.2.13 Esempio Si consideri una C*-algebra commutativa A e ϕ∈σ(A); allora
ϕ(A∗ A) = |ϕ(A)|2 ≥ 0
cioè ϕ è uno stato. Ne segue che, per ogni A ∈ A esiste ω ∈ S(A) tale che
ω(A∗ A) = ||A||2
Infatti A∗ A è autoaggiunto e genera la C*-algebra commutativa C ∗ (A∗ A, I) che
possiede uno stato ϕ (infatti σ(C ∗ (A∗ A, I)) ∼
= σ(A∗ A)), quindi esiste ϕ ∈ σ(A)
tale che ϕ(A∗ A) = ||A||2 . Usando il teorema precedente possiamo estendere ϕ e
ω.
Dato che lo spazio degli stati S(A) è un convesso compatto (in uno spazio
vettoriale topologico localmente convesso A∗ ), per il teorema di Krejn–Millman
8.3.10 l’insieme dei suoi punti estremali è non vuoto e:
S(A) = Conv(Extr(S(A)))
12.2.14 Definizione I punti estremali di S(A) si dicono stati puri; l’insieme
degli stati puri si denota con P(A).
b = B(ϕ)
b 2;
12.2.15 Esempio Se A è commutativa allora per A = B ∗ B si ha Aϕ
inoltre, se f ∈A∗ , per il teorema di Riesz–Markov 9.2.2, esiste una misura regolare
positiva µ tale che
Z
f (A) =
b
A(ϕ)dµ(ϕ)
dunque
f ≥ 0 ⇐⇒ µ è positiva
12.2.16 Definizione Se ω, ϕ ∈ S(A) si dice che ω è uno stato dominato da ϕ
e scriviamo ω << ϕ se esiste una costante M ≥ 0 tale che
Mϕ − ω ≥ 0
L’insieme degli stati dominati da ϕ ∈ S(A) si denota con Cϕ .
Il seguente lemma mostra che gli stati puri corrispondono alle misure di Dirac
449
12.2. Stati e rappresentazioni
12.2.17 Lemma ω ∈ P(A) ⇐⇒ supp µω = {x}
Dimostrazione: Se il supporto della misura µω contiene almeno due punti
distinti ϕ1 , ϕ2 ∈ supp µω allora, dato che siamo in uno spazio di Hausdorff, per il
lemma di Urysohn 2.3.2 esiste una funzione continua f : σ(A) −→ [0, 1] tale che
f (0) = ϕ1 e f (1) = ϕ0 : in questo modo dµω = f dµω + (1 − f )dµω e
Z
Z
Z
b
b
b dµω = f1 (A) + f2 (A)
ω(A) = A(ϕ)dµω (ϕ) = A(1 − f )dµω + Af
(ove f1 , f2 sono funzionali positivi che possiamo normalizzare in modo da avere
Z
Z
ω(A) = (1 − f )dµ ω1 (A) + f dµ ω2 (A)
Quindi ω si decompone in combinazione convessa propria di due stati.
Viceversa, sia ω uno stato puro e dimostriamo che supp µω è ridotto ad un
punto. Questo segue da una osservazione generale: se A è una C*-algebra qualsiasi
e ω ∈ S(A) è tale che
ω = aω1 + bω2
Allora se B ∈ A+ :
con a, b ∈ [0, 1] e a + b = 1
(ω − aω1 )(B) ≥ 0
cioè aω1 ≤ ω (nell’ordinamento determinato da A+ ) e quindi
M ω :=
1
1
ω ≥ ω1 =⇒ ϕ − ω = bω
2
M
(il primo termine è positivo) con b = ||ϕ −
1
ω||.
M
Ne segue che
ϕ = aω + bω 0
(con a = 1/M ). Abbiamo quindi dimostrato il lemma, il cui enunciato è infatti
equivalente al seguente
ω ∈ P(A) ⇐⇒ l’unico stato dominato da ω è ω
qed
Possiamo ulteriormente parafrasare il lemma precedente nella
ω ∈ P(A) ⇐⇒ Cω = {ω}
450
Capitolo 12. Teoria delle rappresentazioni
12.2.18 Proposizione Se A è commutativa allora P(A) = σ(A).
Dimostrazione: Notiamo che
ϕ(A∗ A) = ϕ(A)∗ ϕ(A) = |ϕ(A)|2 ≥ 0
cioè, se ϕ ∈ σ(A) allora ϕ ∈ P(A).
Se viceversa ω ∈ S(A) abbiamo una misura µω tale che
Z
b
ω(A) =
A(ϕ)dµ
ω (ϕ)
σ(A)
Supponendo che µω sia concentrata in un punto vogliamo dedurre che ω è uno
stato puro; ma se ω << ω 0 allora per ogni insieme ∆ µω -misurabile abbiamo che
µω0 (∆) ≤ M µω (∆)
e quindi supp µω0 ⊂ supp µω che è un punto. Ma µω0 è una misura positiva
(normalizzata), quindi è una misura di Dirac.
qed
Ricordiamo che nel caso di una C*-algebra commutativa A avevamo la decomposizione dei funzionali f = f1 + if2 in funzionali hermitiani, con associata
decomposizione di misure positive supportate su insiemi disgiunti
dµfj = dµfj + − dµfj −
e dunque fj = fj+ − fj− e ||fj || = ||fj+ || + ||fj− ||.
12.2.19 Proposizione Se A è una C*-algebra qualsiasi e f = f ∗ un funzionale
allora esiste la decomposizione
f = f+ − f−
con f± ∈ A∗+
tale che ||f || = ||f+ || + ||f− ||.
Dimostrazione: Se A ∈ A consideriamo il funzionale
b :S(A) −→ C
A
ω 7−→ ω(A)
(si tratta di una generalizzazione della trasformata di Gel’fand), che è uno *c∗ = A
b∗ ed è continuo: |ω(A)| ≤ ||A||.
omomorfismo: A
451
12.2. Stati e rappresentazioni
La mappa
f : Aaa −→ CR (S(A)) := {fS (A) −→ R | f continua}
b
A 7−→ A
è un isomorfismo isometrico di spazi di Banach, dato che
b = sup |ω(A)| = ||A||
||A||
ω
Dimostriamo in effetti che esiste un ω tale che
|ω(A)| = ||A||
Se A := C ∗ hA, Ii ∼
= C(σ(A)) è la C*-algebra (commutativa) generata dall’operatore autoaggiunto A, dato che spr(A) = ||A|| (essendo autoaggiunto) i casi
sono due: o ||A|| ∈ σ(A) oppure −||A|| ∈ σ(A). Ma in entrambi questi casi esiste
uno stato su A che, calcolato in A, valga ||A|| oppure −||A||: estendendo questo
stato ad A si ottiene ω.
Ora torniamo a considerare la mappa f e consideriamone l’immagine X: per
ogni f ∈ A∗ tale che f = f ∗ si ha che f (A) ∈ R se A = A∗ , cioè l’immagine fe di
f in X ∗ è tale che
fe(A) = f (A)
e che ||fe|| = ||f ||.
Allora, per il teorema di Hahn–Banach, fe ammette una estensione a CR (S(A))∗
e quindi esiste F ∈ CR (S(A))∗ tale che
³ ´
b = f (A)
||F || = ||fe|| = ||f ||
e
F A
Ad una tale F possiamo far corrispondere, mercé il teorema di Riesz–Markov, una
misura reale µ tale che (tenendo conto del teorema precedente di decomposizione
µ = µ+ − µ− , µ+ ⊥µ− ):
Z
Z
Z
F (g) = g(ω)dµ(ω) = g(ω)dµ+ (ω) − g(ω)dµ− (ω) := F+ (g) − F− (g)
ove ||F+ || + ||F− || = ||F || (dato che µ+ ⊥µ− ). Dunque
³ ´
³ ´
³ ´
b = F+ A
b − F− A
b =: f+ (A) − f− (A)
f (A) = F A
con f± funzionali lineari positivi e
||f± || = f± (I) =
Z
g(ω)dµ± (ω) = ||F± ||
452
Capitolo 12. Teoria delle rappresentazioni
Quindi
||f || = ||F || = ||F+ || + ||F− || = ||f+ || + ||f− ||
Per concludere non resta che definire
f± (A) := f± (A1 ) + if± (A2 )
qed
12.3
Il teorema di Gel’fand–Najmark–Segal
Affrontiamo ora un argomento fondamentale ed affascinante: la costruzione
di Gel’fand–Najmark–Segal (GNS).
Consideriamo una C*-algebra qualsiasi A con unità I ed una sua rappresentazione (non degenere) π in uno spazio di Hilbert H: riordiamo esplicitamente
che, dato che π è non degenere, abbiamo π(I) = I. Sia ora ξ ∈ H1 :
ω(A) := ωξ ◦ π(A) = (ξ, π(A)ξ)
è un funzionale lineare (lo è π) positivo: infatti
ω(A∗ A) = (ξ, π(A)∗ π(A)ξ) = (π(A)ξ, π(A)ξ) = ||π(A)ξ||2 ≥ 0
Inoltre (||ξ|| = 1 e π(I) = I):
ω(I) = ||ξ||2 = 1
Dunque ω ∈ S(A).
In realtà possiamo dimostrare molto di più:
12.3.1 Teorema (Gel’fand–Najmark–Segal) Se A è una C*-algebra con
unità I e ω ∈ S(A) esistono unici:
• uno spazio di Hilbert Hω ;
• una rappresentazione πω : A −→ B(Hω ) non degenere;
• un vettore ξ ∈ Hω di norma 1: ||ξ|| = 1;
tali che per ogni A ∈ A:
(ξω , πω (A)ξω ) = ω(A)
e
πω (ξω ) = Hω
(cioè ξω è ciclico per la rappresentazione πω ).
12.3. Il teorema di Gel’fand–Najmark–Segal
453
Dimostrazione: Prima di affrontare la dimostrazione del teorema, osserviamo
che se al posto di πω consideriamo la rappresentazione πξ := πω |πω (A) allora la
mappa πω 7−→ ω non cambia, e che l’unicità è data dalla ciclicità del vettore ξω .
Dimostriamo per prima cosa l’unicità della tripla (Hω , πω , ξω ).
Sia (H, π, ξ) un’altra tripla siffatta, e sia U0 l’operatore definito su π(A) e
tale che
∀A ∈ A U0 π(A)ξ = πω (A)ξ
(†)
Basta dimostrare che
(††)
||U0 π(A)ξ|| = ||πω (A)ξ||
per avere che U0 è ben definito ed isometrico. Ed infatti
||πω (A)ξ||2 = ω(A∗ A) = ||π(A)ξ||2
da cui segue (††).
f0 ovunque
Estendiamo a questo punto U0 in modo unico ad un operatore U
definito (ciò è possibile per la ciclicità di ξ e ξω ). Osservando che
U π(A)π(B)ξ = U π(AB)ξ = πω (A)U π(B)ξ
ed usando la ciclicità di ξ e la (†) otteniamo
U π(A) = πω (A)U
e U ξ = ξω .
Dunque la tripla (Hω , πω , ξω ) è unica a meno di equivalenze unitarie.
Dimostriamo ora l’esistenza di una tale tripla: prima considereremo lo schema
della dimostrazione, per passare poi nei dettagli. Sia ω ∈ S(A): allora su A∗
abbiamo la forma sesquilineare definita positiva
(A, B) 7−→ ω(A∗ B)
Questa forma induce, sul completamento dello spazio quoziente di A∗ modulo il
sottospazio generato dai vettori che sono nel nucleo della forma, una struttura
di spazio di Hilbert.
Infatti, se consideriamo l’ideale sinistro
Nω := {A ∈ A | ω(A∗ A) = 0}
sullo spazio A/Nω abbiamo il prodotto scalare
(A, B) := ω(A∗ B)
454
Capitolo 12. Teoria delle rappresentazioni
Ma A/Nω è un A-modulo (dato che Nω è un ideale) per tramite della rappresentazione regolare
π(A)B; = AB
(Si noti che, se B 0 = B allora B − B 0 ∈ Nω e quindi A(B − B 0 ) ∈ Nω , da cui
AB − AB 0 = 0).
Dunque completando lo spazio A/Nω rispetto a questo prodotto scalare otteniamo uno spazio di Hilbert Hω sul quale possiamo estendere unicamente π(A) ad
una rappresentazione πω (A). Considerando ξω = I abbiamo la terna (Hω , πω , ξω )
desiderata, dato che
(ξω , πω (A)ξω ) = (I, A) = ω(A)
Passiamo ora ai dettagli della dimostrazione: intanto dobbiamo verificare che
Nω è un ideale sinistro: di certo lo è l’insieme
Iω := {A ∈ A | ∀B ∈ A ω(BA) = 0}
Dimostriamo che si tratta esattamente di Nω . Se A ∈ Iω allora, per B = A∗ si
trova A ∈ Nω , i.e. Iω ⊂ NΩ .
Viceversa:
|ω(B ∗ A)| ≤ ω(B ∗ B)ω(A∗ A)
il che dà l’inclusione opposta. Quindi Nω = Iω è un ideale sinistro.
Verifichiamo ora che la posizione
π(A)B := AB
definisce effettivamente una rappresentazione (il che è ovvio) continua, cioè che
||π(A)B|| ≤ ||A|| ||B||
Questo segue dalla
(AB, AB) ≤ ||A||2 (B, B)
(†††)
Dimostriamola: si ha
(AB, AB) = ω((AB)∗ AB) ≤ ||A||2 ω(B ∗ B)
ove la disuguaglianza vale in quanto
ω((AB)∗ AB) = ω(B ∗ (A∗ A)B) ≤ ||A||2 ω(B ∗ B)
(si rammenti che siamo in una C*-algebra: ||A∗ A|| = ||A||2 ). Dunque
||A|| ||B|| − ||π(A)B|| = ω(B ∗ C ∗ CB) = ω((CB)∗ CB) ≥ 0
12.3. Il teorema di Gel’fand–Najmark–Segal
455
ove C ∗ C = ||A||2 I − A∗ A.
Quindi π(A) è un operatore lineare e continuo, ed inoltre
||π(A)|| ≤ ||A||
sicché, essendo definito su un sottoinsieme denso, π(A) si estende univocamente
ad un πω (A) tale che
||πω (A)|| ≤ ||A||
Osserviamo inoltre che
π(AB)C = (AB)C = A(BC) = π(A)π(B)C
e quindi, dato che è vera sul sottoinsieme denso, vale la
πω (AB) = πω (A)πω (B)
Infine, dato che
(C, πω (A∗ )B) = (C, A∗ B) = ω(C ∗ A∗ B)
= ω((AC)∗ B) = (AC, B) = (πω (A)C, B)
sempre per densità abbiamo
(x, πω (A∗ )y)) = (x, πω (A)∗ y)
Resta solo da osservare la ciclicità di ξω : ma questa segue immediatamente dalla
densità di πω (A)ξω = A/Nω .
qed
Una conseguenza notevolissima di questo importante risultato è la possibilità
di dimostrare che ogni C*-algebra ammette una rappresentazione fedele, cioè con
nucleo 0.
Consideriamo una C*-algebra A e A ∈ A: allora esiste uno stato ω ∈ S(A)
tale che ω(A∗ A) = ||A||2 , quindi, applicando la costruzione GNS, otteniamo una
famiglia di rappresentazioni
{πω }ω∈S(A)
mediante la quale possiamo definire la rappresentazione universale di A:
M
π
b :=
πω
ω∈S(A)
Questa sarà la rappresentazione fedele della nostra C*-algebra:
456
Capitolo 12. Teoria delle rappresentazioni
12.3.2 Teorema π
b è una rappresentazione isometrica.
Dimostrazione: Per ogni A ∈ A abbiamo:
||b
π (A)|| = ||A||
Infatti πω è una contrazione (3.2.7) e quindi anche la somma diretta2 delle πω lo
è: ||b
π (A)|| ≤ ||A||; dunque
||b
π (A)||2 = ||b
π (A∗ A)|| = ||A∗ A|| = ||A||2
Ma
||b
π (A)||2 = sup ||π(A)ξ||2
||ξ||=1
Ora, se poniamo
(
ξω
ξω :=
0
sulla ω-sima componente di π
b
sulle altre componenti di π
b
troviamo che
ξω ω 0 = δωω0 ξω
e quindi
(b
π (A)ξω )(ω 0 ) = δωω0 πω (A)ξω
pertanto
(ξω , π(A)ξω ) = ω(A)
Ne segue che
||b
π (A)ξω ||2 = ω(A∗ A) = ||A||2
cioè
||b
π (A)||2 = sup ||π(A)ξ||2 ≥ 0
||ξ||=1
il che finalmente ci dà la tesi: ||b
π (A)|| = ||A||.
qed
Osserviamo che la costruzione della rappresentazione universale è canonica,
nel senso che non dipende che da proprietà naturali della C*-algebra: tuttavia esistono altre costruzioni che, sebbene non canoniche, sono più semplici da
utilizzare.
2
Basti osservare che ogni rappresentazione di una C*-algebra è una contrazione.
12.3. Il teorema di Gel’fand–Najmark–Segal
457
12.3.3 Teorema (Segal) Se A ⊂ B sono C*-algebre con la stessa unità I
allora ogni stato puro di A si estende unicamente ad uno stato puro di B.
Dimostrazione: Consideriamo, fissato un ω ∈ P(A):
Cω := {ω 0 ∈ S(B) | ω 0 |A = ω}
Ovviamente Cω ⊂ S(B); inoltre Cω è un convesso, dato che
∀A ∈ A (aω 0 + bω 00 )(A) = ω(A)
(con a + b = 1) e Cω è l’intersezione di S(B) con l’insieme
\
{f ∈ B ∗ | f (A) = ω(A)}
A∈A
che è *-debolmente chiuso: dunque Cω pure è *-debolmente chiuso e quindi *debolmente compatto (dato che lo è S(B)). Allora il teorema di Krejn–Millman
garantisce l’esistenza di punti estremali in Cω .
Sia ω
b in tale estremale: dato che ω è uno stato puro, ω
b è estremale anche in
S(B): se infatti
ω
b = aω 0 + bω 00
(con ω 0 , ω 00 ∈ S(B) e ab 6= 0) allora |Eo0 , ω 00 ∈ Cω , dato che
(aω 0 + bω 00 )|A = ω(A) := ω
b |A = a + ω 0 |A + bω 00 |A
Ma ω è puro e quindi
ω 0 |A = ω 00 |A = ω
cioè ω 0 , ω 00 ∈ Cω . Dall’estremalità di ω
b segue allora che ω 0 = ω 00 .
qed
Prima di dimostrare il teorema di Segal che caratterizza gli stati puri come
quelli associati alle rappresentazioni irriducibili per tramite della rappresentazione GNS svolgiamo alcune osservazioni.
Ora consideriamo A separabile e quindi scegliamo {An } ⊂ A densa e {ωn }
successione di stati puri tali che
ωn (A∗n An ) = ||An ||2
Allora
π :=
M
π ωn
n
è tale che ||π(A)||2 = ||A||2 e lo spazio Hω della rappresentazione GNS è separabile, visto che contiene la successione densa {π(An )ξ}: dunque la rappresentazione
GNS è fedele in uno spazio di Hilbert separabile.
458
Capitolo 12. Teoria delle rappresentazioni
Se f ∈ A∗ allora esistono x, y tali che
f (A) = (x, π
b(A)y)
(∗)
Infatti f = f1 + if2 = a1 ω1 + ... + a4 ω4 (con fi hermitiani e ω ∈ S(A)); allora, per
x :=
4
X
ξωk
e
y :=
k=1
4
X
ak ξωk
k=1
si ha la (*): in effetti, per ogni ω ∈ S(A):
δωω0 ω(A) = (ξω , π
b(A)ξω )
12.3.4 Teorema (Segal) Uno stato ω è puro se e solo se la rappresentazione
GNS associata πω è irriducibile.
Dimostrazione: Dimostriamo che, posto Cω = {ϕ ∈ S(A) | ϕ ¿ ω} allora
ω ∈ P(A) ⇐⇒ Cω = {ω}
Ma π è irriducibile se e solo se π(A) = C · I (lemma di Schur 12.1.8) cioè
π(A)0+ = R+ · I, che è vero se e solo se
{T ∈ πω (A)0+ | (ξω , T ξω ) = 1} = {I}
Dunque ci basta far vedere che
∀ω ∈ S(A) Cω ≈ D := {T ∈ πω (A)0+ | (ξω , T ξω ) = 1}
ove ≈ indica un isomorfismo di insiemi convessi.
Dunque sia T ∈ D; allora la mappa
T 7−→ ϕT
ove ϕT (A) = (T ξω , πω (A)ξω ), è un funzionale lineare continuo su A, ed è (a)
positivo e (b) ϕT << ω.
Per T positivo abbiamo T = B ∗ B, con B ∈ πω (A)0 e quindi
πT (A∗ A) =(B ∗ Bξω , πω (A)∗ πω (A)ξω ) = (πω (A)Bξω , Bπω (A)ξω )
= ||Bπω (A)ξω ||2 ≥ 0
Dunque la (a); la (b) segue da
||Bπω (A)ξω ||2 ≤ ||B||2 ||πω (A)ξω ||2 = ||T ||ω(A∗ A)
12.3. Il teorema di Gel’fand–Najmark–Segal
459
La mappa T 7−→ ϕT è inoltre convessa, quindi, per concludere, dobbiamo solo
mostrare che è biunivoca.
Ma, se ξ è un vettore ciclico per πω (A) allora ξ è separante per πω (A)0 e
quindi, se ϕT1 = ϕT2 allora
∀A ∈ A ((T1 − T2 )ξ, πω (A)ξ) = 0
i.e. (T1 −T2 )ξ⊥πω (A)ξ e, per ciclicità: (T1 −T2 )ξ = 0. Un tale vettore è certamente
ξω : quindi possiamo dedurre T1 = T2 .
Sia infine ϕ ∈ Cω ; dimostriamo che esiste T ∈ D tale che ϕ = ϕT . Ma il
funzionale di due variabili
{πω (A)ξω (B)ξω } := ϕ(A∗ B)
è sesquilineare e ben definito: infatti ϕ << ω, quindi se ω(A ∗ A) = 0 allora
ϕ(A∗ A) = 0; per A = B si trova
{πω (A)ξω (A)ξω } ≤ M ω(A∗ A) = M ||πω (A)ξω ||2
(ove ϕ(A∗ A) ≤ M ω(A∗ A)). Quindi, per il teorema di rappresentazione di Riesz,
esiste un unico operatore lineare positivo T con ||T || ≤ M tale che
{πω (A)ξω (B)ξω } := ϕ(A∗ B) = (πω (A)ξω , T πω (B)ξω )
Per A = B = I si ha ovviamente 1 = (ξω , T ξω ).
Infine T ∈ π(A)0 , dato che ϕ(A∗ CB) = ϕ((C ∗ A)∗ B) e quindi
(πω (A)ξω , T πω (C)πω (B)ξω ) = (πω (CA)ξω , T πω (B)ξω )
qed
Si noti che l’operatore T considerato nella dimostrazione del teorema si comporta come una “derivata di Radon–Nikodym” della ϕT .
Si osservi inoltre che se π è una rappresentazione irriducibile di una C*algebra allora π ∼
= πω . Se A ⊂ B (con la stessa unità I) allora si può estendere ω
ad uno stato puro di B: infatti ω è puro per irriducibilità di π (il teorema appena
dimostrato) e quindi è estendibile a B; si consideri poi la rappresentazione GNS
associata a questo stato esteso ω
b in B. Allora Hω ,→ Hωb , dato che
b
∀B ∈ A (ξωb , πωb (B)ξωb ) = ω
b (B) = ω(B)
Cioè πωb |A è una rappresentazione (di A) che ristretta al sottospazio ciclico
generato da ξωb è ciclica per A ed induce lo stato ω: insomma, ritroviamo πω .
460
Capitolo 12. Teoria delle rappresentazioni
Consideriamo ora la rappresentazione universale π
b; se f ∈ A∗ allora
f (A) =< g, π
b(A)
ove g ∈ M0 ⊂ B(Hπb )∗ . Sia A è una *-sottoalgebra di B(H) e se U = M|A ⊂ A∗
(funzionali lineari ultradebolmente continui): allora
uf
12.3.5 Teorema U ∗ ∼
=A .
uf
Dimostrazione: Consideriamo R = A ; la mappa di restrizione R∗ −→ U:
f 7−→ f |A è un isomorfismo isometrico di spazi di Banach:
||f |A || = ||f ||
Per dimostrarlo basta applicare il teorema di densità di Kaplanski 11.4.2 ((A)1 =
A1 ):
||fA || = sup |f (A)| = sup |f (A)| = sup |f (A)| = ||f ||
A∈A1
A∈A1
A∈(A)1
qed
Si noti che se A è non degenere allora U ∼
= A via la mappa che a F associa
TF tale che
f (TF ) = F (f )
∗
00
(teorema di rappresentazione di Riesz).
Allora π(A)00 ∼
= Uπ∗ , ove Uπ∗ ⊂ A∗ è il sottospazio dei funzionali lineari
ultradebolmente continui in π:
Uπ∗ := {f ◦ π | f ∈ M ⊂ B(Hπ )∗ }
Infatti, se g ∈ A∗ allora π(A) 7−→ g(A) è ben definita (ker π ⊂ ker g) ed è
ultradebolmente continua dunque, per il teorema di Hahn–Banach, estendibile a
B(Hπ ). Quindi, per tramite della mappa F 7−→ T tale che
F (fx,y ◦ π) = x (T y)
otteniamo Uπ∗ ∼
= π(A)00 .
Le osservazioni precedenti implicano Uπb ∼
= A∗ :
12.3.6 Definizione L’algebra di von Neumann inviluppante di una C*-algebra
A è π
b(A)00 .
Si noti che, come spazi di Banach: π
b(A)00 ∼
= A∗∗ .
12.3. Il teorema di Gel’fand–Najmark–Segal
461
Se π è una rappresentazione ciclica di A allora π ≤ π
b: infatti se ξ è il vettore
ciclico e
ω(A) =: (ξ, π(A)ξ)
si ha (teorema GNS) π ∼
b.
= πω ≤ π
Quindi
Lemma. Ogni rappresentazione di una C*-algebra ha una sottorappresentazione
ciclica equivalente ad una sottorappresentazione della rappresentazione universale:
∀π π ¿ π
b
12.3.7 Teorema Se Z(b
π (A)00 ) = π
b(A)00 ∩ π
b(A)0 , allora gli idempotenti autoaggiunti di Z(b
π (A)00 ) sono in corrispondenza biunivoca con le rappresentazioni di
A in modo che
π ≈ π 0 ⇐⇒ Z(π) = Z(π 0 )
π << π 0 ⇐⇒ Z(π) ≤ Z(π 0 )
π ◦p π 0 ⇐⇒ Z(π)Z(π 0 ) = 0
Dimostrazione: Come noto, se π1 ¿ π2 allora esiste uno *-omomorfismo
normale ρ : π2 (A)00 −→ π1 (A)00 tale che
ρ ◦ π1 = π2
(In realtà questa è una caratterizzazione delle relazione di quasi-inclusione, ma
questo non l’abbiamo dimostrato).
Quindi, per il lemma, l’algebra di von Neumann inviluppante è tale che, per
ogni rappresentazione π esiste uno *-omomorfismo normale ρπ : π
b(A)00 −→ π(A)00
tale che
ρπ ◦ π
b=π
Il nucleo di ρπ è un ideale ultradebolmente chiuso, quindi (come segue dalla
proposizione 11.4.5) esiste un proiettore F ∈ Z(b
π (A)00 ); ponendo Z(π) = (I − F )
si ottengono le relazioni dell’enunciato.
qed
Osserviamo che, se ω è lo stato
ω(A) = (x, π
b(A)x)
ove x = ξbω e x(ω 0 ) = δωω0 ξω , pre B ⊂ B(H) non degenere e ω = ωx |B esiste
Eω ∈ B 00
più piccolo idempotente autoaggiunto di B00 che contenga x:
462
Capitolo 12. Teoria delle rappresentazioni
12.3.8 Proposizione Eω = EB0 x .
Dimostrazione: Si ha intanto Eω ∈ B 00 e Eω x = x (in quanto B è non degenere)
e quindi, se F = F ∗ = F 2 ∈ B00 è tale che
Fx = x
allora, per ogni T ∈ B 0 :
x ∈ FH ⇒ Tx = TFx = FTx ∈ FH
i.e. B 0 x ⊂ F H, onde E ≤ F .
qed
In altri termini, per ogni ω abbiamo identificato un idempotente autoaggiunto
Eω dell’algebra di von Neumann inviluppante
Eω = Eπb(A)0 ξωb
che è il più piccolo idempotente autoaggiunto di A∗∗ contenente ξbω .
Ma F ∈ A∗∗ se e solo se F ξbω = ξbω i.e.
(ξωb , F ξωb ) = 1
12.3.9 Proposizione
ω
b (F ) = 1
e quindi Eω è il più piccolo idempotente autoaggiunto F di A∗∗ = π
b(A)00 tale che
ω(F ) = 1, cioè che F (ω) = 1.
Dimostrazione: Se B ∈ π
b(A)00 e ω ∈ S(A) allora
∀A (ξbω , π
b(A)ξbω ) = ω(A)
e la mappa fξcω ,ξcω : B(Hπb ) −→ C determinata da
fξcω ,ξcω (T ) = (ξωb , T ξωb )
è debolmente continua e tale che
fξcω ,ξcω |πe(A)00
sia l’unica estensione debolmente continua del funzionale π
b(A) 7−→ ω(A); se
chiamiamo ω
e questa estensione allora ω
e (T ) = T (ω).
qed
12.3.10 Definizione La probabilità di transizione da uno stato ϕ a uno stato
ω è
Pϕ,ω := ω
e (Pω ) = Pω (ϕ)
463
12.4. Stati puri e rappresentazioni irriducibili
12.4
Stati puri e rappresentazioni irriducibili
Rammentiamo ora due fatti noti che utilizzeremo in forma di lemmi nella
dimostrazione del prossimo risultato:
12.4.1 Lemma
• Se A ⊂ B(H) è una *-sottoalgebra, R := A+ e f ∈ R∗ allora la mappa
f 7−→ f |A è una isometria.
• Inoltre se π1 , π2 sono rappresentazioni disgiunte di A allora
f
f
f
(π1 ⊕ π2 )(A) = π1 (A) ⊕ π2 (A)
12.4.2 Teorema (Glimm–Kadison) Se ω, ϕ ∈ S(A) sono stati tali che ||ω −
ϕ|| < 2 allora le rappresentazioni πω e πϕ non possono essere disgiunte.
Dimostrazione: Dimostriamo per assurdo che, se πω ◦p πϕ allora
||ω − ϕ|| = 2
(infatti si ha sempre ||ω − ϕ|| ≤ ||ω|| + ||ϕ|| = 2).
Ma sappiamo che πω ◦p πϕ equivale alla (2) del lemma, quindi I ⊕ (−I) ∈
f
f
πω (A) ⊕ πϕ (A) è limite forte di elementi di π(A) := πω (A) ⊕ πϕ (A).
Inoltre, per la (1) del lemma, se ξ = ξω ⊕ 0 e η = 0 ⊕ ξϕ allora
ω(A) = (ξ, π(A)ξ)
e
ϕ(A) = (η, π(A)η)
sicché
||ω − ϕ|| = ||(fξ,ξ − fη,η ) ◦ π|| = ||(fξ,ξ − fη,η )|π(A)00 ||
(dato che π(A1 ) = π(A)1 e per il teorema di Kaplanski 11.4.2).
Ma se πω ◦p πϕ allora (tenendo presente che fξ,ξ (I ⊕ 0) = fη,η (0 ⊕ −I) = 1):
||(fξ,ξ − fη,η )|π(A)00 || ≥< fξ,ξ − fη,η |I ⊕ (−I) >= 2
cioè ||ω − ϕ|| ≥ 2.
qed
464
Capitolo 12. Teoria delle rappresentazioni
Consideriamo ora ω = ωx (ove ||x|| = 1) e Pω ∈ R tale che
^
^
Pω = {P ∈ R | P x = x} = {P ∈ R | ω(P ) = 1} = ER0 x
Se inoltre
allora
Hω = {B ∈ R | ω(B ∗ B) = 0} = R(I − Pω )
ω(B ∗ B) = 0 ⇐⇒ BPω = 0
Infatti ω(B ∗ B) = 0 ⇐⇒ Bx = 0 ⇐⇒ ∀T ∈R0 T Bx = 0 ⇐⇒ B(T x) = 0 ⇐⇒
B|R0 x = 0 che, per la definizione di Pω , equivale a BPω = 0, cioè a B(I −Pω ) = B,
e quindi a B ∈ R(I − Pω ).
Osserviamo inoltre che, identificando gli spazi di Banach A∗∗ e π
b(A)00 :
ω
e (T ) = (ξbω , T ξbω ) = (η, T η) = T (ω)
12.4.3 Definizione Il supporto di uno stato ω ∈ S(A) è l’elemento Pω ∈ A∗∗
idempotente autoaggiunto tale che
ω
e (Pω ) = 1 = Pω (ω)
e che sia minimale rispetto a tale proprietà.
12.4.4 Proposizione Se ϕ, ω ∈ S(A):
• Pϕ,ω = 0 ⇐⇒ Pω,ϕ = 0 ⇐⇒ Pω ⊥Pϕ .
• Pϕ,ω = 1 ⇐⇒ Pϕ ≤ Pω .
Dimostrazione: Per (1) basta osservare che ϕ(B
e ∗ B) = 0 ⇐⇒ BPϕ = 0. La
(2) segue dalle equivalenze:
Pϕ,ω = 1 ⇐⇒ ϕ(P
e ω ) = 1 ⇐⇒ ϕ(I
e − Pω ) = 0
⇐⇒ I − Pω ⊥Pϕ ⇐⇒ Pϕ ≤ Pω
qed
12.4.5 Teorema Se Cω := {ψ ∈ S(A) | ψ << ω} allora
• Pϕ,ω = 1 ⇐⇒ ϕ ∈ Cω
• ∀ω ∈ P(A)
||.||
(chiusura in norma)
Pϕ,ω = 1 ⇐⇒ ϕ = ω
Dimostrazione: Se Pϕ,ω = 1 allora 1 = ϕ(P
e ω ) = (ξbϕ , Pω ξbϕ ) e quindi ξbϕ ∈
π (A)0
π
b(A)0 ξbϕ . Ne segue che ξbϕ è limite in norma di una successione Tn ξbω con Tn ∈b
tali che ||Tn ξbω || = 1.
465
12.4. Stati puri e rappresentazioni irriducibili
Ora la stessa dimostrazione del teorema di Segal ci permette di concludere
che, se
b(A)Tn ξbω )
ϕn (A) := (Tn ξbω , π
allora ϕ << ω, sicché, se ||xn || = 1 convergono a x in norma allora
||ωxn − ωx || −→ 0 =⇒ ||ωxn ◦ π − ωx ◦ π|||to0
||.||
b, col che abbiamo dimostrato che ϕ ∈ Cω .
Ma ϕ − ϕn = (ωξcω − ωTn ξcω ) ◦ π
Viceversa, sia ψ∈Cω : allora esiste R con R∗ R = T tale che ψ(A) = (Rξω , π(A)Rξω )
(per il teorema di Segal); ma si ha pure
(†)
ψ(A) = (B ξbω , π
b(A)B ξbω )
per qualche B ∈ π
b(A)0 . Infatti π
b = ⊕ω πω e quindi
I=
X
Eω
con Eω ∈ π
b(A)0
ω
Allora basta porre B = R ◦ Eω per avere
´
³
b(A)Rξω
π
b(A)B ξbω (ω 0 ) = δωω0 π
e quindi la (†); da questa segue che
e ω ) = (B ξbω , Pω B ξbω ) = 1
ψ(P
b
ove B ξbω ∈ π
b(A)0 ξbω ⊂ Pω H.
Dunque ψ << ω, cioè Pψ,ω = 1. Ma se questo è vero per un certo insieme di
stati, vale anche per la sua chiusura: infatti se ψn ⊂ S ⊂ S(A) converge a ψ e
Pψn ,ω = 1 allora Pψ,ω = 1. Per rendersene conto basta osservare che
e | Eo)| ≤ ||ψen − ψ|| ||Pω ||
|ψen (Pω ) − ψ(P
Ma ||ψn − ψ|| −→ 0 e quindi, per il teorema di Kaplanski:
fn − ψ||
e = ||ψ^
||ψ
n − ψ|| = ||ψn − ψ|| −→ 0
Con ciò abbiamo che se ψ << ϕ allora Pψ,ω = 1 per gli elementi di un certo insieme
di stati, questa proprietà vale sulla sua chiusura: nel caso di Cω otteniamo la tesi.
qed
466
Capitolo 12. Teoria delle rappresentazioni
12.4.6 Proposizione Se ω ∈ P(A) allora
½
¾
(ξ,
π
b
(A)ξ)
b | ∀A ω(A) =
b \ (0) = ξ ∈ H
Pω H
||ξ||
b1 (||ξ|| = 1) e se
Dimostrazione: Se ξ ∈ H
∀A ω(A) = (ξ, π
b(A)ξ)
allora, per il teorema di Segal, ξ = T ξbω ove T ∈ π
b(A)0 è unitario e quindi si
estende ad una isometria parziale B di π
b(A)0 .
qed
Se π1 , π2 sono rappresentazioni irriducibili, definiamo l’insieme dei loro stati
vettoriali come
Vπi := {ωx ◦ πi | x ∈ Hπi e ||x|| = 1}
12.4.7 Lemma Se π1 ∼
= π2 allora Vπ1 = Vπ2 , mentre se π1 π2 allora Vπ1 ∩
Vπ2 = ∅.
Dimostrazione: Se Vπ1 ∩ Vπ2 6= ∅ allora esiste un ϕ ∈ Vπ1 ∩ Vπ2 ed esistono
x1 ∈ H1 e x2 ∈ H2 tali che
∀A ∈ A (x1 , π1 (A)x1 ) = (x2 , π2 (A)x2 )
Per unicità della rappresentazione GNS deve quindi esistere un operatore di
allacciamento fra π1 e π2 e quindi, dato che le rappresentazioni sono irriducibili,
per il Lemma di Schur 12.1.8, si ha π1 ∼
= π2 .
∼
Viceversa, sia π − 1 = π2 : esista cioè un operatore di allacciamento unitario
fra π1 e π2 , i.e.
∀A ∈ A (x, π1 (A)x) = (U x, π2 (A)x)
Allora {U x}x∈(Hpi1 )1 = (Hπ2 )1 e quindi Vπ1 = Vπ2 .
qed
Osserviamo inoltre che se x ∈ (Hπ )1 allora ωx ◦ π non può essere iniettiva,
dato che (ωx ◦ π)(A) = (x, π(A)x). Ne segue che
12.4.8 Lemma Se π è una rappresentazione irriducibile, allora la x 7−→ ωx π
(per ||x|| = 1) è iniettiva vista come mappa definita sullo spazio proiettivo associato allo spazio di Hilbert Hπ (lo spazio dei sottospazi vettoriali di dimensione
uno di Hπ ).
12.4. Stati puri e rappresentazioni irriducibili
467
12.4.9 Teorema Se ω, ϕ ∈ P(A) sono stati puri allora
(
0
se πϕ πω
Pω,ϕ =
|(ξ, η)|2 se πϕ ∼
= πω
Dimostrazione: Dato che si tratta di stati puri, le rappresentazioni GNS associate a ω e ϕ sono irriducibili, quindi o sono equivalenti o sono disgiunte: in
questo secondo caso Pϕ,ω = 0. Infatti πω ◦p πϕ se e solo se (πω , πϕ ) = 0, il che
equivale a dire Hϕ ⊥b
π (A)0 Hω . Ma allora
ξbϕ ⊥b
π (A)0 ξbω
π (A)0 ξbϕ che, a sua volta, è equivalente a Pϕ ⊥Pω .
cioè π
b(A)0 ξbω ⊥b
Supponiamo ora che piϕ ∼
= πω ed osserviamo che
Pϕ,ω = ϕ(P
e ω ) = (ξbϕ , Pω ξbϕ )
b ove
Ma Pω ∈ π(A)00 e ξbϕ ∈ Eϕ H,
(Eϕ x)(ω) = δω,ϕ x(ϕ)
pertanto, Eϕ ∈ π
b(A).
Quindi
ϕ(P
e ω ) = (Eϕ ξbϕ , Pω ξbω ) = (ξbϕ , Pω Eϕ ξbω ) = (ξϕ , Pω Eϕ ξω )
(dato che Eϕ Pω = EHϕ ∩ πb(A)0 ξω ).
Ma per la purezza degli stati possiamo usare la proposizione 12.4.6, dunque
ω(A) =
(ξ, π
b(A)ξ)
||ξ||
Dunque
Pω Eϕ = E{ξ∈Hϕ | ∀A
(ξ,π(A)ξ)=ω(A)||ξ||}∪{0}
ove {ξ ∈ Hϕ | ∀A (ξ, π(A)ξ) = ω(A)||ξ||} ∪ {0} ha ovviamente dimensione 1.
Quindi se ξ è l’unico vettore di modulo 1 definito a meno di un fattore
complesso di modulo 1 tale che (ξ, πϕ (A)ξ) = ω(A):
ECξ x = (ξ, x)ξ
dunque
(ξϕ , ECξ ξϕ ) = (ξ, ξϕ )(ξϕ , ξ)
468
Capitolo 12. Teoria delle rappresentazioni
Ora supponiamo che le rappresentazioni πϕ e πω siano equivalenti ad una stessa
rappresentazione π, per mezzo di un operatore unitario U ∈ (πϕ , πω ); allora
ϕ = ωη ◦ π
ω = ωξ ◦ π
e
con ||η|| = ||ξ|| = 1, e quindi esiste z ∈ C tale che
U ξϕ = zη
MaU PCξϕ U −1 = PCη (proiettore) e U Gω Hϕ = Cξ ove U Gω U −1 = PCξ . Ne segue
che
Pϕ,ω =(ξϕ , Gω ξϕ ) = (U ξϕ , U Gω ξϕ ) = z(η, U Gω U −1 U ξϕ ) = z(η, PCξ zη)
cioè che
Pϕ,ω = |(η, ξ)|2 = Pω,ϕ
qed
Se Gϕ e Gω sono le proiezioni di rango 1 in B(Hπ ) corrispondenti agli stati ϕ
e ω allora
Pϕ,ω = tr(Gϕ Gω )
Inoltre, considerando che πϕ = π
b|Eϕ Hb e Eϕ ∈ π
b(A)0 :
Gϕ = Pϕ |Eϕ Hb = π
fϕ (Pϕ )
(rappresentazione estesa all’algebra di von Neumann inviluppante). Osserviamo
esplicitamente che se T ∈ π
b(A)00 allora
T |Eϕ = π
fϕ (T )
con Eϕ ∈ π
b(A)0 (avendosi T = limα Tα =limα π
b(Aα ), con Tα ∈ π
b(A)).
Possiamo ripetere questa costruzione per ogni rappresentazione irriducibile
(che è sempre della forma πψ per qualche stato vettoriale ψ), dato che in questo
caso la rappresentazione è equivalente a πϕ ∼
= πω e quindi
P]
ω Pϕ = Gω Gϕ
tr π
e(Pω πϕ ) = Pϕ,ω
e
12.4.10 Lemma Se ω ∈ Conv P(A) allora3 allora esistono {λj } ⊂ C e {ωj } ⊂
P(A) tali che
X
ω=
λj ωj
j
ove ωi ⊥ωj ( ⇐⇒ Pωi ,ωj = 0).
3
Ricordiamo che per il teorema di Krejn–Millman 8.3.10 un tale stato è combinazione
convessa di un numero finito o numerabile di stati puri.
12.4. Stati puri e rappresentazioni irriducibili
469
P
Dimostrazione: Consideriamo ω = j αj ϕj : possiamo supporre che gli ϕj siano stati vettoriali relativi alla medesima rappresentazione (altrimenti basta riscrivere la somma raggruppando gli stati relativi a rappresentazioni equivalenti).
Se
ϕj (A) = tr(π(A)Ej )
(ove Ej = ECξj ) allora
ω = tr(π(A)T )
P
per T = j αj Ej (operatori di rango finito). Possiamo diagonalizzare T usando
il teorema spettrale:
X
T =
λj Pj
j
in modo che i 6= j ⇒ Pj ⊥Pj , da cui
1 = tr T =
X
λj
j
(dato che λj ≥ 0 la combinazione è convessa) e quindi concludere che
X
ω=
λj tr(π(A))Pj
j
qed
12.4.11 Teorema Se ω, ϕ ∈ S(A) con ϕ⊥ω allora
∀a, b > 0 a + b = 1 ⇒ Paω+bϕ = Pω + Pϕ
Dimostrazione: Sia P := Pω + Pϕ : si ratta di un idempotente autoaggiunto in
A∗∗ . Se ψ := aω + bϕ allora ψ(P ) = 1 e P è minimale rispetto a questa proprietà,
i.e. è il supporto di ψ.
Ora dimostriamo che
ψe = ae
ω + bϕ
e
Infatti
e ) =< T |ψ >= a < T |ω > +b < T |ϕ >= ae
ψ(T
ω (T ) + bϕ(T
e )
sicché
e ) = ae
ψ(P
ω (P ) + bϕ(P
e ) = ae
ω (Pω + Pϕ ) + bϕ(P
e ω + pϕ ) = a + b = 1
Ora Paω+bϕ ≤ P (per definizione di supporto), quindi, dato che aω + bϕ = ψ e
dunque ω << ψ, ϕ << ψ:
Pω ≤ Pψ
e Pϕ ≤ Pψ
=⇒
P = Pω + Pϕ ≤ Pψ ≤ P
cioè la nostra tesi.
qed
470
Capitolo 12. Teoria delle rappresentazioni
P
12.4.12 Corollario P ω = j Pωj .
P
Se ϕ, ω ∈ S(A) e se ω ∈ Conv P(A), per il lemma precedente è ω = j λj ωj
con i 6= j ⇒ ωi ⊥ωj , quindi
Ã
!
X
X
X
Pϕ,ω = ϕ(P
e ω) = ϕ
e
Pωj =
Pϕ,ωj
ϕ(P
e ωj ) =
j
Se inoltre ϕ =
P
k
j
P
µk ϕk , si ha ϕ
e = k µk ϕ
ek e dunque
X
X
Pϕ,ω =
µk ϕ
ek (Pωj ) =
µk Pϕk ,ωj
k
j,k
12.4.13 Teorema Se ω, ϕ ∈ P(A) allora Pω,ϕ = 1 − 14 ||ϕ − ω||2 .
Dimostrazione: Se πω πϕ allora (per irriducibilità) πϕ ◦p πω e quindi ||ω−ϕ|| =
2 (teorema di Glimm–Kadison 12.4.2), per cui
1
Pω,ϕ = 0 = 1 − 22
4
banalmente. Dunque sia πω ∼
= πϕ , col che ω = ωξ ◦ π, ϕ = ωη ◦ π e
||(ωξ − ωη ) ◦ π|| = ||ωξ − ωη ||
(per i teoremi di densità di von Neumann e Kaplanski).
Consideriamo ora M = Cξ + Cη; se M = EH si trova
||ωξ − ωη || = ||(ωξ − ωη )|EB(H)E ||
(ξ e η sono linearmente indipendenti dato che Pω,ϕ = 1). Quindi
EB(H)E = M2 (C)
(matrici complesse di ordine due), e, considerando le normalizzazioni e1 e e2 degli
elementi ξ + η e ξ − η (che formano una base):
ξ + η = a1 e1
e
η − ξ = a2 e2
ovvero
ϑ
ϑ
ξ = cos e1 + sin e2
2
2
ϑ
ϑ
η = cos e1 − sin e2
2
2
12.4. Stati puri e rappresentazioni irriducibili
471
(ϑ è l’angolo fra ξ e η) si trova ωξ − ωη ∈ S(M2 (C)), dunque
|(ωx i − ωη )(B)| = max |(ωx i − ωη )(B)|
sup
B∈SL2 (C)
cioè esiste B1 ∈ M2 (C) tale che
(ωξ − ωη )(B1 ) = ||ωξ − ωη ||
(†)
Ma allora B1∗ pure soddisfa la (†) (ωξ − ωη è un funzionale hermitiano) e quindi
anche 12 (B1 + B1∗ ) la soddisfa.
In altri termini, possiamo supporre che B1 sia autoaggiunto; ora se
J(a1 e1 + a2 e2 ) := a1 e1 + a2 e2
allora
Jξ = ξ
e
Jη = η
e quindi anche JBJ soddisfa la (†). Consideriamo allora 12 (B1 +JB1 J) e notiamo
che
¶
¶
µ
µ
1 0
1 0
η=ξ
ξ=η
e
0 −1
0 −1
¶
µ
1 0
allora4
Dunque, se σ3 =
0 −1
ωξ (σ3 B1 σ3 ) = ωη (B1 )
ωη (σ3 B1 σ3 ) = ωξ (B1 )
sicché
(ωξ − ωη )(σ3 B1 σ3 ) = −||ωξ − ωη ||
e la matrice
1
A := (B1 − σ3 B1 σ3 )
2
è reale (A = A), autoaggiunta di norma 1 e tale che
(ωξ − ωη )(A) = ||ωξ − ωη ||
Notiamo inoltre che Aσ3 + σ3 A = 0.
Ma esiste un’unica matrice siffatta in M2 (C), vale a dire
¶
µ
1 0
A=
0 1
dunque (ωx i − ωη )(A) fornisce la tesi.
qed
4
Si tratta di una notazione dovuta a Pauli.
472
12.5
Capitolo 12. Teoria delle rappresentazioni
Rappresentazioni di operatori compatti
Come esempio notevole consideriamo l’algebra K(H) degli operatori compatti
su uno spazio di Hilbert separabile H (di dimensione infinita, altrimenti K(H) =
B(H)).
K è una C*-algebra priva di elemento identità: possiamo tuttavia aggiungere
a K una unità I ottenendo K ⊕ CI.
12.5.1 Teorema I soli ideali bilateri chiusi in norma della C*-algebra B(H)
sono: (0), B(H) e K(H).
Dimostrazione: Supponiamo che esista un ideale bilatero chiuso J tale che
K ( J ( B(H)
J è uno *-ideale (per la decomposizione polare: T = |T |V , sicché V ∗ T V ∗ =
|T |V ∗ = T ∗ ), quindi se T ∈ J anche T ∗ T ∈ J.
Ora consideriamo T ∈ J \ K; per definizione T non è compatto, quindi non lo
è neanche T ∗ T (altrimenti lo sarebbe |T | e pertanto anche V |T | = T ), dunque
Eσ = χ[ε,||T ||2 ] (T ∗ T ) non può avere rango finito, sicché
||T ∗ T (I − Eε )|| ≤ ε
da cui segue che T ∗ T è limite di operatori di rango finito e quindi è compatto.
Deve perciò esistere un ε > 0 tale che Eε non abbia rango finito, sebbene Eε ∈ J,
dato che, considerando la funzione
(
0
se λ < ε
f (λ) :=
−1
λ
se λ ≥ ε
per il calcolo funzionale boreliano f (T ∗ T )T ∗ T ∈J, essendo T ∗ T ∈J e J un ideale.
Ma se esiste un tale ε allora pure esiste una isometria da H sull’immagine di
Eε (per separabilità di H) in modo che
Eε = V V ∗
e
Eε V = V
ove V ∗ V = I e quindi V ∗ V = (Eε V )∗ Eε V = V ∗ Eε V , ovvero Eε ∈ J, da cui segue
I ∈ J e, per linearità e continuità di V : J = B(H).
Ora supponiamo che esista un ideale J tale che
(0) ) J ) K
473
12.5. Rappresentazioni di operatori compatti
Allora J deve contenere un idempotente autoaggiunto E (non zero) contenuto in J (per lo stesso argomento del caso precedente). Ma allora per ogni F
idempotente di rango 1 contenuto in E si ha F E = F i.e. F ∈ J.
Quindi J contiene un proiettore di rango 1, il che implica che in realtà li
contiene tutti: se Cξ = F (H) allora, per ogni η ∈ H considerando l’operatore
Tξη ξ := ξ si ha T F T ∗ = ECη .
Ma gli operatori di rango finito sono densi in quelli compatti e quindi, dato
che l’ideale è chiuso, deve aversi J = K.
qed
12.5.2 Corollario L’algebra A := B(H)/K è semplice.
Chiamiamo algebra di Calkin l’algebra B(H)/K; inoltre introduciamo la notazione
|ηihξ|
per l’operatore Tξη ξ := ξ nella dimostrazione precedente.
12.5.3 Teorema Se π è una rappresentazione non degenere di K allora
M
π=
πα
α∈A
ove le πα sono rappresentazioni equivalenti alla rappresentazione identica π0 (A) =
A.
Dimostrazione: Se T ∈ K \ 0 allora π(T ) 6= 0 (perché il nucleo di π è un ideale
bilatero chiuso in norma) e consideriamo un E ∈ K idempotente autoaggiunto di
rango 1 (dim EH = 1), per cui
E = ECx0 = |x0 ihx0 |
con ||x0 || = 1, e, per ogni T :
ET E = (x0 , T x0 )E
cioè Ex = (x0 , x)x0 . Ma F := π(E) 6= 0 è un idempotente autoaggiunto (lo è E)
tale che F Hπ è ciclico per π: infatti, se cosı̀ non fosse, il sottospazio
⊥
π(K)F (Hπ )
sarebbe stabile e quindi π = π|π(K)F (H
⊥
π)
π(E)0 = π(E)|π(K)F (H
6= 0 diverrebbe degenere:
⊥
π)
= F |π(K)F (H
π)
⊥
=0
474
Capitolo 12. Teoria delle rappresentazioni
Quindi F Hπ è ciclico.
Questo implica la tesi. Infatti
π(ET E) = π(E)π(T )π(E)
||
||
ω0 (T )F =
F π(T )F
ove ω0 (T ) := (x0 , T x0 ). Se (eα )α∈A è una base ortonormale di F Hπ allora (si noti
che eα = F eα e F = F ∗ ):
(eα , π(T )eβ ) =(eα , F π(T )F eβ ) = ω0 (T )(eα , F eβ )
=ω0 (T )(eα , eβ ) = ω0 (T )δαβ
cioè π(T )Hα ⊥π(T )Hβ se α 6= β, che implica π(K)Hα ⊥π(K)Hβ . Ne segue che,
per Mα := π(K)eα si trova α 6= β ⇒ Mα ⊥Mβ e
M
Mα = Hπ
α∈A
(per ciclicità di F Hπ ) ove (eα , π(T )eα ) = ω0 (T ), e dunque π|Mα ∼
= π0 .
qed
Sia ora π
b la rappresentazione universale dell’algebra degli operatori compatti
K: sappiamo che
M
π
b=
π0
α∈A
Ci chiediamo come sia fatta l’algebra di von Neumann inviluppante, notando
immediatamente che, per la decomposizione precedente,
π(K)00 = π(K00 ) = π(B(H))
(questo vale anche nel caso di una somma più che numerabile). Ma sappiamo
anche che
K∗ = {fx,y ◦ π
b} = M = M0
dato che la f 7−→ f |K è una isometria di spazi di Banach, e quindi
K∗∗ = M∗ = B(H)
Conclusione: l’algebra inviluppante di von Neumann di K è proprio B(H).
12.5.4 Teorema Se H è uno spazio di Hilbert separabile e π è una rappresentazione di B(H) allora
π = π1 ⊕ π2
ove π1 è una rappresentazione singolare (i.e. π1 (K) = 0) e π2 = ⊕α∈A π0 .
12.5. Rappresentazioni di operatori compatti
475
Dimostrazione: Consideriamo la decomposizione ortogonale
H=N ⊕M
ove π(K)N = 0 e π(K)(M ) = M = π(K)Hπ .
Questa decomposizione è stabile rispetto alle rappresentazioni di B(H), dato
che, se K ∈ K e x ∈ M :
π(A)π(K)x = π(AK)x ∈ M
(π(AK) ∈ K C B(H)). Dunque M è stabile e quindi anche N = M ⊥ lo è; quindi
π = π1 ⊕ π2
ove, per definizione, π1 |K = 0 ed esiste un unitario U ∈ (⊕α∈A π0 , π2 ).
Infatti AK ∈ K per ogni A ∈ B(H), sicché
U π2 (AK) =U π2 (A)π2 (K) = (⊕π0 ) (A) (⊕π0 ) (K)U
= (⊕π0 ) (A)U π2 (K)
cioè (U π2 (A) − π
e(A))U = 0.
qed
12.5.5 Esempio Consideriamo lo spazio di Hilbert L2 [0, 1] (con la misura di
Lebesgue) e l’operatore di moltiplicazione:
(T f )(s) := sf
Allora se A := C ∗ hT, Ii = C[0, 1] alla mappa
s 7−→ ϕs (f (T )) = f (s)
corrisponde uno stato puro ω (teorema di Segal) di B(H) tale che
ω|A = ϕs
Dunque πω è irriducibile, se
πω (T )ξω = sξω
12.5.6 Definizione Se A è una C*-algebra, uno *-isomorfismo suriettivo di
A in sé si dice isomorfismo di A; l’insieme degli automorfismi di A si denota
Aut(A).
476
Capitolo 12. Teoria delle rappresentazioni
Ovviamente Aut(A) è un gruppo rispetto alla composizione; si tratta inoltre
di un gruppo topologico5 : se A ∈ A e α ∈ Aut(A) si ha per definizione
||α(A)|| = ||A||
quindi su Aut(A) resta indotta la topologia uniforme (cioè della norma) rispetto
alla quale il prodotto è per definizione continuo.
Notiamo che, ovviamente, se dim A < ∞ allora Aut(A) è un gruppo di Lie
di matrici6 .
Vogliamo ora determinare Aut(B(H))
12.5.7 Lemma Una C*-algebra con identità I è la chiusura dello spazio dei suoi
elementi unitari.
Dimostrazione: Osserviamo che per ogni A ∈ A:
A = A1 + iA2
e quindi possiamo limitarci agli autoaggiunti con norma ≤ 1; ma se A ∈ A è un
tale elemento allora, per
√
U := A + i I − A2
si trova U ∗ U = U U ∗ = I e
1
A = (U + U ∗ )
2
Quindi gli unitari generano A.
qed
12.5.8 Teorema Aut(B(H)) = U(H)/T.
Dimostrazione: Sia α ∈ Aut(B(H)); allora la mappa A 7−→ α(A) definisce una
rappresentazione di B(H) irriducibile che è diversa da zero su K, e quindi, per il
teorema precedente, esiste U ∈ U(H) tale che α(A) = U AU −1 .
Abbiamo quindi che gli unici automorfismi di B(H) sono quelli interni, ovvero
quelli della forma
A 7−→ U AU −1
ove U ∈ U(H). Ma U e U 0 inducono lo stesso automorfismo se e solo se esiste un
z ∈ C con |z| = 1 tale che U 0 = zU ; quindi la tesi.
qed
5
6
Nel capitolo ?? discuteremo questo importante concetto.
cfr. i capitoli ?? e ??.
12.5. Rappresentazioni di operatori compatti
477
12.5.9 Definizione Una funzione α : A −→ A che sia moltiplicativa (α(AB) =
α(A)α(B)), biunivoca e *-antilineare si dice antiautomorfismo di A.
12.5.10 Esempio In B(H), considerando una base ortonormale (en ) di H, la
mappa
X
X
J
ci ei
ci ei :=
i
i
definisce una mappa antilineare di H in sé; di più, dato che J 2 = I, si dice
antiunitario. Allora la mappa
A 7−→ JAJ −1
è un elemento antiunitario in B(H). Inoltre
A 7−→ Jα(A)J −1
è un automorfismo, dato che
Jα(A)J −1 = U AU −1
e quindi
α(A) = JU A(JU )−1
Cioè, ogni antiautomorfismo è indotto da un operatore antiunitario.
12.5.11 Teorema Sia V ∈ B(H); allora sono equivalenti le
• V è una isometria parziale.
• V ∗ V è idempotente.
• V ∗ è una isometria parziale.
Dimostrazione: (1) equivale a dire che l’operatore V |(ker V )⊥ è isometrico;
considerando allora M := (ker V )⊥ e x ∈ M si ha ||V x||2 = ||x||2 cioè, (per
polarizzazione),
∀x, y ∈ M (V x, V y) = (x, y)
il che significa che y − V ∗ V y ∈ M ⊥ = ker V . Ma allora per ogni x ∈ ker V :
(x, y − V ∗ V y) = 0
dunque y − V ∗ V y⊥M, M ⊥ , ovvero y − V ∗ V y = 0.
478
Capitolo 12. Teoria delle rappresentazioni
Se y ∈ M ⊥ allora 0 = V ∗ V y, sicché V ∗ V è la proiezione ortogonale su M ,
quindi idempotente. Questo dimostra che (1) implica (2).
Viceversa, se (V ∗ V )2 = V ∗ V allora per x ∈ V ∗ V K = M con V ∗ V x = x si ha
(x, V ∗ V x) = ||x||, i.e. (2) implica (1).
Infine (1) implica (3): infatti basta far vedere che V ∗ V è idempotente. Ma
(V V ∗ )2 = V (V ∗ V )V ∗ = V EM V ∗ = V ∗ V
(dato che V EM x = V x = V Ex + V (I − E)x, e quindi V E = V ).
qed
Capitolo 13
OPERATORI NON LIMITATI
La teoria degli operatori limitati negli spazi di Hilbert è soddisfacente per
molti versi, ma non cattura diversi esempi che sono pervasivi nella Fisica Matematica: gli operatori differenziali. Per studiare questa classe di operatori si
possono introdurre degli spazi di Hilbert opportuni nei quali questi sono definiti
o si debbono considerare gli operatori non limitati e densamente definiti in uno
spazio di Hilbert qualsiasi. Privilegiamo il secondo approccio, basato sulla teoria
delle estensioni degli operatori hermitiani, dovuta a von Neumann.
13.1
Chiusura di operatori
Consideriamo due spazi vettoriali X e Y ed un operatore lineare T : X −→ Y
definito su un sottoinsieme D(T ) = Dom T ⊂ X (il suo dominio); ricordiamo
che abbiamo anche gli insiemi nucleo
ker T = {x ∈ D(T ) | T x = 0} = T −1 (0)
(che si denota tradizionalmente anche con N (T )) e immagine
im T = {T x | x ∈ D(T )}
(che si denota tradizionalmente con R(T ) perché talvolta è chiamato rango
dell’operatore T ). Infine abbiamo il grafico dell’operatore T :
GT := {x ⊕ T x | x ∈ D(T )} ⊂ X ⊕ Y
Osserviamo che non ogni sottoinsieme di X ⊕ Y è il grafico di un operatore.
13.1.1 Definizione Se T1 , T2 : X −→ Y sono operatori tali che D(T1 ) ⊂ D(T2 )
e se T2 |D(T1 ) = T1 si dice che T2 estende T1 , e si scrive T1 ⊂ T2 .
479
480
Capitolo 13. Operatori non limitati
Evidentemente
T1 ⊂ T2 ⇐⇒ GT1 ⊂ GT2
Osserviamo inoltre che GT determina completamente T : infatti se G è un grafico
di un operatore, possiamo intanto ricostruire il dominio dell’operatore, come
D = PX G
(ove PX : X ⊕ Y −→ X e PY : X ⊕ Y −→ Y sono le proiezioni sui due fattori).
Osserviamo che G è il grafico di un operatore se e solo se
∀x ∈ G PX z = 0 ⇐⇒ z = 0
Questo implica che PX |G è lineare e biunivoca, quindi possiamo porre
T := PY ◦ (PX |G )−1
Per definizione GT = G. Ovviamente T è invertibile (i.e. esiste T −1 ) se e solo se
N (T ) = 0 e D(T −1 ) = R(T ).
Siano ora X e Y spazi di Banach.
13.1.2 Definizione Un operatore T : X −→ Y è chiuso se lo è il suo grafico
come sottospazio di Banach in X ⊕ Y .
Un operatore è chiuso se e solo se per ogni {xn } ⊂ D(T ) convergente a x ∈ X
tale che {Tn x} converga a y ∈ Y si ha x ∈ D(T ) e y = T x.
13.1.3 Definizione Se GT è ancora il grafico di un operatore, si dice che T è
chiudibile; inoltre, se GT = GT si dice che T è la chiusura di T .
Ovviamente T è chiudibile se e solo se esiste un T chiuso che lo estenda: in
effetti T si può definire come il più piccolo (rispetto alla relazione di estendibilità)
operatore chiuso che estenda T .
Possiamo riformulare il teorema del grafo chiuso 6.5.12 come
Teorema (del grafico chiuso). Se T : X −→ Y è un opeatore chiuso fra
spazi di Banach allora
D(T ) è chiuso ⇐⇒ T è continuo
13.1. Chiusura di operatori
481
In effetti la condizione di convergenza enunciata nel teorema del grafo chiuso
6.5.121 si riduce alla chiusura di D(T ).
Dunque T è chiudibile se e solo se la chiusura GT è il grafico di un operatore
se e solo se ∀ 0 ⊕ y ∈ GT y = 0.
In altri termini, T è chiudibile se e solo se
∃{xn } ⊂ D(T ) xn −→ 0 e T xn −→ y =⇒ y = 0
Tuttavia si noti che l’essere T chiuso non implica che sia necessariamente continuo. Quello che possiamo dire è che
T lineare e chiuso ⇒ N (T ) chiuso
Infatti N (T ) = {x ⊕ 0 | x ∈ N (T )} = GT ∩ (X ⊕ 0). Inoltre
T lineare, chiuso e invertibile ⇒ T −1 chiuso
dato che GT −1 = {T x ⊕ x | x ∈ D(T )} = U GT , con U (x ⊕ y) := y ⊕ x (si tratta
di un isomorfismo).
Consideriamo ora operatori lineari A; H −→ H in uno spazio di Hilbert, tali
che D(A) sia denso in H. Possiamo definire l’aggiunto di A come
∀y ∈ D(A) D(A∗ ) := {x ∈ H | y 7−→ (x, Ay) è continua}
Quindi, per ogni y ∈ D(A), esiste un unico A∗ x ∈ H tale che
(A∗ x, t) = (x, Ay)
Osserviamo che
GA∗ = {x ⊕ x∗ | ∀y ∈ D(A) (x∗ , y − (x, Ay) = 0}
1
Richiamiamone la dimostrazione, che poggia sul teorema della mappa aperta (cfr. 6.5.10).
Sia D(T ) chiuso; allora PX |GT è biunivoco, lineare e continuo da GT in D(T ) e, per il teorema
−1
della mappa aperta, PX |G
pure è continuo, quindi anche PY ◦ PX |−1
GT lo è, e, per quanto visto,
T
è esattamente T .
Viceversa, se T è continuo, allora definiamo su D(T ) una norma come
|||x||| := ||x ⊕ T x||
che lo rende uno spazio di Banach (questo è sempre vero). Ma
||x|| ≤ |||x||| = ||x ⊕ T x|| ≤ ||x|| + ||T x|| ≤ ||x|| + ||T || ||x||
(per continuità di T ). Ne segue che D(T ) è completo in X, quindi è un sottospazio chiuso.
482
e che, se
Capitolo 13. Operatori non limitati
(x ⊕ x∗ , (−Ay) ⊕ y) := (x∗ , y) − (x, Ay)
allora
GA∗ = (V GA )⊥
ove è l’isomorfismo unitario V (x ⊕ y) := (−y) ⊕ x (V 2 = −I).
Evidentemente, dato che D(A) è denso, A∗ è chiuso.
13.1.4 Teorema (von Neumann) Se A : H −→ H è un operatore lineare
densamente definito allora DA∗ è denso se e solo se A è chiudibile. In questo
caso A = A∗∗ .
Dimostrazione: Supponiamo che A sia chiudibile: allora GA ∩ (0 ⊕ H) = 0. Ma
⊥⊥
⊥⊥
⊥
GA = G⊥⊥
A = −GA = V (V GA ) = V (V GA ⊥)
dato che V 2 = −I e V M ⊥ = U M ⊥ (essendo V unitario). Dunque A è chiudibile
⊥
se e solo se V (V G⊥
A ) ∩ (0 ⊕ H) = 0 cioè
⊥
(V G⊥
A ) ∩ (H ⊕ 0) = 0
Ma V G⊥
A = GA∗ , quindi
x ⊕ 0⊥GA∗ ⇒ x = 0
e dunque D(A∗ ) è denso.
Viceversa se D(A∗ ) è denso allora GA∗∗ = G⊥⊥
A = GA .
qed
13.1.5 Lemma Se A : H −→ H è un operatore lineare, le seguenti condizioni
sono equivalenti:
• ∀x ∈ D(A) (x, Ax) ∈ R.
• ∀x, y ∈ D(A) (x, Ay) = (Ax, y).
• A ⊂ A∗ .
Dimostrazione: La (2) implica la (3) per definizione; la (3) implica la (1) dato
che
(x, Ax) = (Ax, x) = (x, Ax)
La (1) implica la (2) perché, se (x, Ax) ∈ R allora (Ax, x) = (x, Ax) e quindi, per
polarizzazione
(x, Ay) = (Ax, y)
qed
13.1. Chiusura di operatori
483
Notiamo che la (2) non implica che A = A∗ se A non è limitato.
13.1.6 Definizione Un operatore lineare A : H −→ H è hermitiano se è
densamente definito e se vale una delle condizioni equivalenti del lemma.
Notiamo che se A è hermitiano allora è chiudibile (in quanto estendibile
dall’operatore chiuso A∗ ) e quindi A∗∗ = A.
Notiamo inoltre che T ⊂ R implica R∗ ⊂ T ∗ ; quindi A ⊂ A∗ implica A∗∗ ⊂
∗
A , dunque A ⊂ A∗ , cioè
A∗∗∗ = A∗
Quindi la chiusura di un operatore hermitiano è hermitiano.
13.1.7 Definizione A : H −→ H è autoaggiunto se A = A∗ .
Per quanto detto è chiaro che se A autoaggiunto allora è hermitiano, mentre
non vale il viceversa.
Se A ⊂ B sono hermitiani allora B ∗ ⊂ A∗ e quindi A ⊂ B ⊂ B ∗ ⊂ A∗ :
“estendere” A vuol dire quindi “ridurre la distanza fra A e A∗ ”, per cui se A = A∗
allora A è hermitiano massimale (cioè non ha altre estensioni se non se stesso).
Ovviamente non vale il viceversa.
13.1.8 Teorema (von Neumann) Se T è un operatore lineare chiuso densamente definito allora T ∗ T è autoaggiunto
Dimostrazione: Basta dimostrare che I +T ∗ T è autoaggiunto: per questo basta
dimostrare che I + T T ∗ è densamente definito e che R(I + T ∗ T ) = H. Infatti,
per ogni x ∈ D(I + T ∗ T ):
(x, (I + T ∗ T )x) = (x, x) + (T x, T x) ≥ (x, x) ≥ 0
(essendo T chiuso). Quindi I + T ∗ T è hermitiano.
Ma, se R(I +T ∗ T ) = H allora vi è definito (I +T ∗ T )−1 , che è una contrazione:
infatti abbiamo appena visto come (x, (I + T ∗ T )x) ≥ 0 e quindi
||x||2 = (x, x) ≤ (x, (I + T ∗ T )x) ≤ ||x|| ||(I + T ∗ T )x||
cioè ||x|| ≤ ||I + T ∗ T ||. Per questo basta dimostrare che
R(I + T ∗ T ) = H
per avere la tesi 2 .
2
Un argomento alternativo è il seguente: se A ⊂ A∗ è biunivoco e R(A) = H allora A = A∗ .
484
Capitolo 13. Operatori non limitati
Dunque dimostriamo questa identità. Per ipotesi GT è chiuso, quindi
GT + V GT ∗ = GT + (GT )⊥ = H ⊕ H
da cui
x ⊕ 0 = (x1 + ⊕T x1 ) + V (x2 ⊕ T ∗ x2 ) = (x1 − T ∗ x2 ) ⊕ (T x1 + x2 )
pertanto
x2 = −T x1
x = x1 − T ∗ x2 = (I + T ∗ T )(x2 )
e
(si noti che x1 ∈ D(T ) e quindi x2 ∈ D(T ∗ T )).
Non resta allora che da mostrare che D(T ∗ T ) è denso: ma se esistesse un
x0 ⊥D(T ∗ T ) allora
∃x1 ∈ D(T ∗ T ) x0 = (I + T ∗ T )(x1 )
quindi (x0 , x1 ) = 0 il che è assurdo (infatti (x1 , x1 ) ≤ ((I + T ∗ T )x1 , x1 ) = 0).
qed
Si noti il
13.1.9 Corollario T ∗ T è densamente definito.
Possiamo ora discutere il teorema di decomposizione polare per operatori non
limitati: come nel caso limitato proviamo prima a definire la radice quadrata di
un operatore autoaggiunto positivo.
13.1.10 Lemma B = B ∗ (non necessariamente limitato) è positivo se e solo se
Z
B = λdE(λ) ⇒ ∀λ < 0 E(λ) = 0
Dimostrazione: Per ogni λ∈R− , se x∈DB allora E(λ)x∈DB quindi, definendo
y = E(λ)x:
Z
(y, By) =
0
0
Z
λ
λ d(y, E(λ )y) =
−∞
λ0 d(y, E(λ0 )y) ≤ λ(y, y)
(osservando che, se λ1 , λ2 ≥ λ allora (E(λ1 )−E(λ2 ))y = E(λ1 )E(λ) = E(λ2 )E(λ) >
0).
Quindi, per λ < 0, (y, By) ≤ λ(y, y) se e solo se y = 0.
qed
485
13.1. Chiusura di operatori
Quindi, per ogni operatore B autoaggiunto positivo esiste un unico operatore
Z ∞
√
1
B :=
λ 2 dE(λ)
0
√
la cui famiglia spettrale è G(λ) = E(λ2 ) (l’unicità di B segue da quella della
famiglia spettrale).
Osserviamo inoltre che DB ⊂ D√B : infatti
Z ∞
x ∈ D√B ⇐⇒
λ2 d(x, G(λ)x) < ∞
0
Z
e
x ∈ DB ⇐⇒
∞
Z
λ d(x, E(λ)x) < ∞ ⇒
2
0
∞
√
λd(x, G( λ)x) < ∞
0
13.1.11 Teorema (Decomposizione polare) Se A è un operatore lineare
chiuso e densamente definito su uno spazio di Hilbert H allora esistono unici
H e V operatori tali che H = H ∗ è positivo e V è una isometria parziale e che
A=VH
ove N (AH) = N (V ) = N (A).
Dimostrazione: Consideriamo un operatore lineare A densamente definito su
uno spazio di Hilbert H, chiuso (A = A); per il teorema di Von Neumann 13.1.8
A∗ A è un operatore positivo autoaggiunto, quindi possiamo definire
√
H = A∗ A
(quindi DA∗ A ⊂ DH ).
Ora, se x ∈ DA∗ A allora ||Ax|| = ||Hx||, dato che
(Ax, Ax) = (x, A∗ Ax) = (x, H 2 x) = (Hx, Hx) = ||Hx||
Ora utilizziamo il seguente lemma
Lemma. L’insieme {x ⊕ Ax | x ∈ DA∗ A } è denso nel grafico di A.
Possiamo quindi affermare che
∀x ∈ DA = DH
||Ax|| = ||Hx||
e definire una isometria su HDA = HDH :
V (Hx) := Ax
486
Capitolo 13. Operatori non limitati
(si tratta di una isometria perché ||Ax|| = ||Hx||), la cui chiusura è una isometria
parziale:
N (V )⊥ = R(V ∗ V ) = R(H) = N (H)⊥
(essendo H = H ∗ ). Ne segue che H è chiuso e V è una isometria parziale:
N (V ) = N (H)
Ma N (H) = N (A) (sempre perché ||Hx|| = ||Ax||) e quindi, per definizione di
V:
V Hx = Ax
i.e. A = V H.
Che la decomposizione V H sia unica si dimostra come al solito: se A = H 0 V 0
con N (H 0 ) = N (V 0 ) = N (A), H 0 = H 0∗ , H 0 ≥ 0 e V è una isometria parziale,
allora3
(V 0 H 0 )A0∗ = H 0 V 0∗
e
A∗ A = H 0 (V 0∗ V 0 )H 0 = H 02
√
sicché H 0 = A∗ A = H e, dato che A = V 0 H = V H allora V 0 = V (perché
questa identità è valida su un sottospazio denso e sul nucleo N ).
Per concludere non resta che dimostrare il lemma. Ovviamente
{x ⊕ Ax | x ∈ DA∗ A } ⊂ GA
(GA è il grafico di A). Ma A = A, quindi GA è uno spazio di Hilbert; per avere
la tesi basta dimostrare che, come sottospazio di Hilbert di GA :
{x ⊕ Az}⊥ = 0
vale a dire che se z ∈ GA e, per ogni x ∈ DA∗ A : (z, x + Ax) = 0 allora z = 0.
Infatti z = y + Ay (con y ∈ DA ) e quindi
(y + Ay, x + Ax) = (y, x) + (Ay, Ax) = (y, x) + (y, A∗ Ax) = (y, (I + A∗ A)x)
Ma, (I + A∗ A)x descrive, al variare di x ∈ DA∗ A l’intero H.
qed
3
Se B ∈ B(H) e T è un operatore qualsiasi in H allora (BT )∗ = T ∗ B ∗ . Infatti D(BT )∗ =
{x ∈ H | y 7−→ (x, BT y) è continua su DT } (si noti che DT = DB perché B è limitato).
Ma (x, BT y) = (B ∗ x, T y) (sempre perché B è limitato) i.e. B ∗ x ∈ DT ∗ e quindi D(BT )∗ =
{x ∈ H | B ∗ x ∈ DT ∗ }.
487
13.2. Estendibilità di operatori
13.2
Estendibilità di operatori
Consideriamo un operatore hermitiano densamente definito A.H −→ H: si
∗
ha A ⊂ A e
||(A + λI)x||2 = (Ax, Ax) + λ2 (x, x) + 2 Re(λ(x, Ax))
Quindi, per λ = ±i ((x, Ax) ∈ R):
||(A ± iI)x||2 = ||Ax||2 + ||x||2 = ||x ⊕ Ax||2
e le mappe
(A + iI)x
MMM
MMM
MMM
M&
S0 (A)
²
x ⊕ Ax
qq8
q
q
qqq
qqq
(A − iI)x
sono isometrie.
Quindi D± (A) := R(A ± iI) è immagine isometrica di GA , sicché
D± (A) = D± (A)
La S0 (A) si dice trasformata di Cayley 4 , ed è una isometria tale che
D(S0 ) = D+
e
R(§0 ) = D−
e quindi tale che S0 (A) = S0 (A). Si noti che
⊥
H± := D±
= R(A ± iI)
cioè che
H± = N ((A ± iI)∗ ) = N (A∗ ∓ iI)
Ma H± , D(A) ⊂ D(A∗ ) (z ∈ H± ⇐⇒ z ∈ D(A∗ ) e A∗ z = ±iz): gli interi
n± := dim H±
si dicono indici di difetto di A.
Abbiamo dunque D(S0 ) = R(A + iI) e quindi
S0 := (A − iI)(A + iI)−1
4
Si tratta di una generalizzazione della funzione z 7−→
z+i
z−i
= eiα 7−→ cot α2 = z.
488
Capitolo 13. Operatori non limitati
cioè S0 (A + iI)x = (A − iI)x = (A + iI)x − 2ix, da cui
(I − S0 )(A + iI)x = 2ix ⇒ (A + iI)x = 2i(I − S0 )−1 x
col che R(I − S0 ) = D(A) (che è denso) e N (I − S0 ) = 0 (in quanto (I − S0 )z = 0
implica 2ix = 0, vale a dire z := (A + iI)x = 0).
In definitiva, esiste un (I − S0 )−1 densamente definito tale che
∀x ∈ D(A) Ax = −ix + 2i(I − S0 )−1 x
= −i(I − S0 )(I − S0 )−1 x + 2i(I − S0 )−1 x
= i(I + S0 )(I − S0 )−1 x
(dato che (I − S0 )(I − S0 )−1 x = x in D(A)), per cui
∀x ∈ D(A) Ax = i(I + S0 )(I − S0 )−1 x
13.2.1 Lemma Se A = A ⊂ A∗ allora S0 (A) = S0 (A) e D(S0 ) = D+ ; ponendo
E := ED+ si ha quindi che S := S0 E è una isometria parziale.
13.2.2 Teorema Se A = A ⊂ A∗ allora D(A∗ ) = D(A)⊕H+ ⊕H− come somma
diretta di spazi vettoriali (non di Hilbert).
Dimostrazione: Se x ∈ D(A) e z± ∈ H± allora
x + z+ + z− = 0 ⇒ x = z+ = z− = 0
Infatti H± , D(A) ⊂ D(A∗ ) e quindi (A∗ z = ±iz)
0 = (A∗ + iI)(x + z+ + z− ) = (A∗ + iI)x + 2iz+ = 0 ∈ D+ + H+
⊥
Ma H+ = D+
, dunque abbiamo una somma di due vettori ortogonali che fa zero,
pertanto i due vettori sono nulli e questo dimostra che z± e x sono linearmente
indipendenti.
Ora per avere il teorema basta dimostrare che
D(A∗ ) ⊂ D(A) + H+ + H−
Ricordando che z = (A + iI)x ∈ D(S0 ) e
(I − S0 )(A + iI)x = 2ix
e
(A + iI)(I − S0 )x = 2iz
489
13.2. Estendibilità di operatori
abbiamo che (I − S − 0) è inverso (bilatero) di (A + iI); ma
D(A∗ ) = D((A + iI)∗ )
(in quanto, se B è continuo: D((A + B)∗ ) = D(A∗ )) e quindi
y ∈ D((A + iI)∗ ) ⇐⇒ ∃y ∗ (y, (A + iI)(I − S0 )z) = (y ∗ , (I − S0 )z)
Dato che (y, (A + iI)(I − S0 )z) = (y, 2iz), e che (usando il lemma)
(y, z) =(−(2i)−1 y ∗ , (I − S0 )z) =: (y1 , (I − S0 )z)
=(y1 , (I − S)z)
troviamo y − (I − S)∗ y1 ∈ H+ e D(A∗ ) ⊂ H+ + R(I − S ∗ ). Ma
(I − S)∗ = (I − SS ∗ ) + SS ∗ − S ∗ = (I − SS ∗ ) + (S − I)S ∗
e dunque (tenendo conto che R(A + B) ⊂ R(A) + R(B)):
R(I − S)∗ ⊂R(I − SS ∗ ) + R((I − S)S ∗ ) = H− + R(I − S0 ) =H− + D(A)
qed
13.2.3 Corollario Se A = A ⊂ A∗ allora A = A∗ se e solo se n+ = n− = 0.
Il che equivale a dire A∗ z = ±iz ⇒ z = 0; inoltre
n± (A) = n± (A)
(dato che (D± (A) = D± (A)), e quindi
∗
13.2.4 Corollario Se A ⊂ A∗ allora A = A se e solo se n+ = n− = 0.
13.2.5 Teorema La trasformata di Cayley è un isomorfismo suriettivo che preserva l’ordine (cioè A1 ⊂ A2 ⇐⇒ S0 (A1 ) ⊂ S0 (A2 )) fra
{A | A = A ⊂ A∗ }
e lo spazio delle isometrie chiuse S tali che R(I − S) è denso, e fra lo spazio degli
autoaggiunti (A = A∗ ) e l’insieme degli operatori unitari U tali che R(I − U ) è
denso (cioè N (I − U ) = 0).
490
Capitolo 13. Operatori non limitati
Dimostrazione: Che A1 ⊂ A − 2 ⇐⇒ S0 (A1 ) ⊂ S0 (A2 ) è ovvio dalla
definizione.
Sia ora S una isometria tale che R(I − S) è denso: allora basta provare le
• N (I − S0 ) = 0
• A := i(I + S0 )(I − S0 )−1 è densamente definito e A ⊂ A∗ .
Per quel che riguarda (1), sappiamo che esiste S0 ⊂ S isometria parziale tale
che
N (I − S) ⊂ N (I − S) = R((I − S)∗ )⊥ ⊂ R((I − S)∗ |S )⊥
= R((I − S ∗ )S)⊥ = R(I − S0 )⊥ = 0
(per densità di R(I − S0 )). Il penultimo passaggio si giustifica osservando che (S
è una isometria parziale)
(I − S ∗ )S = S − S ∗ S = S(S ∗ S) − S ∗ S = (S − I)S ∗ S
e quindi R((S − I)S ∗ S) = R(I − S0 ) (per chiusura di S0 ). Ne segue che N (I −
S0 ) = 0.
Per avere la (2) basta dimostrare che per ogni x ∈ D(A) (x, Ax) ∈ R, cioè che
∀x ∈ D(A) (x, i(I + S0 )(I − S0 )−1 x) ∈ R
e dunque x = (I − S0 )z (z ∈ D(S0 ) per le ipotesi). Allora
(x, Ax) = ((I − S0 )z, i(I + S0 )z)
quindi
((I − S0 )z, i(I + S0 )z) = i((z, z) − (S0 z, S0 z) + (z, S0 z) − (S0 z, z))
= i((z, S0 z) − (z, S0 z)) ∈ R
((z, z) = 0 perché S0 è isometrico).
qed
Osserviamo che R(I − S0 ) è denso perché coincide con D(A); ma, per ogni
S0 ⊂ S isometria si ha I − S0 ⊂ I − S e quindi I − S ha codominio denso:
il teorema implica allora che in questo modo si ottengono tutte le estensioni
isometriche di A.
Se A ⊂ A∗ , S0 (A) ⊂ S0 e quindi S0 è una estensione isometrica, per cui esiste
A0 ⊂ A0∗ tale che A ⊂ A0 . Se ne conclude che studiare le estensioni di A si riduce
a studiare le estensioni isometriche degli operatori di Cayley.
13.2. Estendibilità di operatori
491
Se A = A allora
S0 (A) : D+ −→ D−
e quindi D+ ⊂ D(S0 ) è determinato da
⊥
D(S0 ) = D+ ⊕ (D+
∩ D(S0 ))
⊥
⊥
Ma D+
∩ D(S0 ) ⊂ H+ e S0 (D+
∩ D(S0 )) ⊂ H− . In effetti S0 è una isometria,
quindi
||S0 x||2 = ||x||2 ⇐⇒ (S0 x, S0 y) = (x, y)
(per polarizzazione) e, se x ∈ D+ , y ∈ H+ ∩ D(S0 ) si ha S0 y ∈ H− .
Dunque
13.2.6 Corollario A ⊂ A∗ è hermitiano massimale (cioè inestendibile) se e
solo se A = A e n+ (A) = 0 oppure n− (A) = 0.
Osserviamo anche che se V : H+ −→ H− è una isometria allora
S0 (z + z 0 ) := S0 (A)z + V z 0
pure è una isometria.
13.2.7 Teorema A ⊂ A∗ ammette una estensione autoaggiunta se e solo se
n+ = n− .
Dimostrazione: Se A possiede estensioni autoaggiunte allora sia B una di esse:
S0 (A) ⊂ U := S0 (B)
ove U è unitario (dato che B è autoaggiunto e R(B ± iI) = H) e U H+ = H− ,
per cui dim H− = dim H+ .
Viceversa, se dim H+ = dim H− allora deve esistere una isometria V : H+ −→
H− per mezzo della quale ottenere l’estensione
U (z + z 0 ) := S0 (A)z + V z 0
e B ⊂ B ∗ tale che n+ (B) = n− (B) = 0 e U = S0 (B); ovvero B = B ∗ .
Quindi
D(V ) = R(I − U ) = {x + (I − V )z | x ∈ D(A) e z ∈ H+ }
Cioè B è tale che B(x + (I − V )z 0 ) = Ax + i(I + V )z 0 .
qed
Se n+ = n− = n allora le estensioni autoaggiunte sono parametrizzate dal
gruppo unitario U (n).
492
Capitolo 13. Operatori non limitati
13.2.8 Proposizione R(I − U ) è denso se e solo se R(I − U )⊥ = 0 se e solo
se 1 ∈ σp (U ).
Dimostrazione: 1 ∈
/ σp (U ) ⇐⇒ (I − U )−1 è limitato ⇐⇒ A = i(I + U )(I −
U )−1 è autoaggiunto limitato.
qed
Cioè la trasformata di Cayley non solo pone in corrispondenza gli operatori
autoaggiunti A con gli operatori unitari U tali che R(I − U ) è denso, ma anche
pone in corrispondenza gli operatori autoaggiunti limitati con gli operatori unitari
tali che 1 ∈
/ σ(U ); in effetti l’inverso della trasformata di Cayley
A = i(I + U )(I − U )−1
è ovunque definito, dunque è limitato (dato che è chiuso), se e solo se R(I −U ) =
H, che equivale a 1 ∈
/ σ(U ), essendo I − U chiuso e iniettivo.
13.2.9 Esempio Consideriamo l’operatore di shift su uno spazio di Hilbert
(separabile):
Sen = en+1
e S0 (A) = S; allora R(S) = {e1 }⊥ sicché S non è unitario; tuttavia è una
trasformazione di Cayley.
Intanto R(I − S) è denso, dato che R(I − S)⊥ = N (I − S ∗ ) = 0: infatti se
S ∗ x = x allora x = 0. Ma S ∗ En+1 = en e quindi N (S ∗ ) = e1 :
(
en−m se n > m
S ∗m en =
0
se n ≤ m
Dunque per ogni x =
P
n cn en
(ove
P
n
S ∗m x −−−−→ 0
m−→0
|cn |2 = ||x||) si ha
fortemente
e S ∗ x = x implica allora S ∗m = x; ma S ∗m −→ 0 e quindi x = 0. Gli indici di
difetto sono 0 e 1.
Notiamo che in questo caso A ⊂ A∗ e non ci sono sottospazi invarianti chiusi
non banali per A: in effetti, se M fosse un tale sottospazio allora A(D(A) ∩ M ) ⊂
M e, se E = EM , avremmo
∀x ∈ D(A) Ex ∈ D(A)
ovvero AEx = EAx, i.e. EA ⊂ AE, da cui S0 (A)E = ES0 (A).
Quindi ES = SE, S ∗ E = ES ∗ , perciò E ∈ {0, I}, dato che l’algebra generata
493
13.2. Estendibilità di operatori
da S e S ∗ è irriducibile e contiene gli operatori compatti. Contiene inoltre ECe1 =
I − SS ∗ . Ma Sen = en+1 e quindi
S(I − SS ∗ )S∗ = ECe2
Iterando il procedimento ne concludiamo che, per ogni n ∈ N ECen è generata
da S e S ∗ e quindi S0 (A) = S è hermitiano massimale ed irriducibile (questa
situazione è opposta al caso di un operatore autoaggiunto che, per il teorema
spettrale, è “completamente riducibile”). Se in luogo di A si considera −A allora
S0 (A) = S ha indici (1, 0).
In realtà ogni operatore hermitiano massimale è somma diretta di un autoaggiunto e di un certo numero di operatori hermitiani che agiscono come l’operatore
A (o −A) nell’esempio precedente.
13.2.10 Teorema (Wold) Se H è uno spazio di Hilbert e S una isometria di
H allora
S = U ⊕ (S0 ⊕ S0 ⊕ ...)
ove U è un operatore unitario e S0 è l’operatore di shift. Lo spazio di Hilbert H
si decompone quindi in somma diretta
H = HU ⊕ (HS0 ⊕ HS0 ⊕ ...)
ove S|HU è un operatore unitario di B(HU ) e gli HS0 sono isomorfi a l2 (N) con
SHS0 operatori di shift.
Dimostrazione: Si ponga
HU :=
\
S nH
n≥0
Evidentemente HU è un sottospazio chiuso S-invariante di H e S|HU ∈ U(HU ).
Anche il sottospazio H0 := HU⊥ è S-invariante: se H0 6= 0 allora H0 + SH0 =
H0 ∩ (SH0 )⊥ è non nullo, e
[
H0 =
S n (H0 + SH0 )
n≥0
Se {eα }α∈A è una base ortonormale in H0 + SH0 e se, per α ∈ A:
HS0 := heα , Seα , S 2 eα , ...i
è lo spazio di Hilbert (separabile!) generato dalla famiglia {S n eα }n≥0 allora possiamo identificarlo
con l2 (N), per ogni α ∈ A, e S|HS−0 è un operatore di shift.
L
Ma H0 = α∈A HS0 e quindi
H = HU ⊕ (HS0 ⊕ HS0 ⊕ ...)
qed
494
Capitolo 13. Operatori non limitati
13.3
Un esempio: la derivata in L2 [0, 1]
d
Sia H = L2 [0, 1] rispetto alla misura di Lebesgue ds e A = i ds
definito sul
dominio D(0, 1) delle funzioni f assolutamente continue5 tali che f (0) = f (1) =
0. Allora (indichiamo le derivate con un apice)
f 7−→ if 0 = Af
è un operatore hermitiano, come si vede integrando per parti:
(g, if 0 ) = (ig 0 , f )
e (A∗ x)s = ix0 (s) con
D(A∗ ) = {x ∈ H | x0 ∈ H ∈ AC(0, 1)}
Quindi A non è chiuso né A è autoaggiunto, dato che
D(A∗∗ ) = {x ∈ AC[0, 1] | x0 ∈ H, x(0) = x(1) = 0}
e dunque A∗∗ ) A∗ .
Possiamo usare la teoria delle estensioni in questo caso semplice (che si potrebbe agevolmente trattare “a mano”: è un esercizio determinare le estensioni
autoaggiunte di A senza ricorrere alla teoria che stiamo delineando).
Determiniamo gli spazi H± le cui dimensioni danno gli indici di difetto: ad
esempio, per identificare H+ dobbiamo considerare le soluzioni della
A∗ x = ix
Dato che x∈D(0, 1) allora x∈AC(0, 1) e quindi (Ax = ix) x0 ∈AC(0, 1); iterando
questo ragionamento troviamo che x ∈ C ∞ (0, 1) e soddisfa l’equazione x0 = x:
quindi x = ces , con c ∈ C; abbiamo cioè
H± = {ce±s }c∈C
e quindi gli indici di difetto sono (1, 1). Ora consideriamo le due funzioni
√
2
ϕ± := √
e±s ∈ H±
2
e −1
5
Ricordiamo che f è assolutamente continua (AC) se
X
X
∀ε > 0 ∃δ > 0
|si − ti | < δ ⇒
|f (si ) − f (ti )| < ε
13.3. Un esempio: la derivata in L2 [0, 1]
495
Dato che le uniche isometrie parziali V : H+ −→ H− sono le mappe
ϕ+ 7−→ αϕ−
con α ∈ C di modulo 1 (i.e. |α| = 1 si può considerare un elemento della circonferenza unitaria S 1 = T ⊂ C), per la corrispondenza fra isometrie parziali e
estensioni autoaggiunte, ogni tale estensione H di A è della forma
H = Aα = i
d
ds
con dominio di definizione
Dα := {f + zϕ+ + zαϕ− | f ∈ D(0, 1) z ∈ C}
Si noti che questi domini sono:
Dα = {f ∈ AC(0, 1) | f (1) = αf (0)}
dato che, se f ∈ Dα :
e dunque
√
z 2(1 + αe)
f (0) = √
e2 − 1
√
z 2(α + e)
α+e
f (1) = √
=
f (0) = βf (0)
1 + αe
e2 − 1
¯ α+e ¯
¯ = 1. Viceversa ogni tale funzione è un elemento di Dα . Dunque
con |β| = ¯ 1+αe
le estensioni autoaggiunte di A sono parametrizzate da T.
13.3.1 Esempio
• Sia H = L2 (R, ds) e
A=i
d
ds
con
DA = {x ∈ H | x ∈ AC(R), x0 ∈ H}
Quindi A = A∗ eA∗ f = ±if , sicché f (s) = ce±s ∈ L2 )(R).
• Se invece ci limitiamo alla semiretta H = L2 ([0, ∞), ds) e
A0 = i
d
ds
con
DA0 = S(0, ∞)
allora
A∗0 = i
d
ds
con
DA∗0 = {x ∈ H | x ∈ AC[0, ∞), x0 ∈ H}
496
Capitolo 13. Operatori non limitati
dunque A∗0 f = ±f i.e. f (s) = ce±s che appartiene a H se il segno è − ma
non vi appartiene se il segno è +. Ora:
A∗∗
0 = i
d
ds
con
DA∗∗
= {x ∈ H | x ∈ AC[0, ∞), x0 ∈ H, x(0) = 0}
0
è un operatore hermitiano con indici (0, 1) ed è l’antitrasformata di Cayley
dell’operatore di shift:
S0 (A∗∗
0 ) = S
Se A = A∗∗ ⊂ A∗ è un operatore hermitiano chiuso densamente definito con
indici (m, n) allora −A ha indici (n, m) e quindi
A ⊕ (−A)
ha indici (n+m, n+m), dunque possiede estensioni autoaggiunte. Ne concludiamo
che, a meno di estendere lo spazio di Hilbert, possiamo dotare A di estensioni
autoaggiunte.
Se A = A∗ è densamente definito (e quindi esiste un operatore unitario U
tale che 1 ∈
/ σ(U ) allora, scrivendo la decomposizione spettrale di U :
Z
2π
eiϑ dF (ϑ)
U=
0
ove la famiglia spettrale F è tale che
s-lim F (ϑ) = 0
ϑ−→0
e
s-lim F (ϑ) = I
ϑ−→2π
con F (0, 2π) = I.
Notando che
U = (A − iI)(A + iI)−1
A = i(I + U )(I − U )−1
e definendo
E(λ) := F (ϑ(λ))
ove ϑ(λ) := −2 arctan λ = F (−2 arctan λ) si ha
s-lim E(λ) = 0
λ−→−∞
Questa sarà la famiglia spettrale di A:
e
s-lim E(λ) = I
λ−→∞
13.3. Un esempio: la derivata in L2 [0, 1]
497
13.3.2 Teorema Se A = A∗ è densamente definito allora esiste un’unica famiglia spettrale E(λ) tale che valgano le
Z ∞
• x ∈ DA ⇐⇒
λ2 d(x, E(λ)x) < ∞
−∞
Z
• x ∈ DA ⇒ Ax =
∞
λdE(λ)x (ove l’integrale è alla Riemann–Stieltjes).
−∞
Dimostrazione: (1) x ∈ DA se e solo se x ∈ R(I − U ) i.e. se esiste z ∈ H tale
che x = (I − U )z; ma
¶2
Z ∞
Z 2π µ
1 + eiϑ
2
i
λ d(x, E(λ)x) =
d(x, F (ϑ)x)
1 − eiϑ
−∞
0
Dato che
µ
¶2 µ
¶
¶ µ
1+z
(1 + z)(1 − z)
2 + (z + z − 2) + 2
4
i
=
=
=
−1
2
1−z
(1 − z)
2 − (z + z)
|1 − z|2
ci basta far vedere che esiste z tale che x(I − U )z se e solo se
Z 2π
1
d(x, F (ϑ)x) < ∞
|1 − eiϑ |2
0
Ma se x = (I − U )z e se consideriamo, per 0 < ϑ1 < ϑ2 < ϑ:
g12 (ϑ) := χ[ϑ1 ,ϑ2 ] (ϑ)(1 − eiϑ )−1
iϑ
Rallora, se G12 (ϑ) = g12 (e ) (g12 è una funzione boreliana per definizione) e quindi
g12 (ϑ)dF (ϑ) = G12 (U ), abbiamo
Z 2π
|g12 (ϑ)|2 d(x, E(λ)x) = ||G12 (U )x||2
0
Infatti, per definizione di g12 :
G12 (U )(I − U ) = F (ϑ2 ) − F (ϑ1 )
quindi
||(F (ϑ2 ) − F (ϑ1 ))z||2 = (z, F (ϑ2 ) − F (ϑ − 2)z) −−−−→ (z, z)
ϑ2 −→2π
ϑ1 −→0
da cui
Z
0
2π
1
d(x, F (ϑ)x) = (z, z) < ∞
|1 − eiϑ |2
498
Capitolo 13. Operatori non limitati
(n)
Viceversa, se vale questa disuguaglianza allora, se ϑ1 è una successione con(n)
(n)
(n)
vergente a 0 e ϑ2 è una successione convergente a 2π, con 0 < ϑ1 < ϑ2 <
ϑ:
Z
2π
0
1
d(x, F (ϑ)x) =
|1 − eiϑ |2
=
Z
lim
(n)
ϑ1 −→0
(n)
ϑ2 −→2π
∞ Z
X
n=1
(n)
(n−1)
(n−1)
(n)
ϑ2
In
(n)
ϑ1
1
d(x, F (ϑ)x)
|1 − eiϑ |2
1
d(x, F (ϑ)x)
|1 − eiϑ |2
(n)
ove In = [ϑ1 , ϑ1
] ∪P[ϑ2
, ϑ2 ] e quindi In ∩ Im = ∅ (abbiamo inoltre tenuto
∞
presente che lim cn = n=1 (cn − cn−1 ).
Dunque abbiamo che En := F (In ) sono proiettori a due a due ortogonali e,
applicando ad essi (per tramite del calcolo funzionale boreliano) le funzioni
Gn (eiϑ ) := χIn (ϑ)(1 − eiϑ )−1
otteniamo
n 6= m ⇒ Gn (U )Gm (U )∗ = 0
e quindi
Z
(m)
ϑ2
(m)
ϑ1
cioè
X
1
Gm (U )x
dF
(ϑ)x
=
|1 − eiϑ |2
n=1
m
¯¯2
¯¯
¯¯
¯¯X
XZ
1
¯¯
¯¯
Gm (U )x¯¯ =
d(x, F (ϑ)x) < ∞
¯¯
iϑ 2
¯¯
¯¯ m
In |1 − e |
n
Sicché la serie sotto il segno di norma converge e quindi, poiché si tratta di una
serie di vettori a due
P a due ortogonali, per il criterio di Cauchy, converge anche
la serie numerica m ||Gm (U )x||. Allora poniamo
Z
(n)
ϑ2
z := lim
n
(n)
ϑ1
1
dF (ϑ)x < ∞
|1 − eiϑ |2
ottenendo (I − U )z = x e quindi x ∈ DA .
(2) Se x ∈ DA allora x = (I − U )z e Ax = i(I + U )z, sicché
Z
z=
lim
(n)
ϑ1 −→0+
(n)
ϑ2 −→2π −
0
2π
1
dF (ϑ)x
1 − eiϑ
499
13.4. Teoria delle perturbazioni
Per continuità di i(I + U ) e dato che G12 (U )x =
Ax =
lim
(n)
ϑ1 −→0+
(n)
ϑ2 −→2π −
=
0
1
dF (ϑ)x
1−eiϑ
si ha
i(I + U )G12 (U )x
Z
ϑ2
lim
(n)
ϑ1 −→0+
(n)
ϑ2 −→2π −
R 2π
ϑ1
1 + eiϑ
i
dF (ϑ)x =
1 − eiϑ
Z
λ2
λdE(λ)x
lim
λ1 −→−∞
λ−→∞
λ1
(per definizione di λ).
Non resta quindi che da appurare l’unicità della famiglia spettrale: se G è
un’altra famiglia allora
Z λ2
λ−i
Ux =
dG(λ)x
λ1 λ + i
e, passando dai λ ai ϑ, G diviene una famiglia spettrale su T; ma la decomposizione spettrale di un operatore unitario è unica, dunque lo è E:
F 0 (ϑ) := G(λ(ϑ)) = F (ϑ) ⇒ G(λ) = E(λ)
qed
13.4
Teoria delle perturbazioni
Ricordiamo che un operatore è estendibile se e solo se ha indici di difetto
uguali: cerchiamo ora delle condizioni perché questa uguaglianza sia verificata.
Cominciamo con il
13.4.1 Teorema (Criterio di von Neumann) Se A ⊂ A∗ è densamente definito e se esiste un operatore antiunitario V tale che V A = AV allora n+ (A) =
n− (A).
Dimostrazione: Se V (A + I)x = (A − I)V x allora V : D+ (A) −→ D− (A)
è suriettivo e quindi lo è V : H+ (A) −→ H− (A): ne segue che dim H+ (A) =
dim H− (A).
qed
∗
Osserviamo che se A ⊂ A allora BA ⊂ AB e quindi BS0 (A) ⊂ S0 (A)B; se
A = A∗ e V = S(A) otteniamo V B = BV .
Ad esempio, se A ⊂ A∗ e A possiede un vettore ciclico x0 :
∀n ∈ N x0 ∈ D(An )
(un tale x0 si dice vettore differenziabile per A e si scrive x0 ∈ C ∞ (A)) e se
supponiamo che l’insieme
{x0 , Ax0 , A2 x0 , ...}
sia totale in H allora
500
Capitolo 13. Operatori non limitati
13.4.2 Teorema
• Se il sottospazio generato da {An x0 } coincide con DA allora A possiede
autoaggiunte.
• Se Ax0 := A|Dx0 (ove Dx0 è il sottospazio generato dall’insieme {An x0 }) ha
indici di difetto (n, n) con n < ∞ allora A ha estensioni autoaggiunte.
Dimostrazione: (1) Definiamo un operatore antiunitario V ; sia
X
X
v0 (
an An x0
an An x0 ) :=
n
n
Dimostriamo che si tratta di una isometria: dato che x0 ∈C ∞ (A) e A è hermitiano
¯¯2
¯¯
¯¯
¯¯X
X
X
¯¯
n ¯¯
an A x0 ¯¯ =
an am (An x0 , Am x0 ) =
an am (x0 , An+m x0 )
¯¯
¯¯
¯¯ n
n,m
n,m
X
X
an am (x0 , Am+n x0 ) =
am an (Am x0 , An x0 )
=
n,m
¯¯2
¯¯
¯¯
¯¯ X
¯¯
¯¯
an An x0 ¯¯
= ¯¯V0
¯¯
¯¯
n
n,m
Dunque, dato che V0 è definito su un insieme totale, esiste un operatore antiunitario V per cui possiamo applicare il criterio di Von Neumann.
(2) Sia Ax0 := A|Dx0 ove Dx0 è il sottospazio generato dall’insieme {An x0 };
allora Ax0 ⊂ A e, dato che gli indici di difetto di Ax0 sono uguali, lo sono anche
quelli di A.
qed
13.4.3 Definizione Un vettore differenziabile x0 ∈ C ∞ (A) si dice vettore di
unicità per A ⊂ A∗ se Ax0 := A|Dx0 (ove Dx0 è il sottospazio generato dall’insieme {An x0 }) è un operatore (densamente definito in Hx0 = Dx0 ) essenzialmente
autoaggiunto in Hx0 .
13.4.4 Teorema (Criterio di Nussbaum) Se A ⊂ A∗ ammette un insieme
totale di vettori di unicità allora A è essenzialmente autoaggiunto.
Dimostrazione: Sia x0 un vettore di unicità; allora i sottospazi chiusi
(A ± iI)D(A)
501
13.4. Teoria delle perturbazioni
coincidono con H se contengono un insieme totale. Quindi basta dimostrare che
per ogni vettore di unicità x0 , x0 ∈ (A ± iI)D(A). Ed infatti
(A ± iI)D(A) ⊃ (Ax0 ± iI)D(Ax0 ) = D± (Ax0 ) = D± (Ax0 )
Ma Ax0 è essenzialmente autoaggiunto per ipotesi, sicché D± (Ax0 ) = H.
qed
Ricordiamo che se B è un operatore limitato, vi possiamo valutare le funzioni
analitiche, e.g.
X λn
eλB =
Bn
n!
n≥0
Più in generale diamo l’importantissima
13.4.5 Definizione x è un vettore analitico per un operatore T se x ∈ C ∞ (T )
è differenziabile per quell’operatore e se esiste un λ > 0 tale che
X λn
n≥0
n!
||T n x|| < ∞
(cioè se la serie ha raggio di convergenza diverso da zero).
In seguito dimostreremo il risultato fondamentale di Nelson secondo il quale, se A ⊂ A∗ ha un insieme totale di vettori analitici allora è essenzialmente
autoaggiunto.
Vogliamo formulare per il momento un risultato che appartiene alla “teoria
delle perturbazioni” degli operatori: il teorema di Kato–Rellich.
Partiamo dall’osservazione che
n± = dim{z | A∗ z = ±iz} = dim{z | A∗ z = λz}
con im λ > 0 ovvero im λ < 0.
Inoltre notiamo che, se, se T è un operatore lineare chiuso e
nul T := dim N (T ) < ∞
o
def T := dim R(T ) < ∞
possiamo definire l’indice dell’operatore T come
ind T := def T − nul T
13.4.6 Definizione Un operatore T si dice quasi-Fredholm se nul T < ∞ o
def T < ∞ e si dice di Fredholm se nul T, def T < ∞.
502
Capitolo 13. Operatori non limitati
Sia T un operatore di Fredholm e B un operatore tale che DB ⊂ DT :
13.4.7 Definizione Se T è tale che
∀x ∈ DT
||Bx|| ≤ M (||x|| + ||T x||)
si dice che T è relativamente limitato limitato rispetto a B (ovvero limitato nel
senso di Kato) se
∃ a0 , b0 ∀x ∈ DT
||Bx|| ≤ a0 ||x|| + b0 ||T x||
Se poniamo
|||x||| := a||x|| + b||T x||
allora B è relativamente limitato se lo è come operatore fra gli spazi di Hilbert
(DT , |||.|||) e H.
Notiamo che se A = A ⊂ A∗ (densamente definito) allora, se z = µ + iν ∈ C
e λ 6= 0:
||(A + zI)x||2 = ||(A − µI)x − iλx||2 = ||(A − µI)x||2 + λ2 ||x||2
(i termini misti si elidono); quindi, per ogni λ 6= 0 l’insieme R(A − zI) è chiuso,
dato che è isometrico al grafo di A − µI munito della topologia della norma
equivalente a |||.||| con T = A − µI.
(
n+
13.4.8 Proposizione dim R(A − zI)⊥ =
n−
se im z > 0
se im z < 0
Dimostrazione: A − zI = A − z0 I − (z − z0 )I e quindi, applicandolo a x:
(A − zI)(x) = (A − z0 I)x − (z − z0 )x
Ma se z0 ∈ C \ {0 + iy}y∈R si trova che (A − z0 I)−1 è densamente definito su Dz0
(che è chiuso) ed è ivi continuo, dato che
||(A − z0 I)x||2 =||(A − z Re z0 I)x||2 + | Im z0 |2 ||x||2
≥| Im z0 |2 ||x||2
e quindi x = (A − z0 I)−1 (A − z0 I)x e
x = (A − z0 I)−1 E0 (A − z0 I)x
ove E0 è la proiezione sul sottospazio R(A − z0 I); sia inoltre
B := (A − z0 I)−1 E0
13.4. Teoria delle perturbazioni
503
Si tratta di un operatore limitato ovunque definito, sicché, per ogni x ∈ DA :
(A − zI)x = (A − z0 I)x − (z − z0 )x = I − (z − z0 )B(A − z0 I)x
Ma, se
|z − z0 | < ||B|| ≤ | Im z0 |−1
allora l’operatore S := I − (z − z0 )B è invertibile, sicch é
(A − zI)x = S(A − z0 I)x
e quindi R(A − zI) = SR(A − z0 I) (si noti che ambedue questi ranghi sono
chiusi) e S è lineare ed invertibile, dunque
dim R(A − z0 I)⊥ = dim R(A − z0 I)
dato che, se x ∈ R(A − zI)⊥ allora, per ogni z ∈ R(A − z0 I):
(x, Sz) = 0 ⇐⇒ X ∗ x ∈ R(A − z0 I)⊥
CIOè S ∗ R(A − z0 I)⊥ = R(A − zI)⊥ .
Ma S è invertibile, quindi anche S ∗ lo è; inoltre, se
T := S ∗ |R(A−zI)⊥
allora T = V |T | (decomposizione polare) e N (T ) = 0 (per invertibilità), sicché
V è una isometria il cui codominio è la chiusura del codominio di T , che è già un
chiuso: quindi V è l’isometria che realizza l’uguaglianza fra le dimensioni degli
spazi.
qed
Osserviamo che, se esiste λ ∈ R tale che
∀x ∈ DA
||(A − λI)x|| ≥ δ||x||
allora gli indici di difetto dell’operatore coincidono: questo è vero, ad esempio, se
λ(x, x) ≤ (x, Ax)
dato che, in questo caso, per la disuguaglianza di Schwartz:
(x, Ax) ≤ ||x|| ||Ax||
e quindi
λ||x|| ≤ ||Ax||
Se, per esempio, A ⊂ A∗ è definito positivo ((x, Ax) ≥ 0) allora ha indici di
difetto uguali: questa situazione avviene in molte applicazioni, ad esempio nella
formulazione di problemi per equazioni differenziali a derivate parziali.
504
Capitolo 13. Operatori non limitati
13.4.9 Definizione Se A ⊂ A∗ e B ⊂ B ∗ sono operatori tali che DA ⊂ DB , si
dice A-limite di B il numero
inf {b | ∃ab ∀x ∈ DA ||Bx|| ≤ ab ||x|| + b||Ax||}
Ad esempio, se l’A-limite è zero allora B è limitato.
13.4.10 Teorema (Kato–Rellich) Se A ⊂ A∗ , B ⊂ B ∗ , DA ⊂ DB e B è
A-relativamente limitato, cioè
∃a, b ∀x ∈ DA ||Bx|| ≤ ab ||x|| + b||Ax||
e se l’A-limite di B è minore di 1 allora
n± (A + B) = n± (A)
In particolare, se A è essenzialmente autoaggiunto allora anche B lo è e DA+B =
DA .
Dimostrazione: Sia b < 1 (ciò che possiamo supporre in quanto, per ipotesi,
l’A-limite di B è minore di 1); vogliamo studiare l’insieme R((A+B)±iI) ovvero
sia R((A + B) − zI).
Si noti intanto che
¯¯
¯¯
p
√
¯¯ 1
¯¯
||Bx|| ≤a||x|| + b||Ax|| ≤ a2 + b2 ||x ⊕ Ax|| = (aε)2 + b2 ¯¯¯¯ x ⊕ Ax¯¯¯¯
ε
Ma b < 1, sicché esiste ε > 0 con (aEe)2 + b2 < 1 e quindi
r
¯¯
¯¯
p
¯¯ 1
¯¯
1
(aε)2 + b2 ¯¯¯¯ x ⊕ Ax¯¯¯¯ = bε
||x||2 + ||Ax||2 = bε ||(A ± iε−1 I)x||
ε
ε2
(infatti ε−2 ||x||2 + ||Ax||2 è una norma equivalente sul grafico di A). Dunque,
come in precedenza:
(A + B ± iε−1 I)x = (A ± iε−1 )x + Bx
e scriviamo
Bx = B(A ± iε−1 I)−1 (A ± iε−1 I)x
ove (A ± iε−1 I)−1 è continuo e e diviene densamente definito componendo con
E± = ER(A±iε−1 I) . Sicché
Bx = B(A ± iε−1 I)−1 E± (A ± iε−1 I)x
13.4. Teoria delle perturbazioni
505
Ma
||B(A ± iε−1 I)−1 z|| ≤ bε ||(A ± iε−1 I)B(A ± iε−1 I)−1 z|| = bε ||z||
e
||B(A ± iε−1 I)−1 E± x|| ≤ bε ||E± z|| ≤ bε ||z||
Quindi la chiusura C± di B(A ± iε−1 I)−1 E± ha norma ≤ bε < 1; ne segue che
(A + B ± iε−1 I)x = (I + C± )(A ± iε−1 I)
ed il complemento ortogonale del codominio di (A + B ± iε−1 I) ha la stessa
dimensione di quello di (A ± iε−1 I).
qed
Si noti che
D a = R(A + iI)−1
Ovviamente, se λ ∈
/ σ(T ) allora (T − λI) è di Fredholm e quindi abbiamo il suo
spettro essenziale
σess (T ) = {λ ∈ C | (T − λI) non di Fredholm}
Se T è normale si tratta dello spettro essenziale da noi già definito; ricordiamo in
effetti il teorema di Weyl 10.5.19 se T è normale e limitato e K compatto allora
σess (T ) = σess (T + K).
Menzioniamo soltanto che esiste una versione di questo teorema per operatori
non limitati: i risultati sono i seguenti:
Teorema. Se B è una perturbazione limitata nel senso di Kato rispetto a T
allora σess (T + B) = σess (T ).
Teorema. Se B è relativamente compatto rispetto a T allora σess (T + B) =
σess (T ).
ove
13.4.11 Definizione B è relativamente compatto rispetto a T se DT ⊂ DB e
l’operatore B è compatto fra lo spazio di Hilbert DT rispetto alla norma |||.|||T e
H.
13.4.12 Proposizione Se T è un operatore autoaggiunto non necessariamente
limitato e B ⊂ B ∗ è T -compatto allora σess (T + B) = σess (T ).
506
Capitolo 13. Operatori non limitati
Dimostrazione: In effetti
σess (T ) = {λ ∈ R | ∃{en } ⊂ DT b.o. ||T eN − λen || −→ 0}
(“b.o.” sta per “base ortonormale”). Ma se {en } è una base ortonormale allora
en −→ 0 debolmente e quindi
debolmente
T en = λen + (T en − λen ) −−−−−−−→ 0
debolmente
cioè en ⊕ T en −−−−−−−→ 0 e quindi (per T -compattezza di B):
in norma
Ben −−−−−−→ 0
Dunque ||(T + B)en − en || −→ 0.
qed
13.5
Un esempio: Il laplaciano in R3
Consideriamo l’operatore di Laplace (a meno del segno) A = −∆; in coordinate di Rn :
¶
µ 2
∂2
∂
+ ··· + 2
∆=−
∂s21
∂sn
Il nostro spazio di Hilbert è H = L2 (Rn , dsn ), e D = Cc∞ (Rn ) (funzioni a supporto
compatto); consideriamo lo spazio di Schwartz
¯¯
¯¯
¾
½
n ¯¯
¯¯
2 m ∂
∞ ¯¯
¯
¯
= pmn (f ) ⇒ pmn (f ) < ∞
S = f ∈ C | ¯¯(1 + s )
f
∂sn ¯¯∞
Sappiamo che D ⊂ S è denso nella topologia di D e che la trasformata di Fourier
è un isomorfismo di S in sé (teorema 8.5.5). Allora, se
A0 := −∆|D
e
A1 := −∆|S
e
(f, i
si ha A0 ⊂ A∗0 e A1 ⊂ A∗1 e
(f, i
∂f
∂g
) = (i
, g)
∂sh
∂sh
∂ 2g
∂ 2f
)
=
(
, g)
∂s2h
∂s2h
(integrazione per parti), sicché ∆ e −∆ sono hermitiani. Ora dimostriamo che
A1 ⊂ A0
13.5. Un esempio: Il laplaciano in R3
507
In effetti per ogni f ∈S esiste {gn } ⊂ S tale che p(gn −f ) −→ 0 pr ogni seminorma
p della topologia di S, quindi
L2
gn −−→ f
∂ ν gn L2 ∂ ν f
−−→ ν
∂sν
∂s
e
(per ogni multiindice ν) dato che
f = (1 + s2 )−k (1 + s2 )k f
e quindi
||f ||L2 ≤ ||(1 + s2 )k f ||∞ ||(1 + s2 )−k ||L2
il che vale anche per ogni derivata parziale della f . Pertanto
∆gn −→ ∆f
Ora “coniughiamo” rispetto alla trasformata di Fourier (che indichiamo con F:
Ff = fb): se
(
Ã
!)
X
B1 := FA1 F−1 = f ∈ S 7−→ h 7−→
kj2 f (n)
j
allora
(B1 f )(k) = k 2 f (k)
Notiamo poi che B1 è essenzialmente autoaggiunto: infatti
R(B1 ± I) = {k 7−→ (k 2 ± i)f (k)}f ∈S = S
(dato che g ∈ S ⇒ k 7−→ (k 2 ± i)−1 g(k)) e quindi è un insieme denso.
Ora sia (se H0 = −∆):
DH0 = {f ∈ L2 | fb ∈ L2 e (k 7−→ k 2 fb(k)) ∈ L2 }
Allora, dato che
Z
||f ||2B1
= ||f || +
2
|k 2 f (k)|2 dn k
si ha DH0 = L2 (Rn , (1 + k 4 )dn s).
Consideriamo il caso n = 3 nell’esempio precedente: se f ∈ DH0 allora
Z
3
2
−1
2
−
fb = (1 + k ) (1 + k )fb ⇒ f (s) = (2π) 2 e−iks (1 + k 2 )−1 (1 + k 2 )fb(k)d3 k
508
Ma
che
Capitolo 13. Operatori non limitati
1 2
k dk
k4
≈
1
dk
k2
e quindi la funzione integranda è a quadrato sommabile; dato
fb = (1 + λk 2 )−1 (1 + λk 2 )fb
cioè (ponendo h = λk):
Z
Z
3
3
2 −2 3
2
(1 + λk ) d k = λ
(1 + h2 )−2 d3 h =: λ 2 c ∈ R
troviamo
3
3
|f (s)| ≤ cλ− 2 ||fb + λk fb(k)||2 = cλ− ||f + λ2 H0 f ||2
2
Ma ||f ||2 = ||fb||2 (teorema di Plancherel) e quindi
13.5.1 Lemma (Disuguaglianza di Sobolev)
|f (s)| ≤ cλ− 2 ||f + λ2 H0 f ||2
3
Ne segue che
|f (s)| ≤ cλ− 2 ||f || + cλ 2 ||H0 f ||
3
1
In altri termini, il funzionale f 7−→ f (s) (per f ∈ DH0 ) è H0 -limitato, cioè, per
ogni x ∈ H l’operatore di rango 1 f 7−→ f (s)x è lineare e relativamente limitato:
si badi bene che non è un operatore chiudibile (avendo rango 1 e non essendo
continuo).
In Meccanica Quantistica si pone
p2
}
H0 =
=−
∆
2m
2m
e l’hamiltoniana del sistema è H0 + V con (V f )(s) = V (s)f (s).
Se V ∈ L2loc (R3 , d3 s), cioè V misurabile e
Z
∀L > 0
|V (s)|2 ds < ∞
|s|≤L
le hamiltoniane corrispondenti ammettono estensioni autoaggiunte. Se
(f, (H0 + V )f ) ∈ R
allora V ammette estensioni autoaggiunte (V (s) ∈ R).
Notiamo che DH0 +V = D (che è lo spazio di Schwartz: se f ∈ D allora V (f ) ∈
L2 ). Dunque, per il criterio di von Neumann, se U è un operatore unitario in L2 :
[U, H0 + V ] = 0 ⇒ H0 + V ha estensioni autoaggiunte
(ove [A, B] = AB − BA è il commutatore).
13.5. Un esempio: Il laplaciano in R3
509
13.5.2 Teorema Se V = f + g con f ∈ L2 (R3 ) e g ∈ L∞ (R3 ) allora
• V è H0 -limitato con H0 -limite pari a 0.
|s|−→∞
• Se g(s) −−−−−−→ 0 allora V è H0 -compatto.
Dimostrazione: (1) Sia x ∈ D:
||V x||2 ≤||f x||2 + ||gx||2 ≤ ||x||∞ ||f ||2 + ||g||∞ ||x||2
≤||f ||2 cλ− 2 ||x + λH0 x||2 + ||g||∞ ||x||2
3
≤(||f ||2 cλ− 2 + ||g||2 )||x||2 + c||f ||2 λ 2 ||H0 x||2
1
3
(per la disuguaglianza di Sobolev). Quindi l’H0 -limite di V è zero.
(2) Dato che V : DH0 −→ H = L2 (R3 ), sappiamo che, per x ∈ DH0 :
||V x|| ≤ a||x|| + b||H0 x||
con b ∝ λ 2 e a ∝ λ− 2 (i.e. a ≈ cb−3 ). Dunque, ricordando che
1
3
a = (λ− 2 ||f ||2 + ||g||∞ )c
3
e
1
b = λ 2 ||f ||2
L2
si trova, per Vn := fn + gn (scelte due successioni {fn } e {gn } tali che fn −−→ f
L∞
e gn −−−→ g):
Vn −→ V
nella norma di B(DH0 , H) (ove su DH0 si pone la norma |||.|||). Quindi V è
compatto se lo sono i Vn , cioè se le fn sono a supporto compatto in L2 (R3 ) e se
|s|−→∞
le gn sono a supporto compatto in L∞ (R3 ) (usando l’ipotesi g(s) −−−−−→ 0).
Quindi possiamo supporre supp f, supp g ⊂ K (compatto) e, per dimostrare la
compattezza di V basta far vedere che porta insiemi limitati in insiemi compatti.
Utilizziamo per questo il teorema di Ascoli–Arzelà 3.5.2. Sia x ∈ DH0 : allora
V x = V Ex = EV x
(ove E = MχK è l’operatore di moltiplicazione per la funzione caratteristica di
K), cioè V (x|K ) ∈ H; prendiamo x in un insieme limitato S rispetto alla norma
del grafico di H0 |||.|||: allora, V (x|K ) appartiene a un compatto di H. Infatti se
x ∈ S:
||H0 x|| ≤ M
e
||x|| ≤ N
e quindi (||∆x|| ≤ M ):
−(x, ∆x) = −
XZ
j
x(s)
∂2
x(s)ds ≤ M
∂s2j
510
Capitolo 13. Operatori non limitati
quindi la famiglia S è equicontinua e, per il teorema di Ascoli–Arzelà, S è compatto in C(K): esiste cioè una successione uniformemente convergente (su K)
e
V (xn ) = f (xn ) + g(xn )
qed
Notiamo che dalla (1) segue che, se V = V allora H0 + V è essenzialmente
autoaggiunto su ciascun dominio ove lo sia H0 e DH0 +V = DH0 , per il teorema di
Kato–Rellich; dalla (2) possiamo invece inferire che σess (H0 + V ) = σess (H0 ) =
c0 è la moltiplicazione per k 2 ).
σ(H0 ) = [0, ∞) (ricordando che H
13.5.3 Esempio Se
V =−
e2
e2
e2
= − χU − χ{U
|s|
|s|
|s|
con U intorno limitato, lo spettro che si ottiene è quello dell’atomo di idrogeno:
questo esempio ha sostanzialmente motivato la teoria.
Osserviamo che se x ∈ DH0 allora
− 32
x(s) = (2π)
e (1 = (1 + k 2 )−1 (1 + k 2 )):
0
00
− 32
x(s ) − x(s ) = (2π)
0
Z ³
−is0 k
e
Z
1 · e−isk x
b(k)d3 k
−is00 k
−e
´
(1 + k 2 )−1 (1 + k 2 )b
x(k)d3 k
00
Ma (e−is k − e−is k )(1 + k 2 )−1 ∈ L2 (R3 ) e (1 + k 2 )b
x(k) ∈ L2 (R3 ), sicché
0
00
|x(s0 ) − x(s00 )| ≤||(e−is k − e−is k )(1 + k 2 )−1 || ||x + H0 x||
=||Gs0 − Gs00 || ||x + H0 x||
=||Gs0 −s00 − G|| ||x + H0 x||†)
(()
ove G = F−1 ((1+k 2 )−1 ) e Gs è la traslazione per s in L2 (R3 ) ((Gs f )(t) = f (t−s));
quindi
Z
||Gs ||2 =
|G(h − s)|2 dh = ||G||2
il che giustifica l’ultimo passaggio delle (†).
s−→0
Inoltre, ||Gs − G|| −−−−→ 0 in norma (questo vale in Lp con p < ∞: questi
spazi sono il completamento di Cc (Rn ) in norma ||.||p ). Osserviamo pure che se
||f − f 0 || < ε allora ||fh − fh0 || < ε e
||fh − f || ≤ ||fh − fh0 || + ||fh0 − f 0 || + ||f 0 − f || < 2ε + ||fh0 − f 0 ||
13.5. Un esempio: Il laplaciano in R3
511
Tornando alle (†):
|x(s0 ) − x(s00 )| < ε||x + H0 x|| ≤ ε(||x|| + ||H0 x||) = ε|||x|||
Quindi se {x} è equilimitato nella norma del grafico |||.||| è pure equicontinuo.
Per ulteriori sviluppi di questo esempio si può consultare [29], §10.
Parte III
Gruppi, Operatori e
Quantizzazione
Capitolo 14
GRUPPI TOPOLOGICI
In questo capitolo discutiamo i gruppi topologici, che generalizzano da un
lato i gruppi di matrici dell’Algebra Lineare, dall’altro la teoria delle serie e
dell’integrale di Fourier, sviluppata nel capitolo ??. L’intera teoria poggia sulla
possibilità di definire un integrale per questi gruppi che generalizza l’integrale di
Lebesgue sul gruppo additivo dei numeri reali.
14.1
Gruppi topologici e misure di Haar
L’analogia esistente fra la teoria di Fourier in Rn e la teoria delle serie di
Fourier non è un caso: possiamo in effetti formulare una generalizzazione di queste
teorie che metta in luce quali sono i loro caratteri comuni.
Osserviamo ad esempio che, nel definire le convoluzioni in Rn , abbiamo in
realtà usato solo due ingredienti essenziali: l’esistenza di una misura boreliana
completa su Rn (la misura di Lebesgue), l’operazione di somma vettoriale in
Rn che lo rende un gruppo commutativo e la compatibilità esistente fra queste
due strutture espressa dall’invarianza della misura di Lebesgue per traslazioni.
Nel caso delle serie di Fourier, pure gli unici ingredienti erano l’esistenza di
una misura boreliana completa sulla circonferenza unitaria T, l’esistenza di un
prodotto commutativo fra gli elementi di T (eit eis = ei(s+t) ) e l’invarianza della
misura per le traslazioni di questa struttura gruppale.
Possiamo quindi immaginare di generalizzare la teoria di Fourier al caso di un
gruppo G commutativo sul quale esista una misura boreliana completa invariante
per la moltiplicazione del gruppo. Naturalmente una misura boreliana presuppone l’esistenza di una topologia, e questa topologia dovrà necessariamente essere
compatibile con la struttura gruppale, cioè l’operazione di moltiplicazione del
gruppo dovrà essere continua. Si arriva in questo modo alla
14.1.1 Definizione Un gruppo topologico è un insieme G che sia al tempo
stesso un gruppo rispetto ad una operazione · ed uno spazio topologico rispetto
515
516
Capitolo 14. Gruppi topologici
ad una topologia T in modo che la funzione
µ : G × G −→ G
(g, h) 7−→ g · h−1
sia continua (su G × G si considera la topologia prodotto).
Si osservi che non è richiesta la commutatività.
14.1.2 Esempio
• Uno spazio vettoriale topologico V , rispetto alla sua topologia ed all’operazione di somma di vettori è un gruppo topologico commutativo.
• Ogni gruppo finito è un gruppo topologico rispetto alla topologia discreta
(il che fornisce esempi di gruppi non commutativi).
• Dato che il prodotto di compatti è compatto, un prodotto infinito di gruppi
finiti è un gruppo compatto (rispetto alla struttura gruppale di prodotto
diretto e topologica di prodotto topologico) non discreto (ovviamente un
gruppo discreto compatto è finito!): un esempio è il prodotto numerabile
di copie di Z2 (il gruppo moltiplicativo {−1, +1}) che risulta quindi essere
un gruppo topologico compatto non discreto.
• Il gruppo Z come sottogruppo topologico di R è un gruppo topologico
localmente compatto; inoltre, dato che il quoziente di gruppi è un gruppo,
il gruppo T = R/Z (toro unidimensionale ovvero circonferenza unitaria in
R2 ) è un gruppo topologico rispetto alla topologia quoziente: dato che si
identifica con la circonferenza {z ∈ C| |z| = 1} è compatto.
• Il gruppo U(H) degli operatori unitari di uno spazio di Hilbert è pure un
gruppo topologico (cfr. il lemma 9.1.9).
14.1.3 Proposizione Un gruppo topologico è T1 se e solo se è T2 .
Dimostrazione: Se è T2 è a fortiori T1 ; viceversa, se è T1 la diagonale ∆ ⊂
G×G è la controimmagine m−1 (e) dell’insieme chiuso {e} per la mappa continua
m(x, y) := x−1 y, e quindi è chiusa.
qed
Non ogni gruppo dotato di una topologia è necessariamente topologico: ad
esempio R con la topologia di Zariski (gli aperti sono i complementari degli insiemi finiti) non è un gruppo topologico, dato che, come spazio, è T1 (i punti sono
chiusi) ma non T2 (ogni aperto è denso!) e quindi per la proposizione precedente
non può essere un gruppo topologico.
14.1. Gruppi topologici e misure di Haar
517
14.1.4 Esempio Una classe notevole di gruppi topologici è data dai gruppi di
matrici come il gruppo lineare generale reale
GL(n, R) := {A ∈ Mn (R) | det A 6= 0}
(ed il suo analogo complesso); il prodotto in GL(n, R) è il prodotto di matrici e la
2
sua topologia è quella indotta da Mn (R) ∼
= Rn del quale è un aperto (in quanto
è il complementare dell’insieme {A ∈ Mn (R) | det A = 0} che è il luogo degli
zeri di una funzione continua, quindi un chiuso). Poiché il prodotto di matrici
AB dipende in modo polinomiale dalle entrate delle matrici A e B, l’operazione
di gruppo è continua e quindi il gruppo lineare generale è un gruppo topologico
2
non commutativo, ma localmente compatto (lo è Rn ).
14.1.5 Definizione Una misura di Haar sinistra (rispettivamente misura di
Haar destra) su un gruppo topologico è una misura boreliana regolare positiva µ
invariante a sinistra (rispettivamente a destra) per la moltiplicazione del gruppo,
cioè tale che
Z
Z
1
0
∀f ∈ L (G)
f (g g)dµ(g) = f (g)dµ(g)
Se una misura di Haar è invariante sia a sinistra che a destra, si dice misura di
Haar biinvariante e si parla di “misura di Haar” senza altre specifiche.
Consideriamo un gruppo topologico localmente compatto: esiste il seguente
teorema, per il quale si rimanda ad esempio ai classici [32] o [26], oppure a [30]:
Teorema (Haar). Se G è un gruppo topologico localmente compatto allora
• G possiede una misura di Haar sinistra (rispettivamente destra) unica a
meno di un fattore moltiplicativo.
• La misura di Haar sinistra e la misura di Haar destra sono assolutamente
continue l’una rispetto all’altra.
• Se G è compatto allora la misura di Haar sinistra e la misura di Haar
destra coincidono e sono finite.
Dimostreremo questo teorema solo nel caso commutativo e, più avanti, per i
gruppi di Lie; l’esistenza della misura di Haar è un fatto cruciale nella teoria dei
gruppi topologici, perché, ad esempio, consente di sviluppare la teoria delle rappresentazioni. Questo spiega perché i gruppi che si considerano sono localmente
compatti: solo per essi si può dare una misura di Haar1 .
1
Una domanda che è legittimo porsi è se non si possa dare un concetto di “gruppo misurabile” indipendente dalla topologia: se quello che realmente conta nella teoria è l’esistenza della
misura di Haar, a priori non è necessario che il gruppo sia topologico; si dimostra comunque che
se un gruppo possiede una misura invariante allora è denso in un gruppo topologico localmente
compatto (teorema di Weil, cfr. [32]
518
Capitolo 14. Gruppi topologici
14.1.6 Esempio Un gruppo non localmente compatto è il gruppo additivo di
uno spazio vettoriale topologico di dimensione infinita.
Osserviamo che, per il teorema di Riesz–Markov 9.2.2, il teorema di Haar
equivale all’esistenza di un funzionale lineare positivo invariante a sinistra (risp.
a destra):
I : Cc (G) −→ R
ove I : Cc (G) è lo spazio delle funzioni complesse a supporto compatto su G.
14.1.7 Definizione La derivata di Radon–Nikodym
∆=
dµL
dµR
delle misure di Haar sinistra e destra si dice funzione unimodulare del gruppo
topologico G; se ∆ = 1 il gruppo stesso di dice unimodulare.
14.1.8 Esempio
• Un gruppo topologico localmente compatto e commutativo è unimodulare,
dato che la misura di Haar destra e sinistra debbono coincidere (gg 0 = g 0 g);
anche un gruppo compatto qualsiasi lo è, come segue dal teorema di Haar.
• Consideriamo il gruppo delle matrici triangolari superiori a coefficienti in
R:
1 a12 a13 ... a1n
0 1 a23 ... a2n
Nn (R) = .. ..
..
..
..
. .
.
.
.
0 0
0 ... 1 a ∈R
ij
Si tratta di un gruppo topologico omeomorfo a R
misura di Lebesgue
Y
dµ =
daij
n(n−1)
2
: esiste quindi la
i<j
Si vede immediatamente che questa è una misura di Haar su Nn (R), cioè
che è invariante a sinistra: infatti, se A, B ∈ Nn (R), il coefficiente nella riga
i-sima e nella colonna s-esima della matrice AB è
X
X
(AB)is =
aik bks = bis + ais +
aik bks
k
i<k<s
cioè è pari a bis + ais più una costante (che non dipende dagli elementi di
indici is ): ne segue che dµ(AB) = dµ(B); analogamente si dimostra che dµ
è invariante a destra, sicché il gruppo è unimodulare.
14.1. Gruppi topologici e misure di Haar
519
14.1.9 Teorema Se G è un gruppo topologico commutativo localmente compatto
allora esiste un’unica misura Haar su G.
Dimostrazione: L’operazione di moltiplicazione in G induce l’operatore di
traslazione, se g ∈ G:
Lg : Cc (G)∗ −→ Cc (G)
ϕ 7−→ (f 7−→ ϕ(fg ))
(con fg denotiamo la funzione f (h) := f (gh) da G in R). Evidentemente Lg è
continua rispetto alle topologie *-deboli e, al variare di g abbiamo la famiglia
L := {Lg }g∈G
di trasformazioni lineari continue che commutano a due a due (perché G è
commutativo: Lg Lh = Lgh = Lhg = Lh Lg ). Se consideriamo il convesso
K := {ϕ ∈ Cc (G)∗ | ||ϕ|| ≤ 1} ∩ {ϕ ∈ Cc (G)∗ | F (1) = 1}
è immediato verificare che la famiglia L lascia invariante K: LK ⊂ K. Ma, per il
teorema di Alaoglu, K è compatto; possiamo quindi applicare alla famiglia L ed
al convesso compatto K il teorema del punto fisso di Markov–Kakutani 8.3.11 e
dedurre l’esistenza di un punto fisso ϕ0 ∈ K. Abbiamo cioè un funzionale lineare
continuo su Cc (G) invariante per ogni traslazione del gruppo: per il teorema di
Riesz–Markov 9.2.2 questo funzionale determina univocamente una misura di
Radon µ che è proprio la misura invariante cercata.
qed
La misura di Haar sul gruppo commutativo G è positiva, in quanto lo sono i
funzionali lineari in K, ed è finita sui compatti perché ϕ0 è continuo (di nuovo
per il teorema di Riesz–Markov).
14.1.10 Esempio
• È facile rendersi conto che, nel caso di Rn , questa costruzione dà luogo
esattamente alla misura di Lebesgue (a meno di multipli costanti).
• Se il gruppo è compatto, µ(G) è finito, ed in genere si normalizza la misura
in modo che µ(G) = 1.
• Nel caso G = Z la misura di Haar ν è semplicemente la media sulle funzioni
a supporto compatto Z −→ R, cioè su quelle che non valgono zero se non
in un numero finito di punti:
Z
X
f (n)dν(n) =
f (n)ν({n})
Z
n∈Z
520
Capitolo 14. Gruppi topologici
In questo caso si normalizza la misura in modo che
ν({n}) = 1
per ogni punto n ∈ Z e quindi la misura di Haar è la misura # che conta:
ν(E) = #E = Card E.
• In particolare, su un gruppo abeliano finito (che è della forma Zm : classi di
congruenza modulo m), la misura di Haar pure è la misura che conta #.
Possiamo quindi considerare la teoria della misura su G: ad esempio gli spazi
Lp , il teorema di Fubini ed i teoremi di convergenza degli integrali. Osserviamo
che nel definire la convoluzione di funzioni in Cc (Rn ) e L1 (Rn ) non abbiamo usato
altro che l’invarianza della misura e le proprietà gruppali della somma di vettori:
mutatis mutandis possiamo quindi riformulare tutta la teoria per un gruppo
commutativo localmente compatto G; la teoria della trasformata di Fourier è il
caso G = Rn e la teoria delle serie di Fourier il caso G = T.
14.1.11 Teorema Se G è un gruppo topologico che ammette una misura di
Haar, lo spazio di Banach L1 (G) è un’algebra di Banach rispetto alla convoluzione, che è commutativa se e solo se lo è il gruppo.
Dimostrazione: Definiamo la convoluzione di due elementi di L1 (G) come
Z
ϕ ∗ ψ(g) :=
ϕ(h)ψ(h−1 g)dh
G
Vediamo intanto che ϕ ∗ ψ ∈ L (G): dato che la funzione (g, h) 7−→ (h−1 g, h) è un
omeomorfismo di G × G in sé, porta funzioni misurabili in funzioni misurabili:
quindi, dato che il prodotto punto per punto ϕ(g)ψ(g) è misurabile se lo sono ϕ
e ψ, anche ϕ(h)ψ(h−1 g) lo è; allora:
Z Z
Z
Z
−1
|ϕ(h)ψ(h g)|dgdh = |ϕ(h)| |ψ(h−1 g)|dg
Z
Z
= |ϕ(h)|dh |ψ(g)|dg < ∞
1
Cioè ϕ(h)ψ(h−1 g) ∈ L1 (G × G) e quindi, per il teorema di Fubini, ϕ ∗ ψ ∈ L1 (G).
Che la convoluzione renda L1 (G) un’algebra associativa si dimostra con gli
stessi passaggi del caso G = Rn ; dimostriamo dunque che, rispetto alla sua
struttura di spazio di Banach, L1 (G) è un’algebra di Banach. Infatti
¯
¶
Z µZ
Z ¯Z
¯
¯
−1
−1
¯
¯
|ϕ(h)| |ψ(h g)|dh dg
||ϕ ∗ ψ||1 = ¯ ϕ(h)ψ(h g)dh¯ dg ≤
¶
Z µZ
Z
Z
−1
=
|ψ(h g)|dg |ϕ(h)dh = |ψ(g)|dg |ϕ(h)|dh
= ||ϕ||1 ||ψ||1
521
14.1. Gruppi topologici e misure di Haar
Infine, abbiamo che se G è abeliano allora
Z
Z
−1
ϕ ∗ ψ(g) = ϕ(h)ψ(h g)dh = ϕ(gk −1 )ψ(k)dk
Z
= ψ(k)ψ(k −1 g)dk = ψ ∗ ϕ(g)
(col cambio di variabile h−1 g = k e tenendo conto che dh = d(gh) e dh = dh−1
per invarianza della misura di Haar) e viceversa.
qed
14.1.12 Esempio
• Su un gruppo abeliano finito G, l’algebra L1 (G) è semplicemente l’algebra
di gruppo cioè lo spazio
(
)
X
C[G] =
ag g | ag ∈ C
g∈G
(infatti una funzione G −→ C è un elemento di CG = CCard G , cioè una
(Card G)-pla, che scriviamo come una somma formale negli elementi di g)
con la convoluzione
Z
X
X
a ∗ b(g) =
a(gh−1 )b(h)dh =
a(gh−1 b(h) =
a(h1 )b(h2 )
G
h∈G
h1 h2 =g∈G
• Se G è un gruppo discreto, possiede ovviamente la misura di Haar che
assegna ad ogni {g} (per g ∈ G) un valore positivo fissato, ad esempio 1.
14.1.13 Proposizione L’algebra L1 (G) possiede un elemento neutro e se e solo
se il gruppo G è discreto.
Dimostrazione: Ovviamente, se G è discreto, la funzione ε : G −→ R
ε(g) := δge
(che si identifica all’elemento e∈G) è diversa da zero in L1 (G), dato che µ({e}) >
0:
Z
ε(g)dµ(g) = µ({e}) = 1
G
ed è ovviamente l’elemento neutro per la convoluzione.
522
Capitolo 14. Gruppi topologici
Viceversa, se L1 (G) contiene un elemento neutro e : G −→ R allora la misura
degli insiemi aperti non vuoti possiede un limite inferiore positivo: se cosı̀ non
fosse, per ogni ε > 0 esisterebbe un U intorno dell’elemento neutro e ∈ G in G
tale che
Z
|e(g)|dg < ε
G
Consideriamo allora un intorno V di e ∈ G tale che se g ∈ V anche g −1 ∈ V e che
V 2 ⊂ U (V 2 è l’insieme dei prodotti di elementi di V con se stesso). Per g ∈ V si
ha quindi
Z
Z
Z
−1
1 = χV (g) = χV ∗ e(g) =
χV (gh )e(h)dh =
e(h)dh ≤
|e(h)|dh < ε
G
gV
U
che è assurdo. Quindi deve esistere un a > 0 tale che, per ogni aperto non vuoto
A ⊂ G, a ≤ µ(A); se g ∈ G, possiamo considerare una successione di aperti
An ⊂ An+1 tali che ∩n An = {e}. Infatti {g} è intersezione della famiglia di
intorni che lo contiene (perché la topologia del gruppo è Hausdorff 2 ), e ciascuno
di questi intorni contiene un aperto contenente g, quindi possiamo scegliere una
successione di questi aperti. Allora
!
Ã
\
An = lim An
µ({g}) = µ
n−→∞
n
cioè µ({g}) ≥ a. Quindi i punti hanno misura positiva, e quindi devono essere
aperti; infatti se U è un aperto di misura finita (che esiste per locale compattezza
del gruppo):
Ã
!
̰
!
∞
[
X
[
∞ > µ(U ) = µ
µ({gi }) = ∞
{g} ≥ µ
{gi } =
g∈U
i=1
i=1
per ogni successione {gi } ⊂ U ; dunque ogni {g} è aperto e quindi G è discreto.
qed
14.2
Gruppi compatti e rappresentazioni
In questa sezione ci occupiamo principalmente di gruppi compatti e delle loro
rappresentazioni: tutti i nostri ragionamenti si baseranno sull’esistenza di un’unica misura di Haar finita per questi gruppi, fatto che abbiamo supposto senza dimostrazione ma che dimostreremo per la classe dei gruppi di Lie, sostanzialmente
i gruppi di interesse nelle applicazioni. Ricordiamo la seguente
2
Se l’intersezione degli intorni di g fosse un insieme I non ridotto al solo {g}, allora, se h ∈ I
e h 6= g, i punti h e g non possiederebbero intorni disgiunti.
14.2. Gruppi compatti e rappresentazioni
523
14.2.1 Definizione Se X è uno spazio vettoriale topologico, una rappresentazione di un gruppo topologico G è un omomorfismo di gruppi topologici
ρ : G −→ GL(X)
Se H è uno spazio di Hilbert, una rappresentazione unitaria di G in H è un
omomorfismo del gruppo nel gruppo U(H) degli operatori unitari di X in sé.
Considereremo solo rappresentazioni di G in spazi di Hilbert: si noti che
una rappresentazione in uno spazio di Hilbert non è necessariamente unitaria:
inoltre la parola “continua” riferita alla rappresentazione vuol dire “fortemente
continua”.
Ricordiamo che se π1 e π2 sono rappresentazioni di un gruppo topologico G
negli spazi di Hilbert H1 e H2 , l’insieme degli operatori di allacciamento è
(π1 , π2 ) := {A : H1 −→ H2 ) | Aπ1 = π2 A}
Esattamente come nel caso delle C*-algebre, due rappresentazioni di un gruppo
topologico G si dicono disgiunte se dim homG (V1 , V2 ) = 0, e si dicono equivalenti
se l’insieme homG (V1 , V2 ) contiene un isomorfismo A.
Abbiamo i concetti di irriducibilità e completa riducibilità di rappresentazioni
per un gruppo topologico come nel caso di un gruppo qualsiasi: π si dice topologicamente irriducibile se non esistono sottospazi invarianti chiusi di V . Ricordiamo
inoltre che nel caso di un gruppo topologico, una sottorappresentazione di una
rappresentazione H è un sottospazio chiuso di H invariante per la rappresentazione di G (si riveda il capitolo ?? per questi concetti nel caso delle C*-algebre
e il capitolo ?? nel caso dei gruppi finiti).
Dal fatto che il complemento ortogonale W ⊥ si un sottospazio invariante W
di uno spazio di Hilbert pure è invariante, segue che
14.2.2 Lemma Ogni rappresentazione unitaria è completamente riducibile.
e quindi il seguente e fondamentale
14.2.3 Teorema Ogni rappresentazione unitaria di dimensione finita è completamente riducibile.
Ricordiamo inoltre che il nucleo e l’immagine di un operatore di allacciamento
sono sottospazi invarianti, quindi:
14.2.4 Lemma (Schur) Se V1 e V2 sono rappresentazioni irriducibili allora
ogni operatore di allacciamento è zero oppure è un isomorfismo.
524
Capitolo 14. Gruppi topologici
14.2.5 Corollario Se V è una rappresentazione irriducibile di G in uno spazio
vettoriale complesso di dimensione finita, allora homG (V, V ) = C.
Dimostrazione: Se A ∈ homG (V, V ) allora esiste λ ∈ C tale che A − λI non
sia invertibile (infatti C è algebricamente chiuso e quindi ogni matrice ammette
sempre autovalori); per il lemma si ha allora A − λI = 0.
qed
14.2.6 Lemma Se H è una rappresentazione unitaria topologicamente irriducibile di G allora homG (H, H) = C.
Dimostrazione: Per prima cosa notiamo che
A ∈ homG (H, H) ⇒ A∗ ∈ homG (H, H)
Infatti
A∗ π(g) = A∗ π(g −1 )∗ = (π(a−1 )A)∗ = (Aπ(g −1 ))∗ = π(g −1 )∗ A∗ = π(g)A∗
Dato che ogni operatore si decompone in somma di autoaggiunti:
1
1
A = (A + A∗ ) (A − A∗ )
2
2
basta dimostrare il lemma per gli elementi autoaggiunti di homG (H, H).
Usiamo quindi la teoria spettrale: se A commuta con un operatore unitario,
lo stesso fa ogni proiezione spettrale Eλ di A (per unicità della decomposizione
spettrale di A). Quindi se A ∈ homG (H, H) allora anche ogni Eλ ∈ homG (H, H)
e, per l’ipotesi di irriducibilità, ogni Eλ risulta essere 0 oppure I. Ne segue che
A è scalare.
qed
Dato che ogni rappresentazione unitaria è completamente riducibile, il seguente teorema è il più fondamentale nella teoria dei gruppi compatti3 :
14.2.7 Teorema Ogni rappresentazione di dimensione finita di un gruppo compatto è equivalente ad una rappresentazione unitaria.
3
Questo teorema ed i seguenti sono del tutto analoghi a quelli dati per i gruppi finiti nel
capitolo ??: in effetti quei risultati sono casi particolari di questi, dato che un gruppo finito è
un gruppo topologico e l’integrale di Haar si riduce alla somma sui suoi elementi.
14.2. Gruppi compatti e rappresentazioni
525
Dimostrazione: Sia π : G −→ GL(V ) la rappresentazione; per avere la tesi
basterà dotare V di un prodotto hilbertiano invariante rispetto agli operatori
{π(g)}g∈G . Consideriamo su V un qualsiasi prodotto scalare (basta ad esempio
prendere una base e dichiararla ortogonale) h, i; allora per x, y ∈ V , poniamo
Z
(x, y) := hπ(g)x, π(g)yidg
G
Evidentemente la (.) è sesquilineare, non degenere e tale che
Z
(π(g)x, π(g)y) = hπ(h)(π(g)x), π(g)(π(h)y)idh
ZG
= hπ(hg)x, π(hg)yidh
ZG
= hπ(k)x, π(k)yidk = (x, y)
G
(per invarianza della misura di Haar per traslazioni: d(hg) = dh)
qed
Se dim V < ∞ possiamo associare alla rappresentazione unitaria π la matrice
i cui elementi sono
px,y (g) := (π(g)x, y)
14.2.8 Teorema Ogni rappresentazione π : g −→ GL(V ) topologicamente irriducibile di un gruppo compatto è di dimensione finita e gli elementi della sua
matrice soddisfano le relazioni
Z
1
px,y (g)px0 ,y0 (g)dg =
(x, x0 )(y, y 0 )
dim
V
G
Dimostrazione: Consideriamo la funzione
Z
x 7−→
px,y (g)px0 ,y0 (g)dg
G
Si tratta evidentemente di un funzionale lineare sullo spazio di Hilbert V , quindi,
per il teorema di Riesz, è della forma x 7−→ (x, z) per qualche z ∈ V , che dipende
da y, x0 , y 0 .
Inoltre, fissati y e y 0 , z dipende in modo continuo da x0 e quindi esiste un
operatore A su V tale che z = Ax0 ; si ha che
A ∈ homG (V, V )
526
Capitolo 14. Gruppi topologici
Questo segue dall’invarianza per traslazioni dell’integrale di Haar e dalla
pπ(g)x,y (h) = πx,y (hg)
Quindi, per il lemma di Schur, A = λI, con λ ∈ C (che dipende ovviamente da y
e y 0 ). Ragionando come in precedenza troviamo allora che
λ = c(y, y 0 )
ove c è una costante che stavolta dipende solo da π. Quindi
Z
(∗)
px,y (g)px0 ,y0 (g)dg = c(x, x0 )(y, y 0 )
G
Se ora {x1 , ..., xn } è un insieme ortonormale di V si ha che
n
X
i=1
|px,xi (g)| =
2
n
X
|(π(g)x, xi )| ≤ ||π(g)x||2 = ||x||2
i=1
Integrando questa disuguaglianza su G ed usando la (*) otteniamo
cn||x||2 ≤ ||x||2
cioè n ≤ c−1 . Questo prova che dim V < ∞.
Per n = dim V si ottiene immediatamente la seconda asserzione del teorema.
qed
14.2.9 Corollario (Relazioni di Ortogonalità) Se π : G −→ GL(V ) e
ρ : G −→ GL(W ) sono rappresentazioni irriducibili non equivalenti di un gruppo
compatto G allora
Z
px,y (g)ρx0 ,y0 (g)dg = 0
G
Le relazioni di ortogonalità mostrano che gli elementi della matrice associata
alla rappresentazione irriducibile π sono un sistema ortonormale nello spazio
L2 (G) e che, per rappresentazioni irriducibili non equivalenti, questi sistemi sono
fra loro ortogonali. In realtà, l’unione di tutti questi sistemi ortonormali al variare
di π nell’insieme di tutte le rappresentazioni irriducibili, è una base ortonormale
di L2 (G).
14.2.10 Teorema (Peter–Weyl) Ogni funzione continua su un gruppo compatto G si può approssimare (in norma uniforme) con combinazioni lineari di
elementi di matrici associate a rappresentazioni irriducibili di G.
14.2. Gruppi compatti e rappresentazioni
527
Dimostrazione: Sia A(G) lo spazio delle combinazioni lineari finite di elementi
di matrici associate a rappresentazioni irriducibili di G; dato che se una rappresentazione π è irriducibile anche la sua aggiunta π ∗ lo è, lo spazio A(G) è chiuso
rispetto alla coniugazione: f ∈ A(G) ⇒ f ∈ A(G).
Inoltre se π1 e π2 sono rappresentazioni di dimensione finita, il loro prodotto
tensoriale V1 ⊗ V2 è uno spazio di dimensione finita e quindi si decompone in
somma di rappresentazioni irriducibili, e quindi il prodotto di due elementi di
matrici associate a rappresentazioni irriducibili è combinazione lineare di elementi
di matrici: questo significa che A(G) è una sottoalgebra di C(G). Per dimostrare
che A(G) = C(G) usiamo quindi il teorema di Stone–Weierstrass 9.2.9: l’unica
ipotesi che ci resta da verificare per applicarlo è che gli elementi di A(G) separino
i punti di G.
Ora, ogni rappresentazione unitaria è somma di rappresentazioni irriducibili;
in particolare la rappresentazione regolare
R : G −→ U(L2 (G))
definita come
(R(g))(f )(h) = f (hg)
si decompone in irriducibili, i.e. se h 6= h0 sono elementi di G esiste una rappresentazione irriducibile π tale che π(h) 6= π(h0 ) (infatti se cosı̀ non fosse avremmo
R(h) = R(h0 ) e quindi, per ogni g ∈ G: gh = gh0 ).
qed
La teoria delle rappresentazioni dei gruppi topologici che stiamo qui delineando presenta forti analogie con la teoria delle C*-algebre: precisiamo questo
legame: cominciamo con l’osservare che il gruppo U(H) degli operatori unitari
di uno spazio di Hilbert H è sempre un gruppo topologico (anche se non è localmente compatto a meno che la dimensione di H non sia finita), come si verifica
immediatamente.
14.2.11 Teorema Esiste una corrispondenza biunivoca fra le rappresentazioni
unitarie continue di un gruppo topologico G e le rappresentazioni non degeneri
dell’algebra di Banach L1 (G) (si noti che, in generale, L1 (G) non è una C*algebra).
Dimostrazione: Sia U : G −→ U(H) una rappresentazione unitaria di G:
definiamo
Z
1
∀f ∈ L (G) (x, π(f )y) := f (g)(x, U (g)y)dg
Evidentemente π : L1 (G) −→ B(H) è un omomorfismo di spazi di Banach:
||π(f )|| ≤ ||f ||1
528
Capitolo 14. Gruppi topologici
Vediamo che si tratta di una rappresentazione:
Z
Z
0
0
(x, π(f )π(f )y) = f (g)(x, U (g)π(f )y)dg = f (g)(U (g)∗ x, π(f 0 )y)dg
Z
Z
= f (g) f 0 (h)(U (g)∗ x, U (h)y)dhdg
Z
Z
= f (g) f 0 (g −1 h0 )(x, U (g)U (g −1 h0 )y)dh0 dg
Z
Z
= f (g) f 0 (g −1 h0 )(x, U (h0 )y)dh0 dg = (x, π(f ) ∗ π(f 0 )y)
(l’ultimo passaggio usa il teorema di Fubini). Si tratta di una *-rappresentazione:
Z
∗
(y, π(f ) x) = (x, π(f )y) = f (g)(x, U (g)y)dµ(g)
Z
Z
= f (g)(U (g)y, x)dµ(g) = f (g)(y, U (g)∗ x)dµ(g)
Z
dµ(g)
= f (g −1 )(y, U (g)x)
dµ(g)
dµ(g −1 )
dµ(g)
cioè f ∗ (g) = λ(g)f (g −1 ) ove λ(g) = dµ(g
−1 ) . Osserviamo che U determina univocamente π, dato che
U (g)π(f ) = π(fg )
(fg (h) := f (g −1 h) è la traslazione della funzione f ) e
∀x ∈ H x⊥π(f )x ⇒ f = 0
P
Dunque, per densità di { i π(fi )xi } π è univocamente determinata.
Viceversa, se π è una rappresentazione non degenere della *-algebra di Banach
1
L (G) allora
lim ||fg − f ||1 = 0
g−→e
e, dato che fg∗ ∗ hg = f ∗ h (analogamente al caso G = R) abbiamo che l’operatore
U0 (g)
X
j
π(fj )yj :=
X
π(fj )g)yi
j
è isometrico e densamente definito: la sua estensione U ∈ U(H) è la rappresentazione di G voluta: le mappe
U (g)π(f )x = π(fg )x
14.2. Gruppi compatti e rappresentazioni
529
Z
e
π(f ) =
f (g)U (g)dµ(g)
sono l’una inversa dell’altra
qed
Nel caso dei gruppi finiti, l’algebra di gruppo è una rappresentazione rispetto
all’azione del gruppo su se stesso per traslazioni: nel caso di un gruppo compatto
qualsiasi, questo non sarà vero che su un sottospazio di L1 (G): lo spazio delle
funzioni di quadrato sommabile.
Consideriamo dunque lo spazio H = L2 (G) e la rappresentazione regolare di
G in H:
(λ(g)x)(h) := x(g −1 h)
Si tratta di una isometria, dato che
Z
Z
−1
2
|f (g h)| dµ(h) = |f (h)|2 dµ(h)
cioè λ : G −→ U(H) è una rappresentazione unitaria di G; le corrisponde quindi
una rappresentazione
Z
(πλ (f )x, h) = f (g)x(g −1 h)dµ(g)
dell’algebra L1 (G) nello spazio B(L2 (G)); osserviamo che
πλ (f )x = f ∗ x
per f ∈ L1 (G), x ∈ L2 (G), sicché
||f ∗ x||2 ≤ ||f ||1 ||x||2
e quindi πλ è una rappresentazione fedele (priva di nucleo), dato che
∀x ∈ L2 (G) f ∗ x = 0 ⇒ f = 0 in L1 (G)
Questo si dimostra usando le identità approssimanti in L1 (G), che sono l’analogo
dei nuclei di Fejér (cfr. proposizioni 7.3.7 e 7.4.5): la loro esistenza per i gruppi
compatti segue dal
14.2.12 Teorema Se f ∈ L1 (G) allora, per ogni ε > 0 esiste una funzione ϕ ∈
L1 (G) tale che
||f ∗ ϕ − f ||1 < ε
e
||ϕ ∗ f − f ||1 < ε
530
Capitolo 14. Gruppi topologici
Dimostrazione: Consideriamo un intorno U dell’elemento neutro e ∈ G e una
funzione ϕU ≥ 0 con supporto in U e tale che
Z
ϕU (g)dµ(g) = 1
(ad esempio basta prendere ϕU =
1
χ );
µ(U ) U
Z
ϕU ∗ f (g) =
allora
Z
−1
ϕU (h)f (h g)dµ(h) =
ϕU (h)fh (g)dµ(h)
e quindi (il gruppo è compatto, quindi µ(G) < ∞ e possiamo supporre, a meno
di normalizzare, che µ(G) = 1)
¯¯
¯¯Z
¯¯
¯¯Z
¯¯
¯¯
¯¯
¯¯
¯
¯
¯
¯
¯
¯
||ϕU ∗ f − f ||1 = ¯¯ ϕU (h)fh dµ(h) − f ¯¯ = ¯¯ ϕU (h)(fh − f )dµ(h)¯¯¯¯
1
1
Z
≤ ϕU (h)||fh − f ||1 dµ(g)
Per continuità della h 7−→ fh possiamo scegliere Uε tale che
∀h ∈ Uε
||fh − f ||1 < ε
Z
ottenendo
||ϕUε ∗ f − f || < ε
ϕUε (h)dµ(h) = ε
Uε
In modo analogo si dimostra che ||f ∗ ϕU − f || −→ 0.
qed
Ora, se f ∈ L (G) allora possiamo definire la norma ridotta di f come
1
||f ||r := ||πλ (f )||
e considerare quindi la norma
||f || := sup ||π(f )||
π
Evidentemente ||f ||r ≤ ||f || e quindi possiamo considerare le C*-algebre
Cr∗ (G) := L1 (G)
||.||r
e
||.||
C ∗ (G) := L1 (G)
che si dicono C*-algebra ridotta e C*-algebra del gruppo G: Cr∗ (G) è quoziente di
C ∗ (G); osserviamo che si tratta delle C*-algebre inviluppanti di L1 (G) rispetto
alle norme ||.||r e ||.||.
14.2. Gruppi compatti e rappresentazioni
531
Notiamo che, avendosi ||π(f )|| ≤ ||f ||, segue che per ogni rappresentazione
π : L1 (G) −→ H, si ha
π(f ) = π
e|L1 (G) (f )
ove π
e è l’estensione di π alla C*-algebra di G: se estendiamo la rappresentazione
regolare otteniamo (dato che è fedele) la successione esatta di algebre di Banach:
C ∗ (G) −→ Cr∗ (G) −→ 0
In realtà vale il seguente
Teorema. ker πλ = 0 se e solo se G è amenabile.
(che non dimostreremo) ove
14.2.13 Definizione Un gruppo G è amenabile se lo spazio CB (G) delle funzioni continue limitate su G è una C*-algebra commutativa con unità e se esiste
uno stato ω di CB (G) invariante, cioè tale che
∀g ∈ G
ω(fg ) = ω(f )
Ad esempio un gruppo commutativo è amenabile, per il teorema di Markov–
Kakutani 8.3.114 , cosı̀ come ogni gruppo compatto: la misura di Haar realizza lo
stato invariante sulle funzioni continue di G.
Consideriamo una rappresentazione non degenere π di C ∗ (G): sappiamo che
esistono le corrispondenze biunivoche
π ↔ π|L1 (G) ↔ Uπ
Ora dimostriamo che
14.2.14 Proposizione π è irriducibile se e solo se lo è U .
Dimostrazione: Questo segue dal fatto che L1 (G) è densa in norma in C ∗ G()
(per definizione) e quindi
π(C ∗ (G))0 = π(L1 (G))0
e, dato che π(f ) =
R
f (g)U (g)dµ(g):
π(L1 (G))0 = U (G)0
qed
Evidentemente
4
Esempi di gruppi non amenabili sono i gruppi liberi (su almeno due generatori, ma anche
SL(2), il gruppo delle matrici di ordine 2 con determinante 1).
532
Capitolo 14. Gruppi topologici
14.2.15 Proposizione π è ciclica se e solo se lo è U .
Consideriamo ora gli stati S(C ∗ (G)) della C*-algebra C ∗ (G): sappiamo per
la teoria GNS che corrispondono alle rappresentazioni come
ω(f ) = (ξ, πω (f )ξ)
Limitandoci, come è sufficiente, ad un sottoinsieme denso in C ∗ (G), ad esempio
L1 (G), troviamo che
Z
ω(f ) = f (g)(ξ, U (g)ξ)dµ(g)
pertanto gli stati corrispondono biunivocamente alle funzioni
ϕ(g) := (ξ, U (g)ξ)
sul gruppo. Osserviamo infatti che se f ha supporto finito allora
¯¯2
¯¯
¯¯
¯¯X
X
¯¯
¯¯
f (g)U (g)ξ ¯¯ =
f (g)f (h)(ξ, U (g −1 h)ξ)
¯¯
¯¯
¯¯
g∈G
g,h∈G
X
=
f (g)f (h)ϕ(g −1 h) ≥ 0
g,h∈G
Quindi si tratta di funzioni di tipo positivo, nel senso della seguente
14.2.16 Definizione Una funzione ϕ : G −→ C si dice di tipo positivo se
ϕ(e) = 1 e, per ogni f : G −→ C a supporto finito:
X
f (g)f (h)ϕ(g −1 h) ≥ 0
g,h∈G
Il seguente teorema è l’analogo del teorema GNS per i gruppi, ed è una
versione del teorema di Bochner :
14.2.17 Teorema ϕ è una funzione di tipo positivo su G se e solo se esiste una
rappresentazione unitaria U : G −→ U(H) tale che
ϕ(g) = (ξ, U (g)ξ)
ove ξ ∈ H è un vettore ciclico per U con ||ξ|| = 1.
14.3. Gruppi a un parametro e teorema di Stone
533
Dimostrazione: Abbiamo appena osservato che la condizione è sufficiente. Sia
quindi ϕ una funzione di tipo positivo e consideriamo lo spazio vettoriale delle
funzioni a supporto finito (se si vuole delle successioni finite di elementi di G);
su questo spazio consideriamo la forma sesquilineare
X
hp, qi :=
p(g)q(h)ϕ(g −1 h)
g,h∈G
Ovviamente hp, pi ≥ 0 e, quozientando per il sottospazio delle funzioni p tali che
hp, pi = 0 e completando si ottiene uno spazio di Hilbert H sul quale gli operatori
U (g)[p] := [pg ]
(con [p] si indica la classe in H della funzione a supporto finito p) definiscono la
rappresentazione unitaria richiesta.
qed
14.2.18 Proposizione Se ϕ è continua in e ∈ G allora è continua in G e anche
U è continua.
Dimostrazione: Dimostriamo che
lim ||U (g)U (h)ξ − U (h)ξ||2 = 0
g−→e
Infatti, se ϕ −→ 1 per g −→ e:
||U (g)U (h)ξ − U (h)ξ|| =2 − 2 Re(U (h)ξ, U (gh)ξ) = 2 − 2 Re(ξ, U (h−1 gh)ξ)
g−→e
=2 − 2 Re ϕ(h−1 gh) −−−→ 0
g−→e
(dato che h−1 gh −−−→ e).
qed
14.3
Gruppi a un parametro e teorema di Stone
Ci occupiamo ora di un caso rilevantissimo di rappresentazioni: i gruppi a un
parametro, cioè le rappresentazioni del gruppo topologico R fortemente continue
negli operatori unitari di uno spazi di Hilbert: il teorema di Stone 14.3.6 ne darà
una classificazione completa.
Consideriamo un operatore autoaggiunto A = A∗ e la trasformata di Cayley:
U = S0 (A) = (A − iI)(A + iI)−1
534
Capitolo 14. Gruppi topologici
Se f ∈ C0 (R) (funzioni continue nulle all’infinito, cioè il cui limite all’infinito
è zero), allora, per il calcolo funzionale continuo, f (A) = g(U ) per una certa
g ∈ C0 (T \ {1}) (funzioni continue nulle all’infinito sull’intervallo (0, 1): immaginiamo il toro unidimensionale S 1 come l’intervallo (0, 1) nel quale si identifichino
i punti 0 e 1, cioè lo pensiamo come la compattificazione di Alexandroff di (0, 1)).
Abbiamo dunque
f ∈ C0 (R) 7−→ g ∈ C0 (T \ {1})
Z
Inoltre
f (A) =
f (λ)dE(λ)
(integrale alla Riemann–Stieltjes).
Ora, se, per t ∈ R
ft (λ) := eitλ
possiamo calcolare
ft (A) = eitA =: U (t)
Si tratta di un operatore unitario (dato che il calcolo funzionale è uno *-omomorfismo)
ed è ovvio che
U (t + t0 ) = U (t)U (t0 )
t0 −→t
Inoltre, per ogni λ: ft0 (λ) −−−−→ ft (λ). Ma, ogni tale f ha modulo 1e quindi le
ft sono equilimitate:
fortemente
U (t0 ) −−−−−−→ (t)
se t0 −→ t.
Cioè l’insieme {U (t)}t∈R soddisfa alla seguente
14.3.1 Definizione Una famiglia {U (t)}t∈R di operatori unitari in uno spazio
di Hilbert si dice gruppo ad un parametro fortemente continuo se
• U (t + t0 ) = U (t)U (t0 ).
fortemente
• Se t0 −→ t allora U (t0 ) −−−−−−−→ U (t).
L’operatore A si dice generatore infinitesimale del gruppo a un parametro.
Un gruppo ad un parametro non è altro che una rappresentazione unitaria
fortemente continua del gruppo additivo R.
Osserviamo che per un gruppo a un parametro (fortemente continuo) la
funzione t 7−→ U (t)x è continua, per ogni x ∈ H fissato e
t−→∞
||U (t) − I|| −−−−−→ 0 ⇐⇒ ||A|| < ∞
14.3. Gruppi a un parametro e teorema di Stone
535
14.3.2 Teorema
• DA = {x ∈ H | t 7−→ U (t)x è una funzione C 1 }.
• Se x ∈ DA allora
1
Ax =
i
µ
d
U (t)x
dt
¶
t=0
e se A = A∗ allora l’equazione di Schrödinger
i
d
x = Ax
dt
possiede un’unica soluzione x tale che x(0) = x0 ∈ H, e tale soluzione è
esattamente
x(t) = eitA x0
Dimostrazione: (1) Siano x∈DA , tn una successione di numeri reali infinitesima
(tn −→ 0) e
1
zn := (U (tn )x − x)
tn
Per dimostrare la (2) basta allora far vedere che zn −→ 0. Per farlo basta far
vedere che
• ∃z (x, zn ) −→ (x, z) (convergenza debole).
• ||zn || −→ ||z||.
Infatti, se valgono a) e b):
||zn − z||2 = (zn − z, zn − z) = ||zn || + ||z|| − 2 Re(z, zn ) −→ 0
Ora dimostriamo le (a) e (b).
¯¯
¯¯2
µ
¶∗ µ
¶
¯¯ 1
¯¯
1
1
¯¯ ((U (tn ) − I)x)¯¯ =(x,
(U (tn ) − I)
(U (tn ) − I) x)
¯¯ tn
¯¯
tn
tn
¯2
Z ∞ ¯ itn λ
¯
¯e
−
1
¯ d(x, E(λ)x)
¯
=
¯
¯ tn
−∞
Ma
¯
¯2
Ã
¡ ¢ !2
¯ itλ
¯
¯
2 tλ
− itλ
¯ e − 1 ¯2 ¯¯ e itλ
2 − e
2 ¯
sin
2
¯
¯
≤ λ2
¯ λ2 = λ2
¯ t ¯ = ¯¯
¯
2t λ2
t λ2
536
Capitolo 14. Gruppi topologici
Possiamo quindi applicare il teorema della convergenza dominata di Lebesgue
per passare al limite sotto il segno di integrale (λ2 è una funzione L1 rispetto alla
misura d(x, E(λ)x) =) ottenendo
¯¯
¯¯2
Z
¯¯ 1
¯¯
¯¯ ((U (tn ) − I)x)¯¯ −→ λ2 d(x, E(λ)x) < ∞
¯¯ tn
¯¯
(si rammenti che x ∈ DA ). Dunque
¯¯
¯¯2
¯¯ 1
¯¯ t−→0
¯¯ ((U (t) − I)x)¯¯ −−
−−→ ||Ax||2
¯¯ t
¯¯
Ma allora
1
(x, ((U (tn ) − I)x)) =
tn
Z
∞
−∞
eitλ − 1
d(x, E(λ)x) −→ i
t
Z
∞
λd(x, E(λ)x)
−∞
e quindi
1
t−→0
((U (tn ) − I)x)) −−−−→ i(x, Ax)
tn
La formula di polarizzazione ci consente allora di scrivere
∀x ∈ H (x,
∀x, y ∈ H (y,
1
t−→0
((U (tn ) − I)x)) −−−−→ i(y, Ax)
tn
Ponendo
1
((U (tn ) − I)x
tn
otteniamo allora un elemento z(t) convergente debolmente a Ax su DA , e quindi
che soddisfa le (a) e (b). Dunque la (2) è dimostrata.
Ora dimostriamo la (1). Sia B tale che
z(t) :=
DB = {x ∈ H | t 7−→ U (t)x è di classe C 1 }
Osserviamo che, per ogni x ∈ DB :
1
Bx :=
i
µ
d
U (t)x
dt
¶
t=0
Abbiamo appena visto che B è densamente definito, dato che DA ⊂ DB e A ⊂ B;
quindi per dimostrare il teorema non resta che mostrare A = B.
Ma A è autoaggiunto, e se proviamo che B è hermitiano allora da A ⊂ B
seguirà A = B. Che B sia hermitiano segue ovviamente da
µ
µ
¶
¶
1 d
1 (x, U (t)x) − (x, x)
∀x ∈ DB (x, Bx) =
(x, U (t)x)
∈R
=
i dt
i
t
t−→0
t=0
14.3. Gruppi a un parametro e teorema di Stone
537
Infatti
(x, U (t)x) − (x, x)
1
(U (t)x, x) − (x, x)
1
lim
= − lim
i t−→0
t
t
µi t−→0 ¶
1
(x, U (−t)x) − (x, x)
1 d
= lim
=
U (t)x
= (x, Bx)
i t−→0
−t
i dt
t=0
(x, Bx) = −
Quindi (x, Bx) = (x, Bx), cioè (x, Bx) ∈ R.
qed
Osserviamo che questo teorema è una generalizzazione al caso di dimensione
infinita della teoria delle equazioni differenziali ordinarie a coefficienti costanti:
in effetti ogni tale equazione è risolta dall’esponenziale di una matrice (nel nostro
caso l’operatore A). Quello che dobbiamo far vedere, per completare l’analogia,
è che ogni gruppo ad un parametro si ottiene come esponenziale di un operatore,
ottenendo cosı̀ una profonda generalizzazione di noti risultati sull’esponenziale
delle matrici: questa generalizzazione sarà il contenuto del teorema di Stone.
Studiamo ora i gruppi a un parametro fortemente continui dal punto di vista
della teoria delle rappresentazioni: intanto osserviamo che la forte continuità può
essere indebolita nella condizione
∀x, y ∈ H (x, U (t)y) −→ (x, y)
dato che
||U (t)y|| = ||y||
(le U (t) sono isometrie). Ricordando le (a) e (b) della dimostrazione del teorema
precedente abbiamo quindi che la continuità debole di U (t) implica la continuità
in norma.
Ora, se U : R −→ B(H) è una rappresentazione unitaria (fortemente continua) del gruppo topologico additivo dei numeri reali, fissati x, y ∈ H, la t 7−→
(x, U (t)y è lineare e continua (disuguaglianza di Schwartz) e quindi
∀f ∈ L1 (R) (x, U (t)y)f (t) ∈ L1 (R)
sicché
¯
¯Z
¯
¯
¯ (x, U (t)y)f (t)dt¯ ≤ ||x|| ||y|| ||f ||1
¯
¯
e, per il teorema di Riesz, esiste un unico operatore π
Z
π(f ) := f (t)U (t)dt
538
Capitolo 14. Gruppi topologici
lineare e continuo con ||π(f )|| ≤ ||f ||1 . Allora, per ogni f, g ∈ L1 (R):
Z
Z
(y, π(f )π(g)x) = f (t)(y, U (t)π(g)x)dt = f (t)(U (−t)y, π(y)x)dt
¶
µZ
Z
0
0
0
= f (t)
g(t )(y, U (t + t )x)dt dt
Z Z
=
f (t)g(t0 )(y, U (t + t0 )x)dt0 dt
Ma f (t)g(t0 )(y, U (t + t0 )x) ∈ L1 (R × R) come si è detto, quindi possiamo applicare
il teorema di Fubini e dedurre:
Z
(y, π(f )π(g)x) = f (t)g(s − t)(y, U (s)x)dtds
(per s = t + t0 ). In altri termini
π(f )π(g) = π(f ∗ g)
(prodotto di convoluzione). Inoltre
Z
Z
∗
(y, π(f ) x) = (x, π(f )y) = f (t)(x, U (t)y)dt = f (t)(y, U (−t)x)dt
cioè, se f ∗ (t) := f (−t),
π(f )∗ = π(f ∗ )
Quindi abbiamo dimostrato il
14.3.3 Lemma π è una rappresentazione dell’algebra di Banach L1 (R) (rispetto
al prodotto di convoluzione).
Dimostriamo che π è non degenere; se x ∈ {π(f )y | f ∈ L1 (R), y ∈ H}⊥ allora
Z
∀f (x, π(f )x) = 0 ⇒ f (t)(x, U (t)x)dt = 0
cioè (x, U (t)x) = 0 q.o. e, per continuità, (x, U (t)x) = 0 ovunque. Quindi x = 0
e U (1) = I.
Ora invertiamo questa costruzione: data una rappresentazione non degenere
di L1 (R) ricostruiamo U (t):
Z
Z
0
0
0
(x, U (t)π(f )y) = f (t )(x, U (t + t )y)dt = f (s − t)(x, U (s)y)ds
=π(ft ))
14.3. Gruppi a un parametro e teorema di Stone
539
(si rammenti che ft (s) := f (s − t)). Ma la misura di Lebesgue è invariante per
traslazioni e quindi
t−→0
||ft − f ||1 −−−−→ 0 =⇒ U (t)π(f )y = π(ft )y
e quindi abbiamo una mappa iniettiva
¾
½
gruppi ad un parametro
−→ {π : L1 (R) −→ B(H) non degeneri}
fortemente continui
Dimostriamo che si tratta di una mappa biunivoca:
14.3.4 Teorema I gruppi unitari ad un parametro fortemente continui corrispondono biunivocamente alle rappresentazioni unitarie non degeneri dell’algebra
di Banach L1 (R).
Dimostrazione: Consideriamo π come rappresentazione non degenere dell’algebra di Banach L1 (R) (ricordiamo che dato che L1 (R) è l’algebra di gruppo di R, le rappresentazioni del gruppo e quelle dell’algebra si corrispondono
biunivocamente) e sia
U (t)π(f )y := π(fy )y
(dato che la rappresentazione è non degenere l’insieme {π(f )y}y∈H è denso,
quindi ci basta aver definito U (t) sugli elementi della forma π(f )y).
Dimostriamo che si tratta di un gruppo ad un parametro fortemente continuo: intanto definisce una famiglia ad un parametro di operatori unitari (basta
all’uopo far vedere che sono lineari isometrici).
Infatti
Z
Z
∗
0
0
0
(ft )(s )gt (s − s )ds = ft (−s0 )gt (s − s0 )ds0
Z
= f (−(s0 + t))g(s − (s0 + t))ds0
sicché
ft∗ ∗ gt = f ∗ ∗ g
da cui
π(ft∗ ∗ gt ) = π(f ∗ ∗ g)
cioè π(ft )∗ π(gt ) = π(f )∗ π(g), dunque
(π(ft )x, π(gt )y) = (π(f )x, π(g)y)
540
Capitolo 14. Gruppi topologici
Quindi la famiglia ad un parametro {U (t)} è unitaria: è inoltre un gruppo ad un
parametro, dato che
U (t0 )U (t)π(f )x = π ((ft )t0 ) x = π(ft+t0 )x = U (t + t0 )π(f )x
Dimostriamo infine che è fortemente continua: abbiamo che
||U (t)π(f )x − π(f )x|| = ||π(ft )x − π(f )x|| = ||π(ft − f )x|| ≤ ||ft − f ||1 ||x||
e ||ft − f ||1 −→ 0, pertanto
||U (t)y − y|| −→ 0
Il gruppo ad un parametro U (t) dà luogo, per tramite della costruzione precedente, alla rappresentazione π:
Z
Z
U (t)g(t)dtπ(f )x = g(t)π(ft )xdt
e, per definizione di convoluzione:
Z
Z
π(g ∗ f )x = π( g(t)ft dt) = U (t)g(t)dtπ(f )x
qed
Notiamo che abbiamo utilizzato il fatto che
||π(f )|| ≤ ||f ||1
(uno *-omomorfismo di un’algebra di Banach in una C*-algebra è una contrazione).
Il seguente criterio ci permette di semplificare questo risultato nel caso di
spazi di Hilbert separabili:
14.3.5 Teorema (von Neumann) Se U : R −→ B(H) è una rappresentazione
unitaria di R su uno spazio di Hilbert separabile allora t 7−→ (x, U (t)y) è misurabile secondo Lebesgue e la rappresentazione unitaria è fortemente continua.
Dimostrazione: Per ipotesi ha senso definire π come
Z
(x, π(f )y) := f (t)(x, U (t)y)dt
in modo da ottenere una rappresentazione di L1 (R); se questa rappresentazione
è non degenere allora
Z
π(f ) = f (t)V (t)dt
541
14.3. Gruppi a un parametro e teorema di Stone
e V è fortemente continua. Quindi non resta che dimostrare che π è non degenere.
Per separabilità di H, esiste una successione {yn } densa; se x è tale che
∀n x⊥π(f )y − n
Z
allora
∀f ∈ L (R)
1
(x, U (t)yn )f (t)dt = 0
cioè per ogni n (x, U (t)yn ) = 0 q.o. e quindi (x, U (t)yn ) = 0 in R \ Nn ove Nn è
un insieme di misura nulla. Dato che
[
N :=
Nn
n
ha ancora misura nulla,
∀t ∈ R \ N
(x, U (t)yn ) = 0
e quindi (dato che x è ortogonale a tutti i π(f )yn : x = 0.
qed
L’ipotesi di separabilità è irrinunciabile: se ad esempio H = l (R) allora per
2
(U (t)x)(s) := x(s − t)
la funzione (x0 , U (t)x) è misurabile secondo Lebesgue, ma la U si guarda bene
dall’essere fortemente continua.
14.3.6 Teorema (Stone) Se U : R −→ B(H) è una rappresentazione unitaria
fortemente continua di R allora esiste un unico operatore A autoaggiunto tale
che
U (t) = eitA
Dimostrazione: Abbiamo visto (teorema 14.3.4) che dare un gruppo ad un
parametro fortemente continuo è come dare una rappresentazione non degenere
π : L1 (R) −→ B(H) tale che
Z
π(f ) = f (t)U (t)dt
(e quindi ||π(f )|| ≤ ||f ||1 ). Se consideriamo lo spazio Cc∞ (R) delle funzioni infinitamente differenziabili a supporto compatto, sappiamo che è denso in L1 (R) e
quindi l’insieme
{π(f )}f ∈Cc∞ (R)
542
Capitolo 14. Gruppi topologici
è un’algebra non degenere, dato che
∀x ∈ H π(Cc∞ (R))x = π(L1 (R))x 3 x
Ore definiamo A come
1
Ax :=
i
µ
¶
d
U (t)
(x)
dt
t=0
Dimostriamo che DA è denso, osservando che
DA = {x ∈ H | t 7−→ U (t)(x) ∈ C 1 (R)}
e che, se
1
A0 :=
i
con
µ
d
U (t)
dt
¶
t=0
D0 = {π(f )x | x ∈ H , f ∈ Cc∞ (R)}
allora D0 è denso, dato che
U (t)π(f )x = π(fy )x
e
Ma, dato che
1
i
µ
¶
d
π(ft − f )
1
U (t)
(x)
y = lim
t−→0
dt
i
t
t=0
1
(ft − f ) −→ f 0 in L1 (R), si ha
t
π(ft − f ) ||.||
π(ft − f )
−−−→ π(f 0 ) =⇒
x −→ π(f 0 )x
t
t
quindi D0 è denso. Abbiamo cioè che
(1) A0 è densamente definito.
e vogliamo dimostrare inoltre che
(2) A0 è hermitiano;
(3) A0 è essenzialmente autoaggiunto;
(4) A0 = A0 ;
Cominciamo con la (2). Se f, g ∈ Cc∞ (R) e
y1 := π(f )x
e
y2 := π(g)y
dimostriamo che
(y1 , A0 y2 ) = (A0 y1 , y2 )
14.3. Gruppi a un parametro e teorema di Stone
In effetti
543
1
1
(y1 , A0 y2 ) = (π(f )x, π(g 0 )y) = (x, π(f ∗ ∗ g 0 )y)
i
i
e
1
1
(A0 y1 , y2 ) = ( π(f 0 )x, π(g)y) = − (x, π(f 0∗ ∗ g)y)
i
i
∗
0
0∗
Basta allora dimostrare che f ∗g = f ∗g per avere la (2), il che è semplicemente
la regola di integrazione per parti combinata con la definizione di convoluzione
(tenendo conto che f e g hanno supporto compatto).
Z
Z
∗
0
∗
0
(f ∗ g )(t) = f (s)g (t − s)ds = − f ∗ (s)dg
Z
Z
∗
∗
= (f g)|∂K − g(s)df = g(t − s)df ∗
Z
= f 0∗ (s)g(t − s)ds = (f 0∗ ∗ g)(t)
(ove K = supp f ∩ supp g è compatto).
Dimostriamo la (3): abbiamo U (t)D0 = D0 dato che U (t)π(f )x = π(ft )x (se
f ∈ Cc∞ (R) anche ft ∈ Cc∞ (R)) e viceversa.
Ora, se A∗0 z = ±iz ha come unica soluzione z = 0 abbiamo la (3); ma
(U (t)x, A∗0 z) = (U (t), ±iz)
e (U (t)x ∈ D0 ) (U (t)x, A∗0 z) = (A0 U (t)x, z), sicché
(A0 U (t)x, z) = ±i(U (t)x, z)
Si ricordi ora che
A0 U (t)y =
dato che
A0 π(ft )x =
1 d
U (t)y
i dt
1d
1d
π(ft )x =
U (t)y
i dt
i dt
e quindi
1d
(U (t)x, z)
i dt
Ne segue che ξ := (U (t)x, z) soddisfa l’equazione
(A0 U (t)x, z) =
ξ 0 = ∓ξ
dunque ξ(t) = ce∓t e
|ξ(t)| ≤ ||U (t)x|| ||z|| = ||x|| ||z|| = costante
544
Capitolo 14. Gruppi topologici
il che è possibile se e solo se c = 0 e quindi z = 0 (dato che è ortogonale ad un
insieme denso). Ne segue la (3).
Infine dimostriamo (4). Se A := A0 ha senso considerare eitA che è un gruppo
ad un parametro fortemente continuo di operatori unitari; vogliamo dimostrare
che per ogni y ∈ D0 (che è denso) si ha che
w(t) := eitA y − U (t)y
è zero per ogni t ∈ R. Intanto w(0) = 0 per definizione; inoltre
d
||w(t)||2 = 0
dt
dato che w(t) è ”C 1 in norma” e quindi
d
d
||w(t)||2 = (w(t), w(t)) = (w0 (t), w(t)) + (w(t), w0 (t))
dt
dt
e
w0 (t) = (eitA y − U (t)y)0 = iAeitA y − iA0 U (t)y
Per U (t)y generico in D0 e A = A0 (in particolare A0 ⊂ A), abbiamo che, su D0 ,
A = A0 , e quindi
w0 (t) = iAeitA y − iA0 U (t)y = iAw(t)
Dunque
d
||w(t)||2 = i ((w(t), Aw(t)) − (Aw(t), w(t))) = 0
dt
(A è hermitiano). Allora ||w(t)|| = 0 (è nullo in 0 e ha derivata nulla, quindi è
costante) e quindi w(t) = 0. Ne segue
eitA = U (t)
qed
Traiamo alcune conseguenze da questo importante risultato. Se A = A , allora
i seguenti oggetti si determinano univocamente a due a due (dare l’uno equivale
a dare l’altro):
∗
• Un operatore unitario U con 1 ∈
/ σ(U );
• Una famiglia spettrale {E(λ)};
• Una rappresentazione ρ : f 7−→ f (A) di C0 (R) non degenere;
• Un gruppo ad un parametro unitario fortemente continuo {U (t)};
14.3. Gruppi a un parametro e teorema di Stone
545
• Una rappresentazione π della *-algebra di Banach L1 (R);
ove, se A è limitato allora nel caso (1) 1 ∈
/ σ(A), nel caso (2) supp E è compatto,
nel caso (3) supp ρ è compatto, nel caso (4) t 7−→ U (t) è uniformemente continua.
Si passa dall’operatore A all’unitario U con la trasformata di Cayley, da
questo alla famiglia spettrale con la formula di decomposizione spettrale, da
questa alla rappresentazione ρ con il calcolo funzionale continuo, da questa al
gruppo U (t) con il teorema di Stone 14.3.6 e da questo alla rappresentazione π
col teorema 14.3.4.
Consideriamo ora una n-pla di operatori essenzialmente autoaggiunti A1 , ...,
An tali che
P
eitA1 · · · eitAn = eit k Ak
Questa scelta determina un gruppo a n parametri fortemente continuo
U (t) = eitA1 · · · eitAn = eit
P
k
Ak
Ponendo
∀λ ∈ R Ut (λ) := U (λt)
otteniamo una rappresentazione del gruppo (topologico) additivo dei numeri
reali:
λ 7−→ eiλAt
ove
At =
X
tk Ak
k
In questo modo otteniamo una generalizzazione della teoria fin qui svolta da R
a Rn (che è sempre un gruppo topologico5 abeliano localmente compatto): ci si
potrebbe spingere più oltre e generalizzare questa costruzione ad un gruppo di
Lie6 G parametrizzando gli operatori A con gli elementi u dell’algebra di Lie del
gruppo ed ottenendo
M (exp λx) = eiλAx
e [Au , A − v] = iA[u,v] (cioè una rappresentazione dell’algebra di Lie di G).
Concludiamo questa discussione sui gruppi ad un parametro con un n-esimo
teorema di von Neumann.
Osserviamo preliminarmente che, riandando alla dimostrazione del teorema
di Stone 14.3.6, abbiamo che da D0 ⊂ DA e
eitA D0 = D0
5
6
Per una discussione di questi gruppi, cfr. il capitolo ??.
Fra due capitoli si daranno dei cenni su gruppi e algebre di Lie.
546
Capitolo 14. Gruppi topologici
(ricordiamo che A = A∗ ) segue che A|D0 è essenzialmente autoaggiunto: cioè D0
un cono per A.
Per ogni f ∈ L1 (R) abbiamo
Z
Z
f (t)U (t)dt = f (t)eitA dt
Z
Ma
itA
e
sicché
eitλ dE(λ)
=
Z
Z
f (t)U (t)dt =
Z
f (t)
eitλ dE(λ)dt
Inoltre, se
¶
µZ
Z
Z
Z
itλ
e d(x, E(λy) dt
(x, f (t)U (t)dty) := f (t)(x, U (t)y)dt = f (t)
e quindi, dato che eitλ è continuo
teorema di Fubini:
Z
Z
(x, f (t)U (t)dty) =
Z
=
e di norma 1 e f ∈ L1 , possiamo applicare il
Z
f (t)eitλ dtd(x, E(λ)y))
Z
b
f (λ)d(x, E(λ)y) = (x, fbdE(λ)y)
Osserviamo che, per il lemma di Riemann–Lebesgue 7.4.9,
funzionale di A con fb. In definitiva:
Z
π(f ) = f (t)U (t)dt = fb(A) = ρ(fb)
R
fbdE(λ) è il calcolo
Se U (t) è unitario allora
R(n) := U n
è una rappresentazione del gruppo additivo Z e, considerando la proiezione
ortogonale E0 sul sottospazio ker(I − U ) allora
N
1 X n
E0 = s-lim
U
N −→∞ 2N
n=−N
come già sappiamo.
14.3. Gruppi a un parametro e teorema di Stone
547
14.3.7 Teorema (Ergodico di von Neumann) Se {U (t)} è un gruppo ad
un parametro fortemente continuo di operatori unitari in uno spazio di Hilbert e
se E0 è la proiezione sul sottospazio dei vettori invarianti di U (t):
{x ∈ H | ∀t ∈ R U (t)x = x}
allora
1
E0 = s-lim
N −→∞ 2N
Z
N
U (t)dt
−N
Dimostrazione: Siano
µ
1
g := χ[−1,1]
2
Allora
Z
1
2N
e
gn (t) := g
¶
1
N
Z
N
U (t)dt =
−N
Ma, se f ∈ L1 (R) è tale che
t
N
gn (t)U (t)dt
Z
f (t)dt = 1
e se fN :=
1
f (t/N )
N
allora
Z
n−→∞
fN (t)U (t)dt −−−−−→ E0
fortemente. Infatti, per il teorema di Stone 14.3.6, U (t) = eitA e
Z
gc
gN (t)U (t)dt
N (A) =
dunque {c
gN } è equilimitata e converge puntualmente a χ{0} , il che si dimostra
come segue:
µ ¶
Z
t
t dt
iN
λN
e
g
= gc
N (λ)
N N
da cui gc
b(N λ); dunque, se λ = 0 allora gb(0) = gc
N (λ) = g
N (0), mentre se λ 6= 0
allora
lim gc
b(N λ) = 0
N (λ) = lim g
N
N
per il lemma di Riemann–Lebesgue.
Ne segue che {c
gN } è equilimitata e converge a
R
zero puntualmente; ma gb(0) = g(t)dt = 1 (per scelta di f ) e gc
N è uniformemente
limitata. Allora
gc
N (A) −→ χ{0} (A) = E{x∈H | Ax=0}
548
Capitolo 14. Gruppi topologici
Ma {x | Ax = 0} = {x |, U (t)x = x} (dato che x ∈ DA ⇐⇒ U (t)x è derivabile
con derivata continua in t e U 0 (t)x = iAU (t)x = iU (t)Ax.
Quindi
N −→∞
gc
N (A) −−−−−→ E0
fortemente.
qed
14.4
Vettori analitici
Vogliamo dare in questa sezione una applicazione importantissima del teorema di Stone: il teorema di Nelson, che fornisce un criterio affinché un operatore
sia essenzialmente autoaggiunto.
Cominciamo col ricordare una definizione formulata in precedenza en passant:
14.4.1 Definizione Se A è un operatore lineare su uno spazio di Banach X, un
vettore x ∈ X si dice analitico se x ∈ C ∞ (A) (cioè se per ogni n x ∈ DAn ) e se
esiste λ > 0 tale che
X λn
||An x|| < ∞
n!
n≥0
P
n
ovvero se la serie n (iλ) /n! An x ha raggio di convergenza maggiore di zero.
Se A è autoaggiunto possiamo trovare moltissimi vettori analitici: per il
teorema spettrale
Z
∗
A = A = λdE(λ)
e quindi, se
Hn := E[−n,n] H = (E(n) − E(−n))H
e
Hω =
[
n
(ovviamente R = ∪n [−n, n]) allora
∀x ∈ Hω x è analitico per A
e il raggio di convergenza della serie
X (iλ)n
n≥0
è infinito.
n!
An x
Hn
549
14.4. Vettori analitici
14.4.2 Definizione Se per un vettore analitico x il raggio di convergenza della
serie
X (iλ)n
An x
n!
n≥0
è infinito, x si dice intero.
Torniamo ora al nostro esempio x ∈ Hω : esiste n tale che x ∈ Hn , quindi
An := A|Hn
è autoaggiunto e limitato (infatti ||An || ≤ n dato che |(x, Ax)| ≤ n); ma, per
ogni n: Hn ⊂ DA , dato che se x ∈ Hn allora
Z
Z n
2
λ d(x, E(λ)x) =
λ2 d(x, E(λ)x) < ∞
−n
Quindi Hω ⊂ DA . Inoltre ogni vettore di Hn è autovettore di A e quindi AHn ⊂
Hn , sicché per ogni x ∈ Hn : x ∈ C ∞ (A) a Akn x = Ak x. Ma
X (iλ)m
X (iλ)m
iλAn
Am x =
Am
x
nx = e
m!
m!
m≥0
m≥0
(il raggio di convergenza è, in questo caso, infinito). Dunque ogni elemento di
Hω è un vettore analitico per A.
Ne segue, dato che Hω = H:
14.4.3 Proposizione Se A è autoaggiunto possiede un insieme denso di vettori
analitici.
Osserviamo che, se x è un vettore analitico e
eitA x =
X (iλ)n
n≥0
n!
An x
Per quel che sappiamo sui gruppi ad un parametro:
x ∈ DA ⇐⇒ t 7−→ U (t)x ∈ C 1 (R)
e quindi
x ∈ DAn ⇐⇒ t 7−→ U (t)x ∈ C n (R)
In particolare
x ∈ C ∞ (A) ⇐⇒ t 7−→ U (t)x ∈ C ∞ (R)
550
Capitolo 14. Gruppi topologici
14.4.4 Teorema Se A è autoaggiunto, un vettore x ∈ C ∞ (A) è analitico per A
se e solo se la funzione t 7−→ U (t)x è analitica, cioè è la restrizione a R di una
funzione olomorfa in {| Im z| < δ} (ove δ è il raggio di convergenza della serie
14.4.1).
Dimostrazione: Sia A autoaggiunto e x ∈ C ∞ (A). Se x è analitico allora, per
ogni y ∈ H:
Ã
! Ã
!
X (it)n
X (it)n
Anm x, y =
−
Anm y, x = (e−itAm y, x)
n!
n!
n≥0
n≥0
(per continuità passiamo il prodotto scalare sotto il segno di sommatoria). Ma
Z
itAm
itA
e
y = e y = eitλ dE(λ)y
(avendosi E(λ)y = Em (λ)y, ove Em (λ) è la famiglia spettrale associata a Am ),
quindi
(y,
X (it)n
n≥0
n!
Anm x) = (
X (−it)n
n≥0
n!
Anm y, x)
= (e−itA y, x) = (U (−t)y, x) = (y, U (t)x)
Cioè
U (t)x =
X (it)n
n≥0
n!
Anm x
Ma, se t = z con |z| < δ allora questa serie definisce nel disco {|z| < δ} una
funzione analitica e quindi, per |t| < δ è la restrizione di una funzione olomorfa
nel disco. Se
xλ = U (t)x
e se ripetiamo il ragionamento, allora questa funzione olomorfa è definita nel
disco di centro λ e raggio δ: possiamo, al variare di λ, descrivere con l’unione di
questi dischi l’intera striscia di piano {| Im z| < δ} e, quindi, per continuazione
analitica, abbiamo il teorema.
qed
Ora dimostriamo il risultato chiave sui vettori analitici:
14.4.5 Teorema (Nelson) Se A ⊂ A∗ possiede un insieme totale di vettori
analitici allora è essenzialmente autoaggiunto.
551
14.4. Vettori analitici
Dimostrazione: Ci basta mostrare che se x è un vettore analitico per A allora
è un vettore di unicità, e quindi applicare il criterio di Nussbaum. Ricordiamo
che un vettore differenziabile x ∈ C ∞ (A) si dice vettore di unicità per A ⊂ A∗ se
Ax := A|Dx (ove Dx è il sottospazio generato dall’insieme {An x}) è un operatore
(densamente definito in Hx = Dx ) essenzialmente autoaggiunto in Hx .
Consideriamo dunque un vettore x analitico per A e l’operatore Ax : osserviamo che, su Hx esiste un operatore antiunitario V definito come
V : aAn x 7−→ aAn x
sui generatori (gli elementi di Dx ) ed estendendo per linearità e continuità a tutto
Hx ; per definizione V Ax = Ax V e quindi, per il criterio di von Neumann 13.4.1
Ax possiede un’unica estensione autoaggiunta H = H ∗ ; allora x è analitico per
H, dato che Anx x = H n x e An x = Anx x, cioè
A(An x) = Ax (An x) = H(An x)
e quindi x è analitico per H. Allora (se |t| < δ):
eitH x =
X (it)n
n≥0
n!
H nx =
X (it)n
n≥0
n!
An x
sicché eitH x non dipende dall’estensione H ma solo da A, se |t| < δ; tuttavia, per
t qualsiasi, possiamo scrivere
eitH = eiH(t1 +...+tn )
con |ti | < δ.
Quindi tutte le estensioni autoaggiunte di Ax danno luogo al medesimo gruppo ad un parametro eitH e dunque, per il teorema di Stone 14.3.6, esiste un’unica
estensione autoaggiunta di Ax ; ma (criterio di Von Neumann 13.4.1) Ax ne possiede almeno una. quindi è essenzialmente autoaggiunto e x è un suo vettore di
unicità.
qed
Consideriamo una applicazione del teorema di Nelson. Sia µ una misura regolare positiva sull’asse reale R con supporto in un intervallo compatto I: allora
è univocamente determinata dai suoi momenti
Z
qn := λn dµ(λ)
I
al variare di n ∈ N (per il teorema di Stone–Weierstrass 9.2.9 e la densità delle
funzioni continue in I nell’algebra L1 (I)).
552
Capitolo 14. Gruppi topologici
Ci chiediamo se questo sia vero per una misura a supporto non compatto: se
µ è semplicemente una misura regolare positiva su R e
Z
an :=
λn dµ(λ)
R
possiamo formulare il problema dei momenti (Hamburger): data una successione {an } esiste una misura regolare positiva su R della quale i momenti siano
gli elementi della successione?
Intanto possiamo osservare che, se una tale misura esiste, allora per ogni
polinomio p ∈ C[z]:
Z
|p(λ)|2 dµ(λ) ≥ 0
e che, se p(z) =
P
n cn z
n
allora
¯2
Z ¯¯X
Z
¯
X
¯
n¯
cn cm λn+m dµ(λ)
cn λ ¯ dµ(λ) =
0≤ ¯
¯
¯
n,m
n
R
cosı̀ che an+m = λn+m .
in altri termini, la
X
cn cm an+m ≥ 0
n,m
è una condizione necessaria per l’esistenza della misura µ. Il risultato interessante
è che questa condizione è anche sufficiente.
14.4.6 Teorema Il problema dei momenti ammette soluzione per una successione {an } se e solo se
N
X
cn cm an+m ≥ 0
n,m=1
per ogni N ∈ N e c1 , ..., cN ∈ C.
Dimostrazione: L’idea è di scrivere
an = (ξ, An0 ξ)
per qualche operatore hermitiano A0 che ammette estensioni autoaggiunte e tale
che ξ ∈ C ∞ (A): infatti avremmo in questo caso
Z
n
an = (ξ, A ξ) = λn d(ξ, E(λ)ξ)
553
14.4. Vettori analitici
per ogni estensione A0 ⊂ A = A∗ .
Consideriamo dunque lo spazio vettoriale X delle funzioni c : N −→ C a
supporto finito (i coefficienti cn ) col prodotto
∞
X
0
(c, c ) :=
cn cm an+m
m,n=0
(si tratta di una forma sesquilineare semidefinita positiva per ipotesi). Se
N = {c ∈ X | (c, c) = 0}
allora sullo spazio vettoriale X/N la forma sesquilineare diviene una struttura
prehilbertiana: sia H lo spazio di Hilbert ottenuto completando questo spazio
prehilbertiano.
Definiamo su X l’operatore
(A0 c)(n) := cn−1
(con (A0 c)(0) := 0). Dato che, se (c, c) = 0 allora A0 c = 0 A0 induce su X/N un
operatore, che è hermitiano: infatti
0
(c , A0 c) =
=
=
∞
X
c0n (A0 c)(m)an+m
∞
X
=
c0n cm−1 an+m
n=0,m=1
n,m=0
∞
X
∞
X
n,l=0
∞
X
n,l=0
∞
X
c0n cl an+l+1 =
c0n cl a(n+1)+l
c0k−1 cl ak+l =
k=1,l=0
=(A0 c0 , c)
(A0 c0 )(k)cl ak+l
k=0,l=0
Abbiamo dunque un operatore densamente definito A0 su H (DA0 = X/N ). Ora
consideriamo gli elementi di X:
ei : N −→ X
tale che
ei (n) = δin
Ovviamente A0 ei = ei+1 ; se ξ = e0 è la sua classe di equivalenza in H, allora
ξ ∈ C ∞ (A0 )
e
(ξ, Ak0 ξ)
= (e0 , ek ) = (e0 , ek ) =
∞
X
n,m=0
e0 (n)ek (m)an+m =
∞
X
n,m=0
δ0n δkm an+m = ak
554
Capitolo 14. Gruppi topologici
Dunque ξ è un vettore ciclico oltre che differenziabile per A0 : ne segue che
l’operatore hermitiano A0 ammette estensioni autoaggiunte.
qed
∗
Osserviamo che, se A0 ⊂ A = A nella dimostrazione precedente, allora A
induce una rappresentazione dell’algebra C(R)
π(f ) := f (A)
che ha ξ come vettore ciclico, dato che
An ξ = s-lim fk (A)ξ
k−→∞
se fk ∈ C0 (R) è una funzione nulla all’infinito. Quindi, per la teoria GNS, la
rappresentazione è univocamente determinata da uno stato
Z
ω(f ) := (ξ, f (A)ξ) = f (λ)dµ(λ)
Dunque le estensioni autoaggiunte sono in corrispondenza biunivoca con le misure
regolari, la cui unicità equivale all’essere A0 essenzialmente autoaggiunto. Ma per
il teorema di Nelson A0 è essenzialmente autoaggiunto perché X/N è un insieme
di vettori analitici.
14.5
Gruppi commutativi e dualità di Pontriagin
Vogliamo infine giustificare l’affermazione fatta in calce al capitolo, secondo la quale è possibile generalizzare la teoria di Fourier al caso di un gruppo
commutativo localmente compatto qualsiasi.
14.5.1 Definizione Un morfismo fra i gruppi topologici G e H è una funzione
ϕ : G −→ H continua che sia un morfismo di gruppi.
Ovviamente i gruppi topologici e i loro morfismi definiscono una categoria.
Combinando le proprietà delle applicazioni continue e dei morfismi di gruppi si
ottengono le proprietà dei morfismi di gruppi topologici: ad esempio, il nucleo
ker ϕ = {g ∈ G | ϕ(g) = e} di un morfismo di gruppi topologici è un sottospazio
chiuso (per continuità della ϕ) di G e lo spazio quoziente G/ ker ϕ è un gruppo topologico isomorfo all’immagine im ϕ; ovviamente un isomorfismo di gruppi
topologici è un omeomorfismo che sia un morfismo di gruppi.
Particolare interesse hanno certi morfismi associati ad un gruppo G:
14.5.2 Definizione Se G è un gruppo topologico, un carattere è un morfismo
χ : G −→ T
del gruppo topologico G nel gruppo topologico T.
14.5. Gruppi commutativi e dualità di Pontriagin
555
In altri termini un carattere di G è una funzione continua a valori complessi
tale che
• |χ(g)| = 1
• χ(gh) = χ(g)χ(h)
Osserviamo che l’insieme dei caratteri di un gruppo topologico è ancora un gruppo topologico: infatti il prodotto χ1 χ2 di due caratteri soddisfa ancora le (1)-(2)
e quindi è un carattere; lo stesso vale per l’inverso, definito come
χ−1 := χ
(complesso coniugato). Rispetto a queste operazioni, l’insieme
b := {χ : G −→ T | χ carattere}
G
b è uno spazio topologico: basta definire la convergenza
è un gruppo. Inoltre, G
di una successione {χn } come la convergenze uniforme sui compatti K ⊂ G; in
b è data dagli insiemi
altri termini, una base di intorni dell’identità e ∈ G
b | |χ(g)| < ε}g∈K
{χ ∈ G
al variare di K fra i compatti di G. Come accade per gli spazi vettoriali topologici,
la topologia su un gruppo topologico è completamente determinata una volta che
sia data intorno all’elemento e: infatti le traslazioni sono per definizione continue,
e, se g ∈ G, e U è un intorno di e allora gU è un intorno di g.
b è a sua volta un gruppo topologico: infatti se
Rispetto a questa topologia, G
χ1 , χ2 , χ3 e χ4 sono caratteri di G, per ogni g ∈ G si ha (denotiamo additivamente
la moltiplicazione in T, che immaginiamo come la circonferenza unitaria nel piano
b
complesso e moltiplicativamente quella in G)
|χ3 (x)χ4 (x) − χ1 (x)χ2 (x)| =|(χ3 (x) − χ1 (x))χ4 (x) − χ1 (x)(χ4 (x) − χ2 (x))|
≤|χ3 (x) − χ1 (x)| + |χ4 (x) − χ2 (x)|
(dato che χ(x) ∈ T si tratta di numeri complessi di modulo 1) e da questo scende
la continuità del prodotto (la continuità del passaggio all’inverso è ovvia).
b è indotta dalla topologia su CB (G) (funzioni
Osserviamo che la topologia di G
continue e limitate su G) data dalle seminorme
pK (f ) = sup |f (g)|
g∈K
b ,→ CB (G).
Infatti G
b è commutativo, dato che lo è T:
Inoltre G
(χ1 χ2 )(g) = χ1 (g)χ2 (g) = χ2 (g)χ1 (g) = (χ2 χ1 )(g)
Calcoliamo il gruppo dei caratteri degli esempi che abbiamo dato:
556
Capitolo 14. Gruppi topologici
b è isomorfo al gruppo topologico T.
14.5.3 Teorema Il gruppo topologico Z
b e T:
Dimostrazione: Intanto stabiliamo una corrispondenza biunivoca fra Z
un carattere χ : Z −→ T è completamente determinato dal valore che assume su
1 ∈ Z, dato che
∀n ∈ Z χ(n) = χ(1 + ... + 1) = χ(1)...χ(1) = χ(1)n
(il prodotto in G = Z è la somma +). Per il resto, la funzione χ : Z −→ T è
completamente arbitraria: ne segue che per ogni z ∈ T esiste un carattere di Z,
determinato dalla
χz (1) := z
Ovviamente se χz (1) = χw (1) allora z = w e quindi abbiamo una corrispondenza
biunivoca
χ
b ←−
Z
−→ T
Di più, abbiamo che
χz 1 z 2 = χz 1 χz 2
e quindi questa corrispondenza biunivoca è un isomorfismo di gruppi.
Resta da verificare che si tratta di un omeomorfismo di spazi topologici. Ma
Z ha la topologia discreta: quindi i suoi compatti sono precisamente gli insiemi
b è, per definizione, quella punto per punto. In
finiti e dunque la convergenza in Z
particolare:
χzn −→ χz ⇐⇒ χzn (1) −→ χz (1)
il che accade se e solo se zn −→ z.
qed
b è isomorfo al gruppo topologico R.
14.5.4 Teorema Il gruppo topologico R
Dimostrazione: Per ogni fissato λ ∈ R, la funzione
χλ : R −→ T
x 7−→ e2πiλx
è un carattere di R: ma ogni altro carattere di R è di questa forma (per il teorema
di Stone 14.3.6 nel caso dello spazio di Hilbert H = C), pertanto χλ ←→ λ è
b che ovviamente è un omeomorfismo, ed un
una una mappa biunivoca R −→ R,
morfismo di gruppi topologici:
χλ+µ (t) = ei(λ+µ)t = eiλt eiµt = χ(λ)χ(µ)
qed
14.5. Gruppi commutativi e dualità di Pontriagin
557
Possiamo stabilire dei semplici risultati sulla dualità nei gruppi abeliani: ricordiamo che se H è un sottogruppo di G (gruppo abeliano), un elemento g ∈ G
b se χ(x) = 1. Se G è topologico e S è un
si dice ortogonale a un elemento χ ∈ G
b ortogonali a tutti gli elementi di
suo sottoinsieme, l’insieme degli elementi χ ∈ G
⊥
S si dice annullatore di S e si denota S . Si tratta ovviamente di un sottogruppo
b
chiuso in G.
14.5.5 Lemma Se G è un gruppo topologico localmente compatto abeliano e
H è un sottogruppo chiuso di G, il duale del gruppo7 quoziente, è isomorfo
b
all’annullatore di H in G.
Dimostrazione: Consideriamo l’epimorfismo canonico
p : G −→ G/H
ed il suo duale
[ −→ G
b
pb : G/H
[ e g∈G. Allora pb è un monomorfismo
definito come pb(χ)(g) = χ(p(g)) ove χ∈ G/H
di gruppi: se pb(χ) = 1 allora χ(p(g)) = 1 e quindi χ ∈ H ⊥ , i.e. è il carattere 1 in
[ inoltre im pb = H ⊥ : infatti un carattere χ ∈ G
b è della forma p(χ0 ) se e solo
G/H;
se χ è 1 su H.
Infine pb è un omeomorfismo: è aperta perché p è continua ed è continua perché
p è aperta.
qed
14.5.6 Proposizione Il duale di un gruppo finito è isomorfo al gruppo stesso.
Dimostrazione: Il duale di Zn è isomorfo all’annullatore in T di nZ ⊂ Z: si
tratta quindi del sottogruppo di T, immagine, per mezzo della mappa canonica
R −→ R/Z = T, del sottoinsieme dei numeri reali x tali che
e2πixn = 1
Si vede facilmente che questo gruppo è ciclico di ordine n, e ne deduciamo che
il duale di un gruppo ciclico è isomorfo al gruppo stesso; combinando questo
risultato col noto teorema di Algebra secondo il quale ogni gruppo abeliano finito
è prodotto di gruppi ciclici, otteniamo la tesi
qed
Dato che, ovviamente
7
Ogni sottogruppo di un gruppo abeliano è normale, quindi il quoziente è sempre un gruppo.
558
Capitolo 14. Gruppi topologici
14.5.7 Proposizione Il duale di un prodotto di gruppi è il duale dei prodotti.
cn = Rn , T
cn = Zn e Z
cn = Tn : in particolare osserviamo che ognuno
abbiamo che R
di questi gruppi è isomorfo al suo biduale (nel caso di Rn questa non è altro che
la dualità canonica fra uno spazio vettoriale ed il suo biduale). In generale è vero
il seguente
14.5.8 Teorema (dualità di Pontriagin) Il duale del duale di un gruppo
topologico G è canonicamente isomorfo al gruppo stesso.
In altri termini si tratta di una vastissima generalizzazione dell’isomorfismo canonico fra uno spazio vettoriale ed il suo biduale, al caso di un gruppo
topologico commutativo qualsiasi:
b∼
b
G
=G
Per la dimostrazione si veda ad esempio [32] oppure, per una dimostrazione che
usi l’Analisi Funzionale, [21].
Dato che G è commutativo, anche L1 (G) e quindi C ∗ (G) lo è; allora, per
il teorema di Gel’fand–Najmark 9.5.1, esiste uno spazio topologico localmente
compatto X tale che
C ∗ (G) ∼
= C0 (X)
Per definizione, la compattificazione di X è lo spettro dell’algebra A ottenuta
aggiungendo un elemento neutro a C ∗ (G): si tratta cioè dello spazio dei funzionali lineari moltiplicativi su C ∗ (G), e quindi dello spazio delle rappresentazioni
unitarie di dimensione 1 (continue) di C ∗ (G); ma sappiamo che esiste una corrispondenza biunivoca fra queste rappresentazioni e le rappresentazioni unitarie
di dimensione 1 di G, ovvero dei suoi caratteri. Quindi
b
X↔G
La catena di corrispondenze che abbiamo enunciato è continua in ambedue i
sensi, quindi ha luogo l’omeomorfismo
b
X∼
=G
Osserviamo in ogni caso, che se G è compatto allora C ∗ (G) = C(X) possiede
un’unità, quindi X è discreto; viceversa se G è discreto allora L1 (G) possiede
una unità, quindi, per il teorema di Gel’fand–Najmark, X è compatto. Dunque
14.5.9 Corollario Il duale di un gruppo compatto è un gruppo discreto e viceversa.
Si noti che, se G è un gruppo commutativo localmente compatto e se consib con la topologia discreta, allora il duale di G
b è un gruppo compatto
deriamo G
nel quale G si immerge, e che si dice compattificazione di Bohr .
14.5. Gruppi commutativi e dualità di Pontriagin
559
Osserviamo che, per la funtorialità espressa dal teorema di Gel’fand–Najmark
9.5.1:
b
C ∗ (G) ∼
= C0 (G)
(isomorfismo di C*-algebre).
b corrisponde unicaQuindi: ogni rappresentazione non degenere ρ di C0 (G)
∗
mente ad una rappresentazione non degenere π di C (G) che corrisponde unicamente ad una rappresentazione unitaria (fortemente continua) U di G, e la
corrispondenza è realizzata dalle
Z
π(f ) = f (g)U (g)dµ(g) = ρ(fb)
ove fb è la trasformata di Gel’fand di f .
Possiamo allora estendere ρ ad una rappresentazione dell’algebra delle funzioni boreliane limitare
b −→ B(H)
ρe : β(G)
in modo che
ρe(χ∆ ) = E(∆)
b possiamo espri(misura spettrale). Quindi, per ogni funzione boreliana f ∈ β(G)
mere ρe(f ) come limite (in norma) di somme alla Lebesgue–Stieltjes:
Z
ρe(f ) =
f (χ)dE(χ)
b
G
b
In particolare, per h ∈ C0 (G):
Z
ρe(h) = ρ(h) =
h(χ)dE(χ)
b
G
sicché, per h = fb (trasformata di Gel’fand di una funzione f ∈ L1 (G)):
Z
b
π(f ) = ρ(f ) =
fb(χ)dE(χ)
b
G
e quindi, dato che la mappa
ηg : χ 7−→ χ(g)
b troviamo
è un funzionale su β(G),
ρe(ηg ) =
Z
χ(g)dE(χ)
b
G
Ora applichiamo il seguente teorema per concludere che
ρe(ηg ) = U (g)
560
Capitolo 14. Gruppi topologici
14.5.10 Teorema (Stone–Najmark–Ambrose–Godement)
Z
χ(g)dE(χ) = U (g)
b
G
Dimostrazione: Osserviamo che, se, al solito, fg (h) = f (g −1 h) da
Z
fb(χ) = ω(f ) = f (g)χ(g)dµ(g)
segue che
fbg (χ) =
Z
Z
−1
f (g h)χ(h)dµ(h) =
f (h)χ(gh)dµ(h) = χ(g)fb(χ)
cioè fbg (χ) = χ(g)fb(χ), da cui (ρ è un omomorfismo):
U (g)π(f ) = π(fg ) = ρ(fbg ) = ρe(fbg ) = ρe(χ(g)e
ρ(fb)
µZ
¶
= ρe(ηg )π(f ) =
χ(g)dE(χ) π(f )
b
G
Pertanto, dato che π è non degenere, {π(f )x} è totale per ogni x al variare di f :
Z
U (g) =
χ(g)dE(χ)
b
G
qed
Definiamo ora la trasformata di Fourier per i gruppi localmente compatti
abeliani semplicemente come la trasformata di Gel’fand
b
b : L1 (G) −→ C0 (G)
Evidentemente
\
b ∩ L2 (G)
b
L1 (G)
∩ L2 (G) = C0 (G)
b (semplicemente scalandola per un
e possiamo scegliere la misura di Haar su G
fattore non nullo) in modo che
Z
Z
2
|f (g)| dµ(g) =
|fb(χ)|2 db
µ(χ)
G
b
G
in modo da generalizzare il teorema di Plancherel al caso dei gruppi:
14.5.11 Teorema La trasformata di Gel’fand si estende ad un isomorfismo
b
unitario fra lo spazio di Hilbert L2 (G) e lo spazio di Hilbert L2 (G).
Capitolo 15
GRUPPI CLASSICI
In questo capitolo studiamo una classe notevolissima di gruppi topologici: i
gruppi classici di matrici, che hanno origine in Algebra Lineare, ma sono fondamentali nella Fisica moderna (sia relativistica che quantistica). Anche se i
concetti introdotti saranno elementari (potrebbero svilupparsi con i soli strumenti forniti dall’Algebra Lineare e dalla Topologia elementare) useremo la teoria generale dei gruppi topologici del capitolo precedente, in particolare quando
discuteremo i gruppi semplicemente connessi e i gruppi spin. Nel paragrafo finale
introdurremo il concetto di varietà differenziabile, motivato dagli esempi dati dai
gruppi classici.
15.1
Gruppi di matrici.
Gli esempi più importanti di gruppi topologici localmente compatti probabilmente si trovano fra i gruppi di matrici: l’insieme (n > 0)
GLn (R) := {A ∈ Mn (R) | det A 6= 0}
è un gruppo rispetto al prodotto di matrici, ed è topologico visto che è un aperto
2
in Mn (R) ∼
= Rn . Ovviamente il prodotto di matrici è continuo1 . Più intrinsecamente, se V è uno spazio vettoriale topologico, il gruppo Aut V degli endomorfismi invertibili di V è un gruppo topologico, sottospazio di End V . Il gruppo
GL(V ) si dice gruppo lineare generale dello spazio vettoriale V . Ovviamente la
definizione può darsi nel caso complesso. Si noti che GL1 (R) = R \ {0} (che è
uno spazio topologico non connesso) mentre GL1 (C) = C \ {0} (che è uno spazio
topologico connesso). Notiamo che, ancora più in generale, se A è un’algebra
associativa di dimensione finita, l’insieme A−1 dei suoi elementi invertibili è un
gruppo topologico che generalizza GLn (R).
1
Le entrate della matrice prodotto AB sono polinomi nelle entrate di A e B: quindi il
prodotto è addirittura una funzione analitica!
561
562
Capitolo 15. Gruppi classici
Si noti che R2n = Cn come spazi vettoriali reali: tuttavia
GLn (C) ( GLn (R)
Infatti il gruppo lineare generale complesso “preserva la struttura complessa”
di Cn , cioè la moltiplicazione per i, ovvero la decomposizione di ogni matrice
complessa A in A = B + iC con B, C matrici reali: in altri termini
)
(µ
¶ ¯¯
A −B ¯
GLn (C) =
¯ A, B ∈ GLn (R)
B A ¯
Un altro esempio è il gruppo lineare speciale
SLn (R) := {A ∈ Mn (R) | det A = 1}
che è un sottogruppo topologico di GLn (R). Osserviamo che si tratta di un
2
chiuso in Mn (R) ∼
= Rn poiché i suoi elementi sono gli zeri della funzione continua
det A−1. Non si tratta però di un gruppo compatto: per vederlo consideriamo una
qualsiasi norma sullo spazio Mn (R) (che essendo uno spazio vettoriale topologico
di dimensione finita è normato e su di esso tutte le norme sono equivalenti), ad
esempio
||A|| := n max |aij |
1≤i,j≤n
è immediato che, rispetto a questa norma, Mn (R) è un’algebra di Banach; ora
una matrice della forma
1 0 ... 0 0
0 1 ... 0 0
.. .. . . ..
..
. .
. .
.
0 0 ... ε 0
0 0 ... 0 ε−1
appartiene a SLn (R) per ogni ε 6= 0, e quindi il gruppo contiene elementi di norma
arbitrariamente grande. Ragionamenti del tutto analoghi possono svolgersi per
il gruppo SLn (C).
Dato che l’algebra B(H), se H = Cn , è l’algebra delle matrici, il gruppo
unitario U(H) diviene un gruppo di matrici: il gruppo unitario
U (n) = {A ∈ Mn (C) | AA∗ = I}
(ove A∗ = AT è la matrice trasposta coniugata). Questo gruppo dipende dalla
presenza di un prodotto hermitiano su Cn , ad esempio
X
(v, w) =
v i wi
i
563
15.1. Gruppi di matrici.
Si tratta di un gruppo compatto: è chiuso per continuità delle funzioni A∗ A − I
(che sono funzioni nelle entrate delle matrici), ed è compatto perché se A ∈ U (n)
allora | det A| = 1 e quindi, se ((aij )) = A:
X
|aij |2 = aij aij ≤
aik aik = 1
k
(dato che AA∗ = I).
Notiamo che il determinante di una matrice unitaria è un numero complesso
di modulo 1: le matrici unitarie che hanno effettivamente determinante 1 sono
un sottogruppo, che si dice gruppo unitario speciale
SU (n) = {A ∈ U (n) | det A = 1} = U (n) ∩ SLn (C)
Ovviamente SU (n) è compatto, dato che è chiuso in U (n). Si noti inoltre che
U (1) = T = S 1 = {z ∈ C | |z| = 1} = SU (1)
e che U (n) = U (1) × SU (n).
Osserviamo che U (n) è un sottogruppo compatto massimale in GLn (C); infatti
se K fosse un sottogruppo compatto contenente U (n) allora la rappresentazione
K ,→ GLn (C) sarebbe unitaria (per compattezza di K) e quindi K ⊂ U (n). In
particolare, ogni sottogruppo compatto massimale di GLn (C) è coniugato a U (n).
Consideriamo ora oggetti analoghi per il caso reale: sia cioè V uno spazio
vettoriale reale di dimensione finita dotato di prodotto scalare, ad esempio
X
(v, w) =
v i wi
i
Il gruppo ortogonale è allora il gruppo delle matrici che preservano questo prodotto: (Av, Aw) = (v, w), cioè
O(n) := {A ∈ Mn (R) | AAT = I}
Ovviamente O(n) è chiuso; per vedere che è compatto di nuovo si ragiona in
modo analogo a quanto fatto per U (n): in effetti una matrice ortogonale A è tale
che | det A| = 1, quindi det A = ±1.
¶
µ
a b
tali che a2 + b2 = 1 =
15.1.1 Esempio O(2) è il gruppo delle matrici
c d
c2 + d2 e ac + bc = 0: in altri termini
¶
¶ µ
¶
µ
¶ µ
µ
cos t sin t
a b
cos t sin t
a b
=
oppure
=
sin t − cos t
c d
− sin t cos t
c d
564
Capitolo 15. Gruppi classici
Il sottogruppo delle matrici di O(n) con determinante 1 è il gruppo ortogonale
speciale
SO(n) = {A ∈ O(n) | det A = 1} = O(n) ∩ SLn (R)
Ovviamente SO(n) è compatto, dato che è chiuso in O(n). Si noti inoltre che
SO(2) = {e2πit }t∈R = S 1 = SU (1)
e che O(2) = {±1} × SO(2).
Osserviamo che i gruppi U (n) e O(n) sono stati definiti considerando forme
bilineari definite positive e simmetriche sugli spazi vettoriali di dimensione finita reali e complessi: in effetti basta considerare forme non degeneri per avere
dei gruppi di matrici. Una forma bilineare simmetrica non degenere è sempre
riconducibile (teorema di Sylvester) alla
(v, w)k =
k
X
v i wi −
i=1
n
X
v i wi
i=k+1
Il gruppo che preserva questa forma è
O(k, n − k) = {A ∈ GLn (R) | (Av, Aw)k = (v, w)}
Ad esempio il gruppo O(1, 3) si dice gruppo di Lorentz , perché preserva le trasformazioni di Lorentz nello spazio di Minkowski: questi gruppi non sono compatti.
Anche qui possiamo considerare i sottogruppi speciali
SO(k, n − k) = O(k, n − k) ∩ SLn (R)
Notiamo che SO(k, n − k) = SO(n − k, k).
Infine consideriamo una forma bilineare non degenere ed antisimmetrica: intanto osserviamo che uno spazio possiede una tale forma solo se è di dimensione
pari: infatti se h, i è una forma bilineare tale che
hv, wi = −hw, vi
allora hv, vi = 0 e quindi, se la forma e non degenere, fissata una base (e1 , ..., ek ),
la matrice A della forma h, i nella base è tale che
A = −AT
e
det A 6= 0
cioè det A = det −AT = (−1)k det A da cui k deve essere pari.
Una tale forma è sempre riconducibile (teorema di Darboux) alla
k
X
hv, wi =
(vi wi+k − wi vi+k )
i=1
565
15.1. Gruppi di matrici.
Il gruppo che preserva questa forma è il gruppo simplettico 2 :
Spn (R) = {A ∈ M2n (R) | hAv, Awi = hv, wi}
Osserviamo che Spn (R)µ ⊂ GLn¶(C) ⊂ GL2n (R). Precisamente, le matrici di
A B
tali che
Spn (R) sono le matrici
−B A
¶
¶ µ
¶µ
¶µ
µ
0 I
A B
0 I
A B
=
−I 0
−B A
−I 0
−B A
¶
µ
0 I
è la matrice della forma simplettica nella base standard.
ove J =
−I 0
È possibile considerare il gruppo simplettico complesso, se lo spazio ove si
considera la forma simplettica è complesso (e.g. C2n ):
Spn (C) = {A ∈ M2n (C) | hAv, Awi = hv, wi}
Questi gruppi simplettici non sono compatti: un argomento analogo alla decomposizione polare mostra in effetti che sono, topologicamente, il prodotto di U (n)
per RN ; è invece compatto il gruppo
Sp(n) = Spn (C) ∩ U (2n)
Il gruppo Sp(n) può definirsi come gruppo di matrici su uno spazio vettoriale
quaternionico: ricordiamo che i quaternioni (cfr. esempio 5.5.9) H = C2 formano
un corpo e quindi possiamo considerare spazi vettoriali su di essi, e quindi i gruppi
GLn (H) e SLn (H): notiamo che GLn (H) ⊂ GL2n (C) (inclusione propria) è il
sottogruppo di GL2n (C) delle matrici che preservano la struttura quaternionica,
cioè delle matrici della forma
µ
¶
A −B
B A
con A, B ∈Mn (C). Allora il gruppo simplettico è l’equivalente del gruppo unitario
nel caso quaternionico:
Sp(n) = {A ∈ GLn (H) | AA∗ = I}
ed è formato dalle matrici A a coefficienti quaternionici che preservano la forma
hermitiana
X
(v, u) =
ui v i
k
2
Il termine, dovuto a H.Weyl, è la versione greca di “complesso”.
566
Capitolo 15. Gruppi classici
ove se u = a1 + bi + cj + dk ∈ H, il suo coniugato è u = a1 − bi − cj − dk.
Si tratta di un gruppo compatto, che è l’analogo di U (n) e O(n) per gli spazi
quaternionici: non esiste un gruppo simplettico speciale, dato che si dimostra che
Sp(n) è già speciale:
Sp(n) ⊂ SLn (H)
I gruppi che abbiamo fin qui introdotti si dicono, nella terminologia di H.Weyl,
gruppi classici .
Studiamo ora le proprietà topologiche dei gruppi classici: riassumiamo quanto
fin qui detto con il
15.1.2 Teorema I gruppi U (n), O(n), Sp(n), SO(n) e SU (n) sono compatti; i
gruppi GLn (K), SLn (K) non sono compatti, con K = R, C, H.
Notiamo che è definita per ogni gruppo classico G una mappa
det : G −→ R \ {0}
In particolare, la mappa det : O(n) −→ {±1} è continua e suriettiva, quindi il
gruppo O(n) non è connesso.
15.1.3 Teorema O(n) ha due componenti connesse: SO(n) e −I · SO(n).
Per dimostrarlo è sufficiente mostrare che SO(n) è connesso; lo dimostreremo
fra breve: intanto notiamo il
15.1.4 Corollario GLn (R) ha due componenti connesse: GL+
n (R) = {A∈Mn (R) | det A >
+
0} e GLn (R) = {A ∈ Mn (R) | det A < 0}.
Dimostrazione: Basta usare la decomposizione polare: ogni matrice A∈GLn (R)
si scrive come A = |A|B con |A| matrice simmetrica definita positiva e B ∈ O(n):
allora, dato che l’insieme delle matrici simmetriche definite positive è convesso,
(tA + (1 − t)A è simmetrica definita positiva se lo è A, al variare di t) è connesso:
quindi le componenti connesse di GLn (R) corrispondono a quelle di O(n).
qed
Osserviamo che questi risultati sono falsi nei casi complesso e quaternionico:
in altri termini
15.1.5 Teorema I gruppi GLn (C) e GLn (H) sono connessi.
Questo seguirà dal seguente risultato
15.1.6 Teorema I gruppi SO(n), U (n) e Sp(n) sono connessi.
567
15.1. Gruppi di matrici.
e dalle decomposizioni polari per i gruppi lineari generali complesso e quaternionico che sono del tutto analoghe a quella reale.
La dimostrazione della connessione di U (n), SO(n) e Sp(n) può svolgersi
considerando l’importante concetto di toro massimale in un gruppo di matrici.
Ricordiamo che il toro n-dimensionale è il gruppo topologico commutativo
compatto (connesso) Tn = S 1 × ... × S 1 . Ogni gruppo classico possiede dei tori
massimali che si definiscono come segue.
In U (n) un toro massimale è semplicemente il sottogruppo delle matrici
diagonali con elementi di modulo 1:
z
0
...
0
1
¯
0 z2 ... 0
¯
¯
n
T = A ∈ U (n) ¯ A = .. .. . .
.
¯
. .
. ..
0 0 ... zn z ,...,z ∈T
1
n
In Sp(n) un toro massimale è semplicemente
c1 0 ... 0
¯
0 c2 ... 0
¯
¯
n
T = A ∈ Sp(n) ¯ A = .. .. . .
.
¯
. .
. ..
0 0 ... cn
µ
¶
zi 0
ove ci =
∈ U (2) e zi ∈ T. Anche in SO(2n) e SO(2n + 1) c’è un toro
0 zi
massimale standard della forma
R1 0 ... 0
¯
0 R2 ... 0
¯
¯
n
T = A ∈ SO(2n) ¯ A = ..
.. . .
.
¯
.
. ..
.
0 0 ... Rn
µ
¶
cos ti sin ti
ove Ri =
ed in SO(2n + 1):
− sin ti cos ti
R
0
...
0
0
1
0 R2 ... 0 0
¯
¯
¯
.
.
.
.
n
.
.
.
.
.
.
T = A ∈ SO(2n + 1) ¯ A = .
. . .
.
¯
0 0 ... Rn 0
0 0 ... 0 I
Ora sia G è uno dei gruppi SO(2n), SO(2n + 1), U (n) o Sp(n): scriviamo A∗ in
luogo di AT per i gruppi ortogonali e AT per i gruppi unitari e simplettici.
568
Capitolo 15. Gruppi classici
Osserviamo che se A ∈ G allora è normale:
A∗ A = A−1 A = I = AA−1 = AA∗
Possiamo allora usare il teorema spettrale nel caso di dimensione finita per
dedurre il seguente teorema dovuto (in una forma più intrinseca) ad Èlie Cartan:
15.1.7 Teorema Se G è uno dei gruppi classici compatti SO(2n), SO(2n + 1),
U (n) ovvero Sp(n) allora per ogni suo toro massimale:
[
G=
gT n g −1
g∈G
Cioè G è unione dei coniugati del toro massimale T n .
Ora, dato che Tn è connesso (è un prodotto di spazi connessi S 1 ) abbiamo
scritto G come unione di connessi gT n g −1 che hanno un punto in comune e:
quindi
15.1.8 Corollario I gruppi SO(n), U (n) e Sp(n) sono connessi.
Segnaliamo che i tori massimali nei gruppi classici giocano un ruolo decisivo
nella descrizione di questi gruppi: ad esempio, considerando T n ⊂ G e il normalizzatore N (T n ) (cioè il più grande sottogruppo di G che ammetta T n come
sottogruppo normale), il quoziente N (T n )/T n si dice gruppo di Weyl W (G): il
gruppo di Weyl agisce su T n come (denotiamo con [n] la classe di n ∈ N (T n ))
([n], t) 7−→ ntn−1
Questa azione è ben definita (non dipende dal rappresentante n ma solo dalla
classe) e consente di dimostrare il seguente teorema, per il quale si rimanda ai
testi specialistici (ad esempio [26], [3] o [21]):
15.1.9 Teorema Il gruppo di Weyl è finito ed agisce senza punti fissi sul toro
massimale.
15.2
Semplice connessione e Spin
Vogliamo qui discutere un’altra proprietà topologica che i gruppi di matrici
possono avere: la semplice connessione. Ad esempio ricordiamo che S 1 = T =
U (1) non è semplicemente connesso: il suo gruppo fondamentale è Z (cfr. 2.5.14).
Prima di procedere osserviamo che basta limitarsi ai gruppi classici compatti
SO(n), U (n) e Sp(n): infatti
15.2. Semplice connessione e Spin
569
15.2.1 Teorema Il gruppo GL+
n (R) (rispettivamente GLn (C), GLn (H)) ha lo
stesso gruppo fondamentale di SO(n) (rispettivamente U (n), Sp(n)).
Dimostrazione: Basta ricordare la decomposizione polare:
GL+
n (R) = SO(n) × S(n)
ove S(n) è lo spazio delle matrici simmetriche definite positive (risp. GLn (C) =
U (n) × H(n) con H(n) matrici hermitiane definite positive, GLn (H) = Sp(n) ×
Q(n) con Q(n) matrici hermitiane quaternioniche definite positive). Ma lo spazio
S(n) (risp. H(n), Q(n)) è convesso (infatti se t ∈ [0, 1] a A ∈ S(n) anche tA +
(1 − t)A ∈ S(n)) e quindi contraibile. Ne segue che
π1 (GLn (R)) = π1 (O(n) × S(n)) = π1 (O(n))
qed
Osserviamo che abbiamo considerato GL+
n (R) perché GLn (R) non è connesso,
e quindi non ha senso considerare il gruppo fondamentale, ma solo i gruppi
fondamentali delle componenti connesse, che in questo caso sappiamo essere due
ed omeomorfe fra loro(tramite la A 7−→ −A); basta quindi limitarsi ad una di
esse, ad esempio quella contenente l’identità I cioè GL+
n (R).
Calcoleremo i gruppi fondamentali dei gruppi classici compatti usando il loro
legame con le sfere. Sappiamo già che
U (1) = SO(2) = S 1
ha gruppo fondamentale Z.
15.2.2 Teorema Il gruppo SU (2) è omeomorfo come spazio topologico alla sfera
S 3 a tre dimensioni.
Dimostrazione: Basta scrivere in modo opportuno le matrici unitarie: un
elemento di SU (2) è una matrice
¶
µ
a b
A=
c d
con a, b, c, d ∈ C tale che A∗ A = I e det A = 1, cioè aa + bb = 1 = cc + dd,
ac + bd = 0 = ca + db e ad = bc + 1. Quindi a = d e b = −d e |a|2 + |b|2 = 1; con
le posizioni
a−a
b+b
b−b
a+a
x2 =
x3 =
x4 =
2
2
2
2
definiamo un omeomorfismo A ↔ (x1 , x2 , x3 , x4 ) fra SU (2) e la sfera di centro
l’origine e raggio 1 in R4 .
qed
x1 =
570
Capitolo 15. Gruppi classici
Il seguente risultato è intuitivamente ovvio: un cammino chiuso su una sfera
di dimensione maggiore o uguale a due è contraibile.
15.2.3 Teorema Per n > 1 la sfera S n è semplicemente connessa.
Dimostrazione: Consideriamo la sfera S n come compattificazione di Alexandroff dello spazio Rn : sia c : [0, 1] −→ S n un cammino in S n con c(0) = c(1) = x0 .
Allora, se y0 è un punto tale che non esiste t ∈ [0, 1] per cui c(t) = y0 (un tale
punto esiste sempre, dato che l’immagine di [0, 1] tramite c non può essere l’intera
S n ), considerando S n = Rn ∪ {y0 } (compattificazione di Alexandroff) il cammino
c è contenuto in Rn e quindi si contrae al punto x0 perché Rn è semplicemente
connesso.
qed
15.2.4 Corollario SU (2) = Sp(1) è semplicemente connesso.
Discutiamo ora il più semplice caso nel quale si manifesta il fenomeno dello
spin: il gruppo SO(3); per farlo realizziamo la sfera S 3 = SU (2) come sfera di
raggio 1 in R4 = H (corpo dei quaternioni): in altri termini realizziamo SU (2)
come le unità dei quaternioni, i.e. i quaternioni q tali che q = q −1 .
Ora consideriamo lo spazio dei quaternioni puramente immaginari:
H0 = {q ∈ H | q = −q} = {bi + cj + dk | , c, d ∈ R} = R3
Ovviamente la forma bilineare
(q1 , q2 ) = q1 q2
rende H0 uno spazio euclideo, isomorfo a R3 col prodotto standard. Ora, la mappa
Φ : SU (2) −→ GL(H0 )
definita come (rappresentiamo gli elementi di SU (2) come quaternioni)
Φ(A)(q) = AqA−1
(prodotto nel corpo dei quaternioni) è lineare e preserva il prodotto scalare in
H0 :
(Φ(A)q1 , Φ(A)q2 ) = Aq1 A−1 Aq2 A−1 = Aq1 A−1 A−1 q2 A
= Aq1 q2 A = −q1 A(−Aq2 ) = q1 q2
(dato che A = A−1 , qi = −qi e, per ogni coppia di quaternioni q, p si ha
qp = pq).Quindi Φ(A) ∈ O(3); ovviamente Φ è suriettiva e continua, quindi, dato
15.2. Semplice connessione e Spin
571
che SU (2) è connesso, l’immagine di Φ è connessa: questa immagine è SO(3).
Inoltre il nucleo della mappa Φ è formato dagli elementi ±I di SU (2): infatti se
Φ(A)(q) = q per ogni q ∈ H0 allora AqA−1 = q, cioè Aq = qA; questo accade solo
se il quaternione è reale (cioè se ha nulle le coordinate i, j, k): ma gli elementi di
H0 hanno nulla la componente reale e q = −q, e quindi A = ±I.
In definitiva abbiamo l’isomorfismo di gruppi topologici:
SU (2)/{±I} ∼
= SO(3)
o, se si vuole, la successione esatta di gruppi
1 −→ Z2 −→ SU (2) −→ SO(3) −→ 1
In particolare, dato che lo spazio proiettivo si ottiene dalla sfera identificandone
coppie di punti (antipodali):
15.2.5 Teorema SO(3) è omeomorfo allo spazio proiettivo reale tridimensionale P3 .
Dal punto di vista geometrico l’isomorfismo
µ
¶ SU (2)/{±1} = SO(3) può descria b
versi come segue: alla matrice A =
∈SU (2) associamo la trasformazione
−b a
lineare fratta
az + b
z 7−→
−bz + a
1
della retta proiettiva complessa CP in sé. Ma, per tramite della proiezione stereografica, CP1 si identifica alla sfera S 2 , della quale le trasformazioni lineari fratte
divengono le rotazioni. Si ottiene cosı̀ di nuovo la mappa SU (2) −→ SO(3): evidentemente due trasformazioni lineari fratte inducono la medesima rotazione se
e solo se differiscono per il segno.
Abbiamo visto come i gruppi unitari speciali in dimensione 1 e 2 siano delle
sfere; in generale non sarà vero che ogni gruppo unitario è una sfera, ma possiamo
stabilire un risultato, valido per i gruppi classici compatti, che lega questi oggetti
alle sfere di dimensione qualsiasi. Consideriamo le sfere S n−1 come le sfere di
centro l’origine e raggio 1 in Rn .
15.2.6 Teorema Il gruppo SO(n) (rispettivamente SU (n), Sp(n)) agisce in modo transitivo sulla sfera S n−1 (rispettivamente S 2n−1 , S 4n−1 ), lo stabilizzatore
nel punto e = (1, 0, ..., 0) ∈ S n è il sottogruppo I × SO(n − 1) (rispettivamente
I × U (n − 1), I × Sp(n − 1)). Hanno quindi luogo gli omeomorfismi
SO(n)/SO(n − 1) = S n−1 ,
SU (n)/SU (n − 1) = S 2n−1 ,
Sp(n)/Sp(n − 1) = S 4n−1
572
Capitolo 15. Gruppi classici
Dimostrazione: Facciamo la dimostrazione per SO(n): negli altri casi procede
in modo del tutto analogo. Consideriamo quindi l’azione di SO(n) su Rn data
dal prodotto di una matrice per un vettore Av: ovviamente
v ∈ S n−1 ⇒ Av ∈ S n−1
(dato che ||Av||2 = (Av, Av) = ||v||2 ). Questa azione è transitiva, dato che ogni
punto v ∈ S n−1 viene spostato in e da un elemento di A: infatti un elemento
v ∈ S n−1 per definizione è tale che ||v||2 = 1; possiamo quindi completare il
vettore {v} ad una base ortonormale di Rn : (v, v2 , ..., vn ). Allora la matrice A =
(v, v2 , ..., vn ) le cui colonne sono i vettori della base è in SO(n) ed è tale che
Av = e. Dunque, dato che l’azione è transitiva, abbiamo che
S n−1 = SO(n)/Ge
ove Ge è lo stabilizzatore di e: ma
¾
¶¯
½µ
1 0 ¯
Ge = {A ∈ SO(n) | Ae = e} =
¯ A ∈ SO(n − 1) = I × SO(n − 1)
0 A
e quindi abbiamo l’omeomorfismo cercato.
qed
Ad esempio, nel caso di SO(3), l’omeomorfismo SO(3)/SO(2) = S 2 è la
fibrazione di Hopf
S 3 −→ S 2
cioè una mappa suriettiva di S 3 in S 2 le cui controimmagini (le “fibre”) sono
isomorfe a S 1 .
Per calcolare i gruppi fondamentali dei gruppi classici compatti di dimensione
qualsiasi, dobbiamo svolgere qualche considerazione sui gruppi semplicemente
connessi. Sappiamo che esistono gruppi non semplicemente connessi, U (1) ad
esempio; tuttavia U (1) = S 1 è quoziente di uno spazio semplicemente connesso
R, e la mappa p : t 7−→ eit che realizza questo quoziente è un omeomorfismo
locale.
15.2.7 Definizione Un rivestimento di uno spazio topologico X è una mappa
p
continua suriettiva E −
→ X a uno spazio topologico E in X tale che
• per ogni x ∈ X la controimmagine p−1 (x) sia un insieme discreto;
• p sia un omeomorfismo locale;
• la topologia pdi X
sia la topologia quoziente indotta dalla mappa p.
L’esempio R −
→ S 1 è quello fondamentale: in questo caso R soddisfa anche la
definizione seguente
573
15.2. Semplice connessione e Spin
p
15.2.8 Definizione Un rivestimento E −
→ X si dice universale se E è semplicemente connesso.
Ovviamente, se esiste, il rivestimento universale è unico: due tali rivestimenti
p1
p−1 p1
p2
p−1 p2
2
1
E1 −
→ X e E2 −
→ X danno luogo a rivestimenti E1 −−
−→ E2 e E2 −−
−→ E1 che
sono omeomorfismi: questo segue dal
p
15.2.9 Lemma Se E −
→ X è un rivestimento, x0 ∈ X e e0 ∈ p−1 (x) allora per
ogni mappa continua f : Y −→ X da uno spazio connesso Y tale che f (y0 ) = x0
esiste un unica mappa f 0 : Y −→ E tale che f 0 (y0 ) = e0 e pf 0 = f .
Dimostrazione: Supponiamo che f 00 : Y −→ E soddisfi la tesi del lemma e
siano
A = {y ∈ Y | f 0 (y) = f 00 (y)}
e
B = {y ∈ Y | f 0 (y) 6= f 00 (y)}
Allora Y = A ∪ B e y0 ∈ A. Mostreremo che sia A che B sono aperti, il che è
assurdo, dato che Y è connesso (A ∩ B = ∅).
Sia y1 ∈ Y e U un intorno di f (y1 ) tale che p−1 (U ) sia unione disgiunta
di intorni a lui omeomorfi; se y1 ∈ A allora f 0 (y − 1) = f 00 (y − 1) appartiene
a qualche componente connessa C di p−1 (U ) e quindi f 0−1 (C) ∩ f 00−1 (C) è un
aperto contenente y1 e contenuto in A; dunque A contiene con ogni suo punto un
intorno aperto di questo punto ed è pertanto aperto. Se invece y1 ∈B allora f 0 (y1 )
appartiene a qualche componente connessa C di p−1 (U ) e f 00 (y1 ) appartiene a
qualche componente connessa D 6= C di p−1 (U ), da cui f 0−1 (C) ∩ f 00−1 (D) è un
intorno aperto di y1 contenuto in D. Quindi anche D è aperto.
qed
Osserviamo che non è affatto garantita l’esistenza di un rivestimento univere è un rivestimento universale, dato che è localmente omeomorsale: infatti, se X
fo a X, ed è semplicemente connesso, X deve essere localmente semplicemente
connesso, cioè ogni suo punto deve possedere un intorno aperto semplicemente
connesso. Questa condizione è pure sufficiente:
15.2.10 Teorema Se X è uno spazio topologico connesso, localmente connesso
e localmente semplicemente connesso allora possiede un rivestimento universale.
Dimostrazione: Diamo solo l’idea della dimostrazione, rimandando a [3], [26]
o [27], per una trattazione completa.
Sia x0 ∈X e consideriamo l’insieme C(x0 ) dei cammini in X con punto iniziale
x0 : se c, c0 : [0, 1] −→ X sono due tali cammini, diciamo che sono equivalenti
(c ∼ c0 ) se c(1) = c0 (1) e sono omotopi. Poniamo
e = C(x0 )/ ∼
X
574
Capitolo 15. Gruppi classici
e −→ X come
e definiamo p : X
p[c] = c(1)
p
e−
Ora rendiamo X uno spazio topologico in modo che X
→ X sia un rivestimento
e la famiglia
universale. La topologia si definisce considerando come base in X,
degli insiemi
A(V, c) := {[cc0 ] | c0 ∈ C(x0 ) c0 (0) = c(1) c0 ([0, 1]) ⊂ V }c∈C(x0 ), V
intorno aperto di p[c]
Si vede facilmente che si tratta di una base di intorni per una topologia e che
rende continua la mappa p: inoltre, se V ⊂ X è un intorno connesso semplicemente connesso di un punto x ∈ X, allora p−1 (x) è unione disgiunta degli A(V, c)
tali che p[c] ∈ V , e p(A(V, c)) = V : quindi p è un omeomorfismo locale. Non è
e è connesso, mentre la semplice connessione segue quasi
difficile verificare che X
per definizione.
qed
Il caso che ci interessa è quello di un gruppo topologico.
15.2.11 Teorema Se G è un gruppo topologico connesso, localmente connesso
p
e−
e localmente semplicemente connesso allora il suo rivestimento universale G
→
G è in modo unico un gruppo topologico con elemento neutro e0 ∈ p−1 (e) (e è
l’elemento neutro in G) e p è un omomorfismo di gruppi topologici.
Dimostrazione: Consideriamo la mappa m : G × G −→ G definita come
m(x, y) = xy −1
p
p×p
e −
e×G
e −
Se G
→ G è il rivestimento universale di G, in G
−→ G × G possiamo
sollevare unicamente m, ottenendo cosı̀ la struttura di gruppo topologico voluta:
l’unicità del sollevamento implica la validità delle proprietà gruppali.
qed
15.2.12 Lemma Se G è un gruppo topologico connesso, H un suo sottogruppo
chiuso connesso e semplicemente connesso e se il quoziente G/H è semplicemente
connesso allora anche G è semplicemente connesso.
p
e−
Dimostrazione: Consideriamo il rivestimento universale G
→ G di G ed il suo
e := p−1 (H) che è chiuso per continuità della p (ed è un sottosottogruppo H
gruppo perché p è un omomorfismo di gruppi). Dato che un rivestimento è un
e H
e sono semplicemente connessi p induce
omeomorfismo locale e che G/H e G/
l’omeomorfismo
e H
e∼
G/
= G/H
15.2. Semplice connessione e Spin
575
p|H
e
e −
−→ H il suo rivestiMa notiamo che, essendo H semplicemente connesso e H
e sicché G/H
e
mento universale, deve essere H = H,
= G/H e quindi la mappa
e
G −→ G/H che si solleva unicamente a G −→ G/H e viene a coincidere con
e −→ G/
e H
e = G/H:
e
e∼
G
dunque G
= G. Ne segue che G è semplicemente connesso.
qed
Siamo ora in grado di calcolare i gruppi fondamentali dei gruppi classici
compatti:
15.2.13 Teorema Per ogni n ≥ 1 SU (n) e Sp(n) sono semplicemente connessi,
mentre π1 (SO(2)) = π1 (U (n)) = Z e π1 (SO(n + 2)) = Z2 .
Dimostrazione: Usiamo il fatto che
S n−1 = SO(n)/SO(n − 1) ,
S 2n−1 = SU (n)/SU (n − 1) ,
S 4n−1 =Sp(n)/Sp(n − 1)
ed il fatto che le sfere sono semplicemente connesse. Nel caso di SU (n) e Sp(n)
si procede per induzione applicando il lemma: per n = 1 abbiamo π1 (SU (1)) =
π1 (SO(2)) = Z mentre π1 (Sp(1)) = π1 (SU (2)) = π1 (S 3 ) = 0; quindi, applicando
il lemma, otteniamo che SU (n + 1) e Sp(n) sono semplicemente connessi perché
lo sono le sfere e SU (n) e Sp(n − 1) per n > 1, per induzione.
Per quel che riguarda SO(n) non possiamo applicare il lemma; tuttavia notiamo che le immersioni ιn : SO(n − 1) ,→ SO(n) inducono degli epimorfismi di
gruppi
ι
π1 (SO(n)) −n∗
→ π1 (SO(n − 1)) −→ 1
i cui nuclei sono i gruppi π1 (S n−1 ); infatti l’epimorfismo assegna ad una classe [σ]
di cammini in SO(n) la classe [σ ◦ ι], e quindi ιn∗ ([σ]) = 0 se e solo se il cammino
σ ha immagine in SO(n)/SO(n − 1); ma in questo caso è contraibile a un punto,
per la semplice connessione di S n−1 , e quindi ιn∗ sono isomorfismi:
Z2 = π1 (SO(3)) = π1 (SO(4)) = ... = π1 (SO(n)) = ...
qed
Dato che i gruppi ortogonali SO(n), per n ≥ 3 non sono semplicemente
connessi (ma si noti che “lo sono quasi”: il loro gruppo fondamentale è il più
piccolo gruppo non banale che esista!) ha senso dare la seguente
15.2.14 Definizione Se n ≥ 3 si dice gruppo spinoriale Spin(n) il rivestimento
universale di SO(n).
15.2.15 Esempio Spin(3) = SU (2).
In generale è possibile realizzare ogni gruppo spinoriale come sottogruppo di
un opportuno gruppo unitario. Vediamo qualche altro esempio.
576
Capitolo 15. Gruppi classici
15.2.16 Proposizione Spin(4) = Spin(3) × Spin(3).
Dimostrazione: Osserviamo che se u, u0 ∈ SU (2) = Spin(3) sono due quaternioni unitari, la mappa
q 7−→ uqu0
è una isometria di H in sé, dato che
|uqu0 | = |u| |q| |u0 | = |q|
Abbiamo quindi una mappa continua
Φ : Spin(3) × Spin(3) −→ SO(4)
che è un omomorfismo di gruppi:
u(vqv 0 )u0 = (uv)qu0 v 0
Il nucleo di Φ è formato solo da (1, 1) e (−1, −1), mentre l’immagine coincide
con SO(4). Quindi si tratta del rivestimento universale di SO(4).
qed
Seguendo questa linea si può dimostrare che (cfr. ad esempio [27])
15.2.17 Teorema Spin(5) = Sp(2) e Spin(6) = SU (4).
15.3
Esponenziale di matrici
In questa sezione facciamo una digressione sull’esponenziale di matrici, che è
lo strumento fondamentale col quale, ad esempio, viene formulata la teoria dei
sistemi di equazioni differenziali ordinarie.
Consideriamo dunque una matrice qualsiasi X ∈ Mn (R), e poniamo
eX := 1 +
X X2 X3
+
+
+ ...
1!
2!
3!
cioè la serie esponenziale classica. Questa è una scrittura che ha formalmente
senso perché coinvolge solo somme e prodotti di matrici, e, perché definisca una
matrice, dobbiamo trovarne un dominio di convergenza.
15.3.1 Lemma Per ogni matrice X la serie eX converge.
577
15.3. Esponenziale di matrici
Dimostrazione: Usiamo il criterio di Cauchy tramite la disuguaglianza triangolare della norma di matrici
¯¯ m
¯¯
m+1
m+k−1
¯¯ X
¯¯ ||X||m
X
X
||X||m+k−1
¯¯
¯¯ <
+
+
...
+
+
...
+
¯¯ m!
(m + 1)!
(m + k − 1)! ¯¯
m!
(m + k − 1)!
Ma la serie numerica e||X|| converge per ogni X e quindi le somme parziali di eX
costituiscono una successione di Cauchy nella norma delle matrici il che dimostra
la convergenza della serie.
qed
Notiamo alcune proprietà immediate dell’esponenziale di matrici: intanto è
ovvio che
¡ A ¢T
T
e
= eA
Inoltre, se B ∈ GLn (R), dato che per ogni m ∈ N: BAm B −1 = (BAB −1 )m allora
BeA B −1 = eBAB
−1
Se la matrice A è triangolare superiore, cioè della forma
a11 a12 ... a1n
0 a22 ... a2n
A = ..
.. . .
..
.
. .
.
0
0
...
ann
allora, dato che gli elementi diagonali delle matrici (triangolari) Am sono {am
ii }
A
aii
e quindi anche e è triangolare con elementi diagonali {e }. In particolare
15.3.2 Proposizione ∀A ∈ Mn (R)
det eA = etr A
Dimostrazione: Infatti per ogni A ∈ Mn (R) esiste una matrice B ∈ GLn (R)
tale che BAB −1 è triangolare superiore (con coefficienti in generale complessi) e
quindi, dato che tr BAB −1 = tr A si ha la tesi.
qed
15.3.3 Corollario Per ogni A ∈ Mn (R), eA ∈ GL+
n (R).
Quindi ogni matrice esponenziale è invertibile con determinante positivo: non
è però vero che ogni matrice A ∈ GL+
n (R) sia l’esponenziale di qualche matrice
B ∈ Mn (R): ad esempio
¶
µ
−2 0
∈ GL+
A=
2 (R)
0 −1
non lo è: il motivo è ovvio, e risiede nel fatto che non è definito il logaritmo
di un numero negativo. Nel caso di matrici complesse, la mappa esponenziale è
invece suriettiva, ed il motivo risiede proprio nell’esistenza delle determinazioni
del logaritmo complesso.
578
Capitolo 15. Gruppi classici
15.3.4 Proposizione Se A e B sono matrici che commutano, cioè AB = BA
allora
eA+B = eA · eB
Dimostrazione: Per l’ipotesi fatta su A e B otteniamo:
̰
!Ã ∞
!
Ã
!
∞
X Ak
X Bh
X m!
X
1
eA · eB =
=
Ak B h
k!
h!
m!
k!h!
m=0
k=0
h=0
h+k=m
∞
X
1
(A + B)m = eA+B
=
m!
m=0
Infatti se A e B commutano, vale la formula del binomiale per calcolare (A + B)n
esattamente come per gli scalari.
qed
15.3.5 Corollario (eA )−1 = e−A e e0 = I.
In generale eA eB 6= eB eA : invece di produrre un controesempio (cosa peraltro
semplicissima) produciamone un’intera classe: scriviamo
[A, B] = AB − BA
per il commutatore delle matrici A e B (che quindi commutano se e solo se
[A, B] = 0). Ricordiamo che, ovviamente [A, B] = −[B, A], e che lo spazio Mn (R)
è un’algebra di Lie rispetto al commutatore, cioè che vale l’identità di Jacobi:
[[A, B], C] + [[C, A], B] + [[B, C], A] = 0
15.3.6 Teorema (Weyl) Se A e B sono matrici tali che
[A, [A, B]] = [B, [A, B]] = 0
allora
eA+B = e− 2 [A,B] eA eB
1
Dimostrazione: (Glauber) Consideriamo la funzione
F (t) = etA etB
Allora
d
F (t) = (A + etA Be−tA )F (t)
dt
579
15.3. Esponenziale di matrici
(e−tA = (etA )−1 ). Ma le ipotesi su A e B sono che
[A, [A, B]]AAB − 2ABA + BAA = 0 ⇒ AAB + BAA = 2ABA
quindi [B, A2 ] = BAA − AAB = BAA + AAB − 2AAB = 2ABA − 2AAB =
2A[B, A]. Per induzione:
[B, Am ] = mAm−1 [B, A]
e per conseguenza:
[B, e−tA ] =
X (−t)m
m
m!
[B, Am ] = −te−tA [B, A]
L’equazione differenziale precedente si scrive quindi come
d
F (t) = (A + B + t[A, B])F (t)
dt
che, con la condizione F (0) = I, ammette la soluzione (tenendo conto del fatto
che A e [A, B] commutano e B e [A, B] commutano):
1 2
[A,B]
F (t) = et(A+B)+ 2 t
1 2
[A,B]
= et(A+B) e 2 t
Ma allora, per l’unicità delle soluzioni di un’equazione differenziale ordinaria con
coefficienti analitici:
1 2
etA etB = et(A+B) e 2 t [A,B]
e, in t = 1, la tesi del teorema.
qed
15.3.7 Corollario Se [A, [A, B]] = [B, [A, B]] = 0 allora
eA eB = e[A,B] eB eA
Dimostrazione: Per il teorema, abbiamo:
e− 2 [A,B] eA eB = eA+B = eB+A = e− 2 [B,A] eB eA
1
1
Ma, per l’identità di Jacobi:
[[A, B], [B, A]] = −[[[B, A], A], B] − [[B, [B, A]], A] = 0
(per le ipotesi su A e B). Dunque
e[A,B] e−[B,A] = e[A,B]−[B,A] = e2[A,B]
e quindi
eA eB = e 2 [A,B] e− 2 [B,A] eB eA = e[A,B] eB eA
1
1
qed
580
Capitolo 15. Gruppi classici
Il teorema precedente ci permette di esprimere, nelle ipotesi [A, [A, B]] =
[B, [A, B]] = 0, il prodotto di matrici esponenziali in termini della somma e del
commutatore degli esponenti.
Abbiamo osservato che non ogni matrice invertibile è l’esponenziale di una
matrice: consideriamo quindi delle condizioni affinché lo sia.
15.3.8 Proposizione La mappa e : Mn (R) −→ GLn (R) è un diffeomorfismo
locale.
Dimostrazione: Dobbiamo dimostrare che esistono degli intorni V di 0∈Mn (R)
e U di I in GLn (R) tali che e ristretta a V sia un diffeomorfismo, cioè un omeomorfismo differenziabile con inverso differenziabile: dimostreremo addirittura che
è analitico.
2
Ovviamente e è una mappa analitica da Mn (R) = Rn nell’aperto (denso)
2
GLn (R) ⊂ Rn , visto che è determinata da una serie di potenze. Per dimostrare
il nostro enunciato basterà dimostrare che, nel punto 0 ∈ Mn , lo jacobiano di e è
diverso da zero, ed invocare quindi il teorema della funzione inversa.
Ora, se X = ((xij )) e eX = A = ((aij )), allora
∂akl
= δki δlj + · · ·
∂xij
dove i puntini indicano i termini che si annulanno in X = 0. Quindi la matrice
jacobiana della mappa esponenziale ha la forma
µµ
¶¶
∂akl
= ((δki δlj ))
∂xij
che è una matrice unitaria di rango massimo, il che dimostra la tesi.
qed
Questo risultato fondamentale può essere ulteriormente precisato: possiamo
cioè cercare di stimare gli intorni U e V nei quali e è un diffeomorfismo: per farlo
scriviamo esplicitamente un inverso locale dell’esponenziale di matrici.
Ispirandoci al caso n = 1, consideriamo la serie logaritmica
(A − I)2
(A − E)m
+ ... + (−1)m+1
+ ···
2
m
P
Dato che la corrispondente serie numerica m (−1)m+1 z m /m converge per |1 −
z| < 1, la serie logaritmica della matrice A converge assolutamente per ||A −
I|| < 1: osserviamo quindi che si ha convergenza nell’intorno U dell’I in GLn (R)
individuato dal lemma 9.1.9. Quindi, se A ∈ U possiamo definire ln A come la
somma della serie logaritmica di A. Un calcolo del tutto analogo a quello per gli
esponenziali mostra le proprietà elementari del logaritmo di matrici:
(A − I) −
581
15.3. Esponenziale di matrici
15.3.9 Proposizione Se A, B ∈ U e AB = BA allora ln(AB) = ln A + ln B.
Ora notiamo che, se A ∈ U allora ha senso considerare eln A : si tratta proprio
di A (basta sostituire formalmente le serie l’una nell’altra):
eln A = A
Viceversa, se ||A|| < ln 2
ln eA = A
Il perché di questa limitazione è semplice: l’equazione ln eA = A può infatti essere
falsa anche se ||eA − I|| < 1; ad esempio se
¶
µ
0 −t
A=
t 0
µ
2n
allora (A
=
−t2n
0
0
−t2n
¶
µ
2n+1
eA
µ
A
e =
=
0
−t2n+1
¶
t2n+1 0
):
0
¶
cos t − sin t
sin t cos t
e quindi, per t = 2π: eA = I, per cui ln eA = 0 =
6 A. Il raggio di convergenza
A
della serie ln e è ln 2.
Osserviamo ora che la mappa esponenziale è suriettiva sullo spazio delle
matrici complesse:
15.3.10 Teorema Se X ∈ GLn (C) esiste una A ∈ Mn (C) tale che eA = X.
Dimostrazione: Naturalmente, se X è diagonale a blocchi
D1 0 ... 0
0 D2 ... 0
X = ..
.. . .
..
.
.
.
.
0
0 ... Dm
Q
allora eX = k eDk . Ora rammentiamo che ogni matrice si decompone in blocchi
diagonali di Jordan:
C(λ1 )
0
...
0
0
C(λ2 ) ...
0
X = ..
..
..
.
.
.
.
.
.
0
0
... C(λm )
582
ove
Capitolo 15. Gruppi classici
λk 0 0 ... 0 0
1 λk 0 ... 0 0
0 1 λk ... 0 0
0 0 1 ... 0 0
C(λk ) =
..
..
.. . .
..
..
.
. .
.
.
.
0 0 0 ... λk 0
0 0 0 ... 1 λk
è una matrice k × k con l’autovalore λk di X sulla diagonale.
Supponiamo quindi che X = C(λ) con λ 6= 0 (altrimenti det X = 0). Quindi
X = λI + Y = λ(I + λ−1 Y ) ove Y ha non nulli solo gli elementi della i-sima riga
e (i − 1)-sima colonna uguali a λ; dato che Y è nilpotente (Y k = 0) (quindi lo è
λ−1 Y ), pertanto la serie esponenziale è un polinomio, dunque possiamo definire
B = ln(I + λ−1 Y )
e quindi
X = λI + Y = λeB
Dato che λ 6= 0 esiste µ tale che λ = eµ , cioè
X = eµ IeB = eµI+B
e dunque A = µI + B è la matrice cercata.
qed
Il calcolo delle matrici esponenziali è fondamentale nella teoria delle equazioni
differenziali ordinarie: infatti un sistema di equazioni differenziali ordinarie può
scriversi come:
.
y = Ay + b
ove y è una funzione vettoriale e A una matrice. Allora la soluzione del sistema
.
omogeneo associato y = Ay si ottiene per y(t) = etA y0 ove y0 rappresenta il
vettore che contiene i dati iniziali. Infatti
dy(t)
d
= etA y0 = AetA y0 = Ay(t)
dt
dt
Sappiamo che la mappa
t 7−→ etA
è un gruppo ad un parametro, e sappiamo che tutti i gruppi ad un parametro sono
di questo tipo (teorema di Stone 14.3.6) nel caso di matrici simmetriche (AT =
583
15.4. Coordinate canoniche sui gruppi classici
A). Possiamo comunque utilizzare le proprietà dell’esponenziale in dimensione
finita3 per dimostrare il teorema di Stone in questo caso:
15.3.11 Teorema Se ρ : R −→ GLn (R) è un gruppo ad un parametro, esiste
un’unica matrice A tale che per ogni t ∈ R ρ(t) = etA .
Dimostrazione: Consideriamo un intorno V di 0 in Mn (R) ed un intorno U di I
in GLn (R) in modo che la mappa esponenziale ristretta a V sia un diffeomorfismo
fra V ed U . Definiamo poi:
ψ(t) := ln(ρ(t))
per quei t ∈ R tali che ρ(t) ∈ U (l’insieme di questi t starà in un intorno T dello
zero in R). Allora, se t ∈ T e s ∈ T sono tali che ρ(t + s) ∈ U si ha
ψ(t + s) = ln(ρ(t + s)) = ln(ρ(t)ρ(s)) = ln(ρ(t)) + ln(ρ(s)) = ψ(t) + ψ(s)
Dunque ψ è una funzione lineare in t e quindi è della forma
ψ(t) = tA
per una determinata matrice A, sicché
eψ(t) = ρ(t) = etA
per ogni t ∈ T .
Per ottenere il risultato per qualsiasi t ∈ R scriviamo un qualsiasi numero
x ∈ R come x = nt ove t ∈ T e n ∈ Z. Allora
ρ(x) = ρ(t)n = (etA )n = exA
qed
15.4
Coordinate canoniche sui gruppi classici
Diamo una prima interessante applicazione dell’esponenziale di matrici, per
determinare su ogni gruppo di matrici delle coordinate come nel caso del teorema
15.3.8.
Osserviamo intanto che i gruppi di matrici posseggono delle “coordinate”
naturali per mezzo delle quali parametrizzare i loro elementi: le entrate delle
3
Anche definendo in modo opportuno il concetto di “differenziabilità” nell’ambito infinitodimensionale, può mostrarsi che la mappa esponenziale non è in quel caso un diffeomorfismo
locale.
584
Capitolo 15. Gruppi classici
matrici stesse: a X associamo le coordinate ((xij )); in altri termini abbiamo delle
funzioni continue
xij : G −→ R
che all’elemento X ∈G associano l’elemento xij (X) che figura nella sua i-sima riga
e j-sima colonna. In generale l’insieme completo delle coordinate {xij } sarà ridondante, poiché esistono delle relazioni che legano queste coordinate, espresse dalle
equazioni che definiscono il gruppo: ad esempio, se il gruppo èPGLn (R) abbiamo
la relazione det X 6= 0; nel caso di O(n) abbiamo le relazioni k xik xjk = δij : se
possiamo estrarre dalle coordinate {xij } un sottoinsieme di funzioni indipendenti
allora otteniamo un sistema di coordinate locali nel senso proprio del termine;
va precisato, ovviamente, il concetto di “indipendenza” di funzioni. In generale
si può adottare la seguente definizione:
15.4.1 Definizione Se X è uno spazio topologico, x0 ∈ X e U ⊂ X è un aperto
di X contenente il punto x0 , un insieme di funzioni {x1 , ..., xn }:
xi : U −→ R
continue si dice sistema di coordinate locali se la mappa x : U −→ Rn :
u 7−→ (x1 (u), ..., xn (u))
è un omeomorfismo di U su un intorno aperto di 0 in Rn . In questo caso, la
coppia (U, x = (x1 , ..., xn )) si dice carta locale o sistema di coordinate locali di
dimensione n.
Le coordinate di un punto u ∈ U sono (x1 (u), ..., xn (u)). Naturalmente, su
un gruppo topologico G, basta avere una carta locale (U, x) intorno all’elemento
neutro e per averne una intorno ad ogni altro g ∈G: se Lg (h) = gh è la traslazione
basti considerare (Lg (U ), x ◦ Lg−1 ).
15.4.2 Esempio
• Se G = Rn abbiamo ovviamente le coordinate vettoriali (x1 , ..., xn ) associate ad una base fissata (e1 , ..., en ). Si noti che G può essere visto come
gruppo di matrici: basta considerare le matrici diagonali in Mn (R) i cui
elementi siano gli esponenziali delle coordinate degli elementi
di Rn : preciP
samente, all’elemento v ∈ Rn tale che xi (v) = vi , i.e. v = i vi ei , associamo
la matrice
evi 0 ... 0
0 ev2 ... 0
..
.. . .
..
.
. .
.
0 0 ... evn
15.4. Coordinate canoniche sui gruppi classici
585
Allora, se A è una tale matrice, ponendo xi (A) = vi otteniamo delle coordinate che realizzano un omeomorfismo di G con Rn : in altri termini (G, x)
stesso è una carta locale. In questo caso il prodotto di elementi di G è tale
che
xi (AB) = xi (A) + xi (b)
• Il gruppo abeliano Tn = S 1 × ... × S 1 si può parametrizzare con degli
angoli (t1 , ..., tn ), dato che i suoi elementi sono prodotti di numeri complessi
della forma eitk = cos tk + i sin tk : ovviamente questa parametrizzazione è
omeomorfa solo localmente,
intorni di un punto (in Rn ) di raggio minore
P
Q per
i k tk
i(2π+tk )
di 2π, dato che e
. Consideriamo comunque n gruppi ad
= ke
un parametro
γ1 : R −→ U (1) ... γn : R −→ U (1)
cioè curve continue tali che γk (t + s) = γk (t)γk (s); sappiamo (teorema di
cn = Rn ) che tali gruppi sono della forma
Stone 14.3.6 oppure il fatto che R
γk (t) = eak t
Quindi il prodotto del gruppo Tn determina ed è determinato dalla somma
di vettori (a1 , ..., an ) in Rn . Osserviamo che in questo caso non abbiamo
delle coordinate globali, cioè l’aperto U nel quale sono definite non può
coincidere con tutto G (questo caso si ha ovviamente solo se G è omeomorfo
a Rn ).
Vogliamo estendere la costruzione dell’ultimo esempio al caso di gruppi qualsiasi: in questo caso la non commutatività del gruppo rende insufficiente la sola
somma in Rn nel descrivere il prodotto del gruppo: possiamo comunque utilizzare
2
la topologia che i gruppi di matrici ereditano da Mn (Rn ) = Rn .
Consideriamo quindi l’algebra delle matrici Mn (R): sappiamo che rispetto ad
ogni norma è uno spazio di Banach: in particolare, rispetto alla norma
||A|| := n max |aij |
i,j
è un’algebra di Banach: in particolare possiamo considerare in Mn (R) la convergenza delle serie. Rammentiamo il lemma 9.1.9 che possiamo formulare come
15.4.3 Lemma Se X ∈ Mn (R) e ||X|| < 1, allora la matrice A = I + X è
invertibile, cioè appartiene a GLn (R).
Cioè le matrici A che verificano la condizione
||A − I|| < 1
586
Capitolo 15. Gruppi classici
per il lemma formano un intorno U della matrice I in GLn (R). A questo punto,
per avere un intorno di una qualsiasi altra matrice B ∈ GLn (R) basta considerare
B ·U che è un intorno di B in quanto la moltiplicazione di matrici è C ∞ . In questo
modo abbiamo le coordinate locali sul gruppo: scriviamole in concreto. Sia B la
matrice intorno alla quale vogliamo le coordinate. Allora, se C = B −1 = ((cij ))
si pone:
(
P
xij (A) = nk=1 cik akj − δij
xij (B) = 0
Le coordinate {xij } sono valide per ogni matrice A tale che
||A − B|| < ||B||
Abbiamo quindi determinato per il gruppo GLn (R) delle coordinate del tutto
simili a quelle di Rn , in un suo intorno U di I:
x1 , ..., xn2 : U −→ R
date dalle entrate delle matrici ln A al variare di A ∈ U : (U, ln) risulta quindi una
carta locale di dimensione n2 per il gruppo GLn (R).
Vogliamo ora trovare delle carte locali per i gruppi classici: basta, per questo,
determinare degli intorni di I in essi diffeomorfi, per tramite del logaritmo di
matrici, a degli intorni di 0 in qualche sottospazio di Mn (R): dobbiamo cioè determinare dei sottospazi vettoriali di Mn (R) le cui coordinate parametrizzeranno
i punti dei gruppi classici.
Fissiamo intanto l’intorno U di I in GLn (R) tale che ln sia un diffeomorfismo
di U su un intorno V dello zero in Mn (R).
15.4.4 Teorema Se U 0 = U ∩ SLn (R) allora ln è un diffeomorfismo fra U 0 e un
intorno dello zero nello spazio delle matrici a traccia nulla.
Dimostrazione: Se tr(X) = 0, consideriamo la curva
A(t) = etX
che è un gruppo a un parametro (A(t+s) = A(t)A(s)) e quindi, se d(t) := det A(t)
si ha
d(t + s) = d(t)d(s)
sicché la funzione d è un gruppo a un parametro in R, per cui deve esistere una
costante c tale che d(t) = ect . Dimostriamo che c = 0. In effetti è
d(t) = det etX = det(1 + tX + o(t)) = t tr X + o(t)
15.4. Coordinate canoniche sui gruppi classici
587
= 0. Allora l’ipotesi che tr X = 0
ove o(t) è una matrice tale che limt−→0 o(t)
t
implica che
µ ¶
df
c=
dt t=0
il che dimostra la tesi.
qed
Abbiamo quindi determinato una carta locale di SLn (R) data dalle coordinate
dello spazio vettoriale
sln (R) = {A ∈ Mn (R) | tr A = 0}
che ha dimensione n2 − 1.
15.4.5 Teorema Se U 00 = U ∩ O(n) (rispettivamente U 00 = U ∩ U (n), U 00 =
U ∩Sp(n)) allora ln è un diffeomorfismo fra U 00 e un intorno dello zero nello spazio delle matrici antisimmetriche (rispettivamente antihermitiane, antihermitiane quaternioniche). Per i gruppi speciali SO(n), SU (n) vale lo stesso enunciato
rispetto alle matrici antisimmetriche speciali e antihermitiane speciali.
Dimostrazione: Dimostriamolo solo nel caso di O(n): negli altri due la dimostrazione è la stessa. Osserviamo che se X è antisimmetrica, i.e. X + X T = 0
allora X e X T commutano, e quindi
(eX )T eX = eX
T +X
= e0 = I
cioè eX ∈ O(n).
qed
Gli spazi delle matrici antisimmetriche, antihermitiane e antihermitiane quaternioniche si denotano con
so(n) ,
su(n) ,
sp(n)
Consideriamo di nuovo l’esempio del gruppo Tn considerato in precedenza: possiamo realizzarlo come toro massimale T n in ciascuno dei gruppi classici compatto
SO(n), SU (n) e Sp(n); allora è ovvio che su T n la mappa esponenziale è suriettiva (ogni suo elemento è un esponenziale di un numero reale) e non iniettiva: in
effetti la mappa esponenziale da Rn in Tn è esattamente la mappa che realizza
il quoziente
Rn −→ Rn /Zn = Tn
Ma ogni elemento di un gruppo classico compatto è coniugato ad un elemento di
un suo toro massimale, quindi
588
Capitolo 15. Gruppi classici
15.4.6 Teorema La mappa esponenziale è suriettiva dallo spazio so(n) delle
matrici antisimmetriche (rispettivamente su(n), sp(n)) nel gruppo SO(n) (rispettivamente SU (n), Sp(n)).
Abbiamo fin qui considerato gruppi di matrici, ed abbiamo mostrato come, nei
nostri esempi, questi gruppi possiedano oltre alla struttura di gruppo topologico,
anche una struttura “localmente euclidea”: infatti abbiamo determinato delle
carte locali su essi, quindi degli omeomorfismi locali con Rn . Abbiamo inoltre
visto il legame esistente fra le coordinate e il prodotto nel gruppo, per tramite
della mappa esponenziale.
In generale, se G è un gruppo di matrici che possiede per ogni suo punto delle
coordinate (basta che le possieda intorno all’I) le sue coordinate canoniche sono
le coordinate (x1 , ..., xm ) definite come segue: consideriamo la mappa esponenziale ed un intorno U di I diffeomorfo tramite essa ad un intorno V di 0 in un
sottospazio g (di dimensione m) dello spazio delle matrici Mn (R). Se (e1 , ..., em )
è una base dello spazio vettoriale g, possiamo scrivere, per ogni A ∈ g:
A=
m
X
ak ek
k=1
Se g ∈ U , ln g ∈ V e scriviamo
ln g =
m
X
xk (g)ek
k=1
In questo modo determiniamo delle coordinate xi su G che si dicono canoniche.
Viceversa, se consideriamo un elemento A ∈ g qualsiasi, esisterà certo un t > 0
tale che tA ∈ V . Quindi etA ∈ U ⊂ G. Se A, B ∈ g, possiamo moltiplicare etA e
etB rispetto al prodotto in G: dato che il prodotto è continuo, possiamo scrivere
etA etB = etC
Naturalmente C dipende da A e B, e riuscendo ad esprimerlo in termini di A e
B otterremmo un legame completo fra le coordinate ed il prodotto: per il calcolo
effettivo di C per mezzo della serie di Campbell–Hausdorff, si rimanda a [26],
[27] o [22]. Limitiamoci qui a dare delle approssimazioni per questo elemento C.
15.4.7 Proposizione Se A, B ∈ Mn (R) allora
³ 1 1 ´n
eA+B = lim e n A e n B
n−→∞
³ 1 1
´n2
1
1
e[A,B] = lim e n A e n B e− n A e− n B
n−→∞
(1)
(2)
589
15.5. Varietà differenziabili
Dimostrazione: Utilizziamo l’identità di Weyl 15.3.6 e il suo corollario. Notiamo infatti che, per ogni A, B:
1
1 1
1
1 1
lim [ A, [ A, B]] = lim [ B, [ A, B]] = 0
n−→∞ n
n−→∞ n
n n
n n
e dunque le ipotesi per applicare queste formule sono verificate al limite per
n −→ ∞. Quindi:
³ 1 A B A B ´n
³ A B ´n
³ A B ´n
−2[ n , n ] n n
A+B
+n
n
= lim e
= lim e n e n
e
= lim e
e e
n−→∞
n−→∞
n−→∞
dato che − 2n1 2 [A, B] è infinitesimo di ordine superiore rispetto a An e Bn ), il che
prova la (1). Per la (2) si noti che, per il corollario all’identità di Weyl:
[A,B]
e
³
= lim
n−→∞
[A
,B]
n n
´n2
e
³
= lim
n−→∞
A
n
B
n
−A
−B
n
n
e e e
´n2
e
cioè la (2).
qed
Usando questa proposizione possiamo scrivere
1 2
[A,B]+O(t3 )
etA etB = etA+tB+ 2 t
ed ottenere cosı̀ una approssimazione al secondo ordine per la funzione C.
15.5
Varietà differenziabili
La presenza di carte locali intorno ad ogni punto di uno spazio topologico
rende quest’ultimo un oggetto geometrico sul quale è possibile sviluppare il calcolo differenziale: non ci addentreremo in questi sviluppi, ma diamo, motivati
dagli esempi dei gruppi classici, una fondamentale
15.5.1 Definizione Una varietà differenziabile è uno spazio topologico tale che
ogni suo punto possieda una carta locale (U, x) di dimensione n (cioè un omeomorfismo x di U su un aperto di Rn ) in modo che, se (U, x) e (V, y) sono carte
locali e U ∩ V 6= ∅ allora la funzione definita da un aperto di Rn ed a valori in
Rn
y ◦ x−1 : x(U ∩ V ) −→ y(U ∩ V )
è infinitamente differenziabile (condizione di compatibilità per carte locali).
In altri termini una varietà differenziabile non solo è localmente omeomorfa
a Rn , ma i “cambiamenti di coordinate” fra una carta e l’altra sono effettuati da
funzioni differenziabili.
590
Capitolo 15. Gruppi classici
Il numero n si dice dimensione della varietà. Ovviamente l’insieme degli intorni U dati dalle carte locali è un ricoprimento della varietà: quindi se la varietà,
come spazio topologico, è compatta, possiamo considerare sempre un insieme
finito di carte su essa.
Gli esempi di varietà pervadono la Matematica moderna e non possiamo dare
qui nemmeno i rudimenti della teoria: ci limitiamo a citare i più ovvi. Intanto
Rn con le coordinate vettoriali è una varietà differenziabile4 , come pure lo sono
Cn e Hn .
15.5.2 Esempio
• Ovviamente Rn rispetto alla singola carta data dalla mappa identica Rn −→
Rn è una varietà differenziabile.
• Un aperto U di una varietà differenziabile V è ancora una varietà differenziabile rispetto alla carta identica U −→ U . Ad esempio, dato che Mn (R) è
2
omeomorfo a Rn è una varietà per l’esempio (1), come pure è una varietà
GLn (R) che è l’aperto {det(A) 6= 0} in Mn (R).
• Un modo diretto di notare che GLn (R) è una varietà è rammentare il teorema 15.3.8: esiste un intorno dell’origine nello spazio vettoriale Mn tale che,
ristretta a questo intorno, e è un diffeomorfismo su un intorno dell’identità
di GLn (R). Quindi il suo inverso costituisce una carta intorno all’identità
della varietà GLn (R), e questo introduce delle coordinate privilegiate su
GLn (R) che si dicono canoniche.
• I teoremi 15.4.4 e 15.4.5 ci dicono che SLn (R), O(n), U (n), Sp(n), SO(n)
e SU (n) sono varietà differenziabili: infatti queste proposizioni forniscono
delle carte locali intorno agli elementi neutri di questi gruppi, e, per moltiplicazione, queste carte danno luogo a carte locali intorno ad ogni elemento
del gruppo.
Diamo ora due classi di esempi non banali di varietà (che contengono i casi
U (1) = S 1 , SU (2) = S 3 e SO(3) = RP3 ):
15.5.3 Esempio Le sfere
S n = {(x0 , x1 , ..., xn ) | x20 + x21 + · · · + x2n = 1} ⊂ Rn+1
sono varietà differenziabili. Consideriamo il punto N = (1, 0, ..., 0) (il “polo
nord”); se P = (p0 , p1 , ..., pn ) ∈ S n è un qualsiasi altro punto allora possiamo
4
Notiamo che uno spazio vettoriale di dimensione infinita non è una varietà secondo la
nostra definizione.
591
15.5. Varietà differenziabili
considerare la retta per P e N , le cui equazioni cartesiane sono
x0 − 1
xn
x1
= ··· =
=
p0 − 1
p1
pn
Questa retta interseca il piano x0 = 0 nel punto f (P ) di coordinate
f (P ) = (0,
p1
p2
pn
,
, ...,
)
1 − p0 1 − p0
1 − p0
(proiezione stereografica di P ). Questa funzione f : S n \ {N } −→ {x0 = 0}
risulta essere un omeomorfismo dall’aperto S n \ {N } ⊂ S n allo spazio cartesiano
(n − 1)-dimensionale {x0 = 0} = {(0, x1 , ..., xn )} ∼
= ∈Rn−1 .
n
In modo analogo, se togliamo a S il “polo nord” S = (−1, 0, ..., 0), possiamo
costruire un altro omeomorfismo g : S n \ {S} −→ {x0 = 0}:
g(P ) = (0,
p1
p2
pn
,
, ...,
)
1 + p0 1 + p0
1 + p0
Sull’intersezione S n \ {N, S} entrambe le funzioni f e g sono definite e sono
omeomorfismi sull’aperto {x0 = 0} \ {(0, 0, ..., 0)}; calcoliamo allora
g ◦ f −1 (0, t1 , ..., tn ) = g(p0 , p1 , ..., pn )
dove (p0 , p1 , ..., pn ) si ottiene intersecando la retta per N e (0, t1 , ..., tn ) con la
sfera S n :
p1
p1
1 − p0 =
= ··· =
,
p20 + p21 + · · · + p2n = 1
t1
t1
Se poniamo α := p21 + · · · + p2n troviamo allora
p20 (1 + α) − 2p0 α + (α − 1) = 0
quindi (la soluzione p0 = 0 viene ovviamente scartata):
p0 =
2t1
2tn
α−1
, p1 =
, ... , pn =
α+1
1+α
1+α
Quindi la funzione g ◦ f −1 vale su un punto di {x0 = 0} \ {(0, 0)}:
α − 1 2t1
2tn
,
, ...,
)
α+1 1+α
1+α
t1
tn
= (0, , ..., )
α
α
g ◦ f −1 (0, t1 , ..., tn ) = g(
ed è dunque un omeomorfismo infinitamente differenziabile.
592
Capitolo 15. Gruppi classici
15.5.4 Esempio Lo spazio proiettivo RPn è una varietà differenziabile: rammentiamo che si tratta dell’insieme delle rette per l’origine di Rn+1 . Possiamo rappresentare un punto p∈RPn con le sue coordinate omogenee p = [p0 : p1 : · · · : pn ]
dove non tutti i numeri reali p0 , p1 , ..., pn sono nulli.
Definiamo per ogni i = 0, ..., n gli aperti
Un = {p ∈ RPn | pi 6= 0}
e le funzioni fi : Ui −→ Rn definite come
fi (p) = (
p0
pi−1 pi+1
pn
, ...,
,
, ..., )
pi
pi
pi
pi
È ovvio che si tratta di carte locali: dimostriamo che su Ui ∩ Uj vale la condizione
di compatibilità, precisamente calcoliamo
fi ◦ fj−1 (p1 , ..., pn )
dove (p1 , ..., pn ) ∈ fj (Ui ∩ Uj ): quest’ultimo è l’insieme dei punti (x1 , ..., xn ) ∈ Rn
tali che xj 6= 0. Allora
fi ◦ fj−1 (p) = fi ([p1 : · · · : pj−1 : 1 : pj+1 : · · · : pn ])
p
p
p
p
p
p
( 1 , ..., i−1 , i+1 , ..., j−1 , j+1 ..., n )
pi
pi
pi
pi
pi
pi
=
p
p
p
p
p
p
( 1 , ..., j−1 , j+1 , ..., i−1 , i+1 ..., n )
pi
pi
pi
pi
pi
pi
se i < j
se i ≥ j
e quindi fi ◦ fj−1 è un omeomorfismo differenziabile.
Dato che le coordinate locali sono omeomorfismi locali con Rn , le proprietà locali
di Rn sono godute anche dalle varietà differenziabili:
15.5.5 Teorema Una varietà differenziabile è localmente compatta, localmente
connessa e localmente semplicemente connessa. In particolare ammette compattificazione di Alexandroff e, se è connessa, un unico rivestimento universale.
Non è invece detto che una varietà sia paracompatta: è comunque una condizione molto naturale e utile da imporre, dato che implica l’esistenza di partizioni dell’unità (cfr. teorema 2.3.5) differenziabili, per mezzo delle quali molte costruzioni fondamentali non potrebbero effettuarsi (ad esempio i tensori
metrici).
Per una varietà, la paracompattezza equivale a proprietà topologiche molto
importanti.
593
15.5. Varietà differenziabili
15.5.6 Teorema Se M è una varietà differenziabile di Hausdorff allora le seguenti proposizioni sono equivalenti:
• M è paracompatta.
• M è σ-compatta (è unione di una famiglia numerabile di compatti).
• M è di Lindelöf (ogni ricoprimento aperto possiede un sottoricoprimento
numerabile).
• Esiste una funzione propria continua ϕ : M −→ (0, ∞).
• M è a base numerabile.
Dimostrazione: L’equivalenza delle (1)–(4) segue dall’essere M localmente
compatta di Hausdorff e dal lemma 2.3.8. D’altronde ogni spazio topologico a
base numerabile è di Lindelöf, quindi non resta che dimostrare il viceversa. Dato
che M è una varietà possiede un ricoprimento di carte locali, dal quale se ne può
estrarre uno numerabile: ma ogni elemento di questo ricoprimento numerabile è
un intorno U omeomorfo a un intorno di Rn , quindi possiede una base numerabile. L’unione numerabile dell’unione numerabile degli elementi di questa base è
la base numerabile di M cercata.
qed
15.5.7 Esempio Consideriamo la varietà di Calabi–Rosenlicht: si tratta dell’insieme
[
X = {x = 0} ∪ {z = 0} ∪
Ua ove Ua = {(x, y, z) ∈ R3 | x 6= 0 oppure y = a}
a∈R
(unione dei piani Oyz, Oxy e del piano Oxy cui sia stata rimossa la retta {x = 0}
ed aggiunta la retta {x = 0, y = a} ⊂ R3 .)
Definiamo le funzioni fa : Ua −→ R2 come
(
(x, y−a
) se x 6= 0
x
fa (x, y, z) =
(0, z)
se x = 0
Si tratta ovviamente di un omeomorfismo su R2 ; verifichiamo ora la condizione
di compatibilità su Ua ∩ Ub :
fa ◦ fb−1 (t, s) = (t, s +
b−a
)
t
che è ovviamente differenziabile.
La varietà cosı̀ costruita è, come spazio topologico, di Hausdorff e connesso,
ma non paracompatto: infatti non soddisfa nessuna delle proprietà del teorema
precedente: ad esempio non è σ-compatta, come si vede facilmente.
594
Capitolo 15. Gruppi classici
Nel teorema precedente abbiamo supposto che M sia di Hausdorff perché
questo non è vero in generale per una varietà: comunque gli esempi di varietà
non di Hausdorff sono poco interessanti.
15.5.8 Esempio Nel piano R2 consideriamo l’insieme (R \ {0})∪{(0, 1), (0, −1)},
ed i suoi sottoinsiemi aperti U = (R \ {0}) ∪ {(0, 1)} e V = (R \ {0}) ∪ {(0, 1)},
con le funzioni f : U −→ R e g : V −→ R definite come
(
(
x se x 6= 0
x se x 6= 0
g(x, y) =
f (x, y) =
0 se x = 0
0 se x = 0
Evidentemente si tratta di due carte locali e, se t ∈ f (U ∩ V ) = R \ {(0, 0)} e
s ∈ g(U ∩ V ) = R \ {(0, 0)} troviamo
g ◦ f −1 (x) = g(x, 0) = x
e
f ◦ g −1 (x) = f (x, 0) = x
quindi la condizione di compatibilità è verificata. Comunque la varietà cosı̀ ottenuta non è di Hausdorff, dato che (0, 1) e (0, −1) non possono essere separati da
nessuna coppia di intorni disgiunti.
La morale della discussione precedente è: supporremo che le nostre varietà
siano di Hausdorff paracompatte.
15.5.9 Definizione Se M e N sono varietà differenziabili di dimensioni m e n,
una funzione f : M −→ N si dice differenziabile se, per ogni carta locale (U, x)
in M e (V, y) in N la funzione
y ◦ f ◦ x−1 : Rm −→ Rn
è differenziabile. L’insieme delle funzioni differenziabili da M in N si denota
C ∞ (M, N ); se N = R si scrive semplicemente C ∞ (M ).
Una funzione differenziabile è in particolare continua. Ad esempio una carta
locale è una funzione differenziabile per definizione.
Rispetto alle funzioni differenziabili le varietà formano ovviamente una categoria, i cui isomorfismi si dicono diffeomorfismi (sono cioè le funzioni biunivoche
differenziabili con inversa differenziabile).
Osserviamo che due varietà possono essere omeomorfe ma non diffeomorfe:
cioè possono esistere strutture distinte di varietà differenziabile sul medesimo
spazio topologico5 .
5
Un famoso risultato di J. Milnor mostra l’esistenza di strutture differenziabili “alternative”
sulla sfera S 7 : risultati più recenti e spettacolari mostrano l’esistenza di strutture differenziabili
“esotiche” sullo spazio R4 , cfr Donaldson–Kronheimer The Geometry of 4-manifolds, Oxford.
Capitolo 16
GRUPPI E ALGEBRE DI LIE
I gruppi di matrici, ai quali abbiamo dedicato spazio perché si tratta dei
gruppi che governano la fisica delle particelle, sono gli esempi classici dei gruppi
di Lie: questi ultimi vengono di solito definiti in Geometria Differenziale come
importanti esempi di varietà differenziabili (cfr. ad esempio [17]). Qui vogliamo
invece introdurli come una notevole classe di esempi di gruppi topologici. In
particolare non useremo il concetto di fibrato tangente, ma la trattazione delle
algebre di Lie associate ai gruppi sarà data in uno spirito più algebrico, anziché
nel modo usuale: questo, crediamo, renderà interessante la trattazione anche a
chi già conosce queste nozioni per via geometrica.
16.1
Gruppi di Lie
Abbiamo visto come GLn (R) sia una varietà in quanto è un aperto di una
varietà: anche gli altri gruppi classici sono varietà differenziabili, anzi sono molto
di più:
16.1.1 Definizione Un gruppo topologico G si dice gruppo di Lie se ammette
una struttura di varietà differenziabile in modo che il prodotto (g, h) 7−→ gh e
l’inverso g 7−→ g −1 siano funzioni differenziabili.
Si può dimostrare (teorema di Pontriagin) che un gruppo di Lie possiede
sempre coordinate non solo differenziabili, ma anche analitiche: lo assumeremo
sempre nel seguito (per la dimostrazione si può vedere [26]).
Dimostriamo piuttosto che su ogni gruppo di Lie esiste una misura di Haar,
ma prima diamo una
16.1.2 Definizione Se M è una varietà differenziabile e µ una misura di Radon
su X, diciamo che µ è una misura differenziabile se per ogni carta locale (U, x)
595
596
Capitolo 16. Gruppi e algebre di Lie
della varietà esiste una funzione continua (positiva) ϕU : U −→ R tale che, per
ogni insieme misurabile E ⊂ U :
Z
µ(E) =
ϕU (x1 , ..., xn )dx1 ...dxn
E
(ove con dx1 ...dxn indichiamo la misura di Lebesgue in Rn ) e tale che se U e V
sono carte locali tali che U ∩ V 6= ∅ allora
¯ ¯
¯ ∂y ¯
ϕV (y) = ¯¯ ¯¯ ϕU (x)
∂x
ove abbiamo indicato lo Jacobiano in U ∩ V con
¯ ¯
µµ
¶¶
¯ ∂y ¯
∂y
i
¯ ¯ = det
¯ ∂x ¯
∂xj
La scelta di una tale funzione ϕu per ogni carta locale spesso si dice forma di
volume sulla varietà differenziabile: le varietà per le quali questa scelta è possibile
si dicono orientabili . I gruppi di Lie rientrano in questa classe1 :
16.1.3 Teorema (Hurwitz) Su un gruppo di Lie esiste un’unica (a meno di
un fattore di scala) misura invariante.
Dimostrazione: Consideriamo un gruppo di Lie G e due carte locali (U, x) e
(V, y) in G tali che g · U ⊂ V per qualche g ∈ G: perché una forma di volume sia
associata ad una misura invariante è necessario che
¯
¯
¯ ∂x(g) ¯
¯ = ϕU (h)
(∗)
ϕV (gh) ¯¯
∂x(h) ¯
Fissiamo ora h ∈ U e moltiplichiamo per un fattore costante in modo da avere
ϕ(h) = 1: allora ogni forma invariante deve essere,
(∗∗)
¯
¯
¯ ∂x(g) ¯−1
¯
ϕV (gh) = ¯¯
∂x(h) ¯
perché la (*) sia vera. Questo dimostra che, se una forma di volume esiste, allora
è unica a meno di un fattore di scala. Ma la (**) può essere usata proprio per
definire una tale forma in gh.
qed
1
In realtà godono di una proprietà ben più forte: sono parallelizzabili, cfr. [17].
597
16.1. Gruppi di Lie
Ovviamente GLn (R) è un gruppo di Lie, dato che prodotto e inverso sono
espressi da funzioni polinomiali e razionali, quindi analitiche. Non è cosı̀ immediato dimostrare che gli altri gruppi classici sono gruppi di Lie: per farlo usiamo
un procedimento generale che coinvolge la trasformata di Cayley.
16.1.4 Definizione Un omomorfismo di gruppi di Lie è una funzione differenziabile fra essi che sia anche un omomorfismo di gruppi. Un isomorfismo di
gruppi di Lie è un isomorfismo di gruppi che sia un diffeomorfismo di varietà
differenziabili.
In particolare un omomorfismo di gruppi è un omomorfismo di gruppi topologici. Possiamo anche definire i sottogruppi di Lie, sebbene possano avere in
generale un comportamento bizzarro.
16.1.5 Esempio Si consideri il gruppo T2 = R2 /Z2 ; se consideriamo il sottogruppo di R2 dato da una retta R passante per l’origine, questo induce sempre sul
quoziente T2 un sottogruppo di Lie: in particolare, se R è una retta che forma un
angolo irrazionale con l’asse delle ascisse, ad esempio, allora il sottogruppo indotto in T2 sarà una curva ergodica, cioè denso in T2 , pur essendo un sottogruppo
di dimensione 1.
Diamo ora una procedura generale per dimostrare che certi gruppi di matrici
sono gruppi di Lie.
16.1.6 Definizione Una matrice A ∈ Mn (R) si dice regolare se det(A + I) 6= 0;
se A è regolare, la matrice
A# := (I − A)(I + A)−1
si dice trasformata di Cayley di A.
L’insieme Rn (R) delle matrici regolari è un aperto denso in Mn (R) e quindi
è una varietà differenziabile.
16.1.7 Lemma La funzione A 7−→ A# è un diffeomorfismo di Rn (R) in sé ed
è involutivo: A## = A.
Dimostrazione: Sia B = A# ; allora
I + B = I + (I − A)(I + A)−1 = ((I + A)(I − A))(I + A)−1 = 2(I − A)−1
e, analogamente
I − B = 2A(I + A)−1
Quindi det(I + B) 6= 0 e
B # = (I − B)(I + B)−1 = A
Che la mappa A 7−→ A# sia differenziabile è ovvio.
qed
598
Capitolo 16. Gruppi e algebre di Lie
16.1.8 Teorema Un gruppo di matrici G tale che le trasformate di Cayley delle
sue matrici regolari sia un aperto in uno spazio vettoriale di matrici M è un
gruppo di Lie.
Dimostrazione: Dato che le trasformate di Cayley di G ∩ Rn (R) formano uno
spazio vettoriale, la mappa A 7−→ A# può vedersi come un sistema di coordinate
locali sull’aperto delle matrici regolari in G (che ovviamente è un intorno di I);
cosı̀ abbiamo un sistema di coordinate intorno ad ogni matrice C ∈ G, considerando l’insieme delle matrici della forma AC con A ∈ G ∩ Rn (R) e la mappa
AC 7−→ A# : per vedere che G è una varietà differenziabile non resta quindi che
verificare che il cambiamento di coordinate fra queste carte è differenziabile. Ma,
se C1 , C2 ∈ G, le carte locali intorno ad essi sono formate dai prodotti A1 C1 e
A2 C2 ; se esiste un punto in comune a questi due intorni allora A1 C1 = A2 C2 e
#
quindi le coordinate sono A#
1 e A2 e sono, per definizione, funzioni razionali nelle
entrate delle matrici A1 e A2 , quindi la loro composizione è certamente differenziabile. Infine, la trasformata di Cayley del prodotto di matrici è una funzione
razionale nelle entrate delle matrici stesse, quindi differenziabile. Ne segue che G
è un gruppo di Lie.
qed
16.1.9 Esempio Se A ∈ O(n) è una matrice ortogonale e B = A# , allora
B T =(I + AT )−1 (I − AT ) = (I + A−1 )−1 (I − A−1 )
=(I + A−1 )−1 A−1 A(I − A−1 ) = (A(I + A−1 ))−1 (A − I)
=(A + I)−1 (A − I) = −(I − A)(I + A)−1 = −B
cioè B + B T = 0, i.e. B ∈ so(n). Viceversa, un conto analogo mostra che, se
B ∈ so(n) allora AT = A−1 i.e. A ∈ O(n). In altri termini le matrici ortogonali
regolari sono esattamente le trasformate di Cayley delle matrici antisimmetriche.
Un ragionamento analogo vale per i gruppi unitario e simplettico (considerando matrici regolari complesse e quaternioniche), cosı̀ come per i loro sottogruppi
speciali. Quindi
16.1.10 Corollario I gruppi di matrici O(n), U (n), Sp(n), SO(n) e SU (n)
sono gruppi di Lie.
Notiamo che gli spazi vettoriali delle coordinate dei gruppi classici compatti
sono algebre di Lie. Ricordiamo che un’algebra di Lie g è uno spazio vettoriale
(su un campo fissato: nel nostro caso R o C) fornito di una mappa bilineare
l : g × g −→ g
599
16.2. Funtore di Lie
che scriviamo [X, Y ] = l(X, Y ) che sia anticommutativo e verifichi l’identità di
Jacobi:
[X, Y ]+[Y, X] = 0
[[X, Y ], Z] + [[Z, X],Y ] + [[Y, Z], X] = 0
16.1.11 Esempio
• L’algebra delle matrici Mn (R) rispetto al commutatore
[A, B] = AB − BA
è un’algebra di Lie.
• In generale, se A è un’algebra associativa (ad esempio un’algebra di Banach), porre [A, B] = AB − BA la rende un’algebra di Lie: ovviamente se A
è pure commutativa, la struttura di Lie che si ottiene è banale (cioè nulla).
L’algebra di Lie degli operatori lineari di uno spazio vettoriale V rispetto al
commutatore [F, G] = F G − GF si denota gl(V ).
Ora è immediato che, se A, B ∈ so(n), allora
[A, B] + [A, B]T =AB − BA − B T AT + AT B T = AB − AT B − BA + BAT
=(A − AT )B − B(A + AT ) = 0
Quindi so(n) è un’algebra di Lie (analogamente lo sono su(n) e sp(n)). Inoltre,
per le identità di Weyl, il prodotto del gruppo SO(n) è legato al commutatore
dell’algebra so(n) dalla formula
eA eB (eA )−1 (eB )−1 = e[A,B]
a meno di termini superiori al secondo.
16.2
Funtore di Lie
Consideriamo una costruzione che permette di definire algebre di Lie a partire
da algebre date qualsiasi (non necessariamente associative): se A è un’algebra
qualsiasi, consideriamo lo spazio End(A) degli operatori lineari di A in sé: si
tratta di un’algebra associativa rispetto alla composizione di endomorfismi. Sia
Der(A) il sottospazio vettoriale degli elementi D ∈ End(A) tali che
D(ab) = D(a)b + aD(b)
Gli elementi di Der(A) si dicono derivazioni dell’algebra A.
600
Capitolo 16. Gruppi e algebre di Lie
16.2.1 Proposizione Der(A) è un’algebra di Lie.
Dimostrazione: Basta definire il commutatore come
[D, D0 ](a) = D(D0 (a)) − D0 D((a))
Allora [D, D0 ] ∈ Der(A):
[D, D0 ](ab) =D(D0 (a)b) + D(aD0 (b)) − D0 (D(a)b) − D0 (aD(b))
=D(D0 (a))b + D0 (a)D(b) + D(a)D0 (b) + aD(D0 (b))−
− D0 (D(a))b − D(a)D0 (b) − D0 (a)D(b) − aD0 (D(b))
=(D(D0 (a)) − D0 (D(a)))b + a(D(D0 (b)) − D0 (D(b)))
=[D, D0 ](a)b + a[D, D0 ](b)
Che [.] definisca una struttura di algebra di Lie si verifica allo stesso modo che
per le parentesi [A, B] = AB − BA su Mn (R).
qed
16.2.2 Esempio Se g è un’algebra di Lie, Der(g) è l’algebra di Lie degli operatori lineari D : g −→ g tali che
D[X, Y ] = [DX, Y ] + [X, DY ]
Se consideriamo quindi la rappresentazione aggiunta di g su se stessa, cioè la
mappa lineare
ad : g −→ End(g)
X −→ (Y −→ adX Y = [X, Y ])
l’identità di Jacobi in g vuol dire che adX è una derivazione per ogni X ∈ g.
16.2.3 Definizione Se g è un’algebra di Lie, una rappresentazione di g è un
omomorfismo di algebre di Lie
ρ : g −→ gl(V )
Un omomorfismo fra le algebre di Lie g e h è un operatore lineare F : g −→ h
tale che
F [X, Y ] = [F X, F Y ]
rispetto ai commutatori di g e h.
601
16.2. Funtore di Lie
Prima di continuare la discussione sulle algebre di Lie, vediamo il motivo per
il quale le abbiamo introdotte.
Se M è una varietà differenziabile, possiamo considerare l’algebra C ∞ (M )
delle funzioni differenziabili da M in R: si tratta di un’algebra rispetto alla
moltiplicazione punto per punto:
(f g)(x) = f (x)g(x)
È quindi un’algebra commutativa e associativa: si tratta una sottoalgebra associativa dell’algebra di Banach C(M ) delle funzioni continue sullo spazio topologico
M a noi ben nota, ma non una sottoalgebra di Banach: sappiamo infatti che lo
spazio C ∞ (M ) è solo uno spazio di Fréchet.
Possiamo comunque considerare le derivazioni dell’algebra C ∞ (M ):
16.2.4 Definizione Un campo di vettori su una varietà differenziabile M è una
derivazione dell’algebra C ∞ (M ): l’insieme di tali campi si denota X(M ).
16.2.5 Esempio Se M = R, e se x è una coordinata su R, allora la mappa
lineare
∂f
f 7−→
∂x
è un campo di vettori (per la regola di Leibniz di derivazione del prodotto di
funzioni). Si noti che X(c) = 0 se c è costante, dato che X(c) = X(1)c + X(c)1
e quindi X(1) = 0, da cui X(c) = 0.
Naturalmente X(M ) è uno spazio vettoriale reale di dimensione infinita: inoltre, per la proposizione precedente, è un’algebra di Lie rispetto al commutatore
di campi [X, Y ](f ) = X(Y (f )) − Y (X(f )).
16.2.6 Teorema I campi vettoriali di Rn sono gli operatori differenziali del
primo ordine, cioè funzionali della forma
X=
X
hi
∂
∂xi
con hi ∈ C ∞ (Rn ).
Dimostrazione: Intanto notiamo che su una varietà differenziabile M , un campo di vettori è un operatore “locale”, cioè, se f ∈ C ∞ (M ) si annulla in un intorno
U di un punto x allora X(f ) è nulla in x: basta considerare una funzione h che
sia 1 in U e zero fuori da V (ad esempio come quella considerata a pag. 242)
X(f )(x) = X(1 − h)(x)f (x) + X(f )(x)(1 − h(x)) = 0
602
Capitolo 16. Gruppi e algebre di Lie
Ora mostriamo che in Rn (e quindi nell’intorno di un punto di una qualsiasi
varietà) i campi di vettori sono esattamente gli operatori lineari differenziali. Se
f ∈ C ∞ (R) e x in un intorno dello zero di Rn :
Z
1
f (x) = f (0) +
0
X
∂
f (tx)dt = f (0) +
xi
∂t
i=1
n
Quindi
(Xf )(0) =
n
X
X(xi )(0)
i=1
sicché, intorno a zero,
X(f ) =
n
X
i=1
hi
Z
0
1
∂f
(tx)dt
∂xi
∂f
(0)
∂xi
∂f
∂xi
con hi (0) = X(xi )(0).
qed
Consideriamo ora un gruppo di Lie G: dato che, in particolare è una varietà
differenziabile, possiede la sua algebra di Lie dei campi di vettori X(G).
16.2.7 Definizione Se X ∈ X(G), diciamo che si tratta di un campo invariante
a sinistra se
∀f ∈ C ∞ (G) ∀g ∈ G X(fg ) = X(f )
ove fg è la funzione (fg )(h) = f (gh).
Dato che, se X e Y sono invarianti a sinistra allora
[X, Y ](fg ) = X(Y (fg )) − Y (X(fg )) = X(Y (f )) − Y (X(f )) = [X, Y ](f )
si ha che
16.2.8 Proposizione Il sottospazio L(G) ⊂ X(G) dei campi di vettori invarianti a sinistra è una sottoalgebra di Lie dell’algebra dei campi di vettori, che si
dice algebra di Lie del gruppo.
Mentre lo spazio X(G) è di dimensione infinita, l’algebra di Lie L(G) ha
dimensione finita pari alla dimensione del gruppo: per vederlo interpretiamone
gli elementi come curve integrali di equazioni differenziali.
Consideriamo cioè X ∈X(M ) su una varietà ed una carta locale (U, x) intorno
ad un punto fissato p ∈ M ; supponiamo che x(p) = 0. Possiamo allora scrivere
un’equazione differenziale
d
(f ◦ c)(t) = X(f )(c(t))
dt
603
16.2. Funtore di Lie
ove f ∈ C ∞ (M ) e c : I −→ M è differenziabile in un intervallo I della retta
reale contenente lo zero. Le soluzioni di questa equazione, tali che c(0) = p si
dicono curve integrali del campo vettoriale X nel punto p. Una curva integrale
massimale è una curva integrale c : I −→ M di X tale che non esistano curve
integrali c0 : I 0 −→ R di X tali che I ⊂ I 0 e c0 |I = c; un campo vettoriale si dice
completo se tutte le sue curve integrali sono massimali (e.g. se M è compatta
ogni campo è completo).
16.2.9 Definizione Un gruppo a un parametro su un gruppo di Lie G è un
omomorfismo di gruppi di Lie c : R −→ G.
In particolare c(0) = e. Si noti che i gruppi ad un parametro che abbiamo considerato fin qui sono gruppi ad un parametro nel senso della definizione
precedente solo se lo spazio di Hilbert sul quale sono definiti è di dimensione
finita.
16.2.10 Teorema I gruppi a un parametro su un gruppo di Lie sono esattamente le curve integrali dei campi invarianti a sinistra.
Dimostrazione: Consideriamo un gruppo a un parametro c; la curva differenziabile
cg (t) = gc(t)
è tale che cg (0) = g per un fissato g ∈ G. Consideriamo una carta (U, x) intorno
a g e definiamo un campo di vettori
µ
¶
d
(Xf )(g) =
(f ◦ cg )
dt
t=0
Si tratta di una derivazione in C ∞ (U ) per la regola di derivazione delle funzioni
composte, e per definizione cg è una sua curva integrale. È un campo invariante
perché
chg (t) = hgc(t) = h(cg (t))
Sia ora X un campo di vettori invariante a sinistra, c una sua curva integrale massimale tale che c(0) = e; dimostriamo che si tratta di un gruppo a un
parametro. Per l’invarianza di X abbiamo che
chg = (cg )h
(nella notazione precedente). Ora: dato che, fissato s, la curva t 7−→ c(t + s) è
integrale per X e in 0 vale h = ce (s) allora ch (t) = ce (t + s) e quindi
c(s + t) = c(t + s) = ce (t + s) = ch (t) = hce (t) = ce (s)ce (t) = c(s)c(t)
604
Capitolo 16. Gruppi e algebre di Lie
Resta solo da far vedere che c è definita in R, dato che a priori una curva integrale
massimale è definita su un intervallo I ⊂ R. Ma anche se I ( R allora, per ogni
t ∈ R esiste n ∈ N tale che t/n ∈ I e quindi se definiamo
c(t) = c(t/n)n
otteniamo un gruppo a un parametro che estende c; se mostriamo che è una
curva integrale per X abbiamo un assurdo, per massimalità di c.
Ed infatti:
X(f )(c(t)) =X(f )(c(t/n)n ) = X(f )(c(t/n)...c(t/n))
d
=X(fc(t/n)n−1 )(c(t/n)) = (fc(t/n)n−1 ◦ c)(t/n)
dt
d
d
= (f (c(t/n)n )) = (f ◦ c)(t)
dt
dt
qed
16.2.11 Corollario Un campo invariante a sinistra su un gruppo di Lie è completo.
Ora consideriamo un sistema di coordinate (U, x) di G intorno all’elemento
neutro e; se X è un campo invariante a sinistra e c una sua curva integrale
massimale, allora c è completamente determinata dai numeri
µ ¶
dci
ai =
dt t=0
ove ci = xi ◦ c : R −→ R; infatti ci (0) = 0 e ci è l’unica soluzione del si.
stema differenziale ci = X(xi ) ◦ c (teorema di esistenza e unicità: le ci sono
differenziabili).
Quindi, localmente, un gruppo a un parametro è determinato dal “vettore
tangente” (a1 , ..., an ) e viceversa: questo significa che
16.2.12 Proposizione Lo spazio vettoriale L(G) è isomorfo a Rdim G .
Inoltre questo mostra che l’algebra di Lie di un gruppo dipende solo dalla
struttura locale del gruppo intorno a e: vogliamo mostrare che L(G) determina
effettivamente il gruppo intorno a e; per vederlo, basta mostrare che se due gruppi
G e U 0 sono localmente isomorfi , cioè se esiste un diffeomorfismo
ϕ : U −→ U 0
fra una carta locale U in G e una carta locale U 0 in G tale che
ϕ(gh) = ϕ(g)ϕ(h)
(per g, h tali che gh∈U e ϕ(g)ϕ(h)∈U 0 ), allora le algebre di Lie L(G) e L(G0 ) sono
isomorfe (che lo siano come spazi vettoriali segue dal fatto che dim G = dim G0 ).
Questo è conseguenza dal
605
16.2. Funtore di Lie
16.2.13 Teorema La mappa L : G 7−→ L(G) che ad un gruppo di Lie associa
la sua algebra è un funtore dalla categoria dei gruppi di Lie alla categoria delle
algebre di Lie.
Dimostrazione: Basta far vedere che se ϕ : G −→ H è un omomorfismo di
gruppi di Lie allora è indotto un omomorfismo L(ϕ) : L(G) −→ L(H) di algebre
di Lie. In effetti, basta porre, se X ∈ L(G) e f ∈ C ∞ (H):
L(ϕ)(X)(f ) = X(f ◦ ϕ)
In effetti, se L(ϕ)(X) è un campo di vettori invariante a sinistra se lo è X, dato
che
(f ◦ ϕ)g (h) = f (ϕ(gh)) = f (ϕ(g)ϕ(h)) = (fϕ(g) ◦ ϕ)(h)
e quindi
L(ϕ)(X)(fϕ(g) ) =X(fϕ(g) ◦ ϕ) = X((f ◦ ϕ)g ) = X(f ◦ ϕ) = L(ϕ)(X)(f )
Mostriamo infine che L(ϕ) è un omomorfismo: per vederlo dimostriamo intanto
che, se X ∈ L(G) allora esiste un unico X 0 ∈ L(H) tale che
(†)
(X 0 f ) ◦ ϕ = X(f ◦ ϕ) = (L(ϕ)X)(f )
Definiamo la funzione X 0 f : G −→ R in e come
(X 0 f )(e) = X(f ◦ ϕ)(e)
e, per ogni h ∈ H (si tenga conto che ϕ(e) = e):
(X 0 f )(h) = (X 0 fh )(e) = X(fh ◦ ϕ)(e)
Allora, per definizione, X 0 è un campo invariante a sinistra e verifica la (†). Ora
mostriamo che
L(ϕ)[X, Y ] = [X 0 , Y 0 ] ◦ ϕ
Infatti
L(ϕ)[X, Y ]f =X(Y (f ◦ ϕ)) − Y (X(f ◦ ϕ)) = X((Y 0 f ) ◦ ϕ) − Y ((X 0 f ) ◦ ϕ)
=(X 0 (Y 0 f )) ◦ ϕ − (Y 0 (X 0 f )) ◦ ϕ = ([X 0 , Y 0 ]f ) ◦ ϕ
Infine mostriamo che ϕ è un omomorfismo di algebre di Lie:
[L(ϕ)X, L(ϕ)Y ]f =L(ϕ)X(L(ϕ)Y (f )) − L(ϕ)Y (L(ϕ)X(f ))
=(L(ϕ)X)((Y 0 f ) ◦ ϕ) − (L(ϕ)Y )((X 0 f ) ◦ ϕ)
=(X 0 (Y 0 f )) ◦ ϕ − (Y 0 (X 0 f )) ◦ ϕ
=([X 0 , Y 0 ]f ) ◦ ϕ = L(ϕ)[X, Y ](f )
qed
606
Capitolo 16. Gruppi e algebre di Lie
Il funtore L si dice funtore di Lie. Abbiamo visto come esista una corrispondenza biunivoca fra gli elementi dell’algebra di Lie L(G) (campi di vettori
invarianti a sinistra) e gruppi a un parametro su G: usiamo questa biiezione per
costruire la mappa esponenziale su un gruppo di Lie qualsiasi. Precisamente,
definiamo
exp : L(G) −→ G
come
exp X = c(1)
ove c : R −→ G è l’unico gruppo a un parametro associato a X.
Notiamo che exp 0 = e.
16.2.14 Teorema exp è un diffeomorfismo locale intorno a 0 ∈ L(G).
Dimostrazione: Fissiamo delle coordinate (U, x) intorno a e∈G e consideriamo
un campo di vettori X invariante ed il corrispondente gruppo ad un parametro
c; possiamo scrivere la mappa esponenziale in coordinate:
x ◦ exp : L(G) −→ Rn
ottenendo una funzione differenziabile fra spazi vettoriali della stessa dimensione:
per mostrare che è un diffeomorfismo intorno a zero basta notare che la sua
matrice jacobiana è invertibile in zero ed usare il teorema della funzione inversa.
Ma gli elementi della jacobiana sono le funzioni ∂(xi ◦ exp)/∂xj e si calcolano in
0 come segue:
¶
µ
X µ ∂xi ◦ exp ¶ .
dxi ◦ c
xj (0) =
= ai
∂x
dt
j
0
0
j
ove (a1 , ..., an ) è il vettore corrispondente a c nell’isomorfismo fra lo spazio dei
gruppi a un parametro e Rn (abbiamo tenuto conto che c(t) = exp tX) che, per
c 6= 0 è diverso da zero.
qed
Nel caso di un gruppo di matrici, la mappa esponenziale è esattamente l’esponenziale di matrici: ogni gruppo a un parametro è infatti della forma t 7−→ etX
ove si identificano gli elementi X dell’algebra di Lie con le matrici corrispondenti
in una fissata base (si tratta di operatori lineari).
Il funtore di Lie permette di realizzare una equivalenza di categorie, come
asserito dal seguente teorema dovuto a E. Cartan:
16.2.15 Teorema Il funtore di Lie è una equivalenza fra la categoria dei gruppi
di Lie connessi e semplicemente connessi e la categoria delle algebre di Lie.
607
16.2. Funtore di Lie
Questo vuol dire che ogni algebra di Lie (di dimensione finita) è l’algebra
di Lie di un gruppo di Lie, e che esiste un solo gruppo connesso e semplicemente connesso per cui questo è vero; per la dimostrazione si rimanda ai testi
specialistici, come [26] o [27].
L’idea consiste nei seguenti passi: si fa vedere che ogni algebra di Lie g è un’algebra di Lie di matrici (teorema di Ado, cfr. 16.3.18), si dimostra poi l’esistenza
di intorni aperti in g tali che la serie di Campbell–Hausdorff che determina C
nell’equazione eA eB = eC converga e si dimostra che la struttura di gruppo cosı̀
trovata si può “globalizzare” ad una struttura di gruppo di Lie.
Facciamo qualche esempio: consideriamo un gruppo di Lie di matrici G per
il quale le trasformate di Cayley dei suoi elementi regolari sono un aperto in uno
spazio vettoriale V .
16.2.16 Teorema Lo spazio V è l’algebra di Lie L(G).
Dimostrazione: Consideriamo X ∈ L(G) e quindi il corrispondente gruppo a
un parametro t 7−→ etX (siamo in un gruppo di matrici); ma per ipotesi lo spazio
delle matrici regolari in G forma un intorno dell’I e quindi esiste t tale che
(etX )# = (I − etX )(I + etX )−1 ∈ G# = V
Ma V è uno spazio vettoriale, quindi la derivata rispetto a t di etX calcolata in
zero appartiene ancora a V e
d tX #
d
(e ) = −XetX (I + etX )−1 + (I − etX ) ((I + etX )−1 )
dt
dt
e quindi
µ
d tX #
(e )
dt
¶
0
1
=− X
2
i.e. X ∈ V . Quindi L(G) ⊂ V : ma si tratta di spazi vettoriali della medesima
dimensione, quindi L(G) = V .
qed
Ad esempio:
L(O(n)) = L(SO(n)) = so(n) ,
L(SU (n)) = su(n) ,
L(Sp(n)) = sp(n)
Il commutatore dell’algebra di Lie di un gruppo di matrici è esattamente il
commutatore di matrici.
Dimostriamo ora due risultati fondamentali sul rapporto fra gruppi e algebre
di Lie.
608
Capitolo 16. Gruppi e algebre di Lie
16.2.17 Lemma Se H è un sottogruppo chiuso di un gruppo di Lie allora
V = {X ∈ L(G) | ∀t ∈ R exp tX ∈ H}
è un sottospazio vettoriale di L(G).
Dimostrazione: Notiamo intanto che, se {Zn } è una successione di elementi
non nulli in L(G) tale che per ogni n: exp Zn ∈ H allora
(∗)
lim Zn = 0 e
n−→∞
Zn
=Z ⇒Z ∈V
n−→∞ ||Zn ||
lim
(ove ||.|| è una norma qualsiasi sullo spazio di dimensione finita V ). Infatti, dato
che ||Zn || −→ 0 (e ||Zn || 6= 0) deve esistere una successione di numeri interi {kn }
tale che
lim kn ||Zn || = t
n−→∞
e quindi
exp tZ = lim exp(kn Zn ) = lim (exp Zn )kn
n−→∞
n−→∞
ove (exp Zn ) ∈ H e, dato che H è chiuso, exp tZ ∈ H, i.e. Z ∈ V .
Ora si osservi che, scrivendo in coordinate locali lo sviluppo di Taylor, abbiamo, su un intorno di e diffeomorfo tramite exp a un intorno di L(G):
kn
(∗∗)
exp−1 (exp X · exp Y ) = X + Y + O(||X|| + ||Y ||)
Dimostriamo ora che v è un sottospazio vettoriale di L(G): ovviamente se X ∈ V
e t ∈ R allora tX ∈ V , mentre se X, Y ∈ V sono tali che X + U 6= 0, allora per
Z = (X + Y )/||X + Y || e
1
1
X · exp Y )
n
n
la (*) è soddisfatta (in virtù della (**)). Quindi X + Y ∈ V e V è un sottospazio
vettoriale.
qed
Zn = exp−1 (exp
16.2.18 Teorema Se H è un sottogruppo topologico chiuso di un gruppo di Lie
G allora H è un gruppo di Lie e la sua algebra di Lie è formata dagli elementi
di L(G) i cui esponenziali appartengono a H.
Dimostrazione: Scegliamo un sistema di coordinate (U, x) intorno a e ∈ G (e
quindi, traslando, intorno a ogni suo punto) tale che la mappa esponenziale sia in
U un diffeomorfismo; preso V come nel lemma, possiamo definire delle coordinate
su H semplicemente considerando exp−1 U ∩ V in L(G) ed usando ivi la mappa
esponenziale per definire delle coordinate che, per il lemma, sono coordinate su
H.
qed
609
16.2. Funtore di Lie
Ad esempio ogni sottogruppo chiuso di GLn (R) è un gruppo di Lie: questo è
un metodo che va bene per SLn (R) e tutti gli altri gruppi classici.
Dimostriamo ora che un gruppo topologico può sostenere al più una struttura
di gruppo di Lie.
16.2.19 Lemma Se c : R −→ G è un omomorfismo continuo allora è differenziabile, cioè un gruppo a un parametro.
Dimostrazione: Scegliamo al solito un intorno U di e ∈ G sul quale exp sia un
diffeomorfismo: possiamo, al più restringendo questo intorno, supporre che per
ogni g ∈ U esista h ∈ U tale che h2 = g. Allora se ε > 0 è tale che c([−ε, ε]) ⊂ U ,
e se c(ε) = exp X, allora
µ
¶2
³ ε ´2
1
c
= c(ε) = exp X = exp X
2
2
Iterando: c(ε/2k ) = exp X/2k e quindi c(qε) = exp qX per ogni q ∈ Q della forma
n/2n ∈ [−1, 1]: ma questi razionali sono densi in [−1, 1] e, per continuità di c
troviamo allora
∀t ∈ [−1, 1] c(tε) = exp tX
e quindi per ogni t ∈ R. In particolare c è differenziabile.
qed
16.2.20 Teorema Se f : G −→ G0 è un omomorfismo di gruppi topologici fra i
gruppi di Lie G e G0 allora è differenziabile.
Dimostrazione: Basta mostrare che lo è in un intorno di e ∈ G: fissiamo quindi
una carta locale (U, x) intorno a e ∈ G0 e definiamo
fi (t) = f (exp tEi )
per una fissata base (E1 , ..., En ) di L(G). Abbiamo cosı̀ degli omomorfismi continui fi : R −→ G, e, per il lemma, sono differenziabili ed esistono Ei0 ∈ L(G0 ) tali
che
fi (t) = exp tEi0
Ora consideriamo due mappe differenziabili
h : Rn −→ G
e
h0 : Rn −→ G0
h(t1 , ..., tn ) = exp t1 E1 · · · exp tn En
e
h0 (t1 , ..., tn ) = exp t1 E10 · · · exp tn En0
definite come
610
Capitolo 16. Gruppi e algebre di Lie
Si tratta, intorno alle e ∈ G, G0 di diffeomorfismi; ora usiamo l’ipotesi che f sia
un omomorfismo di gruppi:
f (h(t1 , ..., tn )) = f (t1 ) · · · f (tn ) = exp t1 E10 · · · exp tn En0 = h0 (t1 , ..., tn )
Cioè intorno a e abbiamo espresso f come h0 ◦ h−1 composizione di mappe
differenziabili. Quindi f è differenziabile.
qed
16.2.21 Corollario Su un gruppo topologico esiste al più una struttura di gruppo
di Lie.
Dimostrazione: Se G è un gruppo topologico che possiede due strutture distinte di gruppo di Lie (per la medesima topologia fissata), indichiamo i gruppi
di Lie corrispondenti con G0 e G00 (come gruppi topologico sono esattamente G).
L’identità id : G0 −→ G00 è ovviamente una mappa continua fra questi gruppi
di Lie, quindi è differenziabile: anche l’inverso dell’identità lo è e quindi G0 e
G00 sono isomorfi come gruppi di Lie per mezzo dell’identità: sono cioè lo stesso
gruppo di Lie.
qed
Sorge spontanea la domanda se un gruppo topologico possegga sempre una
struttura di gruppo di Lie: si tratta di un arduo problema (il quinto nella famosa
lista di Hilbert) risolto da von Neumann, Pontriagin, Montgomery, Zippin, Gleason e Yamabe. Citiamo i loro risultati: osserviamo intanto che un gruppo di Lie,
essendo una varietà differenziabile, deve essere localmente compatto e localmente
connesso. Un’altra condizione necessaria è che non abbia sottogruppi piccoli, nel
senso della
16.2.22 Definizione Un gruppo topologico G non possiede sottogruppi piccoli
se esiste un intorno U di e ∈ G che non contiene sottogruppi di G a parte {e}.
16.2.23 Lemma Un gruppo di Lie non contiene sottogruppi piccoli.
Dimostrazione: Consideriamo un intorno U di e ∈ G nel quale exp sia un
diffeomorfismo e tale che V = exp−1 (U ) sia convesso in L(G). Anche U 0 = exp 12 V
è un intorno di questo tipo: se per assurdo G possiede un sottogruppo H (6= {e})
e tale che H ⊂ U 0 , sia h 6= e un suo elemento; allora esiste X ∈ 12 V tale che
exp X = h, e, dato che V è limitato e convesso, esiste k ∈N tale che 2k X ∈V \ 12 V .
Quindi
r
h2 = exp 2r X ∈ exp V \ U 0
(dato che exp è iniettiva in V ) il che vuol dire che H non è un sottogruppo.
qed
Queste condizioni sono anche sufficienti:
611
16.2. Funtore di Lie
Teorema (Gleason–Yamabe). Un gruppo topologico di Hausdorff è un gruppo
di Lie se e solo se è localmente compatto e non possiede sottogruppi piccoli.
Teorema (Montgomery–Zippin). Un gruppo topologico di Hausdorff è un
gruppo di Lie se e solo se è localmente omeomorfo ad uno spazio Rn fissato.
Per questi risultati si veda ad esempio [19].
Limitiamoci qui al caso compatto.
16.2.24 Teorema Se G è un gruppo topologico compatto allora le seguenti proposizioni sono equivalenti.
• G non ha sottogruppi piccoli.
• G è un sottogruppo chiuso di O(n) per qualche n > 0.
• G è un gruppo di Lie.
Dimostrazione: (1) implica (2): ci basta trovare una rappresentazione fedele
di G, cioè ρ : G −→ GL(V ) con ker ρ = {e}; infatti, dato che il gruppo è
compatto, tale rappresentazione è completamente riducibile e quindi, se π è una
sua qualsiasi sottorappresentazione irriducibile, questa ha dimensione finita ed è
unitaria, i.e. π(G) ⊂ O(n) per qualche n (cfr. §2 cap. precedente). Per l’ipotesi
(1), esiste un intorno U di e ∈ G che non contiene sottogruppi di G; se ρ è una
qualsiasi rappresentazione di G, ker ρ è un sottogruppo normale chiuso di G e si
ha
\
ker ρ = {e}
ρ
al variare di ρ nell’insieme delle rappresentazioni di G; se F = G \ U si ha quindi
\
(ker ρ ∩ F ) = ∅
ρ
Ma F è un chiuso nel compatto G, quindi è compatto, cioè possiede la proprietà
dell’intersezione finita: esistono ρ1 , ..., ρn rappresentazioni di G tali che
(ker ρ1 ∩ F ) ∩ ... ∩ (ker ρn ∩ F ) = ∅
T
T
i.e. i ker ρi ⊂ U e quindi, per ipotesi (1), i ker ρi = {e}. La somma diretta
ρ1 ⊕ ... ⊕ ρn è quindi una rappresentazione fedele di G.
(2) implica (3) perché un sottogruppo chiuso di un gruppo di Lie è un gruppo
di Lie.
(3) implica (1) per il lemma.
qed
612
Capitolo 16. Gruppi e algebre di Lie
16.3
Algebre di Lie, rappresentazioni e coomologia
Consideriamo un’algebra di Lie g su un campo K (che sarà R o C) ed una
sua rappresentazione
ρ : g −→ gl(V )
di dimensione finita. Conveniamo di scrivere l’azione di g su V come una moltiplicazione, i.e. di scrivere Xv ∈ V in luogo di ρ(X)(v), se X ∈ g e v ∈ V : allora
l’essere V una rappresentazione di g si esprime come
[X, Y ]v = X(Y v) − Y (Xv)
per ogni X, Y ∈ g e v ∈ V .
16.3.1 Definizione Una cocatena m-dimensionale sull’algebra g a coefficienti
nella rappresentazione V è una funzione
c : gm −→ V
multilineare antisimmetrica.
In altri termini possiamo supporre
c : g ∧ ... ∧ g −→ V
Per convenzione una cocatena di dimensione zero è una costante in V . Una
cocatena di dimensione uno è semplicemente una mappa lineare
c : g −→ V
Ovviamente l’insieme C m (g, V ) delle m-cocatene su g a coefficienti in V è uno
spazio vettoriale di dimensione finita (se lo sono V e g). Possiamo inoltre definire2
una mappa di cobordo
δ : C m (g, V ) −→ C m+1 (g, V )
come
(δc)(X0 , X1 , ..., Xm ) =
n
X
ci , ..., Xn )+
(−1)i Xi · c(X1 , ..., X
i=0
0...n
X
+
ci , ..., X
cj , ..., Xn )
(−1)i+j c([Xi , Xj ], X1 , ..., X
i<j
b indica l’omissione della variabile X). Per definizione, se c ∈ C m (g, V )
(ove X
allora δc ∈ C m+1 (g, V ).
2
Questa definizione si ispira alla definizione del differenziale esterno per le forme su una
varietà, che dà luogo al complesso di de Rham.
16.3. Algebre di Lie, rappresentazioni e coomologia
613
16.3.2 Esempio Se c : g −→ V è una 1-cocatena allora
δc(X, Y ) = Xc(Y ) − Y c(X) − c([X, Y ])
La successione
V −→ C 1 (g, V ) −→ · · · −→ C m (g, V ) −→ C m+1 (g, V ) −→ · · ·
non è esatta: possiamo comunque misurare quanto non lo sia. Un semplice calcolo
per induzione che qui non riportiamo permette infatti di stabilire che
16.3.3 Proposizione δ ◦ δ = 0.
Una cocatena c∈C m (g, V ) tale che δc = 0 si dice cociclo, mentre una cocatena
c ∈ C m+1 (g, V ) tale che esista una cocatena b ∈ C m (g, V ) in modo che δb = c
si dice cobordo. Ovviamente, per la proposizione, un cobordo è un cociclo. Il
viceversa non è vero a meno che la successione degli spazi delle cocatene non sia
esatta.
Possiamo definire gli spazi formati da cocicli e cobordi come:
´
´
³
³
δ
δ
e
B m (g, V ) = im C m−1 −
→ Cm
Z m (g, V ) = ker C m −
→ C m+1
Quindi la successione delle cocatene è esatta se Z m (g, V ) = B m (g, V ) (definizione
di successione esatta). In generale, B m (g, V ) sarà un sottospazio vettoriale di
Z m (g, V ): lo spazio quoziente
H m (g, V ) = Z m (g, V )/B m (g, V )
si dice m-esimo gruppo di coomologia di g a coefficienti nella rappresentazione
V . Questi gruppi (che sono spazi vettoriali) sono tutti nulli se e solo se la successione delle cocatene è esatta: altrimenti la loro dimensione ne misura la “non
esattezza”.
Consideriamo ad esempio H 0 (g, V ): dato che, per definizione, B 0 (g, V ) = 0,
abbiamo che H 0 (g, V ) = Z 0 (g, V ); inoltre
H 0 (g, V ) = ker ρ
Infatti c ∈ H 0 (g, V ) se e solo se 0 = δc(X) = Xc i.e. c ∈ ker ρ. Notiamo che se ρ è
la rappresentazione aggiunta ad : g −→ gl(g) allora ker ad = H 0 (g, g) è il centro
dell’algebra di Lie g.
Identifichiamo ora H 1 (g, V ): un 1-cociclo è una mappa c : g −→ V tale che
Xc(Y ) − Y c(X) = c[X, Y ], mentre un 1-cobordo è una mappa b : g −→ V della
614
Capitolo 16. Gruppi e algebre di Lie
forma bX = Xv per qualche v ∈V . Quindi se H 1 (g, V ) = 0 allora per ogni mappa
lineare c : g −→ V esiste un v ∈ V tale che
c(X) = Xv
Analogamente, se H 2 (g, V ) = 0 allora per ogni mappa bilineare antisimmetrica
c : g ∧ g −→ V esiste una mappa lineare b : g −→ V tale che
c(X, Y ) = Xb(Y ) − Y b(X) − b([X, Y ])
Particolarizziamo ora la nostra situazione al caso della rappresentazione banale
β : g −→ gl(K) = K
data semplicemente da β(X) = 0 (si noti che su K esiste una sola struttura di
algebra di Lie: quella identicamente nulla!).
Allora una cocatena è una forma multilineare alternante
c : g ∧ ... ∧ g −→ K
e la formula del cobordo si riduce alla:
(δc)(X0 , ..., Xn ) =
0...n
X
ci , ..., X
cj , ..., Xn )
(−1)i+j c([Xi , Xj ], X1 , ..., X
i<j
In questo caso, H 0 (g) = K; inoltre, un 1-cociclo è un funzionale lineare c ∈ g∗
tale che
∀X, Y ∈ g c[X, Y ] = 0
mentre l’unico cobordo è 0 ∈ g∗ . Quindi H 1 (g) è lo spazio dei funzionali lineari
che si annullano sugli elementi della forma [X, Y ]: in particolare H 1 (g) = 0 se e
solo se l’unico elemento in g della forma [X, Y ] è 0.
16.3.4 Definizione Un’algebra di Lie si dice semisemplice se g = [g, g], ove
[g, g] è la sottoalgebra degli elementi della forma [X, Y ] con X, Y ∈ g. Un’algebra
di Lie si dice semplice se non è abeliana e non possiede ideali non banali.
Un’algebra semplice è semisemplice, dato che [g, g] è un ideale e quindi [g, g] =
g (se fosse [g, g] = 0, g sarebbe abeliana).
Esempi di algebre semplici sono le algebre di Lie dei gruppi classici compatti
e sl(n); l’algebra Mn (R) non è semisemplice, dato che [Mn (R), Mn (R)] = sl(n) 6=
Mn (R).
Si noti che g è abeliana se e solo se [g, g] = 0. Più in generale, se i e j sono
ideali in g, anche [i, j] (sottoalgebra generata dagli elementi della forma [X, Y ]
con X ∈i e Y ∈j) è un ideale. Possiamo quindi generalizzare il concetto di algebra
di Lie abeliana nel modo seguente:
16.3. Algebre di Lie, rappresentazioni e coomologia
615
16.3.5 Definizione Un’algebra di Lie si dice risolubile se esiste k ≥ 1 tale che
g(k) = 0 ove la successione di ideali {g(k) } è definita come
g(1) := g
g(2) = [g, g]
g(k) := [g(k−1) , g(k−1) ]
16.3.6 Esempio
• Un’algebra abeliana è risolubile con k = 2.
• L’algebra di Lie delle matrici diagonali superiori rispetto al solito commutatore è risolubile: ad esempio la matrice
¶
µ
1 0
0 1
non è esprimibile
µ
a
[
0
in alcun modo nella forma
¶
¶ µ 0 0¶
µ
a b
0 b0 (a − a0 ) + b(c0 − c)
b
,
]=
0 c0
0
0
c
Ora notiamo che, se i e j sono ideali risolubili in un’algebra di Lie qualsiasi g
allora i + j pure è un ideale risolubile: infatti (i + j)/i ∼
= i/(i ∩ j) (il quoziente di
ideali risolubili è ovviamente risolubile).
Quindi, se dim g < ∞ esiste un unico ideale risolubile massimale, cioè la
somma di tutti gli ideali risolubili in g: questo ideale si dice radicale e si denota
con Rad(g). Dato che [g, g] = g implica Rad(g) = 0, se [g, g] ( g allora g/[g, g] è
risolubile; dunque
16.3.7 Proposizione g è semisemplice se e solo se Rad(g) = 0.
Dalla definizione di semisemplicità segue ovviamente che
16.3.8 Proposizione Se g è semisemplice allora H 1 (g) = 0.
In realtà vale un teorema più forte (per il quale si rimanda ai testi specialistici,
come [27] o [10]:
16.3.9 Teorema (Primo lemma di Whitehead) Se g è semisemplice allora
H 1 (g, V ) = 0 per ogni rappresentazione di dimensione finita V di g.
L’idea della dimostrazione consiste nel far vedere che, se g è semisemplice,
allora H n (g, V ) è somma diretta di k copie di H n (g), ove k è la molteplicità con
la quale la rappresentazione banale figura come sottorappresentazione di V . Una
notevole applicazione è il seguente
616
Capitolo 16. Gruppi e algebre di Lie
16.3.10 Teorema (Weyl) Ogni rappresentazione di dimensione finita di un’algebra di Lie semisemplice è completamente riducibile.
Dimostrazione: Vogliamo dimostrare, data una rappresentazione ρ : g −→
gl(V ), che per ogni sottorappresentazione P ⊂ V ne esiste una complementare
Q ⊂ V tale che P ⊕ Q = V . Questo è equivalente a dimostrare che esiste una
proiezione EP sul sottospazio P che sia un morfismo di rappresentazioni:
∀X ∈ g ρ(X)EP = EP ρ(X)
Per questo consideriamo lo spazio W ⊂ End(V ) degli operatori lineari A : V −→
V tali che
im A ⊂ P ⊂ ker A
(e quindi tali che A2 = 0). Si tratta non solo di un sottospazio vettoriale di
End(V ), ma anche di una rappresentazione di g, rispetto alla mappa π : g −→
gl(W ) data da
π(X)(A) = [ρ(X), A]
Se E è un operatore di proiezione su P allora
∀X ∈ g [ρ(X), E] ∈ W
sicché possiamo definire un operatore lineare c : g −→ W come
c(X) := [ρ(X), E]
cioè una cocatena in C 1 (g, W ). Ma, per l’identità di Jacobi:
Xc(Y ) − Y c(X) − c[X, Y ] = [ρ(X), [ρ(Y ), E]]−
− [ρ(Y ), [ρ(X), E]] − [ρ([X, Y ]), E] = 0
e quindi c è un cociclo; ma per il lemma di Whitehead deve allora esistere un
cobordo A ∈ W tale che c(A) = (δA)(X) = A(X), sicché
[ρ(X), E] = [ρ(X), A]
Questo significa che l’operatore EP := E − A commuta con tutti gli operatori
ρ(X) e quindi è un morfismo della rappresentazione V in sé; resta solo da notare
che si tratta di una proiezione su P :
∀v ∈ P
EP v = Ev − Av = v − 0 = v
(dato che P ⊂ ker A).
qed
16.3. Algebre di Lie, rappresentazioni e coomologia
617
Torniamo a considerare la coomologia a coefficienti nella rappresentazione
banale. Definiamo prima una rappresentazione di g sullo spazio vettoriale g∗
come
∀X ∈ g ∀ξ ∈ g∗ ad∗X (ξ) = −ξ ◦ adX
che si dice rappresentazione coaggiunta di g; si tratta della rappresentazione duale
della rappresentazione aggiunta. Ora definiamo una mappa, per m > 0:
ϕ : C m (g) −→ C m−1 (g, g∗ )
come
(ϕ(c)(X1 , ..., Xm−1 ))(X) = c(X1 , ..., Xm−1 , X)
16.3.11 Lemma δ ◦ ϕ = ϕ ◦ δ.
Dimostrazione: Si tratta di un calcolo:
(δϕ(c))(X1 ,.., Xm ))(X) =
m
X
ci , ..., Xm )))(X)+
(−1)i+1 (Xi (ϕ(c)(X1 , ..., X
=
i=1
1...m
X
ci , ..., X
cj , ..., Xm ))(X)
(−1)i+j (ϕ(c)([Xi , Xj ], X1 , ..., X
+
=
i<j
m
X
ci , ..., Xm ))([Xi , X])+
(−1)i+1 (ϕ(c)(X1 , ..., X
i=1
1...m
X
ci , ..., X
cj , ..., Xm , X)
(−1)i+j c([Xi , Xj ], X1 , ..., X
+
=
i<j
m
X
ci , ..., Xm , [Xi , X])+
(−1)i+1 c(X1 , ..., X
i=1
1...m
X
ci , ..., X
cj , ..., Xm , X)
(−1)i+j c([Xi , Xj ], X1 , ..., X
+
i<j
=(ϕ(δc)(X1 , ..., Xm ))(X)
qed
In particolare se c è un cociclo, anche ϕ(c) lo è.
16.3.12 Proposizione Se g è semisemplice allora H 2 (g) = 0.
618
Capitolo 16. Gruppi e algebre di Lie
Dimostrazione: Se u ∈ Z 2 (g) allora, per il primo lemma di Whitehead, esiste
una cocatena ξ ∈ C 0 (g, g∗ ) = g∗ tale che
ϕ(c) = δξ
e quindi, per ogni X, Y ∈ g:
c(X, Y ) =((ϕ(c))(X))(Y ) = ((δξ)(X))(Y )
=(ad∗X ξ)(Y ) = −ξ([X, Y ]) = (δξ)(X, Y )
dunque c = δξ, pertanto H 2 (g) = 0.
qed
Notiamo che in generale H (g) 6= 0: il funzionale bilineare
3
k(X, Y ) := tr(adX ◦ adY )
induce un 3-cociclo che non è mai un cobordo se g è semisemplice: in effetti se g
è semisemplice allora la forma bilineare k è non degenere (teorema di Cartan) e
quindi non può essere il cobordo di un funzionale lineare su g.
Di nuovo, vale un teorema più forte:
16.3.13 Teorema (Secondo lemma di Whitehead) Se g è semisemplice allora H 2 (g, V ) = 0 per ogni rappresentazione di dimensione finita V .
Diamo anche per questo una applicazione.
16.3.14 Definizione Una estensione di un’algebra di Lie a per mezzo di una
sottoalgebra g è un’algebra di Lie h tale che la successione
α
0 −→ a −→ h −→ g −→ 0
sia esatta.
In altri termini a è un ideale di h e h/a = h. Un’estensione si dice banale
se h possiede una sottoalgebra di Lie isomorfa a g per mezzo della proiezione
α : h/a −→ g.
Due estensioni h e h0 si dicono equivalenti se esiste un omomorfismo di algebre
di Lie e : h −→ h0 tale che il seguente diagramma
0
0
/a
/a
/h
²
α
/g
/0
α
/g
/0
e
/h
16.3. Algebre di Lie, rappresentazioni e coomologia
619
sia commutativo. Allora necessariamente e è un isomorfismo.
Notiamo che esiste una mappa lineare β : g −→ h tale che α ◦ β = id:
l’estensione è banale se e solo se la β può essere scelta in modo che sia un
omomorfismo di algebre di Lie; in generale non lo sarà, cioè la funzione
c(X, Y ) = [βX, βY ] − β[X, Y ]
sarà non identicamente nulla.
Se a è abeliana allora c è un 2-cociclo nello spazio delle cocatene C 2 (g, a), ove
la rappresentazione di g in a è definita dalla formula, per X ∈ g e Y ∈ a:
ρ(X)(Y ) = [βX, Y ]
Che si tratti di un cociclo segue dall’identità di Jacobi; se l’estensione è banale
il cociclo è un cobordo, quindi
16.3.15 Proposizione Se a è abeliana, lo spazio H 2 (g, a) è in corrispondenza
biunivoca con l’insieme delle estensioni di g tramite a a meno di equivalenza.
Quindi, per il secondo lemma di Whitehead:
16.3.16 Corollario Una estensione h di un’algebra di Lie semisemplice g per
mezzo di un’algebra abeliana a è banale.
Abbiamo osservato in precedenza che un’algebra di Lie qualsiasi possiede
sempre un unico ideale risolubile massimale, Rad(g), e che g/ Rad(g) è semisemplice. Una immediata conseguenza del corollario precedente è che, se il radicale
è abeliano, allora
g = Rad(g) ⊕ s
oe s è una sottoalgebra semisemplice isomorfa a g/ Rad(g) (la somma diretta è
nel senso degli spazi vettoriali). Questo risultato è vero in generale.
16.3.17 Teorema (Levi) Ogni algebra di Lie g è, come spazio vettoriale, somma diretta del radicale e di una sottoalgebra semisemplice.
Dimostrazione: Procediamo per induzione sulla dimensione di Rad(g); se Rad(g) =
0 allora g = s è semisemplice e il teorema è banale; se dim Rad(g) = 1 allora Rad(g) è abeliano ed il teorema segue dal corollario precedente. La stessa
conclusione vale se l’ideale a = [Rad(g), Rad(g)] è zero (che implica Rad(g)
abeliano).
Sia, per induzione, valido il teorema per m < n con n > 0; dato che Rad(g) è
risolubile, dim Rad(g)/a < n e che Rad(g)/a è il radicale dell’algebra quoziente
620
Capitolo 16. Gruppi e algebre di Lie
g/a, allora, per ipotesi induttiva, g/a è somma diretta di Rad(g)/a e di una sua
sottoalgebra semisemplice, che si solleva ad una sottoalgebra b di g tale che
g = Rad(g) + b
e
Rad(g) ∩ b = a
Ma Rad(b) = a; infatti a è un ideale risolubile in b ed il quoziente b/a è
semisemplice.
Dato che dim b < n, per induzione, esiste un’algebra semisemplice s in b tale
che b = a ⊕ s; cioè
Rad(g) ∩ s = Rad(g) ∩ b ∩ s = a ∩ s = 0 ,
Rad(g) + s = Rad(g) + Rad(g) ∩ b + s = Rad(g) + a + s
= Rad(g) + b = g
Quindi g = Rad(g) ⊕ s.
qed
Il teorema di Levi ha una conseguenza capitale nel teorema di Ado, secondo
il quale ogni algebra di Lie è un’algebra di matrici (in realtà vale un enunciato
più preciso).
16.3.18 Teorema (Ado) Ogni algebra di Lie di dimensione finita possiede una
rappresentazione fedele.
Dimostrazione: Osserviamo intanto che il teorema è vero se g è semisemplice:
infatti in questo caso la rappresentazione aggiunta ad : g −→ gl(g) è fedele, dato
che il suo nucleo è il centro di g che sta nel radicale (essendo un ideale abeliano
è risolubile) che è zero.
Se g non è semisemplice ma possiede una rappresentazione ρ che, ristretta al
centro z(g) di g è fedele, allora la rappresentazione
ad ⊕ρ
è fedele su g: infatti ker ad ∩ ker ρ = z(g) ∩ ker ρ = 0. Il teorema si riduce quindi
alla ricerca della rappresentazione ρ.
Consideriamo ora il centro z(g): possiede sempre rappresentazioni fedeli (uno
spazio vettoriale V si immerge in End(V )) e sia ζ una di esse. Vogliamo costruire
a partire da ζ una rappresentazione di Rad(g) che sia fedele sul centro. Per farlo
notiamo che se r è un’algebra risolubile, allora esiste una successione di ideali
(†)
z(r) ⊂ r1 ⊂ · · · ⊂ rk ⊂ r
tali che dim ri+1 /ri = 1. Infatti abbiamo la successione di ideali
z(r) = r(k−1) ⊂ r(k−2) ⊂ · · · ⊂ r(2) = [r, r] ⊂ r
16.3. Algebre di Lie, rappresentazioni e coomologia
621
Se questa sequenza non soddisfa il requisito dim r(k+1) /r(k) = 1 possiamo comunque “infittirla” con altre sottoalgebre di r in modo da ottenere una sequenza (†)
con [ri−1 , ri ] ⊂ ri .
Per dedurre da z(g) una rappresentazione di Rad(g) usiamo allora questo
ragionamento ed il seguente
Lemma. Se g è un’algebra di Lie e g = r ⊕ h (come spazi vettoriali) ove r è
un ideale risolubile in g e h una sottoalgebra, allora ogni rappresentazione σ di r
induce una rappresentazione ρ di g tale che r ∩ ker ρ ⊂ ker σ.
Prima di dimostrare il lemma concludiamo la dimostrazione del teorema di
Ado: in virtù del lemma possiamo costruire per ogni ri una rappresentazione a
partire da una di ri−1 e quindi una rappresentazione di Rad(g) fedele su z(g) a
partire da una rappresentazione fedele di z(g). Infine applichiamo il teorema di
Levi ed il lemma per indurre una rappresentazione di g fedele sul centro, che era
quanto richiesto per avere il teorema di Ado.
Resta solo da provare il lemma, il che è facile: infatti se σ è una rappresentazione di r e se consideriamo ρ = σ ⊕ ad (ove ad è la rappresentazione aggiunta
di h: ad : h −→ gl(h)) allora otteniamo una rappresentazione di g il cui nucleo è
ker ρ = ker σ ⊕ z(h)
cioè r ∩ ker ρ = ker σ.
qed
Un simile risultato è falso per i gruppi di Lie: concludiamo la nostra discussione fornendo un esempio di gruppo di Lie non di matrici.
Osserviamo intanto che un gruppo discreto è certamente un gruppo di Lie, di
dimensione zero (ogni punto {g} è una carta locale con la mappa g 7−→ 0 come
coordinata), e che la sua algebra di Lie è 0.
16.3.19 Definizione Un gruppo di Lie G si dice semplice se non è abeliano e
se ogni suo sottogruppo normale è di dimensione zero (e quindi, se è chiuso, è
discreto).
In particolare, a differenza dei gruppi per sé presi, un gruppo di Lie può essere
semplice anche se ha centro non banale: basta che questo centro sia discreto; si
noti che un gruppo è semplice se e solo se lo è la sua algebra: questo suggerisce
anche la
16.3.20 Definizione Un gruppo di Lie G è semisemplice se lo è la sua algebra
di Lie L(G).
Notiamo che π : G −→ GL(V ) una rappresentazione di un gruppo di Lie
ne induce una dell’algebra: infatti, per funtorialità, se ϕ : G −→ H è un
622
Capitolo 16. Gruppi e algebre di Lie
omomorfismo di gruppi di Lie, il diagramma
L(G)
L(ϕ)
/ L(H)
exp
exp
²
²
g
ϕ
/h
è commutativo
16.3.21 Teorema Il centro di un gruppo semisemplice di matrici è finito.
Dimostrazione: Consideriamo A ∈ G, gruppo di matrici in GL(V ): dato che
A commuta con ogni elemento di G, commuta anche con ogni elemento della
sua algebra di Lie (tramite l’esponenziale) e dato che l’algebra di Lie di G è
semisemplice, per il teorema di Weyl, possiamo decomporre V in somma diretta
di sue rappresentazioni irriducibili
A = A1 ⊕ ... ⊕ An
Ora usiamo il lemma di Schur per dedurre che Ai = λi I, con λi ∈ C: che i
coefficienti siano complessi non è un problema, dato che possiamo immergere
V nello spazio complesso V C = V ⊕ iV preservando l’irriducibilità della rappresentazione. Le matrici della forma Ai sono un sottogruppo Gi di G, quindi,
dato che [G, G] = G, anche [Gi , Gi ] = Gi e quindi Gi è composto da matrici di
determinante 1. Quindi det Ai = 1 cioè esistono ni ∈ N tali che
λni i = 1
Dunque λi è una radice ni -esima di 1 ∈ C; ne esiste solo un numero finito, quindi
anche di matrici Ai ne esiste solo un numero finito e, per conseguenza, esiste solo
un numero finito di matrici A nel centro di G.
qed
Quindi un gruppo di Lie semisemplice che possegga centro infinito non può
essere un gruppo di matrici: diamone un esempio, ma prima svolgiamo qualche
osservazione generale.
16.3.22 Lemma Sia G un gruppo topologico connesso.
• G non possiede sottogruppi aperti distinti da G stesso.
• Ogni intorno V di e ∈ G genera il gruppo G.
• Un sottogruppo discreto normale K di G sta nel centro di G.
16.3. Algebre di Lie, rappresentazioni e coomologia
623
Dimostrazione: (1): Poiché H è aperto, ogni laterale sinistro gH di H è aperto
(dato che Lg : h 7−→ gh è un omeomorfismo) e quindi l’insieme
[
gH
g6=e
è aperto, essendo unione di aperti; ma si tratta del complementare di H, che
quindi risulta essere chiuso. Dato che G è connesso e H 6= ∅, è H = G (si noti
che abbiamo in generale dimostrato che in un gruppo topologico qualsiasi, un
sottogruppo aperto è anche chiuso).
(2) Sia H il sottogruppo generato da V : si tratta di un sottogruppo aperto
per definizione e, per (1), H = G.
(3) Sia k ∈ K e U un intorno di k non contenente altri elementi di K; per
continuità della mappa g 7−→ g −1 kg esiste un intorno V di e tale che V −1 kV ⊂ U .
Ma K è normale in G e U ∩ K = {e}, quindi
∀h ∈ V
h−1 kh = k
e quindi il sottogruppo Zk degli elementi di G che commutano con k contiene
l’intorno V , che genera G per (2), e quindi Zk = G, pertanto k sta nel centro di
G.
qed
Consideriamo ora il gruppo di Lie SLn (R): la sua algebra di Lie è
sln (K) = {A ∈ Mn (K) | tr A = 0}
Notiamo che tr AB = tr BA allora tr[A, B] = 0 e quindi sln (K) è un ideale in
Mn (K); dunque
16.3.23 Proposizione L’algebra di Lie Mn (K) non è semplice.
a differenza del caso associativo. Dimostriamo ora la semplicità di sln (K) nel
caso più facile di n = 2.
Scriviamo una base di sln (K):
¶
¶
µ
¶
µ
µ
1 0
0 0
0 1
H=
F =
E=
0 −1
1 0
0 0
Il prodotto di Lie è completamente determinato dalle relazioni
[E, F ] = H
[H, E] = 2E
[H, F ] = −2F
In altri termini, E e F sono autovettori per l’applicazione lineare LH (X) = [H, X]
di autovalori 2 e −2; sia ora I un ideale non nullo e
A = aE + bF + cH
624
Capitolo 16. Gruppi e algebre di Lie
un suo elemento non nullo. Allora
[E, [E, A]] = [E, bH − 2cE] = −2bE ∈ I ,
[F, [F, A]] = [F, −aH + 2cF ] = −2aF ∈ I
Quindi, se a 6= 0 oppure b 6= 0 abbiamo E, F ∈ I e quindi H ∈ I, cioè I = sl2 (K).
Se invece a = b = 0 allora c 6= 0 e quindi H ∈ I, da cui, dato che [H, E] = 2E e
[H, F ] = −2F , E, F ∈ I e di nuovo I = sl2 (K).
Dunque il gruppo SL2 (R) è semplice perché lo è la sua algebra di Lie; ricordiamo che si tratta di un gruppo non semplicemente connesso, perché si contrae
sul gruppo ortogonale speciale SO(2) = S 1 (abeliano) che ha gruppo fondamenf 2 (R): in
tale Z. Possiamo quindi considerare il suo rivestimento universale SL
generale, se G è un gruppo di Lie connesso, localmente connesso e localmente
e −→ G è
semplicemente connesso, sappiamo che il suo rivestimento universale G
un gruppo topologico; se G è un gruppo di Lie allora possiamo considerare un
suo intorno U di e∈G che sia una carta locale (U, x) e che sia omeomorfo, tramite
e componendo p con x otteniamo allora
p, a un intorno p−1 (U ) di e0 ∈ p−1 (e) ∈ G;
e
delle coordinate locali su G:
16.3.24 Teorema (Weyl) Il rivestimento universale di un gruppo di Lie G è
un gruppo di Lie che ha la stessa algebra di Lie di G (essendo localmente isomorfo
a G).
^ di SL(2) è un gruppo di Lie la cui
Quindi il rivestimento universale SL(2)
algebra di Lie è sl2 (R); tuttavia, dato che la mappa di rivestimento
f 2 (R) −→ SL2 (R)
p : SL
è un epimorfismo di gruppi di Lie, il nucleo è un sottogruppo normale, che quindi,
f 2 (R) è semplice, deve essere discreto. Per la (3) del lemma, ker p sta
dato che SL
nel centro di SL2 (R): se dimostriamo che ker p è infinito, il teorema 16.3.21
f 2 (R) non può essere un gruppo di matrici.
implica che SL
Ma il nucleo di p è infinito dato che il gruppo fondamentale di SL2 (R) è
Z: infatti, per la decomposizione polare, SL2 (R) è prodotto delle matrici 2 ×
2 simmetriche definite positive (uno spazio contraibile, quindi semplicemente
connesso) e di SO(2) = S 1 , che ha gruppo fondamentale Z. Cosı̀ il rivestimento
universale di SL2 (R) deve contenere il rivestimento universale di SO(2) che è R,
e il nucleo di p contiene il nucleo di R −→ S 1 , che è Z.
f 2 (R) non è un gruppo di matrici.
Quindi SL
625
16.4. Teorema di Nelson
16.4
Teorema di Nelson
Discutiamo da ultimo alcuni risultati che combinano la teoria dei vettori
analitici con quella delle algebre di Lie, in particolare un altro fondamentale
teorema di Nelson.
Sia H uno spazio di Hilbert separabile e A = A∗ un operatore autoaggiunto,
corrispondente a un gruppo a un parametro U (t) = eiAt . Sappiamo che un vettore
x è analitico per A se e solo se la funzione T 7−→ U (t) è la restrizione di una
funzione olomorfa in una striscia {a+ib | |b| < δ} ⊂ C; ad esempio se x appartiene
1 2
all’immagine dell’operatore e− 2 A allora x è analitico.
Supponiamo ora che A sia completo, i.e. che
∀t ∈ R BU (t) = U (t)B ⇒ B ∈ {U (t)}00t∈R
ovvero
U (R)0 = U (R)00 = {f (A) | f ∈ C0 (R)} = {f (A) | f ∈ L∞ (R, dµ)}
con dµ misura basica. In questo caso x ∈ L∞ (R, dµ) e
(U (t)x)(λ) = eitλ x(λ)
e possiamo realizzare H come L2 (R, dµ); la misura è determinata da
Z
(ξ, f (A)ξ) = f (λ)dµ(λ)
Basta cioè conoscerne i momenti
Z
n
(ξ, A ξ) =
λn dµ(λ)
16.4.1 Proposizione Se per ogni x ciclico consideriamo ξ = e− 2 A x allora ξ è
ciclico ed analitico per A.
1
2
Dimostrazione: Vediamo che ξ è ciclico. Se
∀f ∈ C0 (R) (y, f (A)e− 2 A x) = 0
1
2
allora (e− 2 A y, f (A)x); ma {f (A)x} è denso (e e− 2 A è autoaggiunto), sicché
1
1
2
e− 2 A y = 0
1
2
che, siccome e− 2 A è iniettiva, implica y = 0.
1
2
2
626
Capitolo 16. Gruppi e algebre di Lie
Per mostrare che ξ è analitico basta provare che
X zn
n≥0
n!
An e− 2 A
1
2
è convergente nella norma uniforme degli operatori: ed infatti
¯
¯¯
¯¯
¯ rn
¯ n − 12 s2 ¯
¯¯ n − 12 A2 ¯¯
¯¯A e
¯¯ ≤ sup ¯s e
¯=
e
s
(derivando e valutando in s = 0). Ma e− 2 s sn è limitata, e, dato che il raggio di
convergenza della serie
r
X zn n
1 2
n≥0
n!
e
è infinito, si ha l’analiticità di ξ.
qed
Estendiamo ora la teoria svolta per un singolo A ad una famiglia finita commutativa: consideriamo cioè una famiglia {A1 , ..., An } di operatori permutabili, nel senso che le famiglie spettrali commutano a due a due e {A1 , ..., An } è
completa. Per f1 , ..., fn ∈ C0 (R):
C ∗ (A1 , ..., An ) = C ∗ (f1 (A1 ), ..., fn (An ))
è una C*-sottoalgebra commutativa di C ∗ (U1 , ..., Un ) (trasformate di Cayley) e
si trova che
C ∗ (A1 , ..., An ) = C0 (jσ(f1 (A1 ), ..., fn (An )))
(spettro congiunto). La determinazione della misura basica avviene in modo
mn − 12 (A21 +...+A2n )
1
completamente analogo: Am
è limitato e i momenti sono
1 ...An e
Z
m1
mn
(ξ, A1 ...An ξ) = λm1 ...λmn dµ(λ)
Z
e
mn
i(t1 Am1
1 +...+tn An )
(ξ, e
ξ) =
ei(λ,t) dµ(t)
(trasformata di Fourier).
Enunciamo da ultimo il fondamentale teorema di Nelson che generalizza ai
gruppi di Lie quello che abbiamo visto in dettaglio nel caso di gruppi a un
parametro.
Se G è un gruppo di Lie connesso, è generato da un suo intorno dell’identità:
a meno di estendere con traslazioni del gruppo possiamo quindi definire i concetti
627
16.4. Teorema di Nelson
che non dipendono dalla topologia di G (dalla sua struttura globale) supponendo
che i suoi elementi siano della forma exp tX con X ∈ L(G) (algebra di Lie del
gruppo) e t ∈ R; ad esempio, se U : G 7−→ U(H) è una rappresentazione unitaria
(fortemente continua) in uno spazio di Hilbert di G, per ogni X ∈ L(G) abbiamo
U (exp tX) = eiJX t
(teorema di Stone) ove JX è autoaggiunto e
[JX , JY ] = iJ[X,Y ]
Cioè le rappresentazioni unitarie fortemente continue di G inducono rappresentazioni dell’algebra di Lie L(G). Il teorema di Nelson stabilisce delle condizioni
per invertire questa corrispondenza ed “integrare” le rappresentazioni dell’algebra al gruppo: in altri termini, dato JX autoaggiunto vogliamo determinare U .
Ovviamente, in generale, questo non sarà possibile: ad esempio basta considerare
G = U (1) = S 1 , per il quale eiAt = I solo se t ∈ 2πZ; in questo caso la difficoltà
è legata alla impossibilità di sollevare in modo unico la rappresentazione, che è
conseguenza della struttura topologica di S 1 .
Partiamo quindi da una rappresentazione J di un’algebra di Lie g nello spazio
degli operatori hermitiani di uno spazio di Hilbert H: ad ogni X ∈ g associamo
un JX , in modo che
[JX , JY ] = iJ[X,Y ]
Dato che l’algebra g ha dimensione finita, fissata una sua base (X1 , ..., Xn ) il suo
commutatore è determinato dalle costanti di struttura
X
[Xi , Xj ] =
ckij Xk
k
Possiamo in particolare scrivere
JX =
X
ci Ji
ove Ji = JXi . Poichè data g, la teoria di Lie ci dice che esiste un unico gruppo di
Lie connesso semplicemente connesso G tale che L(G) = g, non è sorprendente
che dovremo richiedere queste proprietà topologiche.
Poiché l’algebra di Lie viene rappresentata in un’algebra di operatori, ha senso
considerare, fissata una base (X1 , ..., Xn ) di g l’algebra generata da
Xi
e
Hij = Xi Xj + Xj Xi
Denoteremo con U2 questa algebra associativa 3 : si tratta di un’algebra di dimensione finita, al più n + n(n + 1)/2.
3
Si tratta di una sottoalgebra dell’algebra inviluppante universale di g: cfr. [10].
628
Capitolo 16. Gruppi e algebre di Lie
16.4.2 Teorema (Nelson) Se G è un gruppo di Lie connesso e semplicemente
connesso e J è una rappresentazione di L(G) nello spazio degli operatori hermitiani su H in modo che il dominio D di JX (X ∈ L(G)) sia invariante rispetto
alla rappresentazione (i.e. JX D ⊂ D) e che valgano le condizioni seguenti
• [JX , JY ] = iJ[X,Y ]
P
• ∆ = k Jk2 è essenzialmente autoaggiunto su D.
Allora esiste un’unica rappresentazione unitaria fortemente continua U : G −→
U(H) tale che
U (exp tX) = eiJX t
Dimostrazione: Scriviamo Ji := JXi e consideriamo
ξ = J1 + ... + Jn
Dimostriamo intanto che, se α = ∆ − I allora esiste c tale che, per ogni x:
(∗)
||ξx|| ≤ c||αx||
||(adξ )n αx|| ≤ cn ||αx||
e
(ove adξ è l’azione aggiunta). Infatti, per la disuguaglianza di Schwartz:
µ
¶
X
X
1 2
1
2
||Ji x|| =
(Jxi , Jxi ) = (−∆x, x) ≤ ( ∆ − ∆ +
x, x)
2
2
i
1
1
=( (∆ − I)2 x, x) = ||(∆ − I)x||2
2
2
cioè
X
r
||Ji x|| ≤
i
n
||(∆ − I)x||
2
Consideriamo ora l’algebra U2 generata da Ji e Hij = Ji Jj + Jj Ji e notiamo che,
rispetto alla norma
|||B||| := inf{k | ∀x ||B|| ≤ k||αx||}
è un’algebra di Banach.
Per definizione U2 è stabile rispetto a adJi e quindi esistono delle costanti
c1 , ..., cn tali che
|||adJi B||| ≤ ci |||B|||
Per c = n max ci otteniamo cioè
X
||(adξ )n αx|| =
||adJn ...Ji ∆x|| ≤ ||ci1 ...cin αx|| ≤ cn ||αx||
i1 ...in
629
16.4. Teorema di Nelson
Da cui la (*).
Ora consideriamo la chiusura ∆ dell’operatore ∆, una sua famiglia spettrale
E(λ) e l’insieme
B = {x ∈ H | ∃Φ boreliano E(Φ)x = x}
Per il teorema spettrale possiamo dedurre che
\
B⊂
D(∆n )
e
e che la serie
X ||e
αn x||
n≥0
n!
B=H
sn
e è la restrizione di ∆ all’intersezione ∩D(∆n ) e α
converge per s ≥ 0, ove ∆
e=
e
∆ + I.
Quindi, per X ∈ g, iJX è essenzialmente autoaggiunto (ogni vettore analitico
per ξ lo è per X). Ora consideriamo l’unico gruppo di Lie connesso semplicemente
connesso G la cui algebra di Lie è g, e un intorno Ne di e ∈ G nel quale exp è un
diffeomorfismo: allora il prodotto del gruppo è determinato, in Ne , dal prodotto
dell’algebra
exp X exp Y = exp Z
con Z ∈ exp−1 Ne ; se x è tale che
n
X ||JX+Y
x||
n≥0
n!
sn
e
X ||J n x||
Z
n≥0
n!
sn
convergono allora possiamo “integrare” la rappresentazione J ad una rappresentazione U di G definita in N come
U (exp X) = eiJX
in modo che, in U :
U (g)U (h) = U (gh)
Ma sappiamo che questo è vero su un insieme denso B ⊂ H e quindi, nell’intorno N , possiamo effettivamente definire la rappresentazione UG : G −→ U(H):
per connessione del gruppo questa si estende a tutto il gruppo G e per semplice connessione questa estensione è unica. Abbiamo quindi la rappresentazione
cercata.
qed
Questo teorema vale anche se la (2) è sostituita dalla
(20 ) Ogni x ∈ D è un vettore analitico per Jk .
Per discussione più approfondita si vedano: E. Nelson, Annals of Math. 70 (1959),
B. Simon Comm. Math. Phys. 28 (1972) oppure J. Frölich, Comm. Math. Phys.
54 (1977).
Capitolo 17
SISTEMI QUANTISTICI
In questo capitolo introduciamo l’approccio di von Neumann alla Meccanica
Quantistica (cfr. [24]) e mostriamo come questo possa inquadrarsi nella teoria
delle rappresentazioni delle C*-algebre da noi precedentemente trattata (capitolo ??). Introdurremo nel nostro linguaggio i concetti di base della Meccanica
Quantistica, ponendo l’accento sul concetto di simmetria, ed utilizzandolo per
dare la formulazione relativistica dell’equazione di Schrödinger, data da Dirac.
Utilizzeremo alcune nozioni di Relatività Ristretta, almeno una familiarità con i
termini: talora utilizzeremo risultati della letteratura non completamente dimostrati in queste note; comunque, come si vedrà, il formalismo delle algebre di Lie
introdotto nel capitolo ?? interverrà pesantemente.
17.1
Stati ed osservabili
Consideriamo di un sistema fisico un numero molto grande N di copie, che
per definizione si chiama ensemble: si consideri inoltre un numero N 0 ¿ N di
copie dell’ensemble, e si immagini di eseguire N 0 misure secondo le procedure di
misura in modo da ottenere `1 , . . . , `N 0 valori, che sono proprietà dell’ensemble,
posto che gli N 0 campioni siano scelti a caso e N 0 sia abbastanza grande.
Il valore ottenuto si dice attesa (expectation), e si denota Exp.
17.1.1 Definizione Dato un sistema fisico definiamo:
• Gli stati del sistema sono le classi di equivalenza di ensemble modulo la
relazione
Ω ≈ Ω0 ⇐⇒ per ogni procedura A
Exp(Ω, A) = Exp(Ω0 , A)
• Gli osservabili sono le classi di equivalenza di procedure modulo la relazione
A ≈ A ⇐⇒ per ogni ensemble Ω
630
Exp(Ω, A) = Exp(Ω, A0 )
631
17.1. Stati ed osservabili
Denotiamo l’insieme degli stati con S e l’insieme degli osservabili con O.
Possiamo supporre che S sia un insieme convesso: infatti
∀Ω, Ω0 ∈ S ∀α, β ≥ 0 α + β = 1 ⇒ αΩ + βΩ0 ∈ S
Questo può vedersi nel seguente modo: se α, β ∈ Q allora è
α=
N1
N
e
β=
N2
N
e, preso N À 0 tale che N1 e N2 siano le cardinalità di due ensemble Ω1 e Ω2 e
se Ω1 e Ω2 sono le rispettive classi di equivalenza, allora
Ω = Ω1 ∪ Ω2
è ancora un ensemble: dunque, se Ω è la sua classe di equivalenza:
Ω = αΩ1 + βΩ2
La funzione
ϕ 7−→ Exp(ϕ, A)
è convessa. Infatti se si considerano n1 campioni in Ω1 e n2 campioni in Ω2 , il
numero di campioni prelevati in Ω è n = n1 + n2 < N , sicché
n1
N1
=
n
N
e
n2
N2
=
n
N
Se i campioni sono scelti a caso, abbiamo che
`1 + ... + `n1 + `01 + ... + `0n2
n1 `1 + ... + `n1 n2 `01 + ... + `0n2
+
=
n
n
n1
n
n2
n1
n2
= Exp(Ω1 , A) +
Exp(Ω2 , A) = α Exp(Ω1 , A) + β Exp(Ω2 , A)
n
n
Exp(ϕ, A) =
Avrà interesse considerare i punti estremali di questo insieme convesso S, che
chiameremo stati puri.
Ora consideriamo gli osservabili: se A ∈ O, consideriamo lo spettro fisico di
A, vale a dire l’insieme σph (A) dei valori (si tratta di numeri reali) delle possibili misurazioni di A. Compatibilmente con la nozione di misurazione di una
grandezza, questo insieme sarà supposto limitato in R, ed anziché considerare i
suoi punti, sarà fisicamente più significativo limitarsi a parlare degli intorni dei
suoi punti, per tener conto dell’errore sistematico che affligge ogni misura. (Come
632
Capitolo 17. Sistemi quantistici
regola empirica osserviamo anche che due misure immediatamente successive di
uno stesso osservabile devono coincidere).
L’altra ipotesi che si farà su σph (S) è che sia chiuso in R, e quindi compatto.
Ora è chiaro che, per calcolare il valore di una funzione f su un osservabile A,
bisognerà misurare A per trovare ` ∈ σph (A) e quindi calcolare f (`): poiché come
abbiamo detto, consideriamo i punti dello spettro fisico sempre associati ad un
proprio intorno, diciamo l’intorno di raggio ² del punto `, la funzione f deve
essere uniformemente continua, in modo che se ` e `0 differiscono per δε , si avrà
|f (`)−f (`0 )| < ε. Dato che σph (A) è compatto la richiesta su f è che sia continua,
cosı̀
σph (f (A)) = f (σph (A))
Quindi, fissati A ∈ O e Ω ∈ Σ possiamo calcolare Exp(Ω, f (A)) per una qualsiasi
funzione continua f ed avere cosı̀ un funzionale lineare positivo:
f 7−→ Exp(Ω, f (A))
Positivo significa che σph (A) ⊂ [0, ∞) e Exp(Ω, A) ≥ 0 per ogni Ω. Allora il
teorema di Riesz–Markov ci dice che
Z
Exp(Ω, f (A)) = f (`)dµΩ,A (`)
In particolare, se Q ∈ O è tale che sia σph (Q) ∈ {0, 1}, si dice una questione, e
verifica la
n1
Exp(Ω, Q) =
n
ove n1 è il numero di volte in cui si trova il valore 1 in n misurazioni e quindi
l’attesa della questione è la probabilità che la risposta alla questione sia “sı̀”
(Q = 1). Ora, se A ∈ O, l’insieme
{f (A) | f ∈ C(σph (A))}
è una R-sottoalgebra di R: se f è boreliana, ad esempio f = χ∆ ove ∆ è un
boreliano, si ha
Exp(Ω, χ∆ (A)) = µΩ,A (∆)
Notiamo che se A e B sono osservabili qualsiasi può non aver senso considerare
A + B o AB: ma se A e B sono compatibili (cioè se le misurazioni nelle classi
A e B si possono eseguire simultaneamente in modo non contraddittorio) allora
A + B e AB hanno come misurazioni la somma ed il prodotto delle misurazioni
di A e B: in particolare, se A + B è definita si ha
1
(A + B)2 − A2 − B 2 =: A ◦ B
2
che si dice prodotto di Jordan di A e B.
(A, B) 7−→
17.1. Stati ed osservabili
633
Per procedere dovremo ora, dopo questi preliminari, fare delle ipotesi sulla
natura matematica degli oggetti che andiamo considerando: postuleremo quindi
che1
17.1.2 Assiomi
• Σ = Σ(A) sia l’insieme degli stati di una C*-algebra A.
• O = Aaa sia la parte autoaggiunta di A.
• Exp(Ω, A) = hΩ|Ai.
(scriviamo hΩ|Ai per Ω(A).)
Quindi Extr Σ(A) = P(A) sono gli stati puri di A, σph (A) = σ(A) ed il
calcolo di funzioni sullo spettro altro non è che il calcolo funzionale.
Per giustificare quest’ultima asserzione si può procedere nel seguente modo:
` ∈ σph (A) se esiste un Ω tale che A misurato nello stato Ω dia con certezza il
valore `, cioè, considerando lo scarto medio
(∆Ω A)2 := hΩ|(A − hΩ|AiI)2 i
(qui I è l’identità che corrisponde al non fare misurazione alcuna) la certezza di
trovare ` si esprime come
∆Ω = 0
cioè
(∆Ω A)2 = hΩ|A2 i − (hΩ|Ai)2 = 0
e quindi, considerando la rappresentazione GNS
(ξ, π((A − Ω(A)I)2 )ξ) = ||π(A)(ξ − Ω(A)ξ)||2
si trova che
(∆Ω A)2 = 0 ⇐⇒ ξ − Ω(A)ξ è un autovettore di π(A)
cioè se e solo se Ω è uno stato puro: π(f (A))ξ = f (Ω(A))(ξ), ovvero hΩ|f (A)i =
f (Ω(A)), ovvero Ω(A) ∈ σ(A).
Ne concludiamo che
` ∈ σph (A) ⇐⇒ ∃Ω ∈ Σ ∆o A = 0, Ω(A) = ` ⇐⇒ ` ∈ σ( A)
e quindi che σph (A) = σ(A).
1
Si rammentino le nozioni del capitolo ??.
634
Capitolo 17. Sistemi quantistici
Osserviamo che, se A è commutativa, allora può vedersi come l’insieme delle
funzioni continue su uno spazio topologico compatto Ω (ammettendo che 1 ∈
A) e quindi gli osservabili sono funzioni continue e gli stati misure regolari di
probabilità su Ω e
Z
Exp(Ω, A) =
A(ϕ)dµ(ϕ)
Ω
L’insieme Ω corrisponde cioè allo spazio delle fasi e gli stati puri alle misure di
Dirac: come si vede, in questo caso in ogni stato puro ogni osservabile assume un
valore certo.
In generale, per motivi fisici, l’insieme degli stati puri non sarà l’intero Σ(A),
ma un suo sottoinsieme Σ. Se consideriamo l’algebra inviluppante di von Neumann A∗∗ di A, allora gli elementi di A∗∗
aa saranno considerati osservabili genera∗∗
lizzati, dato che, per B ∈Aaa , in virtù del Teorema di Kaplanski 11.4.2, B è limite
forte delle immagini, via la rappresentazione universale π
b di elementi Aα ∈ Aaa e
||aα || ≤ ||B||. Quindi per ogni stato Ω ∈ Σ(A) esiste un’unica estensione normale
b∈π
b
Ω
b(A)00∗ = A∗ tale che Ω(B)
sia il limite forte degli Ω(Aα ), che si dice valor
medio dell’osservabile.
Se ora E è un elemento di A tale che E = E 2 = E ∗ allora è una questione e,
per ogni stato Ω, Ω(E) è la misura di probabilità che E abbia risposta affermativa
nello stato Ω. Se Ω(E) = 1 si dice che Ω possiede la proprietà descritta da E.
Denotando con PΩ ∈ A∗∗ il più piccolo idempotente autoaggiunto che verifichi
la
b )=1
Ω(P
(si dice proprietà caratteristica di Ω), ricordiamo che la probabilità di transizione
da uno stato ϕ ad uno stato Ω è la
Pϕ,Ω = ϕ(P
b Ω)
(si tenga presente che Pϕ,Ω = 1 non implica che ϕ = Ω a meno che non si tratti
di stati puri).
17.1.3 Lemma PΩ ∈ A∗∗ è minimale fra i proiettori di A∗∗ se e solo se Ω è uno
stato puro.
Dimostrazione: È noto che
b = {ξ ∈ H
b | (ξ, π
PΩ H
b(−)) ∈ CΩ }
ove CΩ denota la chiusura in norma degli stati dominati da Ω. Ricordiamo inoltre
che CΩ = {Ω} se e solo se Ω è puro.
635
17.1. Stati ed osservabili
b ⊂ PΩ H
b si
Ora, sia Ω puro e P ≤ PΩ un proiettore. Ne segue che, se ξ ∈ P H
e ) = (ξ, P ξ) = 1. Ma
ha che (ξ, π
b(−)ξ) = Ω (per quanto appena ricordato) e Ω(P
PΩ è il più piccolo proiettore che verifichi questa relazione e quindi PΩ ⊂ P .
Viceversa, se PΩ è minimale, allora PΩ π
b(A)00 PΩ è un’algebra di von Neumann,
alla quale possiamo applicare il
Lemma. Se R è un’algebra di von Neumann, e per E ∈R definiamo RE := ERE
e R0E := R0 E, allora RE e R0E sono algebre di von Neumann e sono l’una il
commutante dell’altra.
e dedurre che PΩ π
b(A)00 PΩ = APΩ . Quindi per ogni ξ nell’immagine di PΩ ed
ogni T in PΩ π
b(A)00 PΩ si ha
e )PΩ
(ξ, T ξ) = Ω(T
cioè
(ξ, π
b(A)ξ) = Ω(A)
e quindi Ω è uno stato puro.
qed
Possiamo allora dedurre che
ϕ(P
b Ω) = 1
=⇒
ϕ=Ω
Ora siano A, B ∈ Aaa , e definiamo C ∈ Aaa come
iC := AB − BA
Se Ω ∈ Σ(A) vogliamo associare a Ω le indeterminazioni in A e B: ∆Ω A e ∆Ω B:
queste grandezze sono importanti, perché se ∆Ω A 6= 0 si dice che A subisce una
fluttuazione quantistica in Ω.
17.1.4 Teorema (Relazioni di Heisenberg)
1
∆Ω A · ∆Ω B ≥ |Ω(C)|
2
Dimostrazione: Se definiamo A0 := A − Ω(A)I allora:
A0 B 0 − B 0 A0 = iC
e quindi
|Ω(A0 B 0 − B 0 A0 )| = |Ω(C)|
636
Capitolo 17. Sistemi quantistici
Ma, osservando che se A è autoaggiunto, anche A0 lo è, e che Ω(A0 B 0 ) = Ω((A0 B 0 )∗ ) =
Ω(B 0 A0 ) si trova
2| Im Ω(A0 B 0 )| =|Ω(A0 B 0 ) − Ω(A0 B 0 )| = |Ω(A0 B 0 ) − Ω(B 0 A0 )
≤|Ω(A0 B 0 )| + |Ω(B 0 A0 )|
per cui, tenendo conto della diseguaglianza di Schwartz e dell’autoaggiunzione di
A e B:
1
1
1
|Ω(C)| ≤ |Ω(A0 B 0 )| ≤ Ω(A02 ) 2 Ω(B 02 ) 2 = ∆Ω A · ∆Ω B
2
qed
Osserviamo che, avendosi per ||πΩ (T )ξΩ || = Ω(T ∗ T ) 2 :
1
∆Ω A = ||πΩ (A)ξΩ − Ω(A)ξΩ ||
lo scarto quadratico è zero se e solo se ξΩ è un autovettore.
17.1.5 Corollario A e B sono osservabili compatibili se e solo se [A, B] = 0.
Dimostrazione: Che la condizione sia sufficiente segue dal teorema di Heisenberg. Dimostriamo che è necessaria: siano dapprima σ(A) e σ(B) insiemi finiti,
cioè
X
X
A=
`i Pi
e
B=
µi Fi
i
i
con {Pi , Fj } idempotenti autoaggiunti. Dimostriamo che A e B sono compatibili,
cioè che esiste un G ∈ Aaa tale che, per opportune funzioni f e g si abbia
A = f (G)
e
B = g(G)
e
g(`i + aµj ) := µj
Ma se G := A + aB, e se poniamo
f (`i + aµj ) := `i
allora f (G) = A e g(G) = B.
Il caso generale si dimostra in modo analogo per mezzo del seguente risultato
di analisi reale:
Teorema. Per ogni coppia di operatori autoaggiunti A e B in uno spazio di
Hilbert H tali che AB = BA esiste un operatore G autoaggiunto e due funzioni
boreliane f e g tali che f (G) = A e f (G) = B.
637
17.1. Stati ed osservabili
che non dimostreremo.
qed
La non-commutatività di una C*-algebra è equivalente all’esistenza di sue rappresentazioni irriducibili di dimensione maggiore di uno, come è ovvio osservare
se si considera la rappresentazione
M
A 7−→
πξ (A)
b
ξ∈A
che è fedele: in effetti, se ogni rappresentazione irriducibile fosse di dimensione
1, renderebbe A sottoalgebra di un’algebra commutativa e quindi a sua volta
commutativa.
Fatta questa precisazione, consideriamo una rappresentazione π della nostra
C*-algebra A nello spazio di Hilbert Hπ : sappiamo che questo dato ci fornisce
una famiglia di stati puri
PHπ ←→ Vπ ⊂ P(A)
(stati vettoriali), ove con P indichiamo lo spazio proiettivo associato ad uno spazio
vettoriale dato. Se ξ, η ∈ Hπ hanno norma 1, e se definiamo gli stati associati
ξ 7−→ Ω := (ξ, π(−)ξ) ,
η 7−→ ϕ := (ξ, π(−)ξ)
è ovvio che se ξ e η sono linearmente indipendenti allora Ω 6= ϕ e quindi
dim Hπ > 1 ⇐⇒ #Vπ > 1
Se ξ e η sono linearmente indipendenti e x = aξ + bη con a, b ∈ C in modo che
||x|| = 1 allora abbiamo uno stato puro (x, π(−)x) e
(x, π(A)x) = |a|2 (ξ, π(A)ξ) + |b|2 (η, π(A)η) + 2 Re ab(ξ, π(A)η)
Il terzo termine del secondo membro di questa eguaglianza è l’interferenza nella
somma degli stati (in analogia con la teoria delle onde).
Ora, se Ω, ϕ ∈ P(A) sono associate a rappresentazioni non equivalenti allora
le sovrapposizioni di Ω e ϕ non sono stati puri, cioè esiste una rappresentazione
π che estende le πΩ e πϕ per cui esistono ξ, η ∈ Hπ tali che
(ξ, π(−)ξ) = Ω ,
(η, π(−)η) = ϕ
Allora, se x = aξ +bη (a, b∈C) si ha (x, π(−)x) = |a|2 Ω+|b|2 ϕ. Ora dimostriamo
che se le rappresentazioni associate agli stati Ω e ϕ non sono equivalenti, non si
ha interferenza.
638
Capitolo 17. Sistemi quantistici
17.1.6 Proposizione ∀A ∈ A
(ξ, π(A)η) = 0
Dimostrazione: Dato che le rappresentazioni πΩ e πϕ sono irriducibili, non
sono equivalenti se e solo se sono disgiunte cioè se e solo se (πΩ , πϕ ) = 0. Ma
sappiamo che sono estese ambedue da una rappresentazione π, i.e. che
πΩ ∼
= π|H1
e
πϕ ∼
= π|H2
e quindi i proiettori E1 ed E2 su questi sottospazi di Hilbert sono elementi di
π(A)0 , per cui
(πΩ , πϕ ) = E1 π(A)0 E2
Allora le rappresentazioni non sono equivalenti se e solo se
E1 π(A)0 E2 = 0
e quindi ciò implica che i proiettori E1 e E2 sono ortogonali: E1 E2 = 0. Ma allora,
dato che E2 è π-stabile, si ha l’asserto.
qed
Osserviamo in particolare che, se le rappresentazioni associate a due stati sono
disgiunte, allora (x, π(−)x) = |a|2 Ω + |b|2 ϕ, e che quindi si possono sovrapporre
solo stati puri di una stessa famiglia Vπ .
17.1.7 Definizione Le famiglie Vπ si dicono settori di superselezione.
Possiamo riassumere nel seguente modo le osservazioni che abbiamo fin qui
collezionato:
17.1.8 Teorema Se A è una C*-algebra e Σ(A) sono i suoi stati, allora le
seguenti proposizioni sono equivalenti:
• A non è commutativa.
• Esistono stati puri con fluttuazioni quantistiche.
• Non tutti gli osservabili sono fra loro compatibili.
• Esistono rappresentazioni irriducibili di dimensione maggiore di uno.
• Esistono settori di superselezione nei quali vale il principio di sovrapposizione.
Per questo motivo, nel caso commutativo parliamo di teorie classiche, e nel
caso non commutativo di teorie quantistiche.
639
17.1. Stati ed osservabili
17.1.9 Esempio Supponiamo di avere un solo settore di superselezione (il che
vuol dire che stiamo trattando sistemi dinamici con un numero finito di gradi di
libertà), di modo che esista un’unica rappresentazione irriducibile e sia
A = K(H)
con H spazio di Hilbert separabile e A ⊂ A∗∗ = B(H). Ora, gli osservabili sono
elementi autoaggiunti di B(H) e gli stati sono gli stati normali su K(H), cioè
funzionali positivi normalizzati nel preduale2 B(H)∗ , quindi
Ω(A) = tr(AT )
ove T ≥ 0 ha traccia 1. Dunque Ω è puro se e solo se T ha rango 1 i.e. se
T = T ∗ = T 2 (ed è minimale rispetto a queste condizioni) ed in tal caso T = PΩ .
Inoltre la transizione fra stati è data da
PΩ,ϕ = tr(T R)
ove Ω = tr(T −) e ϕ = tr(R−).
Si noti che gli osservabili {A1 , ..., An , ...} sono compatibili se e solo se commutano a due a due, e formano un insieme completo se, per ogni B ∈ B(H)aa e per
ogni i Ai B = BAi , allora B = f (A1 , ..., An , ...), cioè se l’algebra di von Neumann
generata dalla famiglia {Ai } degli osservabili in questione è abeliana massimale.
17.1.10 Esempio Consideriamo lo spazio di Hilbert H = L2 (X, dµ) ove X è lo
spettro congiunto degli osservabili {Ai } e dµ è la misura basica, allora a f (A1 , ...)
corrisponde l’operatore di moltiplicazione Mf in L2 : in altri termini, la famiglia
di osservabili si può simultaneamente diagonalizzare.
Chiediamoci quale sia il significato di x ∈ L2 (X, dµ), ove
Z
|x(ξ)|2 dµ(ξ) = 1
X
(identifichiamo gli x e x0 se esiste una numero complesso a di modulo 1 tale che
x = ax0 ).
Intanto osserviamo che il valor medio di B in x è (x, Bx), e che, se B è una
questione, allora questo numero rappresenta la probabilità di trovare la proprietà
2
Si rammenti che il duale dello spazio degli operatori compatti è lo spazio degli operatori
nucleari, cioè quelli per i quali è definita la traccia: il duale dello spazio degli operatori nucleari
è esattamente B(H).
640
Capitolo 17. Sistemi quantistici
B nello stato puro x. Consideriamo allora B = Mχ∆ ove ∆ è un insieme µmisurabile. Cosı̀ B descrive la proprietà che le misure simultanee degli osservabili
{Ai } diano un valore ξ in ∆, e la probabilità che ciò sia vero è
Z
Z
Z
(x, Bx) =
x(ξ)f (ξ)x(ξ)dµ(ξ) =
x(ξ)x(ξ)dµ(ξ) =
|x(ξ)|2 dµ(ξ)
X
∆
∆
Quindi x è una funzione d’onda generalizzata, e se è il vettore ciclico che definisce
la misura basica, la densità di probabilità è
|x(ξ)|2 dµ(ξ)
17.2
Gruppi di simmetria
Una simmetria sugli osservabili è una trasformazione
η : Ω −→ Ω
che deve godere delle seguenti proprietà:
• essere 1–1 su O.
• essere R-lineare.
• soddisfare alla η(A2 ) = η(A)2 .
Se, come stiamo postulando, O = Aaa , allora
η(A + iB) = η(A) + iη(B)
In particolare
µ
η
¶
1
1
(AB + BA) = (η(A)η(B) + η(B)η(A))
2
2
Se ora scriviamo A = A1 + iA2 e B = B1 + iB2 si ha
{A, B} := AB + BA = {A1 , B1 } − {A2 , B2 } + i ({A1 , B2 } + {A2 , B1 })
(prodotto di Jordan) e quindi η : A −→ A deve essere un isomorfismo di spazi
vettoriali complessi tale che
η({A, B}) = η(A)η(B) + η(B)η(A)
dunque un automorfismo di algebre di Jordan.
Citiamo, rimandando a [12] per la dimostrazione, il
641
17.2. Gruppi di simmetria
Teorema. Se A è una C*-algebra con centro C · I allora ogni automorfismo di
Jordan η è un automorfismo oppure un antiautomorfismo della C*-algebra (un
antiautomorfismo è semplicemente uno *-isomorfismo di spazi vettoriali tale che
η(AB) = η(B)η(A)).
17.2.1 Esempio Se A = K(H) (al solito H spazio di Hilbert separabile) allora
ηe(A) = U AU −1
ove η è un automorfismo antilineare e U un operatore unitario o antiunitario.
E. Wigner ha formulato una definizione di simmetria come una biiezione
Ω −→ Ω0 sugli stati puri tale che
PΩ,ϕ = PΩ0 ,ϕ0
Il Teorema di Wigner afferma che se Ω(A) = (ψ, Aψ) allora Ω0 (A) = (ψ 0 , Aψ 0 )
ove ψ 0 = U ψ.
17.2.2 Definizione Un gruppo G si dice gruppo di simmetrie di una teoria
quantistica se esiste un omomorfismo
α : G −→ Aut(A) ∪ AntiAut(A)
(Osserviamo che AntiAut(A) non è un gruppo, e che Aut(A) C Aut(A) ∪
AntiAut(A) con indice 2).
Se Ω ∈ Σ allora Ωαg−1 è l’azione di g ∈ G su Ω: G × Σ −→ Σ. Quindi, se
A 7−→ αg (A) = A0 si trova che Ω0 (A0 ) = Ω(A).
17.2.3 Esempio Consideriamo il gruppo generato da {g 2 }g∈G : allora
∀g ∈ G
αg ∈ Aut(A)
dato che αg2 = αg2 e quindi gli antiautomorfismi dell’algebra non intervengono.
Tratteremo il caso in cui G sia un gruppo di Lie connesso. È noto che Aut(A)
è un gruppo topologico, (è un sottospazio di B(H)), ed è quindi naturale chiedersi
se α sia continua o meno. Se lo è, allora
||αg − 1|| −−−→ 0 =⇒ ∀Ω ||Ω · αg − Ω|| −−−→ 0
g−→e
il che fisicamente è inaccettabile. Per chiarire diamo la
g−→e
642
Capitolo 17. Sistemi quantistici
17.2.4 Definizione Ω si dice stato regolare per α se la sua orbita è continua,
cioè se, preso A ∈ A la mappa g 7−→ αa (A) è continua (vale a dire ||αg (A) −
A|| −→ 0 per g −→ e) sull’orbita di A.
Consideriamo ora l’insieme U = {g | ||Ωαg − Ω|| < 2}, ed osserviamo che se
Ω è regolare per α, allora U è un intorno dell’identità del gruppo di Lie G, e
che quindi genera G come gruppo (dato che è connesso per ipotesi, cfr. lemma
16.3.22).
Se oltre ad essere regolare, Ω è anche puro, allora gli stati Ωαg sono stati
vettoriali della rappresentazione GNS π di Ω, cioè: se g ∈ U , la rappresentazione
π◦αg = πΩαg è unitariamente equivalente a π, dunque esiste un operatore unitario
Vg tale che
Vg π(A)Vg−1 = π(αa (A))
e quindi, dato che U genera G, per ogni g = g1 ...gn ∈ G con {gi } ⊂ U , ponendo
Vg = Vg1 ...Vgn abbiamo ancora un operatore unitario.
In definitiva, quello che richiederemo sarà al più la continuità dell’orbita di
un operatore.
Consideriamo di nuovo l’operatore Vg unitario, che è definito a meno di multipli complessi di modulo 1 (e quindi a rigore sullo spazio proiettivo associato allo
spazio di Hilbert in questione): ciò significa che, se Vg0 = z(g)Vg per z(g) ∈ {|z| =
1} = T è ancora un operatore unitario (in effetti Vg−1
V V ∈ π(A)00 = C).
1 g2 g1 g2
17.2.5 Definizione Una rappresentazione π di A si dice covariante se esiste
una rappresentazione unitaria U di G tale che
U (g)π(A)U (g)−1 = π(αg (A))
cioè che
Ad U (g)π = π ◦ αg
Diciamo che π : Aut(A) −→ Aut(B(Hπ )) è un operatore di allacciamento fra
questi due spazi.
È ora facile rendersi conto che l’operatore Vg è di allacciamento: resta solo da
capire se e quando V sia una rappresentazione, cioè che
Vg1 Vg2 = w(g1 , g2 )Vg1 g2
ove w : G × G −→ T è un valore complesso di modulo 1. Ora,
Vg01 Vg02 = z(g1 )z(g2 )Vg1 Vg2 = z(g1 )z(g2 )w(g1 , g2 )Vg1 g2
= z(g1 )z(g2 )w(g1 , g2 )z(g1 g2 )−1 Vg01 g2 = δz(g1 , g2 )w(g1 , g2 )Vg01 g2
643
17.2. Gruppi di simmetria
ove abbiamo definito
δz(g1 , g2 ) = z(g1 )g(z2 )z(g1 g2 )−1
Quindi δz : G × G −→ T. Il simbolo δ indica il cobordo di un complesso di
cocatene per il quale w è un 2-cociclo, nel senso seguente:
(†)
w(g1 , g2 )w(g1 g2 , g3 ) = w(g1 , g2 g3 )w(g2 , g3 )
(in virtù dell’identità (Vg1 Vg2 ) Vg3 = Vg1 (Vg2 Vg3 )).
Se cioè denotiamo con C n (G, T) le funzioni da Gn in T abbiamo le mappe di
cobordo:
δ
δ
C 1 (G, T) −→ C 2 (G, T) −→ C 3 (G, T)
ove la δ : C 1 (G, T) −→ C 2 (G, T) è definita come
δz(g1 , g2 ) = z(g1 )z(g2 )z(g1 g2 )−1
e la δ : C 2 (G, T) −→ C 3 (G, T) è definita come
δw(g1 , g2 , g3 ) = w(g1 , g2 )w(g1 g2 , g3 )w(g1 , g2 g3 )−1 w(g2 , g3 )−1
Quindi, dato che se z è un omomorfismo di gruppi allora (δz)(g1 , g2 ) = 1, δz
“misura quanto z non è un omomorfismo”; analogamente δw “misura quanto w
non soddisfa la (†)”. Inoltre
δ(δz)(g1 , g2 , g3 ) = (δz)(g1 , g2 )(δz)(g1 g2 , g3 )(δz)(g1 , g2 g3 )−1 (δz)(g2 , g3 )−1
= z(g1 )z(g2 )z(g1 g2 )−1 z(g1 g2 )z(g3 )z(g1 g2 g3 )−1
z(g1 g2 g3 )z(g2 g3 )−1 z(g1 )−1 z(g2 g3 )z(g3 )−1 z(g2 )−1 = 1
cioè
δ◦δ =1
Il che ci dice che esiste una coomologia H 2 (G, T) che misura “quanto un cociclo
non è esatto”. In particolare, dalle relazioni precedenti, abbiamo che
H 2 (G, T) = 0 =⇒ Vg0 è una rappresentazione di G
Osserviamo esplicitamente che se ω ∈ Vπ allora ωαg converge fortemente a ω
per g −→ e, e quindi le funzioni z e w sono continue: questo significa che stiamo
considerando la coomologia continua del gruppo, cioè consideriamo solo le mappe
continue come cocatene.
Notiamo che se G è connesso e g = L(G) è la sua algebra di Lie, allora
possiamo far corrispondere ad ogni elemento di C k (G, T) un elemento di C k (g),
644
Capitolo 17. Sistemi quantistici
lo spazio vettoriale delle cocatene di g a coefficienti nella rappresentazione banale.
Infatti, il diagramma
z /
GO
TO
exp
g
e2πi
ze
/R
è commutativo: l’immagine di exp è un intorno di e ∈ G che genera G (poiché è
connesso). Possiamo analogamente sollevare una 2-cocatena:
G ×O G
w
exp × exp
g×g
/T
O
e2πi
w
e
/R
In generale i gruppi di coomologia saranno diversi: questo perché la coomologia
di G riflette informazioni topologiche che g non può contenere; in generale, il
sollevamento di un elemento di G a g per tramite della mappa esponenziale non
è unico: in effetti in ogni rivestimento di gruppi G1 −→ G2 le algebre di Lie
coincidono. Per avere l’unicità bisogna limitarsi al rivestimento universale, cioè
ai gruppi semplicemente connessi. In questo caso, la teoria di Lie ci dice che esiste
un unico gruppo (connesso) semplicemente connesso del quale g è l’algebra di
Lie e che quindi i morfismi da G in T si sollevano in modo unico.
17.2.6 Teorema (Bargmann–Wigner) Se la mappa g 7−→ αg è fortemente
continua, G è semplicemente connesso e H 2 (L(G), R) = 0 allora H 2 (G, T) = 1
e quindi π è covariante.
Dimostrazione: Consideriamo un cociclo w del gruppo di Lie G, e scriviamo
1
w(exp tX, exp tY )
t−→0 t
Dimostriamo che c è un cociclo per l’algebra di Lie. Per vederlo ci mettiamo in un
intorno dell’identità del gruppo nel quale la mappa esponenziale sia invertibile,
e quindi nel quale possiamo scrivere gi = exp tXi ; la condizione δw = 1 diviene:
(∗)
eic(X,Y ) = lim
1 =w(exp tX1 , exp tX2 )w(exp −tX2 , exp −tX3 )
w(exp tX1 exp tX2 , exp tX3 )w(exp tX1 , exp tX2 exp tX3 )−1
=w(exp tX1 , exp tX2 )w(exp −tX2 , exp −tX3 )
µ
µ
¶
¶
1 2
3
w exp tX1 + tX2 + t [X1 , X2 ] + o(t ) , exp tX3
2
µ
µ
¶¶−1
1 2
3
w exp tX1 , exp tX2 + tX3 + t [X2 , X3 ] + o(t )
2
645
17.2. Gruppi di simmetria
e quindi, usando la (*) e la
exp(tX1 + tX2 + t2 /2[X1 , X2 ] + o(t3 )) = exp tX1 exp tX2
(∗∗)
(cfr. proposizione 15.4.7) otteniamo
1 = e−ic([X1 ,X3 ],X2 ) eic([X1 ,X2 ],X3 ) e−ic(X1 ,[X2 ,X3 ])
che implica
0 = c([X1 , X2 ], X3 ) − c([X1 , X3 ], X2 ) + c([X2 , X3 ], X1 ) = δc(X1 , X2 , X3 )
Quindi c è un 2-cociclo per g; ma, per ipotesi, ogni 2-cociclo per g è un cobordo,
i.e. esiste un f ∈ g∗ tale che
c(X, Y ) = −f ([X, Y ])
sicché
1
w(exp tX1 , exp tX2 ) = e−if ([X1 ,X2 ])
t−→0 t
Ma, di nuovo per la (**):
lim
w(exp X1 , exp X2 ) =eif (X1 ) eif (X2 ) e−if (X1 −itX2 −i 2 t ([X1 ,X2 ])−io(t
=z(g1 )z(g2 )z(g1 g2 )−1 = (δz)(g1 , g2 )
1 2
3 ))
con z(g) = eif (X) . Abbiamo cioè dimostrato, assumendo la forte continuità di w,
che se H 2 (g) = 0 allora H 2 (G, T) = 1, dato che il ragionamento svolto è valido
in un intorno di G che genera tutto il gruppo (essendo G connesso).
qed
L’ipotesi di forte continuità della α implica che, per ogni stato ω puro e
regolare:
g−→e
||ω ◦ αg − ω|| −−−−→ 0
Se ωg := ω ◦ αg−1 allora
g−→e
g−→e
Pω,ωg −−−−→ 1 ⇐⇒ ||ω ◦ αg − ω|| −−−−→ 0
Pertanto la formula di Roberts–Elkstrom3
1
Pω,ϕ = 1 − ||ω − ϕ||2
4
e la forte continuità di α implicano la continuità di Pω0 ,ωg per ogni ω 0 , ω.
3
Per una discussione più approfondita si veda: D.J. Simms, Lect. Notes in Math. #52,
oppure le lezioni di Les Houches (1961) di A.S. Wightman.
646
Capitolo 17. Sistemi quantistici
17.2.7 Esempio
• Questo teorema si applica ai gruppi ad un parametro (G = R), cioè π :
t 7−→ αt è covariante e quindi U (t) = exp(itH) ove l’operatore hamiltoniano
H non è in generale limitato.
• Invece il teorema non vale per R2 , che non soddisfa l’ipotesi H 2 (L(G), R) =
0, né per SO(3) che non è semplicemente connesso. Tuttavia, per il secondo lemma di Whitehead 16.3.13 ogni gruppo semisemplice semplicemente
connesso soddisfa le ipotesi del teorema.
Osserviamo che il gruppo H 2 (G) parametrizza, come nel caso delle algebre di Lie,
le estensioni centrali di G; un caso fondamentale, che ricorre nelle applicazioni
alla Meccanica Quantistica, è quello del prodotto semidiretto con un gruppo
abeliano.
In generale il prodotto semidiretto è una generalizzazione del prodotto G×H.
Nel caso del prodotto, G e H divengono sottogruppi normali G × {e} e {e} × H
di G × H; nel caso del prodotto semidiretto non abbiamo questa condizione ma
una più debole: un sottogruppo è effettivamente normale, mentre l’altro non lo
è ma agisce per automorfismi sul primo.
Precisamente, siano H e N gruppi (nel nostro caso gruppi di Lie connessi) e
consideriamo un omomorfismo (di gruppi di Lie)
η : H −→ Aut(N )
cioè η(hh0 )(n) = (ηh)((ηh0 )(n)). Allora il prodotto semidiretto N n H di N e
H rispetto alla rappresentazione η è l’insieme (varietà differenziabile) N × H
equipaggiata della struttura di gruppo (di Lie) data dal prodotto
(h, n) · (h0 , n0 ) = (hh0 , nη(h)(n0 ))
L’inverso è dato da
(h, n)−1 = (h−1 , η(h−1 )(n−1 ))
Nel caso in cui N = R, abbiamo ad esempio che il prodotto semidiretto
equivale ad una estensione centrale
0 −→ R −→ R n G −→ G −→ 0
Se G è un gruppo di Lie connesso ma non semplicemente connesso, è sempre pose (come varietà differenziabile)
sibile considerare il suo rivestimento universale G
che è un gruppo di Lie a sua volta:
e −→ G
η:G
647
17.2. Gruppi di simmetria
e hanno la stessa algebra di Lie, che è
(η è un diffeomorfismo locale, quindi G e G
determinata da un intorno dell’identità).
e a G nei nostri ragionamenti, per avere almeno
Allora possiamo sostituire G
una delle ipotesi del teorema di Bargmann–Wigner sempre verificate: in effetti,
se α è la solita rappresentazione del gruppo G, evidentemente α
e := α ◦ η è una
e e se
rappresentazione del gruppo G,
U |ker(η) = I
e
allora la rappresentazione (π, V ) è covariante per G.
Fino al termine della sezione ci occuperemo di un esempio importantissimo: il gruppo di Lorentz O(1, n − 1). Ricordiamo che si tratta del gruppo di
trasformazioni lineari nello spazio Rn che preservano la forma
hx, yi = x1 y1 −
n
X
x i yi
i=2
Questo gruppo non è connesso: ad esempio, nel caso n = 2, i suoi elementi sono
matrici delle forme
¶
¶
µ
µ
cosh t − sinh t
cosh t sinh t
sinh t − cosh t
sinh t cosh t
¶
¶
µ
µ
− cosh t − sinh t
− cosh t sinh t
− sinh t − cosh t
− sinh t cosh t
e ciascun tipo corrisponde ad una componente connessa distinta. In generale
O(1, n − 1) ha quattro componenti connesse: per vedere che ne possiede almeno
quattro basta osservare che esiste l’omomorfismo di gruppi
Φ : O(1, n − 1) −→ Z2 × Z2
definito come
Φ(A) = (det A, sgnhe1 , Ae1 i)
ove e1 è il versore dell’asse x1 .
Qui ci interessa il caso delle trasformazioni dello spazio della Relatività Ristretta R4 con la metrica di Minkowski: O(1, 4); richiamiamo qualche nozione
sullo spazio di Minkowski R41 .
17.2.8 Definizione Se v ∈ R41 è un vettore non nullo, v e la retta vR generata
da v si dicono
• spaziali (space-like) se hv, vi < 0.
648
Capitolo 17. Sistemi quantistici
• isotropi (light-like) se hv, vi = 0.
• temporali (time-like) se hv, vi > 0.
Vettori dello stesso tipo formano un cono nello spazio di Minkowski: cosı̀
abbiamo la decomposizione in unione disgiunta
R41 = S ∪ V ∪ T
ove V = V+ ∪ V− è il cono di luce, che consta di due componenti connesse: si
tratta della superficie di equazione
x21 = x22 + x23 + x24
Anche il cono T dei vettori temporali ha due componenti connesse, mentre il cono
dei vettori spaziali è connesso: la differenza si spiega considerando le superficie
in R41 definite dalle
Ωm := {v ∈ R41 | hx, xi = m2 } e Ωim := {v ∈ R41 | hx, xi = −m2 }
−
che si dicono iperboloidi di massa: Ωm è un iperboloide a due falde Ωm = Ω+
m ∪Ωm
3
(omeomorfe a R ), mentre Ωim è un iperboloide ad una falda (omeomorfo a
S 2 × R2 ).
Definiamo anche i semiconi C± = T± ∪ V± , che sono chiusi convessi i cui punti
estremali sono V± : si tratta dei semiconi dei vettori che orientati al futuro (C+ )
e orientati al passato (C− ).
Consideriamo ora il gruppo di Lorentz omogeneo L di tutte le trasformazioni
dello spazio di Minkowski (che ne preservano la metrica); abbiamo la decomposizione, esattamente come nel caso delle rotazioni, in trasformazioni proprie e
improprie, secondo che il determinante sia 1 o -1:
L = L+ ∪ L−
Inoltre abbiamo anche una decomposizione in trasformazioni ortocrone e antiortocrone, secondo che preservino V− e V+ oppure li scambino:
L = L↑ ∪ L↓
Abbiamo cioè la decomposizione nelle quattro componenti connesse di L data da
L = L↑+ ∪ L↑− ∪ L↓+ ∪ L↓−
Ad esempio L↑+ è la componente connessa dell’identità, cioè è il sottogruppo
delle trasformazioni di determinante 1 che conservano il segno della variabile temporale: dato che questo gruppo contiene SO(3), non è semplicemente
connesso.
Se Λ∈L↑+ è una trasformazione (non identica) che lascia fisso punto per punto
un piano P , ci sono tre possibilità:
649
17.2. Gruppi di simmetria
• P è un sottospazio di vettori temporali (Λ è una rotazione);
• P è un sottospazio di vettori spaziali;
• P è un sottospazio di vettori isotropi (Λ è una “rotazione isotropa”);
Procedendo come per i gruppi delle rotazioni, possiamo determinare delle forme
canoniche per gli elementi di L↑+ , vedendo i suoi elementi come matrici 4 × 4.
Una rotazione si può sempre scrivere nella forma
1 0
0
0
0 1
0
0
Λ1 =
0 0 cos t − sin t
0 0 sin t cos t
ove t ∈ [0, π) è un angolo. Un Λ ∈ L↑+ di tipo
forma
cosh r sinh r
sinh r cosh r
Λ2 =
0
0
0
0
ove r > 0 è una “rapidità”. Una rotazione
forma
1 1
0 1
Λ3 =
0 0
0 0
(2) si può sempre scrivere nella
0 0
0 0
1 0
0 1
isotropa si può sempre scrivere nella
1
0
2
1 0
1 0
0 1
Infine una trasformazione Λ può essere della forma V R = RV ove R è una
rotazione e V di tipo (2); in questo caso
cosh r sinh r
0
0
sinh r cosh r
0
0
Λ4 =
0
0
cos t − sin t
0
0
sin t cos t
Queste trasformazioni sono diagonalizzabili nello spazio di Minkowski complessificato. Il seguente teorema appartiene agli elementi della Teoria della Relatività
Ristretta:
17.2.9 Teorema Ogni trasformazione di Lorentz propria ortocrona Λ∈L↑+ (6= I)
è della forma Λ1 ,...,Λ4 .
650
Capitolo 17. Sistemi quantistici
Il gruppo inomogeneo di L↑+ è il gruppo di Poincarè P+↑ , che per definizione è
il prodotto semidiretto di L↑+ con R4 , ed ha quindi come moltiplicazione la:
(a, Λ) · (a0 , Λ0 ) := (a + Λa0 , ΛΛ0 )
Determiniamo ora il rivestimento universale di L↑+ : se Λ ∈ M4 (R) è un elemento
di L↑+ e se
∀x ∈ R4
(Λx, gΛx) = (x, gx)
ove g(x, y) = hx, yi è la metrica di Lorentz con segnatura (+ − −−), cioè se
ΛT gΛ = g
allora det Λ = 1 e Λ00 > 0. Ora osserviamo che lo spazio delle matrici 2×2
complesse autoaggiunte è, come spazio vettoriale, un R4 , con coordinate
µ
¶
a b
H=
b c
(a, c ∈ R e b ∈ C) ed identificazione data da
R4 −→ M2 (C)
µ
¶
x0 + x3 x1 − ix2
(x0 , ..., x4 ) 7−→ x
e :=
x1 + ix2 x0 − x3
Quindi
det x
e = x20 − x21 − x22 − x23
mentre
tr(e
x) = x0
(consideriamo la traccia normalizzata: se A ∈ Mn , tr(A) =
Evidentemente la trasformazione
1
n
P
i
Aii ).
H 7−→ AHA∗
è un automorfismo delle matrici hermitiane (∼
= R4 ) che preserva il determinante
se det A = ±1 (la condizione di ortocronia tr(AA∗ ) ≥ 0 è sempre vera). Con
ciò abbiamo che una matrice A ∈ SL(2, C) dà luogo ad una trasformazione che
preserva il determinante.
Allora abbiamo l’omomorfismo delle matrici speciali nel gruppo di Lorentz
SL(2, C) −→ L
A 7−→ Λ(A)
17.3. Rappresentazioni del gruppo di Lorentz
651
ove Λ(A)x := Ae
xA∗ , che ha nucleo {±1}: si tratta cioè di un rivestimento doppio
e, dato che SL(2, C) è semplicemente connesso, del rivestimento universale del
gruppo di Lorentz 4 .
Osserviamo che
¶
¶
µ
¶
µ
¶
µ
µ
¶
µ
1 0
0 −i
0 1
x0 + x 3
0
1 0
+ x3
+ x2
+ x1
= x0
0 −1
i 0
1 0
0
x0 − x3
0 1
= x0 I + x · σ
ove σ1 , σ2 , σ3 sono le matrici di Pauli. È un esercizio verificare che per ogni vettore
di norma 1 u si ha (u · σ)2 = 1, e quindi osservare che
ϑ
U := ei 2 u·σ
è una matrice unitaria per ogni ϑ∈R. Viceversa, ogni matrice unitaria è di questo
tipo, e si ha:
^
Ux
eU ∗ = R(U
)x
ove R(U ) è una rotazione di un angolo ϑ attorno all’asse individuato dal versore
u. I valori Lu = u · σ si dicono momenti angolari .
17.3
Rappresentazioni del gruppo di Lorentz
Abbiamo visto alla fine del paragrafo precedente che per studiare le rappresentazioni del gruppo di Lorentz possiamo concentrarci sulle rotazioni e sulle
traslazioni.
Consideriamo ora una rappresentazione covariante π e la rappresentazione di
G indotta U(a, A). Alle matrici unitarie U dell’esempio precedente corrispondono
i generatori infinitesimali del gruppo delle rotazioni
³
´
i
U 0, e 2 ϕu·σ = eiLu ϕ
4
Ricordiamo per quale motivo il gruppo speciale complesso sia semplicemente connesso:
intanto abbiamo la decomposizione polare A = V H di ogni matrice speciale A in una matrice
V unitaria ed una H hermitiana positiva, entrambe di determinante 1. H è una trasformazione
∗
di Lorentz pura, in quanto H
µ γ= U DU
¶ , ove U ∈ SU (2) e D è diagonale definita positiva e
e
0
di determinante 1, i.e. D =
, per γ ∈ R. Se ora t 7−→ A(t) è una curva (continua)
0 e−γ
chiusa (A(0) = A(1)) in SL(2, C), la possiamo deformare in una curva V (t) in SU (2), dato
che la mappa (t, s) 7−→ A(t, s) := V (t)H(t)s è evidentemente l’omotopia che realizza questa
deformazione. Quindi π1 (SL(2, C)) = π1 (SU (2)) = 1, dato che SU (2) altri non è che la sfera
S3.
652
Capitolo 17. Sistemi quantistici
Per studiare le rappresentazioni del gruppo delle rotazioni studiamo quelle irriducibili del gruppo SU(2), che è il suo rivestimento universale: sia j un indice
variabile nell’insieme dei seminteri non negativi { n2 }n∈N , e sia
¢
¡
D(j) (U ) := U ⊗2j |Sym2j (C2 )
(ove Symn (V ) denota i tensori simmetrici di grado n su V ). Consideriamo ad
esempio una rotazione di un angolo ϕ intorno all’asse x3 :
µ iϕ
¶
ϕ
e 2
0
= ei 2 σ3
−i ϕ
2
0 e
µ ¶
µ ¶
0
1
, si ha (per k ∈ {−2j, ...2j}):
ev=
Se u =
1
0
(j)
k 2j−k
D (U )u v
³
iϕ
2
= e
´k ³
−i ϕ
2
e
´2j−k
ϕ
ϕ
uk v 2j−k = eik 2 −ijϕ+ik 2 = ei(k−j)ϕ
e quindi (scrivendo il momento angolare Lxk come Lk ):
L3 uk v 2j−k = (k − j)uk v 2j−k
Osserviamo esplicitamente che dim D(j) = 2j + 1. Lo spettro di L3 è
σ(L3 ) = {j, j − 1, ..., −j}
Quindi, L3 è un operatore con molteplicità uniforme pari a uno, ed i suoi autovalori sono tutti interi o tutti seminteri secondoché lo sia o meno j. Ciò naturalmente
può dirsi anche per L2 e L3 . Se
L2 := L21 + L22 + L23
questo operatore è invariante per rotazioni, dato che
U(0, U )L2 U(0, U )−1 = L2
17.3.1 Proposizione Nella decomposizione della rappresentazione U di SU (2)
in rappresentazioni irriducibili
M
U(0, U ) =
Un (U )
l’operatore L2 si decompone in somma di scalari:
M
L2 =
kn I
17.3. Rappresentazioni del gruppo di Lorentz
653
Dimostrazione: Ognuna delle componenti di Un (U ) è Un (U ) = Djn (U ), e si ha
kn = jn (jn + 1)
Ora lavoriamo sull’algebra di Lie su(2) = so(3), che è determinata dai generatori
infinitesimali
ϕ
1
ei 2 σk 7−→ σk
2
(matrici di Pauli) e ricordiamo le regole di moltiplicazione
σj σk = iσl
σj2 = I
σj σk = −σk σj ,
se k 6= 0
ove (j, k, l) è una permutazione ciclica di (123), da cui
[σj , σk ] = 2σj σk = 2iσl
Quindi l’algebra di Lie è determinata da
X
[Uk , Ul ] =
²m
kl Um
m
ove ²m
kl è zero se (klm) non è una permutazione ciclica, altrimenti ne è il segno.
Ora consideriamo
³ i ´
U e 2 ϕσk = eiϕLk
in modo che
[Lk , Lj ] = iLm
(al solito (klm) è una permutazione ciclica). Calcoliamo allora L2 :
[L3 , (L1 + iL2 )] = iL2 + L1 = L1 + iL2 =: A
Quindi
L3 A = A(L3 + I)
Se Φ è un autovettore di L3 di autovalore j, si ha che
L3 AΦ = (j + 1)AΦ
Cioè, se Φ sta in un sottospazio di Hilbert Hj ove la rappresentazione sia irriducibile, per Φ = u2j v 0 si trova
Lj Φ = jΦ
654
Capitolo 17. Sistemi quantistici
e quindi AΦ = 0 (per irriducibilità). Dunque L2 |Hj = kj I con
L2 Φ = L23 Φ + (L21 + L22 )Φ = j 2 Φ + (L21 + L22 )Φ
Ora, A∗ = L1 − iL2 , il che ci consente di calcolare L21 + L22 :
A∗ A =L21 + L22 + i[L1 , L2 ] = L21 + L22 + iL3 = L21 + L22 − L3
ed infine
L2 Φ = j 2 Φ + (A∗ A + L3 )Φ = j 2 Φ + jΦ = j(j + 1)Φ
qed
Osserviamo che si potrebbe dimostrare anche una formula di Clebsh–Gordan:
M
0
D(j) ⊗ D(j ) =
D(s)
|j−j 0 |≤s≤j+j 0
Ora consideriamo il sottogruppo delle traslazioni dato dalla formula spettrale
Z
a 7−→ U(a, I) = eip·a dE(p)
ove la misura ∆ 7−→ E(∆) sui boreliani di R4 è invariante per trasformazioni di
Lorentz:
U(0, A)E(∆)U(0, A)−1 = E(Λ(A)∆)
(le trasformazioni a 7−→ U(a, I) e a 7−→ U(Λ(A)a, I) sono unitariamente equivalenti). Se H è separabile, la misura basica è
dµ(p) = (ξ, dE(p)ξ)
ove ξ è un vettore separante, ed è invariante per trasformazioni di Lorentz, e la
misura
dµΛ (p) := dµ(Λp )
è equivalente a dµ.
17.3.2 Teorema Ogni misura regolare positiva invariante su R4 è della forma
Z
Z
Z
(4)
−
−
+
+
dρ (m)dΩm (p) + cδ0 + dρ (m)dΩm (p) + dpdΩim (p)
(4)
ove δ0 è la misura di Dirac concentrata in 0 ∈ R4 , dp è la misura di Lebesgue
del semiasse positivo, e dΩm la misura su un iperboloide di massa m
d3 p
dΩm (p) := p
2 p2 + m
17.3. Rappresentazioni del gruppo di Lorentz
655
Per questo teorema si veda [29], §IX.8.
Se ora ∆ è un boreliano invariante per trasformazioni di Lorentz: Λ(∆) = ∆,
e 0 . Ricordiamo che
e quindi E(∆) appartiene al commutante di U(P)
U(G)00 = π(L1 (G))00 = π
e(C0 (b(G))00
e quindi E(∆) appartiene al commutante dell’algebra di von Neumann della
e 0 ∩ U(P)
e 00 .
rappresentazione del gruppo, cioè sta nel centro U(P)
Ora, se {P0 , ..., P4 } sono gli operatori fortemente permutabili che generano
e si ha che
P,
M 2 = P02 − P12 − P22 − P32 ≥ 0
Z
e
M=
∞
mdG(m)
0
ove G(B) = E(∆), se B è un boreliano di R+ e ∆ = {p| ||p|| ∈ B}.
e deve essere
Se U è una rappresentazione irriducibile di P,
M 2 = m2 I
e la formula spettrale è E(∆) ∈ {0, I}. Quindi il supporto di E come misura sui
boreliani invarianti è una singola orbita, il che significa che esiste un’orbita Ωm
tale che
E(Ωm ) = I
Richiamiamo ora alcuni fatti generali sulle rappresentazioni indotte, che si applicano al nostro caso: se G è un gruppo localmente compatto e ρ la sua rappresentazione regolare in L2 (G, dµ) rispetto alla misura dµ di Haar del gruppo, e se
H è un sottogruppo chiuso di G e
U : H −→ U(HU )
una rappresentazione unitaria fortemente continua, vogliamo utilizzarla per indurre delle rappresentazioni di G.
È noto (cfr. [30], §14) che G/H è uno spazio topologico dotato (come pure H\G, che è il quoziente di G rispetto all’azione sinistra) di misure quasiinvarianti per l’azione di G. Scegliamo quindi una tale misura (regolare) su H\G,
e consideriamo le funzioni Ψ : G −→ HU boreliane e covarianti nel senso che
∀h ∈ H
∀g ∈ G
Ψ(hg) = U(k)Ψ(g)
Allora, dato che (Ψ(g), Ψ(g)) = (Ψ(kg), Ψ(kg)) la Ψ passa al quoziente H\G e
si ha
Z
(Ψ(g), Ψ(g))dµ(g) < ∞
H\G
656
Capitolo 17. Sistemi quantistici
Queste funzioni formano uno spazio di Hilbert sul quale è definita la rappresentazione
s
dµ(hg)
(U µ (g)Ψ) (h) := Ψ(hg)
dµ(h)
(l’espressione sotto radice è la derivata di Radon–Nikodym).
Ora sia G = N n H (ove N = R4 e H = SL(2, C)) con N gruppo localmente
compatto commutativo e normale in G, e H sottogruppo localmente compatto
di G, ove il prodotto semidiretto è effettuato rispetto all’azione continua
η : H −→ Aut(N )
b è un carattere, si ha che χ ◦ ηh è un’azione di H sul duale
Ovviamente, se χ ∈ N
b
N . Inoltre osserviamo che se Hχ = {h ∈ H | χ ◦ ηh = χ} è lo stabilizzatore, e se
U è una rappresentazione di Hχ allora
χU(n, h) = χ(n)U(h)
è una rappresentazione di N n Hχ , dato che
χU ((n, h)(n0 , h0 )) = χU(nηh (n0 ), hh0 ) = χ(n)χ(n0 )U(hh0 )
Allora inducendo dal sottogruppo N nHχ al gruppo N nH si ottiene una rappresentazione di G: la teoria è dovuta sostanzialmente a Mackey, che ha formulato,
fra gli altri, i risultati seguenti:
17.3.3 Teorema
b e L è una rappresentazione unitaria fortemente continua di Hχ
• se χ ∈ N
allora la rappresentazione indotta da χL non varia se χ varia nell’orbita
χηH .
0
0
• Se Hχ 6= Hχ0 allora U χL U χ L .
• Se L è una rappresentazione unitaria fortemente continua irriducibile di
Hχ allora la rappresentazione indotta U χL è irriducibile.
Qui faremo anche le seguenti e più restrittive ipotesi:
b che è una sezione dell’azione di H, cioè incontra
• Esiste un boreliano in N
tutte le orbite esattamente in un punto).
• Hχ è un gruppo di tipo I (cioè ogni rappresentazione π della sua C*-algebra
il cui centro è ridotto al solo C è tale che π(A)00 = B(H) per un opportuno
spazio di Hilbert, in altre parole: π è un multiplo di una rappresentazione
irriducibile: il tipo di un gruppo è il tipo dell’algebra di von Neumann
π(A)00 , che, per l’ipotesi che il centro di π sia C, è un fattore).
17.3. Rappresentazioni del gruppo di Lorentz
657
In questi caso, anche N è di tipo I (e quindi anche G = N n H lo è) ed ogni
rappresentazione irriducibile è della forma U χL ove L è una rappresentazione
irriducibile di Hχ .
Applichiamo ora queste nozioni al caso in cui N = R4 e H = SL(2, C), con
ηA (a) = Λ(A)a
essendo Λ il morfismo del rivestimento SL(2, C) −→ L del gruppo di Lorentz. In
e
questo modo G = N n H = P.
c4 ∼
Osserviamo intanto che l’ipotesi (1) precedente è verificata. Le orbite di R
=
4
R per l’azione di SL(2, C) sono:
• il punto {0}.
• il cono di luce positivo o negativo meno l’origine:
V ± := {p ∈ R4 | p2 = 0, p0 ≷ 0}
• Ω±
m e Ωim .
Per avere una sezione boreliana, consideriamo l’asse x0 , l’asse x+
1 (esclusa l’origine), un punto su V + ed uno su V − .
Per verificare che vale l’ipotesi (2), identifichiamo come sono fatte le orbite:
nel caso (a) è H0 = SL(2, C), mentre nel caso (c) è, ad esempio nel punto
p = (1, 0, 0, 0), Hp = SU (2), e questi sono gruppi di tipo I cfr. [15].
Restano i casi (b) e (d). Nel caso (b), preso come p il punto (1, 0, 0, 1), la
matrice hermitiana che gli corrisponde è I + σ3 ovvero
¶
µ
2 0
p=
0 0
e
¶
¶
µ
1 0
1 0
∗
. Ma se A =
A =
Cioè gli elementi di Hp sono tali che A
0
0
0
0
¶
µ
a b
∈ SL(2, C) abbiamo che
c d
¶µ
¶µ
µ
¶
¶ µ
¶ µ
a c
1 0
a b
1 0
aa ac
=
=
0 0
c d
0 0
ac cc
b d
µ
cioè |a|2 = 1 e c = 0, e quindi
½µ
¶
¾
a b
2
Hp =
| |a| = 1
0 a
658
Capitolo 17. Sistemi quantistici
Ma, se
µ
¶ µ
¶
a b
u uz
=
0 a
0 u
(u = a e z = ab) e, moltiplicando:
µ
u uz
0 u
¶µ 0
¶ µ 0 0
¶
u u0 z 0
uu z u0 + zuu0
=
0
0 u0
uu0
e, scrivendo le matrici come elementi (u, z):
(u, z)(u0 , z 0 ) = (uu0 , z + u2 z 0 )
e quindi Hp è isomorfo al prodotto semidiretto di S 1 e R2 rispetto all’azione di
S 1 su R2 data da
¡
¢
u = eiϑ 7−→ z 7−→ z + e2iϑ z
cioè è un rivestimento doppio del gruppo euclideo del piano che ha come orbite
circonferenze di centro l’origine e l’origine stessa. Si tratta di un gruppo di tipo I:
le rappresentazioni si possono studiare a partire da queste orbite. Nel caso delle
circonferenze si ottengono rappresentazioni di dimensione infinita, che non hanno
senso fisico (a meno di non concepire spin infiniti!), mentre nel caso dell’orbita
ridotta alla sola origine le rappresentazioni sono
D(eiϑ , z) = e2ijϑ
ove j è lo spin della particella di massa zero. Abbiamo cioè
)
(µ
¶ ¯¯
u uz ¯
Hp =
¯u ∈ T e z ∈ C
0 u ¯
con p = (1, 0, 0, 1).
Nel caso (d), consideriamo invece il punto p = (0, 0, 1, 0): allora p = σ2 e gli
e
elementi di Hp sono le A tali che Aσ2 A∗ = σ2 . Ma (A e σ2 sono invertibili, e σ2
è inversa di se stessa):
A = σ2 A∗−1 σ2
è una rappresentazione (non unitaria) di SL(2, C) la cui rappresentazione controgradiente (cioè duale) verifica la
A = σ2 A∗−1 σ2
17.3. Rappresentazioni del gruppo di Lorentz
659
Infatti Aσ2 A∗ = σ2 implica che Aσ2 AT = σ2 è equivalente a iAσ2 AT = iσ2 . Se
scriviamo esplicitamente queste relazioni in termini delle entrate delle matrici,
otteniamo
¶
¶µ
¶ µ
¶µ
¶µ
µ
a c
b −a
a c
0 −1
a b
=
b d
d −c
b d
1 0
c d
¶
¶ µ
µ
0 1
0
bc − ad
=
=
−1 0
ad − cb
0
Ne segue che
Hp = {A | A = σ2 A∗−1 σ2 = A} = SL(2, R)
e
Consideriamo ora le rappresentazioni unitarie fortemente continue del gruppo P
tali che lo spettro sia
σ (U|R4 ) ⊂ V + = {p ∈ R4 | p2 = 0 e p0 ≥ 0}
+
e precisamente quelle irriducibili associate all’orbita Ω+
m (m > 0): sia Pω ∈ Ωm ,
Hpω lo stabilizzatore in SL(2, C), D una rappresentazione unitaria irriducibile di
Hpω e χ il carattere associato a pω ; dato che si può scegliere pω = (m, 0, 0, 0), si
ha
Hpω = SU (2) ,
D = D(j)
Quindi la rappresentazione irriducibile è caratterizzata da m e j. Per capire come
è fatta, prendiamo una matrice Ap tale che, per ogni p nell’orbita di pω
Ap pω A∗p = p
f
e che p 7−→ Ap sia continua. Componiamo questa funzione con Φ:
Ψ(p) := Φ(0, A−1
p )
Evidentemente lo stabilizzatore è {(a, A)}A∈Hpω . Quindi
Z
||Ψ(p)||2 dΩm (p) < ∞
Ricordiamo che
dΩm (p) = q
dp
d 12
p
dt
+ m2
660
Capitolo 17. Sistemi quantistici
D(j) opera su C2j+1 . Ora abbiamo Ψ 7−→ U(a, A)Ψ, e, se A−1
p AAΛ(A−1 )p sta nello
stabilizzatore:
−1
−1
−1
U(a, A)Ψ =U(a, A)Φ(0, A−1
p ) = Φ((0, Ap )(a, A)) = Φ((Λ(Ap )a, Ap A))
−1
=Φ((Λ(A−1
p )a, Ap AAΛ(A−1 )p AΛ(A−1 )p ))
−1
=Φ((Λ(A−1
p )a, Ap AAΛ(A−1 )p )(0, AΛ(A−1 )p ))
−1
=eipω Λ(Ap
)a
D(j) (A−1
p AAΛ(A−1 )p )Φ(0, AΛ(A−1 )p ))
−1
=eipω a D(j) (A−1
p AAΛ(A−1 )p )Ψ(Λ(A )p ))
(tenendo conto della covarianza della rappresentazione). Che poi A−1
p AAΛ(A−1 )p
stia nello stabilizzatore si verifica facilmente:
−1
−1
−1
Λ(A−1
p AAΛ(A−1 )p )pω = Λ(Ap )Λ(A)Λ(A )p = Λ(Ap )p = pω
Abbiamo cioè dimostrato il
17.3.4 Teorema (Formula di Wigner)
−1
(U(a, A)Ψ)) (p) = eipA D(j) (A−1
p AAΛ(A−1 )p )Ψ(Λ(A )p )
Si noti ora che
Λ(Ap )pω = p
Ap pω A∗p = p
e
f
e
Se pω ∈ Ω+
m e m > 0 possiamo prendere pω = (m, 0, 0, 0) e quindi pω = mI, cioè
f
la matrice Ap è determinata dalla Ap A∗p = p/m. Osserviamo esplicitamente che,
e
avendosi det(p) = p2 = m2 e tr(p) = 2p0 ≥ 2m si ha che p > 0 e quindi possiamo
considerare
e
e
e
r
Ap :=
p/m
e
che ci fornisce la sezione continua voluta.
17.4
Equazione di Dirac
Continuiamo a considerare le rappresentazioni del gruppo di Lorentz: poniamo
µ
µ
¶
¶
2
(j)
||Φ(p)|| = Φ(p), D
p/m Φ(p)
e
661
17.4. Equazione di Dirac
introducendo in questo modo una struttura di spazio di Hilbert Hm,j sulle fun2j+1
zioni da Ω+
misurabili e tali che
m in C
Z
||D(j) (Ap )Φp ||2 dΩm (p) < ∞
Allora la
(V Φ)(p) = D(j) (A−1
p )Φp
è una trasformazione unitaria V : Hm,j −→ H, per cui
Um,j (a, A) := V −1 U(a, A)V
è una rappresentazione unitaria che opera come
(Um, j(a, A)Φ)(p) = eipa D(j) (A)Φ(Λ(A−1 )p )
Se Ψ(p) ∈ C2(2j+1) è il vettore
Φ(p)
µ
¶
(j)
D
p/m Φ(p)
µ
allora
µ
Φ(p), D
(j)
e
¶
¶
1
p/m Φ(p) = (Ψ(p), γ ◦ Ψ(p))
2
e
¶
0 I
.
ove γ =
I 0
In Hm,j abbiamo una ulteriore struttura hilbertiana H0 la cui la norma è
!
µ
¶−1
Z Ã
|||Φ(p)|||2 := ||Ψ||2 =
Ψ(p), D(j) p/m
Ψ(p) dΩm (p)
µ
ed un operatore unitario V : H0 −→ H:
Ã
(V Φ)(p) = D
e
!
r
p/m Φ(p)
e
Allora la rappresentazione V U(a, A) opera (tenendo conto della formula di Wigner 17.3.4) come
Ã
!
r
p/m (U(a, A)V −1 Φ)(p)
(V U(a, A)V −1 Φ)(p) = D
e
v
u
u
±
u
= eipa D(A)D tΛ(A−1 )p m (V −1 Φ)(Λ(A−1 )p)
^
= eipa D(A)ΦΛ(A−1 )p
662
Capitolo 17. Sistemi quantistici
cioè
(V U(a, A)V −1 ΦΨ)(p) = eipa D(A)Ψ(Λ(A)−1 p)
Stiamo usando la metrica
µ
¶
|||Ψ(p)||| := (Ψ(p), D p/m Ψ(p))
2
e
Ma, considerando
¶
ψ1 (p)
ψ2 (p)
µ
Ψ(p) :=
(con ψi (p) ∈ C2j+1 ) e scrivendo
¶−1 !
õ
ψ1 (p) = Ψ(p)
e
ψ2 (p) = D
p/m
Ψ(p)
e
e ricordando le formule per pe e p e che (p/m)−1 = pe/m troviamo che ψ(p) soddisfa
e
alla
e
(e
p/m)¶
ψ1 (p)
ψ2 (p) = D µ
ψ1 (p) = D p/m ψ2 (p)
e
che scriviamo in forma più compatta usando l’operatore di Dirac
!
Ã
0
D(p)
e
P :=
D(e
p)
0
ottenendo l’equazione di Dirac
P Ψ(p) = mΨ(p)
Notiamo che
|||ψ(p)|||2 = |||Ψ(p)|||2 =
1
= (Ψ(p), γΨ(p))
2
¶
0 I
). Introducendo le matrici di Dirac:
I 0
¶
¶
µ
µ
0 I
0
D(σk )
e
γ0 =
γk =
I 0
−D(σk )
0
µ
(ove γ =
1
((ψ1 (p), ψ2 (p)) + (ψ2 (p) + ψ1 (p)))
2
663
17.4. Equazione di Dirac
possiamo anche scrivere l’equazione di Dirac come
P=
X
pk γk
k
Consideriamo ora nuovamente la rappresentazione
¶
µ
D(A)ψ1 (Λ(A)−1 (p))
ipa
(Um,j (a, A)Ψ)(p) = e
D(e
p/m)D(A)ψ1 (Λ(A)−1 (p))
ed osserviamo che
µ
∗−1
(e
p/m) A =A
∗
∗−1
(A (e
p/m) A) = A
−1
=A∗−1 Λ(A−1 )p/m
µ
−1
A
¶
¶−1
∗−1
p/m A
e
³
´
−1 )p/m
^
= A∗−1 Λ(A
^
(N.B: A∗−1 = A−1∗ ) e quindi che
D(A)ψ1 (Λ(A)−1 (p))
(Um,j (a, A)Ψ)(p) =eipa
−1 )p/m)ψ (Λ(A−1 )(p))
^
D(A∗−1 )D(Λ(A
1
¶
µ
−1
D(A)ψ1 (Λ(A) (p))
=eipa
D(A∗−1 )ψ2 (Λ(A−1 )(p))
Ora definiamo
S(A) := D(j) (A) ⊕ D(j) (A∗−1 )
ove abbiamo scritto
D(j) (A) = D(j,0) (A)
e
D(j) (A∗−1 ) = D(0,j) (A)
e quindi S = D(j,0) ⊕ D(0,j) , sicché
(Um,j (a, A)Ψ)(p) = eipa S(A)Ψ(Λ(A)−1 (p))
ottenendo cosı̀ la covarianza dell’equazione di Dirac:
S(A)−1 = Λ(A)P
S(A)P
664
Capitolo 17. Sistemi quantistici
17.4.1 Esempio Nel caso j = 0 possiamo semplicemente considerare
H = L2 (Ω+
m , dΩm )
con la rappresentazione
((U(a, A)Ψ)(p) = eipa Ψ(Λ(A)−1 (p))
Presa l’anti-trasformata di Fourier
1
ϕ(x) = √
2π
e p0 =
p
Z
Ω+
m
e−ipx Φ(p)dωm (p)
p~2 + m2 , troviamo
ϕ(e
e p) = Φ(ω(~p), p~)
pertanto
1
ϕ(x) = √
2π
Z
Ω+
m
eipx ϕ(p)
e
dp
2p0
Abbiamo cosı̀ ottenuto (p2 − m2 )ϕ(p)
b
= 0, cioè l’equazione di Schrödinger relativisticamente invariante
(¤ + m2 )ϕ(x) = 0
Si tratta di un’equazione del secondo ordine in t: per questo motivo Dirac ha
considerato in sua vece la
X
∂ψ
iγk
= mψ
∂xk
k
che si deduce dall’equazione di Dirac per
P.
Restringiamo ora la nostra indagine al caso m = 0: questo vuol dire che ci
poniamo sul cono di luce futuro con misura invariante (j = 0)
dp
2|p0 |
Se j 6= 0 consideriamo (1, 0, 0, 1) come vettore di riferimento e costruiamo la
sezione per mezzo di
(p, p~) := (|~p|, p~)
Se Hp è la trasformazione di Lorentz pura (diagonale) tale che
Hp (1, 0, 0, 1) = (p, 0, 0, p)
665
17.4. Equazione di Dirac
e la componiamo con la rotazione (unitaria) Up tale che
Up (0, 0, 0, p) = (p, p~)
otteniamo Ap = Up Hp , che non è una matrice definita positiva; tuttavia, se
m = 0, l’equazione di Dirac e la relazione di covarianza divengono
PΨ = 0
e
S(A)−1 = 0
S(A)P
Dunque, considerando lo spazio di Hilbert delle funzioni dal cono di luce futuro ai vettori in C 2j+1 (con la solita metrica definita dalle γk ) otteniamo una
e
rappresentazione unitaria di P.
Dimostriamo ora che questa rappresentazione non è irriducibile. Se pω =
(1, 0, 0, 1), lo stabilizzatore è
½µ
¶¾
a b
⊂ SL2 (C)
0 a
e le rappresentazioni di dimensione finita sono
µ
¶
(±j) a b
D
= a±2j
0 a
Se il segno è (-)+ Lo spin è (anti-)parallelo all’impulso: infatti considerando p
nell’orbita di (1, 0, 0, 1) e A nello stabilizzatore troviamo che
Λ(A)p = p = Λ(A)−1 p ⇒ AΛ(A)−1 (p) = Ap
Inoltre, per p = pω = (1, 0, 0, 1) Ap = I e la formula di Wigner diviene
(U(0, A)Ψ)(pω ) = a±2j Ψ(pω )
Per A tale che Λ(A) sia una rotazione di asse p~ω (l’asse x3 ) e angolo ϕ abbiamo
!
µ
¶ Ã iϕ
a 0
e2
0
A=
=
=⇒ (U(0, A)Ψ)(pω ) = e±ijϕ Ψ(pω )
− 2i ϕ
0 a
0 e
Dunque, se A appartiene allo stabilizzatore di un punto p dell’orbita di pω allora
Ap = AΛ(A)−1 p e la formula di Wigner diviene (si rammenti che Ap = Up Hp )
−1
−1 −1
−1
(U(0, A)Ψ)(p) = D(A−1
p AAp )Ψ(Λ(A) p) = (Hp Up AUp Hp )Ψ(λ(A )p)
quindi, se A è una rotazione, Up−1 AUp è una matrice diagonale, precisamente una
rotazione di asse x3 , il che consente di affermare che D è una rappresentazione e
di scrivere la formula di Wigner come
(U(0, A)Ψ)(p) = D(Up−1 AUp )Ψ(Λ(A)−1 p) = e±ijϕ Ψ(Λ(A)−1 (p))
666
Capitolo 17. Sistemi quantistici
Ma allora l’equazione
P Ψ = 0 descrive la rappresentazione
1
1
[0, ] ⊕ [0, − ]
2
2
che è riducibile.
Il motivo per cui esiste questa decomposizione è
P Ψ(pπ ) = 0 (pω = (1, 0, 0, 1)); allora
0 0
¶
µ
0 0
0
I + σ3
= 2
P=
0 0
I − σ3
0
0 1
il seguente: consideriamo
1
0
0
0
0
0
0
0
e quindi
P Ψ(pω ) = 0 se e solo se ψ3 = ψ2 = 0. La rappresentazione è
µ
¶
A
0
0 A∗−1
à i
!
e2ϕ
0
con A =
, rotazione di asse x3 unitaria (A∗−1 = A):
i
0 e− 2 ϕ
µ ¶
ψ1
µ
¶ ψ1
0 A 0
A
0
= µ ¶
0
0 A∗−1 0
A
ψ4
ψ4
Ora la decomposizione nelle due rappresentazioni [0, 12 ] e [0, − 12 ] è del tutto
evidente.
Capitolo 18
QUANTIZZAZIONE CANONICA
In questo capitolo diamo una descrizione matematica del formalismo (ormai
classico) della Meccanica Quantistica di un sistema finito di particelle: si tratta
della teoria di Schrödinger–Heisenberg, che discuteremo nell’àmbito della teoria
delle algebre di operatori e della simmetria del capitolo precedente. In particolare
dimostreremo l’unicità della rappresentazione di Schrödinger (d’onde il nome
“canonica”) per la forma che Weyl ha dato alle relazioni di Heisenberg: come
si vedrà, la differenza degli approcci classici sta solo nella diversa presentazione
di stesse algebre di operatori isomorfe fra loro. Preliminarmente richiameremo
brevemente il formalismo hamiltoniano per i sistemi classici con finiti gradi di
libertà.
18.1
Formalismo canonico
Consideriamo uno spazio vettoriale V di dimensione finita: ogni elemento di
V ⊗ V si decompone in modo unico come somma di un tensore simmetrico ed un
tensore antisimmetrico; questo significa che per studiare le forme bilineari basta
limitarsi a queste.
Se ϕ : V × V −→ K (K = C oppure K = R) è una forma bilineare, possiamo
associarle la
ϕ[ : V −→ V ∗
definita come
(ϕ[ (v))(v 0 ) = ϕ(v, v 0 )
Dato che V / ker ϕ[ = im ϕ, la forma è non degenere se e solo se ϕ[ è un isomorfismo. Una forma bilineare simmetrica non degenere è una forma pseudo-euclidea;
il teorema di Sylvester, noto dall’Algebra Lineare, classifica queste forme in termini delle forme quadratiche loro associate: se ϕ è una forma bilineare non degenere,
possiamo associarle una forma quadratica Q(v) = ϕ(v, v) che, in una opportuna
667
668
Capitolo 18. Quantizzazione canonica
base (e1 , ..., en ), è sempre del tipo
Q(x) = x21 + .. + x2k − x2k+1 − ... − x2n
Nel caso antisimmetrico, non possiamo definire la forma quadratica, e la classificazione è molto più semplice.
18.1.1 Definizione Una forma simplettica su uno spazio vettoriale V è una
funzione bilineare antisimmetrica e non degenere ϕ : V × V −→ K.
Nel caso in cui dim V = ∞, questa definizione non è precisa: bisogna infatti specificare cosa significhi essere non degenere; se V è uno spazio di Banach,
un forma bilineare continua ϕ è fortemente non degenere se la mappa lineare e
continua ϕ[ è un isomorfismo di spazi di Banach fra V e V ∗ (duale topologico),
mentre è debolmente non degenere se ϕ[ è semplicemente una isometria; ovviamente uno spazio di Banach ammette forme fortemente non degeneri se e solo se
è riflessivo, e una forma debolmente non degenere e suriettiva, è pure fortemente
non degenere, per il teorema della mappa aperta.
18.1.2 Esempio Se H è uno spazio di Hilbert complesso, e (x, y) è la sua forma
hilbertiana, questa, come forma bilineare simmetrica, è fortemente non degenere:
se scriviamo
(x, y) = α(x, y) + iβ(x, y)
allora β : H × H −→ R è una forma simplettica fortemente non degenere su H.
18.1.3 Teorema (Darboux) Se ϕ è una forma simplettica su uno spazio vettoriale V di dimensione finita, allora esiste una base (e1 , ..., e2n ) di V nella
quale
n
X
ei ∧ ei+n
ϕ=
i=1
Una tale base si dice base simplettica.
Dimostrazione: Procediamo per induzione sulla dimensione N di V . Per prima
cosa osserviamo che deve aversi dim V = 2n; infatti in una qualsiasi base la forma
simplettica è rappresentata da una matrice A antisimmetrica, A = −AT e quindi
tale che det A = det(−AT ) = (−1)N det AT = (−1)N det A, sicché N è pari
oppure det A = 0; ma A è non degenere, quindi det A 6= 0, i.e. N = 2n è pari.
Ora sia n = 1: allora fissato un vettore non nullo e1 ∈ V , il funzionale lineare
fe1 (v) := ϕ(e1 , v)
669
18.1. Formalismo canonico
su V è non nullo (la forma è non degenere), quindi esiste un e2 ∈ V tale che
fe2 (e1 ) = 1; ovviamente e1 e e2 non possono essere linearmente dipendenti, altrimenti e1 = ae2 e quindi ϕ(e1 , e2 ) = aϕ(e2 , e2 ) = 0. Quindi sono una base di V
che ha dimensione 2.
Se n > 1 e supponiamo che il teorema sia valido per n − 1 scegliamo di
nuovo un vettore e1 ∈ V non nullo e, come nel caso precedente, un vettore en+1
linearmente indipendente da e1 e tale che
ϕ(e1 , en+1 ) = 1
Ora consideriamo i funzionali lineari fe1 e fen+1 dati da
fe1 (v) := ϕ(e1 , v)
fen+1 (v) := ϕ(en+1 , v)
e gli spazi N1 e Nn+1 ortogonali a e1 e en+1 rispetto alla forma simplettica:
N1 = {v ∈ V | ϕ(e1 , v) = 0}
Nn+1 = {v ∈ V | ϕ(en+1 , v) = 0}
si tratta di spazi (2n − 1)-dimensionali (nuclei di funzionali lineari), la cui intersezione W = N1 ∩ Nn+1 ha dimensione 2n − 2: infatti e1 ∈
/ Nn+1 e en+1 ∈
/ N1 .
Vogliamo ora dimostrare che su W la forma simplettica ϕ è non degenere,
e quindi applicare l’induzione per dedurre l’esistenza di una base simplettica
(e2 , ..., en , en+2 , ..., e2n ) per W : aggiungendo a questa base i vettori e1 e en+1 si
ottiene ovviamente una base simplettica di V e il teorema è dimostrato.
Resta solo quindi da provare che ϕ|W è non degenere, il che è semplice: se
esistesse w ∈ W tale che, per ogni w0 ∈ W , ϕ(w, w0 ) = 0, allora, dato che per
definizione si ha pure ϕ(e1 , w) = ϕ(en+1 , w) = 0, e W ⊕ e1 K ⊕ en+1 K = V , allora
w sarebbe nel nucleo della forma ϕ, i.e. w = 0.
qed
In altri termini, la forma è, nella base (e1 , ..., e2n ) determinata dalle equazioni
ϕ(ei , ej ) = 0
se i, j
µ
0
−I
ϕ(ei+n , ej+n ) = 0
ϕ(ei , ej+n ) = δij
∈¶{1, ..., n}, ed è quindi, scritta in forma matriciale, la matrice J =
I
.
0
18.1.4 Definizione Uno spazio simplettico è uno spazio vettoriale dotato di una
forma simplettica.
18.1.5 Corollario Uno spazio simplettico di dimensione finita ha dimensione
pari.
670
Capitolo 18. Quantizzazione canonica
Una trasformazione lineare simplettica è una funzione lineare f : V −→ W
fra spazi vettoriali simplettici che preserva le forme simplettiche
ψ(f (v), f (w)) = ϕ(v, w)
Una trasformazione lineare simplettica è un simplettomorfismo (o isomorfismo
simplettico) se è un isomorfismo di spazi vettoriali.
18.1.6 Corollario Due spazi simplettici della stessa dimensione sono simplettomorfi.
18.1.7 Esempio Il più importante (ed in un certo senso l’unico) spazio vettoriale simplettico è il seguente: consideriamo uno spazio vettoriale qualsiasi V , ed
il suo spazio duale V ∗ ; allora possiamo definire una forma simplettica su V × V ∗
come
ϕ((v, ϕ), (w, ψ)) = ψ(v) − ϕ(w)
Per il teorema di Darboux, ogni spazio vettoriale simplettico di dimensione
2 dim V si ottiene in questo modo. In coordinate, scriviamo una base (q1 , ..., qn )
di V ed una base duale (p1 , ..., pn ) di V ∗ : allora la forma simplettica standard è
ϕ=
n
X
pi ∧ q i
i=1
Usiamo ora queste nozioni per formalizzare la Meccanica Classica; consideriamo un sistema fisico descritto da energia cinetica E e potenziale U , come
ad esempio un sistema di punti con masse mi e distanze dall’origine ri , che ha
energia cinetica e potenziale
1X
d
E=
mi ri 2
2 i=1
dt
n
U=
X
Vij (ri − rj )
i,j
(Vij sono le interazioni fra i punti di masse mi e mj , ad esempio il potenziale
gravitazionale newtoniano Vij (r) = −Gmi mj /|r|). I moti t 7−→ q(t) del sistema
sono descritti come gli estremali del funzionale
Z t1
.
(†)
L(q(t), q(t))dt
t0
ove L = E − U è la lagrangiana del sistema. Se le coordinate lagrangiane q =
(q1 , ..., qn ) sono quelle di Rn , la lagrangiana è semplicemente una funzione L :
671
18.1. Formalismo canonico
R2n −→ R. Come noto dagli elementi della Meccanica gli estremali del funzionale
(†) sono localmente descritti dalle equazioni di Eulero–Lagrange:
d ∂L
∂L
. =
dt ∂ q k
∂qk
Sotto opportune condizioni di non degenerazione della lagrangiana, questo sistema può trasformarsi in uno equivalente per mezzo della trasformata di Legendre
(cfr. [1] o [2]) in un sistema hamiltoniano: si definiscono gli impulsi
pk =
∂L
.
∂ qk
e le equazioni di Lagrange divengono
.
pk =
∂L
∂qk
Considerando ora la funzione hamiltoniana
X .
.
H(p, q, t) =
pk q k − L(q, q, t)
k
e confrontandone il differenziale
dH =
∂H
∂H
∂H
dp +
dq +
dt
∂p
∂q
∂t
.
.
col differenziale della trasformata di Legendre pq − L(q, q, t) della lagrangiana L:
.
qdp −
.
.
∂L
.
.
dq − Ldt = qdp − pdq − Ldt
∂q
otteniamo le equazioni di Hamilton.
∂H
.
pk = −
∂qk
∂H
.
q k =
∂pk
18.1.8 Esempio Se la lagrangiana L : Rn × Rn −→ R è una forma quadratica
sullo spazio vettoriale V = Rn , ad esempio L = E − U con E prodotto scalare
in V , allora H = E + U . Infatti la trasformata di Legendre di una funzione
quadratica coincide con la forma stessa: H(p(q)) = pq − L(q) = 2E − (E − U ) =
E + U.
672
Capitolo 18. Quantizzazione canonica
Si può esprimere in forma intrinseca il formalismo hamiltoniano ricorrendo
agli spazi simplettici: gli osservabili di un sistema dinamico classico sono le funzioni (differenziabili o comunque che soddisfino ipotesi di regolarità) f : V −→ R
definite sullo spazio delle fasi , che in generale sarà una varietà differenziabile (ad esempio un aperto di R2n ); nel caso lineare, V è uno spazio vettoriale
simplettico. L’algebra degli osservabili è quindi C ∞ (V ) col prodotto di funzioni
punto per punto: si tratta di un’algebra associativa e commutativa. Possiamo
definire su C ∞ (V ) anche una struttura di algebra di Lie, considerando le parentesi di Poisson. Per farlo consideriamo una forma simplettica ϕ su V = R2n e
l’isomorfismo
ϕ# : V ∗ −→ V
duale dell’isomorfismo ϕ[ . Possiamo allora definire un campo di vettori in V come
XH = ϕ# (dH)
ove dH è il differenziale dell’osservabile H : V −→ R. Un campo della forma XH
si dice campo hamiltoniano di hamiltoniana H; le parentesi di Poisson su C ∞ (V )
si definiscono come
{F, G} = ϕ(XF , XG )
e le equazioni del moto assumono la forma
.
F = {H, F }
ove H è l’hamiltoniana e F è un osservabile. Per F = qk e F = pk otteniamo
esattamente le equazioni di Hamilton; gli integrali primi del sistema, le costanti
del moto, sono caratterizzati dalla
{H, I} = 0
Se il sistema possiede integrali primi I1 , ..., Ik , l’algebra di Lie da essi generata
(rispetto alle parentesi di Poisson) corrisponde a un gruppo di Lie che è il gruppo
delle simmetrie del sistema: se gli integrali primi sono un sistema completo, nel
senso che le relazioni {Ik , F } implicano F = 0 allora il sistema è completamente
integrabile (teorema di Liouville).
Oltre alla presentazione hamiltoniana, esiste anche un punto di vista indipendente dal tempo: per questo si considerano gli stati del sistema, cioè funzionali
lineari sugli osservabili C ∞ (V ) che abbiano valori positivi sulle funzioni positive
e 1 sulla funzione 1 (si tratta di misure di probabilità su V ), che variano col
tempo secondo le equazioni di Hamilton: se ρ(p, q, t) è la densità di probabilità
associata ad uno stato, allora
.
ρ = {ρ, H}
18.2. Rappresentazione di Schrödinger
673
I due approcci sono legati dalla relazione
Z
Z
{H, F }ρdpdq =
F {ρ, H}dpdq
V
V
Questi concetti hanno degli analoghi in Meccanica Quantistica: in questo caso
l’algebra degli osservabili non è un’algebra di funzioni ma di operatori (non commutativa), ma esiste un analogo delle parentesi di Poisson dato dal commutatore
di operatori: l’equazione del moto è formalmente analoga a quella precedente
(Heisenberg picture):
.
}A = i[H, A]
Analogamente al caso classico esiste anche una presentazione nella quale gli operatori che corrispondono agli osservabili non cambiano nel tempo, ma cambiano gli stati (Schrödinger picture). L’equazione del moto in questo caso diviene
l’equazione di Schrödinger
.
}ρ = iHρ
La corrispondenza fra un sistema classico e un sistema quantistico, in modo che
ad osservabili classici corrispondano osservabili quantistici, a simmetrie classiche
simmetrie quantistiche e alle parentesi di Poisson le parentesi di Lie fra operatori
si dice quantizzazione del sistema classico: per una discussione precisa di questo
concetto si rimanda a [6].
18.2
Rappresentazione di Schrödinger
Consideriamo un sistema nel quale posizione e impulso siano determinati dalle
famiglie finite di osservabili
q1 , ..., qn
e
p1 , ..., pn
di operatori autoaggiunti su uno spazio di Hilbert H, ove, se k 6= h e r 6= s:
(
[qk , qh ] = [pr , ps ] = 0
[pr , qk ] ⊂ −i}δrk I
(si noti che gli operatori non sono continui, quindi dobbiamo considerare l’estensione del commutatore.)
Per semplicità notazionale ci limiteremo al caso n = 1, ponendo anche } = 1:
pq − qp ⊂ −iI
674
Capitolo 18. Quantizzazione canonica
Notiamo che, se lo spazio H ha dimensione finita, allora possiamo calcolare
la traccia di p e q, cosı̀ come del loro commutatore:
tr[p, q] = 0
il che contraddice la relazione di Heisenberg precedente.
Quindi lo spazio deve avere dimensione infinita, e lo stesso argomento prova
che gli operatori p e q non possono essere nucleari; in realtà
18.2.1 Proposizione Gli operatori p e q non possono essere continui.
Dimostrazione: Supponiamo che lo siano: è ben definito allora l’operatore
Se ω è uno stato e se ∆ω A =
p
1
c := [p, q]
i
ω(A2 ) − ω(A)2 allora
1
1
∆ω (p)δω (q) ≥ |ω(c)| =
2
2
Ma, per continuità di p, ∆ω p ≤ ||p|| e quindi
∆ω p ≥
1
2||p||
∆ω q ≥
e
1
2||q||
Se ω è uno stato tale che ξω = E(∆)ξω , ove
Z
p = λdE(λ)
con E(∆) 6= 0 e diam(∆) < ε allora
p
∆ω p = ω(p2 ) − ω(p)2 ≤ ||(p − ω(p)I)ξω || ≤ ε
il che contraddice il principio di Heisenberg.
qed
18.2.2 Esempio Consideriamo una particella che si muove sulla circonferenza
T = S 1 e lo spazio di Hilbert H = L2 (T, ds) (misura di Lebesgue), e gli operatori
(qx)(s) = sx(s)
e
(px)(s) = −i
∂
x(s)
∂s
Notiamo che σ(q) = [0, 2π], mentre σ(p) = Z: si noti che in questo caso p
è certamente non limitato, mentre lo è q; questo non è in contraddizione col
principio di Heisenberg, dato che p è definita (in quanto operatore di derivazione)
sulle funzioni assolutamente continue (periodiche in R di periodo 2π) e quindi il
dominio di [p, q] contiene funzioni che in 0 e 2π valgono zero.
675
18.2. Rappresentazione di Schrödinger
Se H = L2 (Rn , dsn ) con
(qk x)(s) = sk x(s)
(pk x)(s) = −i
e
∂
x(s)
∂sk
allora
Dqk = {x ∈ H | (s 7−→ sk x(s)) ∈ H} e Dpk = {x ∈ H | (s 7−→ sk x
b(s)) ∈ H}
dato che, se Fx = x
b è la trasformata di Fourier, allora
Fqk F−1 = pk
e quindi
[pk , qr ] ⊂ −δkr I
e
[qh , qk ] = 0
Possiamo meglio precisare queste relazioni nel modo seguente: le mappe U, V :
Rn −→ Rn definite come
U (α) := eihα,qi
e
v(α) := eihα,pi
sono rappresentazioni unitarie fortemente continue di Rn e
(U (α)x)(S) = eihα,si x(s)
e
(V (α)x)(S) = x(s + α)
sono operatori unitari (ovvio) fortemente continui (teorema della convergenza
dominata).
18.2.3 Definizione La rappresentazione degli operatori q e p per mezzo delle U
e V si dice rappresentazione di Schrödinger.
Possiamo quindi, per il teorema di Stone 14.3.6, scrivere:
µ
¶
1
∂
U (α)x (s) = sj x(s) = qj (x)(s)
i ∂αj
µ
¶α=0
∂
1
∂
V (α)x (s) = −i
x(s) = pj (x)(s)
i ∂αj
∂sj
α=0
Ma
V (β)U (α)(s) =U (α)(x)(s + β) = eihα,s+βi x(s + β)
= eihα,βi ei<α,s> x(s + β)
= eihα,βi (U (α)V (β)x)(s)
Abbiamo cioè ottenuto le regole di commutazione di Weyl
676
Capitolo 18. Quantizzazione canonica
18.2.4 Teorema V (β)U (α) = eihα,βi U (α)V (β)
Viceversa, partendo da due rappresentazioni unitarie U e V fortemente continue, sempre per il teorema di Stone 14.3.6, possiamo dedurre che sono della
forma
U (α) = eihα,qi
e
V (β) = eihβ,pi
per p e q opportuni operatori autoaggiunti. Allora, supponendo che le rappresentazioni U, V soddisfino alle relazioni di Weyl, si deduce che
[pk , qj ] ⊂ −iδjk I
La corrispondenza fra la rappresentazione di Schrödinger e le relazioni di Weyl
non è precisamente biunivoca: in effetti ogni rappresentazione delle relazioni di
Weyl è somma diretta di rappresentazioni di Schrödinger. Prima di dimostrarlo
approfondiamo qualche proprietà di queste ultime.
18.2.5 Teorema La rappresentazione di Schrödinger è irriducibile.
Dimostrazione: Sia U, V la rappresentazione di Schrödinger: allora
{U (α)}00α∈Rn = {U (α)}0α∈Rn
(si tratta di un’algebra di von Neumann abeliana massimale); inoltre
¶
µZ
f (α)U (α)dαx (s) = fb(s)x(s)
dunque
{U (α)}00α∈Rn = {Mf }f ∈L∞ (Rn )
(operatori di moltiplicazione). Ma sappiamo che ogni x∈L2 (Rn ) tale che {x = 0}
abbia misura nulla è ciclico.
Analogamente si procede per V , dato che F−1 U F = V e quindi, se B ∈ B(H)
è tale che
BU = U B
e
BV = V B
allora B ∈ CI. in particolare, se [B, U ] = [B, V ] = 0 allora B = Mf , con f ∈
L∞ (Rn ); ma
(V (β)Mf x)(s) =(Mf x)(s + β) = f (s + β)x(s + β)
=f (s + β)(V (β)x)(s) = (Mf−β V (β)x)(s)
(ft è la traslazione per t), ovvero
V (β)Mf V (β)−1 = Mf−β
677
18.2. Rappresentazione di Schrödinger
Ma, dato che [B, U ] = 0, B = Mf e Mf = Mfβ i.e.
Mf −fβ = 0 ⇒ f = fβ q.o.
e quindi f è quasi ovunque costante, cioé Mf ∈ CI.
Quindi la rappresentazione di Schrödinger è irriducibile.
qed
Consideriamo ora qk , pj operatori autoaggiunti su H che siano una rappresentazione delle relazioni di Heisenberg; ci chiediamo quando una tale rappresentazione sia irriducibile. Una condizione è che, per ogni B ∈ B(H) si abbia
Bqk ⊂ qk B
e
Bpj ⊂ pj B
BEqk (λ) = Eqk (λ)B
e
BEpj (λ) = Epj (λ)B
cioè
(famiglie spettrali). Nel caso della rappresentazione di Schrödinger, queste condizioni sono una caratterizzazione dell’irriducibilità:
)
BU (α) = U (α)B
⇒ B ∈ CI
BV (α) = V (α)B
Ora definiamo l’operatore di von Neumann, se z = α ⊕ β ∼
= α + iβ:
W (z) := e 2 hα,βi U (α)V (β)
i
La funzione z 7−→ W (z) è fortemente continua ed è una rappresentazione:
0
0
W (z)W (z 0 ) = e 2 (hα,βi+hα ,β i) U (α)U (β)U (α0 )U (β 0 )
i
0
0
0
= e 2 (hα,β>+hα ,β i+2hα ,βi) U (α + α0 )V (β + β 0 )
i
0
0
0
= eihα ,βi W (z + z 0 ) = e 2 (hα ,βi−hα,β i) W (z + z 0 )
i
= eiσ(α,β) W (z + z 0 )
ove abbiamo definito
1
1
1
σ(z, z 0 ) = (hα0 , βi − hα, β 0 i) = Imhz 0 , zi = hα + iβ, α0 + iβ 0 i
2
2
2
(prodotto scalare in Cn ). Notiamo che σ è una forma bilineare, antisimmetrica e
non degenere: infatti è la parte immaginaria di una forma sesquilineare1 . Si tratta
1
Una tale forma si dice kähleriana.
678
Capitolo 18. Quantizzazione canonica
cioè di una forma simplettica; sappiamo
ogni tale forma è, in una opportuna
µ che ¶
0 I
(teorema di Darboux).
base, associata ad una matrice J =
−I 0
Notiamo qui che la R-bilinearità e l’antisimmetricità di σ implicano
W (z)∗ = W (z)−1 = W (−z)
e quindi, se z = λξ (λ ∈ R), λ 7−→ W (λz) è una rappresentazione unitaria e
fortemente continua di R; viceversa, ogni tale rappresentazione tale che
0
W (z)W (z 0 ) = eiσ(z,z ) W (z + z 0 )
(†)
determina una rappresentazione di Schrödinger U, V come
U (α) = W (α + i0)
e
V (β) = W (0 + iβ)
Quindi la (†) e le regole di commutazione di Weyl sono equivalenti.
Ora consideriamo l’insieme Hn = {(z, λ) | λ ∈ R e z ∈ Cn } tale che
(z, λ) 7−→ eiλ W (z)
Vogliamo su Hn una moltiplicazione che renda questa mappa una rappresentazione:
0
0
0
(z, λ) · (z 0 , λ0 ) 7−→ ei(λ+λ ) W (z)W (z 0 ) = ei(λ+λ +σ(z,z )) W (z + z 0 )
Ovviamente basta porre
(z, λ) · (z 0 , λ0 ) := (z + z 0 , λ + λ0 + σ(z, z 0 ))
vale a dire che Hn = R n Cn è il prodotto semidiretto dei gruppi di Lie additivi
R e Cn .
18.2.6 Definizione Il gruppo Hn si dice gruppo di Heisenberg.
Usando la terminologia della teoria delle algebre di Lie, che si applica anche
ai gruppi, possiamo dire che Hn è estensione centrale del gruppo additivo C n per
mezzo del cociclo σ:
0 −→ R −→ Hn −→ Cn −→ 0
Ricordiamo che queste estensioni sono parametrizzate, a meno di equivalenze, da
H 2 (Cn ): in effetti la forma simplettica σ usata per definire l’estensione dà luogo
esattamente all’elemento di H 2 (Cn ) associato all’estensione stessa.
18.2. Rappresentazione di Schrödinger
679
Notiamo che possiamo realizzare il gruppo Hn come gruppo di matrici nel
modo seguente:
¯
1 xT t ¯
¯
n
0 1 y ¯x, y ∈ C e t ∈ R
Hn =
¯
0 0 1
Si vede in questo modo che il gruppo di Heisenberg è nilpotente.
Con la costruzione precedente abbiamo quindi determinato una rappresentazione unitaria del gruppo di Heisenberg per mezzo dell’operatore di von Neumann
UW (λ, z) = eiλ W (z)
Naturalmente, per il teorema di Stone 14.3.6, ogni rappresentazione U del gruppo
di Heisenberg soddisfa alla relazione
U(0, λ) = eiT λ
per un opportuno T ; inoltre, dato che σ(z, z) = 0, di nuovo per il teorema di
Stone 14.3.6, abbiamo che
U(α + i0, 0) = eihα,qi
e
U(0, 0 + iβ) = eihβ,pi
per opportuni p, q; quindi esistono 2n + 1 generatori per la rappresentazione del
gruppo tali che
1
[pk , qj ] = δkj T
i
Dato che a noi interessano operatori che verifichino le relazioni di Heisenberg o,
equivalentemente, quelle di Weyl, dobbiamo considerare solo le rappresentazioni
tali che T = I.
Osserviamo che Hn è connesso e semplicemente connesso: possiamo quindi,
per mezzo del teorema di Nelson 16.4.2, determinarne le rappresentazioni a partire da quelle della sua algebra di Lie. L’algebra di Lie hn del gruppo di Heisenberg
è ovviamente (come spazio vettoriale) somma diretta di R e Cn (algebre di Lie
banali); il prodotto è desunto da quello del gruppo:
[(z, λ), (z 0 , λ0 )] = (0, 2σ(z, z 0 ))
Notiamo inoltre che la forma simplettica σ : Cn ∧ Cn −→ C determina un 2cociclo sull’algebra di Lie: questo è ovvio se scriviamo la mappa esponenziale
exp : hn −→ Hn : usiamo la rappresentazione matriciale che abbiamo dato per il
gruppo di Heisenberg.
680
Capitolo 18. Quantizzazione canonica
Per prima cosa, osserviamo che le
0
0
0
matrici di Hn sono della forma
xT t
0 y
0 0
con x, y ∈ Cn e t ∈ R; allora
1 xT t + 12 σ(x, y)
0 xT t
y
exp 0 0 y = 0 1
0 0 0
0 0
1
In questo caso la mappa esponenziale è quindi un diffeomorfismo fra il gruppo
Hn e la sua algebra di Lie hn .
Consideriamo una rappresentazione dell’algebra di Lie hn , i cui generatori
siano p1 , ..., pn ,q1 , ..., qn e I; per applicare il teorema di Nelson 16.4.2 necessita
che l’operatore
1X 1
(p + qj2 )
2 j j
sia essenzialmente autoaggiunto (si tratta dell’hamiltoniano dell’oscillatore armonico (} = m = mω = 1)): lo dimostreremo alla fine di questo capitolo.
18.3
Teorema di Stone–von Neumann
Affronteremo ora la dimostrazione del seguente e fondamentale teorema che
stabilisce la canonicità della rappresentazione di Schrödinger (e quindi, ad esempio, implica la sua equivalenza alla rappresentazione di Heisenberg).
18.3.1 Teorema di unicità (Stone–von Neumann) Ogni rappresentazione
unitaria irriducibile delle relazioni di Weyl su Cn è isomorfa alla rappresentazione di Schrödinger.
che implicherà il teorema di unicità di Dirac–Dixmier per la rappresentazione
di Schrödinger: combinando infatti questo risultato col teorema di Nelson 16.4.2
otteniamo il
18.3.2 Corollario Ogni rappresentazione delle relazioni di Weyl in Cn è somma
diretta di copie della rappresentazione di Schrödinger.
Procediamo ora nella dimostrazione del teorema di Stone–von Neumann: si
tratta di dimostrare in sostanza che il gruppo di Heisenberg possiede, a meno di
equivalenze unitarie, la sola rappresentazione di Schrödinger come rappresentazione irriducibile unitaria.
18.3. Teorema di Stone–von Neumann
681
L’algebra di gruppo L1 (Hn , dµ) del gruppo di Heisenberg: è un’algebra di
Banach non commutativa (non lo è il gruppo): sia J C L1 (Hn ) un suo ideale
chiuso, tale che le rappresentazioni che verificano la
U(0, λ) = eiλ
siano zero su J, e sia
π : L1 (Hn ) −→ L1 (Hn )/J −→ B(H)
la rappresentazione associata a U; per questo possiamo ad esempio considerare
l’ideale delle funzioni tali che
Z
eiλ f (z, λ)dλ = 0
(si tratta ovviamente di uno *-ideale bilatero chiuso). Descriviamo ora il quoziente L1 (Hn )/J: un elemento dell’algebra L1 (Hn ) possiamo immaginarlo come
una funzione
λ 7−→ f (z, λ)
la cui trasformata di Fourier sia
µ 7−→ fb(z, µ)
Quozientare per J significa allora valutare la trasformata di Fourier in λ = 1:
fb(z, 1). Quindi, dato che, per ogni f, g ∈ L1 (Hn ),
Z
(f ∗σ g)(z, λ) :=
f (z 0 , λ0 )g((z 0 , λ0 )−1 (z, λ))d(z 0 , λ0 )
Z HZn
=
f (z 0 , λ0 )g(z − z 0 , λ − λ0 + σ(−z 0 , z))dz 0 dλ0
R
Cn
si trova che
f\
∗σ g(z, s) =
Z
Cn
0
fb(z 0 , s0 )g(z − z 0 , s)e−iσ(z ,z)s dz 0
1
e quindi, in L (Hn )/J la convoluzione è
f\
∗σ g(z, 1)
sicché, come *-algebra di Banach, è isomorfa a L1 (Cn ) con l’involuzione f ∗ (z) =
f (−z) e il prodotto:
Z
Z
0
0 iσ(z 0 ,z)
0
(f ∗σ g)(z) :=
f (z )g(z − z )e
dz =
f (z − ζ)g(ζ)eiσ(z−ζ,z) dζ
n
n
C
ZC
−iσ(ζ,z)
=
f (z − ζ)g(ζ)e
dζ
Cn
682
Capitolo 18. Quantizzazione canonica
Quindi le rappresentazioni non degeneri di L1 (Cn ) col prodotto ∗σ sono in corrispondenza biunivoca con le rappresentazioni delle relazioni di Weyl per mezzo
della
Z
π(f ) =
f (z)W (z)dz
Cn
Infatti
W (z)π(f ) = π(f(z) )
iσ(z,z 0 )
ove f(z) (z 0 ) = e
f (z 0 − z), pertanto
Z
π(f )π(g) = f (z)g(z 0 )W (z)W (z 0 )dzdz 0
Z
0
= f (z)g(z 0 )eiσ(z,z ) W (z + z 0 )dzdz 0
Z
= f (z)g(ζ − z)eiσ(z,ζ) W (ζ)dζ = π(f ∗σ g)
Inoltre
Z
(f ∗σ g)(ζ) =
Z
f (z)g(ζ − z)e
iσ(z,ζ)
dz =
0
f (ζ − z 0 )g(z 0 )e−iσ(z ,ζ) dz 0
Per dimostrare il teorema di Stone–von Neumann ci basterà quindi dimostrare
che l’algebra L1 (Cn , ∗σ ) possiede un’unica rappresentazione irriducibile.
18.3.3 Lemma Per ogni rappresentazione π 6= 0 di L1 (Cn , ∗σ ) e ogni funzione
f tale che π(f ) = 0 si ha f = 0.
Dimostrazione: Abbiamo W (z)π(f )W (z)−1 = 0, dato che
Z
Z
W (z) f (ζ)W (ζ)dζW (−z) = f (ζ)W (z + ζ)eiσ(z,ζ) dζW (−z)
Z
= f (ζ)W (ζ)ei(σ(z+ζ,−z)+σ(z,ζ)) dζ
=π(f (z) )
ove f (z) (ζ) = e2iσ(z,ζ) f (ζ), cioè
∀x, y ∈ H
ovvero
Z
e2iσ(z,ζ) f (ζ)(x, W (ζ)y)dζ = 0
\
f · (x,
W (−)y) = 0
sicché f · (x, W (−)y) = 0 q.o. da cui f = 0 q.o. il che vuol dire che f = 0 come
elemento di L1 (Cn ).
qed
683
18.3. Teorema di Stone–von Neumann
Ora introduciamo la funzione
f0 (z) :=
(con ||z|| =
P
1 − 1 ||z||2
e 4
(2π)n
|zj |2 ); f0 è tale che
f0∗ ∗ f0 = f0 ⇒ f0 = f0∗
ed inoltre
18.3.4 Lemma ∀f ∈ L1 (Cn )
f0 ∗ f ∗ f0 = ω(f )f0
Dimostrazione: Basta far vedere che
f0 ∗ f0 (ζ) = ω0 (ζ)f0
(∗)
con ω0 (0) = 1. Infatti2 , se è vera la (*):
Z
Z
g ∗ f = g(ζ)f(ζ) dζ = g(ζ)f (z − ζ)eiσ(ζ,z) dz
e quindi, dato che
Z
ω0 (f ) =
ω0 (ζ)f (ζ)dζ
si ha
f ∗ ∗ f0 (0) = f0 (0)
Z
Ma
(f0 ∗ f0(w) )(z) =
0
f0 (z − z 0 )f(w) (z 0 )eiσ(z,z ) dz 0
0
e f0 (z 0 − w)eiσ(w,z ) = f0(w) , quindi
Z
(f0 ∗ f0(w) )(z) =
2
0
0
f0 (z − z 0 )f (z 0 − w)ei(σ(z,z )+σ(w,z )) dz 0
Si rammenti che (per antisimmetricità di σ):
Z
Z
Z
f (z)W (ζ)W (z)dz = f (z)eiσ(ζ,z) W (ζ − z)dz f (z − ζ)eiσ(ζ,z) W (z)dz = π(f(ζ) )
ove f(ζ) (z) = eiσ(ζ,z) f (z − ζ).
684
Capitolo 18. Quantizzazione canonica
Dunque, per definizione di f0 :
Z
1
1
0 2
0
2
0
0
(f0 ∗ f0(w) )(z) =
e− 4 (||z−z || +||z −w|| )+i(σ(z,z )+σ(w,z )) dz 0
2n
(2π)
Z
1
1
2 1
2 1
2 1
0
0
0
=
e− 2 ||z|| − 4 ||z|| − 4 ||w|| + 2 (Re(z,z )+Re(w,z )+i Im(z ,w+z)) dz 0
2n
(2π)
Z
1
− 14 ||z||2 − 14 ||w||2
− 12 ||z 0 ||2 + 12 (z 0 ,w+z)
=
dz 0
e
e
(2π)2n
Z
1
1
0 2 1 0
− 14 ||w||2
e− 2 ||z || + 2 (z ,w+z) dz 0
=f0 (z)e
2n
(2π)
Per avere la nostra tesi dobbiamo mostrare che
Z
1
1
0 2 1 0
e− 2 ||z || + 2 (z ,w+z) dz 0 = 1
2n
(2π)
Z
Ma
− 12 ||z 0 ||2 + 21 (z 0 ,z+w)
e
Z
0
dz =
0
0
e− 2 (z ,z +w+z) dz 0
1
e quindi basta dimostrare l’identità
Z
1
1
e− 2 a(a+b) da1 da2 = 1
2π
che segue osservando che
µ
(a1 − ia2 )(a1 + ia2 + b) =
da cui
1
2π
Z
− 12 a(a+b)
e
Ne segue che
1
da1 da2 = √
2π
Z
b
a1 +
2
2
− 12 (a1 +i 2b )
e
¶2
µ
b
+ a2 − i
2
1
da1 = √
2π
Z
¶2
e− 2 a1 da1 = 1
1 2
(f0 ∗ f0(w) )(z) = f0 (z)e− 4 ||w||
1
Z
e
ω0 (f ) =
2
f0 (z)e− 4 ||z|| dz
1
2
qed
Ora consideriamo una rappresentazione irriducibile π non degenere (quindi
π(f0 ) 6= 0); se E0 := π(f0 ) allora abbiamo dimostrato che
E0∗ E0 = E0
e
E0 π(f )E0 = ω0 (f )E0
18.4. Regole di commutazione e completa riducibilità
685
Possiamo dunque, analogamente a quanto fatto per la costruzione GNS, considerare l’operatore unitario U tale che, se {eα } è una base:
Uαβ π(f )eβ = π(f )eα
cioè πα ∼
= πβ e πα è irriducibile:
(eα , π(f )eα ) = ω0 (f )
Ma la rappresentazione di Schrödinger πS è irriducibile e quindi esiste un vettore
Ω tale che
(Ω, πS (f )Ω) = ω0 (f )
(vedremo in realtà che Ω è il vettore di stato dello stato fondamentale dell’oscillatore armonico).
Questo implica il teorema di unicità di Stone–von Neumann.
18.4
Regole di commutazione e completa riducibilità
Il teorema di completa decomposizione di una rappresentazione delle regole di commutazione di Weyl in somma diretta di copie della rappresentazione
di Schrödinger è stato ottenuto nella sezione precedente come conseguenza del
teorema di unicità di Stone–von Neumann e del teorema di Nelson 16.4.2 sull’integrazione di rappresentazioni di algebre di Lie ai gruppi corrispondenti: qui
dimostreremo il teorema di completa riducibilità direttamente, senza ricorrere
alla teoria di Nelson.
Consideriamo la C*-algebra A inviluppante della *-algebra di Banach L1 (Cn , ∗σ ):
dato che le rappresentazioni di quest’ultima sono in corrispondenza biunivoca con
le rappresentazioni non degeneri delle regole di commutazione di Weyl, queste
sono anche in corrispondenza biunivoca con le rappresentazioni non degeneri di
A.
Ora dimostriamo un risultato generale
18.4.1 Lemma Se B è una *-algebra di Banach e E0 ∈ B è un idempotente
autoaggiunto tale che
• Se π è una rappresentazione di B allora π(E0 ) = 0 implica π(B) = 0.
• E0 BE0 = E0 C.
• B ammette rappresentazioni fedeli su spazi di Hilbert separabili.
allora la C*-algebra A inviluppante di B è la C*-algebra degli operatori compatti
su H.
686
Capitolo 18. Quantizzazione canonica
Dimostrazione: Sia π una rappresentazione irriducibile di B; π(E0 ) idempotente autoaggiunto è un proiettore di rango 1, quindi π(E0 )∈K(H) e π(A)π(E0 )π(B)
è un operatore di rango 1 (π(E0 ) è un proiettore) e se
|ΩihΩ| := π(E0 )
allora
|π(A)Ωihπ(B ∗ )Ω|
P
Dunque una somma finita del tipo
π(A)π(E0 )π(B) ha rango finito; ma la
chiusura in norma di queste somme è un sottospazio dell’algebra degli operatori
compatti.
Alternativamente: si consideri la C*-algebra inviluppante A e l’intersezione
π(A) ∩ K(H)
la cui controimmagine in π(B) è un ideale bilatero chiuso J che non può essere
proprio, altrimenti le rappresentazioni del quoziente indurrebbero delle rappresentazioni di A nulle su J e quindi nulle su E0 : la (1) implicherebbe allora che
π(B) = 0, i.e. che J possiede solo la rappresentazione nulla e quindi J = A.
Questo dimostra che π(A) ⊂ K(H).
Il viceversa, K(H) ⊂ π(A), si ottiene immediatamente per ciclicità della
rappresentazione π.
qed
Se π0 è una rappresentazione irriducibile allora π0 (A) = K(H) e la mappa
A 7−→ π0 (A) è una isometria di le C*-algebre, dato che
π0 (A)
0
...
0
0
π0 (A) ...
0
M
π0 (A)
π(A) = ..
..
.. =
.
.
···
.
0
0
... π0 (A)
In particolare ||π(A)|| = ||π0 (A)|| = ||A||, quindi A ∼
= K(H) i.e.
A∗∗ ∼
= B(H)
(algebra di von Neumann inviluppante della C*-algebra A): in effetti π
b(A) =
⊕α π0 (A) è la rappresentazione universale.
In generale, se G è un gruppo topologico localmente compatto commutativo
possiamo scrivere su di esso le relazioni di Weyl: consideriamo due rappresentazioni unitarie in uno spazio di Hilbert H
V : G −→ U(H)
e
b −→ U(H)
U :G
18.4. Regole di commutazione e completa riducibilità
687
tali che
U (χ)V (g) = χ(g)V (g)U (χ)
Ad esempio, considerando la rappresentazione regolare di G, L2 (G) abbiamo
(U (χ)f )(g) = χ(g)f (g)
e
(V (h)f )(g) = f (gh)
Il seguente teorema di Mackey generalizza allora la teoria svolta per il gruppo di
Heisenberg:
Teorema. (U, V ) è la sola rappresentazione irriducibile delle relazioni di Weyl
su G.
Anche in questo ambito più generale esiste un teorema di unicità alla Stone–
von Neumann. Notiamo comunque che queste generalizzazioni si limitano al caso
localmente compatto: ad esempio se X è uno spazio vettoriale topologico non di
dimensione finita, non possiamo dire nulla di tutto ciò: possiamo comunque (e
questo sarà fatto nel prossimo capitolo) sfruttare la linearità di X per considerare
delle forme simplettiche e definire un gruppo di Heisenberg HX = X o R per
il quale potremo scrivere delle regole di commutazione di Weyl: tuttavia non
avremo più l’unicità, che è propria del caso di dimensione finita, e che giustifica
la terminologia “quantizzazione canonica” data a questa teoria.
Riassumiamo la procedura di quantizzazione3 fin qui considerata: abbiamo
definito
Z
π(f ) = f (z)W (z)dz
ove l’operatore di von Neumann soddisfa alle relazioni di Weyl
0
W (z)W (z 0 ) = eiσ(z,z ) W (z + z 0 )
Ciò induce un gruppo a un parametro fortemente continuo che, per il teorema di
Stone 14.3.6, possiamo scrivere come
λ 7−→ W (λz) = eiλA
ove A = (α, q) + i(β, p), se z = α + iβ:
¶
¶
µ
µµX
¶
X
∂
∂
1 ∂
1
W (z)
αk
+
βk
W (λz)
= (α, q) + i(β, p)
=
i ∂λ
∂αk
∂βk
z=0
λ=0 i
Quindi, se fb ∈ F(L1 ) ⊂ C0 (R2n ) è la trasformata di Fourier:
Z
b
f (q, p) := f (α, β)ei((α,q)+(β,p)) dβdβ = π(f )
3
Dovuta a Wigner, Von Neumann e Moyal.
688
Capitolo 18. Quantizzazione canonica
allora π(f )∗ = π(f ) equivale a f ∗ (z) = f (−z), i.e. fb∗ = fb e quindi fb è autoaggiunto.
Se fb è reale allora fb(q, p) è compatto; se fb è continua, fb(q, p) è nucleare
(tracciabile).
Dimostriamo ora il teorema di completa riducibilità, che abbiamo già dedotto
dal teorema di Nelson 16.4.2 e dal teorema di unicità di Stone–von Neumann.
18.4.2 Teorema Se {qk , pk } è una rappresentazione delle regole di commutazione di Heisenberg per mezzo di operatori hermitiani su un dominio comune D,
denso e invariante, e se
1X 2
A0 =
(pk + qk2 )
2
è essenzialmente autoaggiunto su D allora la rappresentazione è somma diretta
di copie della rappresentazione di Schrödinger.
Dimostrazione: Considereremo per semplicità il caso n = 1; per ipotesi abbiamo gli operatori autoaggiunti p, q che soddisfano le regole di Heisenberg e posseggono un dominio comune (denso) D invariante per essi (basta in realtà che D
sia contenuto nei domini di p, q e [p, q]) e sappiamo che l’operatore A0 = p2 + q 2
è essenzialmente autoaggiunto sul dominio D.
Se A = A0 ne è la chiusura, allora A è un operatore autoaggiunto definito
positivo (perché A0 è hermitiano definito positivo) e se
1
η := √ p0 − iq0
2
(ove p0 e q0 sono operatori definiti su D) allora η è definito su D, come pure lo
è p0 + iq0 , sicché
1
√ (p0 + iq0 ) ⊂ η ∗
2
∗
∗
Ma η η e ηη sono autoaggiunti definiti positivi (essendo chiusi, teorema di von
Neumann 13.1.8) e soddisfano alle
1
η ∗ η|D = (p20 + q02 ) −
2
1
ηη ∗ |D = (p20 + q02 ) +
2
i
[p0 , q0 ]
2
i
[p0 , q0 ]
2
cioè η ∗ η|D = A0 − 12 I e ηη ∗ |D = A0 + 12 I; ma A0 è essenzialmente autoaggiunto,
e A0 ⊂ η ∗ η + 12 I implicano
1
A = η∗η + I
2
e
1
A0 = ηη ∗ − I
2
18.4. Regole di commutazione e completa riducibilità
689
Dato che Dη∗ η = Dηη∗ , se η = |η|V è la decomposizione polare di η allora
D|η| = Dη∗ = Dη
e quindi ker η 6= 0 mentre ker η ∗ = 0; infatti4 A ≥ 0 e, se x ∈ ker η ∗ allora
1
(x, Ax) = η ∗ x, η ∗ x) − (x, x)
2
dunque x = 0 (per positività di A); se fosse ker η = 0 allora, per unitarietà di V
(V V ∗ = I), avremmo
µ
¶
1
1
1
∗
2 ∗
2
2
A + I = ηη = V |η| V ⇒ A = |η| + I = V |η| − I V ∗
2
2
2
e quindi AV ∗ = V ∗ A + I. A sarebbe dunque unitariamente equivalente a |η|2 −
1
I=A − I, i.e. per ogni n ∈ Z: A ∼
= A + nI, col che lo spettro di A sarebbe
2
Z-invariante e A e quindi illimitato sia inferiormente che superiormente, il che
è assurdo, dato che A è definito positivo. Ne segue che V non è un operatore
unitario, ma solo una isometria parziale, e ker η 6= 0.
Sia ora x0 ∈ker η con ||x0 || = 1 e completiamo {x0 } a un sistema ortonormale,
definendo
xn := V ∗n x0
Questi sono tutti vettori di norma 1. Si rammenti che se V ∗ è una isometria
parziale, allora
AV ∗ = V ∗ (A + I)
(†)
e quindi A|im V ∗ è unitariamente equivalente a (A + I)||imV ∗ ; allora, se n < m:
(xn , xm ) = (V ∗n x0 , V ∗n V ∗m−n x0 ) = (x0 , V ∗m−n x0 ) = (V x0 , V ∗m−n x0 ) = 0
(dato che V x0 = 0: x0 ∈ ker η). Quindi {xn } è un sistema ortonormale; inoltre
ogni xn appartiene al dominio di definizione di A, dato che, per induzione dalla
(†):
AV ∗n = V ∗n (A + In)
e quindi, dato che η ∗ η = A − 12 I e x0 ∈ ker η:
¶
µ
n ´
1
Axn = A + I x0 = n +
xn
2
2
√
Dunque |η|2 xn = nxn , cioè |η|xn = nxn , per il calcolo funzionale.
³
4
(x, A0 x) = 12 (||px||2 + ||qx||2 ) ≥ 0
690
Capitolo 18. Quantizzazione canonica
Si noti che V ∗ xn = xn+1 e che V è lo shift unilaterale:
(
0
se n = 0
V xn =
xn−1 se n > 0
Da questo segue che
ηxn = |η|V xn =
√
η ∗ xn = |η|V ∗ xn =
cioè che
Ora:
sicché
(
0
nV xn = √
√
nxn−1
se n = 0
se n > 0
n + 1xn+1
1
xn = √ η ∗n x0
n!
1
p|Dp ∩Dq ⊂ √ (η ∗ + η)
2
e
1
q|Dp ∩Dq ⊂ √ (η ∗ − η)
i 2
1
p = √ (η ∗ + η)
2
e
1
q = √ (η ∗ − η)
i 2
ovvero
1
1
√ (η ∗ + η) ⊂ p
√ (η ∗ − η) ⊂ q
e
2
i 2
Dunque, per ogni xn ∈ Dp ∩ Dq :
´
´
√
√
1 ³√
1 ³√
nxn−1 + n + 1xn+1 , qxn = √
n + 1xn+1 − nxn−1
pxn = √
2
i 2
Assumiamo momentaneamente il
18.4.3 Lemma Per ogni n, xn è un vettore analitico intero per p e q.
e dimostriamo il teorema con questo assunto: per prima cosa, se (p, q) è una
rappresentazione irriducibile allora ogni operatore lineare e continuo che commuti con p e q è multiplo dell’identità I; vogliamo ora dimostrare che il sistema
ortonormale {x0 , x1 , ...} costruito è una base hilbertiana, cioè che il sottospazio
M0 da esso generato è denso; ma questo equivale a dimostrare che il proiettore
ortogonale su questo sottospazio è I, e, come abbiamo osservato, per questo basta far vedere che commuta con p e q. Per assicurarcene, mostreremo che M0 è
un sottospazio stabile per i gruppi unitari generati da p e q.
In virtù del lemma, le serie
eiλp xn =
X (iλ)k
k≥0
k!
pk x n
e
eiµq xn =
X (iµ)k
k≥0
k!
q k xn
18.4. Regole di commutazione e completa riducibilità
691
convergono per ogni λ; quindi, dato che pk xn e q k xn sono combinazioni lineari di
vettori del sistema {x0 , x1 , ...}, le ridotte n-esime di questa serie esponenziale (le
somme parziali che la approssimano) appartengono al sottospazio M0 generato
dal sistema {x0 , x1 , ...}, quindi, se M = M0 è la chiusura di questo sottospazio:
eiλp M ⊂ M
e
eiµq M ⊂ M
Dunque l’irriducibilità della rappresentazione (p, q) implica che M coincide
con
ª
©
1
tutto lo spazio di Hilbert del sistema, e A si diagonalizza con spettro n + 2 .
Se supponiamo (p0 , q 0 ) essere un’altra rappresentazione irriducibile, possiamo
iterare la costruzione precedente ed esibire un sistema ortonormale {x0n }; allora,
l’operatore
U xn := x0n
è unitario; facciamo vedere che realizza una equivalenza unitaria fra le due rappresentazioni. Infatti (se M0 è il sottospazio generato dal sistema ortonormale
{x0n })
p0 |M00 U = p0 U |M0 = U p|M0
dato che U M0 = M00 . Analogamente per q e q 0 , quindi abbiamo le
U q0 = q00 U
e
U p0 = p00 U
e quindi U è un operatore di allacciamento fra le rappresentazioni: essendo
unitario, le rappresentazioni sono unitariamente equivalenti, considerando
q 0 = q00
e
p0 = p00
e ricordando che, per il teorema di Nelson 16.4.2:
U (q0 ) = q00 U
e
U (p0 ) = p00 U
Abbiamo cioè dimostrato che se la rappresentazione delle relazioni di Heisenberg
che soddisfa le ipotesi del teorema è irriducibile allora è unica, e quindi coincide
con la rappresentazione di Schrödinger; dimostriamo ora che se non è riducibile
è somma diretta di rappresentazioni irriducibili delle relazioni di Weyl, quindi di
copie della rappresentazione di Schrödinger.
Se la rappresentazione (p, q) non è irriducibile, allora consideriamo il sottospazio di Hilbert
H0 = ker η = ker V 6= 0
ed una sua base ortonormale {x(α) }; per ogni α abbiamo un sistema ortonormale
formato dagli elementi
1 ∗n (α)
(α)
x(α)
η x0 = V ∗n x0
n := √
n1
692
Capitolo 18. Quantizzazione canonica
Di nuovo questi elementi sono vettori analitici interi per p e q e costituiscono una
base ortonormale, dato che, se n < m:
(α)
(β)
(β)
(x(α)
n , xm ) = (x0 , xm−n ) = 0
Allora, per m = n:
(α)
(β)
(β)
(x(α)
n , xm ) = δnm (x0 , x0 ) = δnm δα,β
(per ortonormalità del sistema {x(α) }).
Consideriamo ora i complementi ortogonali di questi vettori analitici: si tratta
di sottospazi la cui somma è tutto H (altrimenti avremmo ker η = 0); definendo
(α)
Hα come il sottospazio chiuso generato dalla famiglia {xn }n per α fissato al
variare di n, allora
M
H=
Hα
α
e la restrizione della rappresentazione (p, q) al sottospazio Hα è unica a meno di
equivalenze unitarie: questo dà la decomposizione postulata dal teorema.
Non resta che da provare il lemma precedente: l’analiticità intera dei vettori
xn . Scrivendo η # per η oppure η ∗ , abbiamo che
||q k xn || = ||pk xn || = 2− 2 ||(η ± η ∗ )k xn || ≤ 2− 2 2k ||(η # )k xn ||
k
k
(sviluppando (η ± η ∗ )k e maggiorando col massimo dei 2k termini), e
r
k
k
k
(n + k)!
2− 2 2k ||(η # )k xn || ≤ 2k− 2 ||η ∗k xn || = 2k− 2
n!
√
(dato che η ∗ xn = n + 1xn+1 ). Ma allora la serie
p
X λk
X√
(n + k)!
1
||pk xn || ≤ √
( 2λ)k
k!
k!
n! k≥0
k≥0
converge per il criterio del rapporto.
qed
Abbiamo quindi dimostrato che ogni rappresentazione delle regole di commutazione di Heisenberg si decompone in somma diretta di rappresentazioni
irriducibili, unitariamente equivalenti alla rappresentazione di Schrödinger.
L’applicabilità del teorema è tuttavia condizionata dal supporre l’operatore
hamiltoniano dell’oscillatore armonico essenzialmente autoaggiunto. Vediamo che
questo accade effettivamente per almeno una rappresentazione.
18.4. Regole di commutazione e completa riducibilità
693
Consideriamo la rappresentazione di Schrödinger (pS , qS ) che opera nello spazio di Hilbert L2 (R, ds); questo spazio contiene le funzioni infinitamente differenziabili rapidamente decrescenti, cioè lo spazio di Schwartz S(R); scegliendo il
dominio D come
D = DpkS qSh
per h + k = 2, abbiamo che
S(R) ⊂ D
T
(in realtà vale un risultato più preciso: S = h,k DpkS qSh ).
Ci basta quindi dimostrare, per poter applicare il teorema precedente, che
1 2
(p + qS2 ) è essenzialmente autoaggiunto su S(R).
2 S
In effetti, esiste x0 tale che ηx0 = 0 e che tutti i vettori
1
xn = √ η ∗n x0
n
siano in S(R). Per vederlo dobbiamo risolvere l’equazione
1
i
√ (p − iq)x0 = 0 =⇒ − √ (x00 (s) + sx0 (s)) = 0
2
2
cioè x00 + sx0 = 0, che effettivamente ammette soluzioni
x0 (s) = ce− 2 s ∈ L2 (R)
1 2
Normalizzando queste soluzioni, ponendo cioè c = (2π)− 2 abbiamo che x0 ∈S(R),
come pure a decrescenza rapida è la funzione
µ
¶n
1
√ (p + iq) x0
i 2
1
dato che possiamo scrivere
µ
¶n
1
√ (p + iq) x0 (s) = Hn (s)x0 (s)
i 2
per opportuni polinomi Hn : incidentalmente questi polinomi sono esattamente
i polinomi di Hermite che avevamo incontrato nel capitolo ?? (a pagina 270)
nella costruzione di un sistema ortonormale per L2 (R) (nel quale, per giunta, la
trasformata di Fourier era in forma diagonale).
Abbiamo in questo modo diagonalizzato l’operatore 12 (p2 + q 2 ) che risulta
quindi essenzialmente autoaggiunto.
Capitolo 19
SECONDA QUANTIZZAZIONE
In questo capitolo proviamo ad estendere la teoria del precedente al caso di
sistemi con infiniti gradi di libertà: come vedremo la teoria non è più canonica, ma
potremo comunque stabilire delle notevoli generalizzazioni che ci consentiranno
di costruire lo spazio di Fock, dando cosı̀ un esempio di modello per la teoria dei
campi (seppure in un caso semplicissimo: il campo libero).
19.1
Prodotti tensoriali e limiti induttivi.
Introduciamo qui alcune nozioni necessarie per trattare la generalizzazione
a sistemi con infiniti gradi di libertà della teoria svolta in precedenza, ed in
particolare il concetto di prodotto tensoriale di spazi di Hilbert, che consente di
formalizzare la nozione di indipendenza fra sistemi quantistici.
Consideriamo due spazi di Hilbert H e K e costruiamone il prodotto tensoriale
algebrico H £ K nel modo usuale; possiamo rendere questo prodotto tensoriale
uno spazio pre-hilbertiano definendo il prodotto
X
X
X
(
xi £ xi ,
x0i £ yi0 ) :=
(xi x0j )H (yi , yj0 )K
i
i
i,j
Definiamo ora H ⊗ K semplicemente come il completamento di H £ K rispetto
a questo prodotto1 .
Consideriamo ora z ∈ H ⊗ K e due basi ortonormali {eα } di H e {fβ } di K.
Per definizione (precisamente per la proprietà universale) {eα ⊗ fβ } è una base
ortonormale di H ⊗ K e, per ogni x ∈ H e y ∈ K,
fz (x, y) := (z, x ⊗ y)
1
b
In genere si denota con V ⊗ W il prodotto tensoriale algebrico e con V ⊗W
quello
hilbertiano: per non confonderci, qui usiamo una notazione diversa.
694
19.1. Prodotti tensoriali e limiti induttivi.
695
è una forma bilineare tale che
X
|f (eα , fβ )|2 < ∞
α,β
La fz si dice forma di Hilbert–Schmidt e, come ci si può aspettare:
19.1.1 Proposizione H ⊗ K ∼
= {fz | fz forma di HS}
Possiamo dare anche un’altra realizzazione dello spazio H ⊗ K considerando
la forma sesquilineare
g(x, y) := (z, x ⊗ y)
e l’operatore T : K −→ H (lineare e continuo) ad essa associato tale che
(z, x ⊗ y) = (x, T y)
e che
tr T ∗ T =
X
X
X
(fβ , T ∗ T fβ ) =
||T fβ ||2 =
|(eα , T eβ )|2 < ∞
β
β
α,β
(usando la norma degli operatori nucleari).
Possiamo quindi identificare H ⊗ K con lo spazio degli operatori di Hilbert–
Schmidt T : K −→ H con
tr Tz∗ Tz0 = (z, z 0 )
Si riduce ad una semplice osservazione la seguente
19.1.2 Proposizione Se H e K sono spazi di Hilbert e K = M ⊕ N allora
H⊗K ∼
= (H ⊗ M ) ⊕ (H ⊗ N )
Naturalmente possiamo generalizzare
L al caso in cui K sia somma di una
famiglia di sottospazi di Hilbert: K = α Nα ; in questo caso otteniamo
M
H⊗K ∼
H ⊗ Nα
=
α
Ad esempio, se {eα } è una base ortonormale di K e Nα = C allora
M
H⊗K ∼
H
=
α∈A
(dato che i prodotti tensoriali sono presi sui complessi V ⊗C ∼
= V ), ove Card A =
dim K.
696
Capitolo 19. Seconda quantizzazione
Ora rammentiamo che B(H) è un’algebra di von Neumann il cui preduale
M = B(H)∗ è lo spazio delle funzioni lineari ultra-debolmente continue su B(H)
e tale che
X
∀f ∈ M (f, A) =
(xi , Ayi )
con
P
i
||xi || < ∞ e
2
P
i
i
||yi || < ∞; cioè x, y ∈
2
L
He
(f, A) = (x, π(A)y)
ove π(A)(⊕xi ) = ⊕Axi . Possiamo quindi osservare che
H ⊕ H ⊕ ··· ∼
=H⊗K
ove K è uno spazio di Hilbert separabile (l2 (N) ad esempio) e π(A) si ottiene
come prodotto tensoriale di operatori, che viene definito nel modo seguente: se
H e K sono spazi di Hilbert con A ∈ B(H) e B ∈ B(K) allora possiamo definire
l’operatore A ⊗ B ∈ B(H ⊗ K) come
A ⊗ B(x ⊗ y) = Ax ⊗ By
per ogni x∈Ch e y ∈K (questa definizione è ben posta per la proprietà universale
del prodotto tensoriale), in modo che
||A ⊗ B|| = ||A|| · ||B||
Ovviamente esistono due immersioni isometriche
B(H) −→ B(H ⊗ K)
A 7−→ A ⊗ I
B(K) −→ B(H ⊗ K)
B 7−→ I ⊗ B
Effettivamente sussiste il seguente teorema di von Neumann e Murray:
(B(H) ⊗ I)0 = I ⊗ B(H)
(I ⊗ B(K))0 = B(K) ⊗ I
Torniamo ora al caso precedente: avevamo dim K = ℵ0 , ed una base ortonormale
(en ) di K in modo che
X
M
H⊗K =
H ⊗ en C ∼
H
=
n∈N
n∈N
L
il che induce la decomposizione A ⊗ I ∼
= n A e quindi
π(A) ∼
=A⊗I
sicché
(f, A) = (z, A ⊗ Iz 0 )
Si osservi che in generale, se π1 e π2 sono rappresentazioni di una C*-algebra
allora π1 ≈ π2 se e solo se π1 ⊗ I ∼
= π2 ⊗ I.
19.1. Prodotti tensoriali e limiti induttivi.
697
Richiamiamo ora brevemente la nozione di limite induttivo di spazi vettoriali
(si tratta in realtà di una nozione che si estende a categorie più generali di oggetti:
anelli, gruppi, &c.): consideriamo una successione {Xn } di spazi vettoriali ed una
successione
fmn : Xm −→ Xn
di applicazioni lineari definite per m ≤ n in modo che
• fnn : Xn −→ Xn sia l’applicazione identica;
• se m ≤ n e l ≤ m allora fln = fmn ◦ flm .
Si dice che le successioni {Xn } e {fmn } formano un sistema induttivo (o sistema
diretto); partendo da un sistema induttivo, possiamo costruire un nuovo spazio
vettoriale X nel modo seguente: consideriamo la somma diretta
S=
M
Xn
n∈N
Ovviamente ciascun Xn si identifica ad un sottospazio di S, e possiamo considerare il sottospazio T di S generato dagli elementi della forma
xm − fmn (xm )
Allora si pone X := S/T ; in questo modo, X è una somma diretta degli spazi
{Xn } nei quali però gli elementi di indice abbastanza grande sono identificati
fra loro. Evidentemente, le inclusioni Xn ⊂ S e la proiezione S −→ X = S/T si
compongono a fornire le applicazioni lineari
fn : Xn −→ X
Per la (2) si ha ovviamente che, se m ≤ n:
(3)
fm = fn ◦ fmn
Si scrive
X = lim Xn
−→
n∈N
e si dice che X è il limite induttivo del sistema induttivo dato.
Il tratto fondamentale dei limiti induttivi è la seguente proprietà universale,
che li caratterizza:
698
Capitolo 19. Seconda quantizzazione
19.1.3 Lemma Ogni elemento x ∈ X si esprime nella forma fn (xn ) per qualche
n ∈ N e xn ∈ Xn .
Dimostrazione: Supponiamo che x∈X; allora, per costruzione, x è della forma
s = xi1 + · · · + xik
ove xij ∈ Xij tenendo conto che xij = fij n (xij ) se ij ≤ n. Allora, per n =
max(i1 , ..., ik ) otteniamo che
xi1 + · · · + xik = fi1 n (xi1 ) + · · · + fik n (xik
che è un elemento di Xn , chiamiamolo yn ; quindi, per la (3):
fn (yn ) = fn (fi1 n (xi1 ) + · · · + fik n (xik )) = fn ◦ fi1 n (xi1 ) + · · · + fn ◦ fik n (xik )
= fi1 (xi1 ) + · · · + fi1 (xik ) = xi1 + · · · + xik = x
cioè x = fn (yn ) con yn ∈ Xn , come volevamo.
qed
19.1.4 Teorema Se ({Xn }, {fmn }) è un sistema induttivo e se Y è uno spazio
vettoriale tale che esista una successione di applicazioni lineari {gn : Xi −→ Y }
tali che
∀m ≤ n gm = gn ◦ fmn
allora esiste un’unica applicazione lineare g : X −→ Y tale che
∀n ∈ N gn = g ◦ fn
Viceversa un insieme X che soddisfa questa proprietà è isomorfo a lim Xn .
−→ n
Dimostrazione: Supponiamo che X = lim Xn : dimostriamo che vale la pro−→ n
prietà universale; per il lemma, possiamo immediatamente esibire la funzione
g:
g(x) = gn (xn )
ove x = fn (xn ) per il lemma. Allora gn = g ◦ fn per definizione.
Il viceversa è ovvio: se un insieme soddisfa alla proprietà universale del limite
induttivo, per Y = lim Xn otteniamo una mappa h : X −→ lim Xn che inverte
−→ n
−→ n
la g : lim Xn −→ X, che viene quindi ad essere un isomorfismo.
−→ n
qed
19.1. Prodotti tensoriali e limiti induttivi.
699
19.1.5 Esempio Se consideriamo una successione di sottospazi {Xn } di uno
spazio vettoriale X fissato tali che se m ≤ n allora Xm ⊂ Xn , il limite induttivo
di questa successione (rispetto alle inclusioni fmn : Xm ,→ Xn ) è la somma di
tutti i sottospazi {Xn }, vale a dire lo spazio da essi generato.
Una interessante proprietà dei limiti induttivi è il loro comportamento rispetto ai prodotti tensoriali: consideriamo un sistema diretto ({Xn }, {fmn }) di spazi
vettoriali ed uno spazio vettoriale Y : è immediato che ({Xn ⊗ Y }, {fmn ⊗ I}) è
un sistema diretto.
19.1.6 Teorema Ha luogo l’isomorfismo di spazi vettoriali
lim(Xn ⊗ Y ) = lim Xn ⊗ Y
−→
n∈N
−→
n∈N
Dimostrazione: Siano
X = lim Xn
−→
n∈N
W = lim(Xn ⊗ Y )
−→
n∈N
Per la proprietà universale otteniamo un unico operatore lineare
g : W −→ X ⊗ Y
ove le mappe gn sono le fn ⊗ I; si tratta di dimostrare che g è un isomorfismo.
Per farlo usiamo la proprietà universale dei prodotti tensoriali, dimostrando cioè
W la soddisfa ed è quindi isomorfo a X ⊗ Y : consideriamo quindi le funzioni
bilineari
hn : Xn × Y −→ Xn ⊗ Y
date dalla definizione di prodotto tensoriale (gn (xn , y) = xn ⊗ y). Possiamo, per
mezzo di esse, definire la funzione lineare
h : X × Y −→ W
come
h(x ⊗ y) = hn (xn ⊗ y)
ove x = fn (xn ) per il lemma precedente. La funzione h è bilineare perché lo sono
le hn e dato che le fn sono lineari; quindi la proprietà universale del prodotto
tensoriale implica l’esistenza di una mappa lineare
k : X ⊗ Y −→ W
Di nuovo usando il lemma si ottiene che g e k sono l’una l’inversa dell’altra.
qed
Vogliamo ora approfondire il significato fisico del prodotto tensoriale.
700
Capitolo 19. Seconda quantizzazione
Consideriamo una successione {Hn } di spazi di Hilbert ed una successione
{Ωn } di vettori in essi (Ωn ∈ Xn ) con ||Ωn || = 1; possiamo definire, per x ∈ H1 ⊗
· · · ⊗ Hm
fmn := x ⊗ Ωm+1 ⊗ · · · ⊗ Ωn
Si verifica immediatamente che queste mappe e la successione {Hn } definiscono
un sistema diretto del quale possiamo considerare il limite induttivo
H = lim H1 ⊗ · · · ⊗ Hn
−→
n∈N
che è uno spazio prehilbertiano rispetto al prodotto scalare
(x, y) = (x ⊗ Ωn+1 ⊗ · · · , y ⊗ Ωm+1 ⊗ · · · )
e del quale possiamo considerare il completamento
{Ωn }
O
Hn
n∈N
19.1.7 Proposizione Se, per ogni n ∈ N, xn ∈ Hn e se la successione
Φn := x1 ⊗ · · · ⊗ xn ⊗ Ωn+1 ⊗ · · ·
è di Cauchy allora il suo limite è l’elemento x1 ⊗ x2 ⊗ · · · ∈
N{Ωn }
n∈N
Hn .
Dimostrazione: Sia Φ il limite della Φn e poniamo
Ω := Ω1 ⊗ Ω2 ⊗ · · ·
Allora
lim (Φn , Ω) = (Φ, Ω)
n−→∞
Q
cioè il prodotto n (xn , Ωn ) tende a (Φ, Ω). Ora usiamo il seguente lemma (che
non dimostreremo) di von Neumann: se zα sono vettori non nulli negli spazi di
Hilbert Hα allora
Y
X
zα = z 6= 0 ⇐⇒
|1 − zα | < ∞
α
α
701
19.1. Prodotti tensoriali e limiti induttivi.
P
Nel nostro caso troviamo che
n |1 − (xi , Ωi )| < ∞ e, viceversa, che se vale
questa condizione allora la successione {Φn } è di Cauchy. Infatti
||Φn − Φm ||2 = ||xm+1 ⊗ · · · ⊗ xn − Ωm+1 ⊗ · · · ⊗ Ωn ||2
n
¯¯ X
¯¯
Ωm+1 ⊗ · · · ⊗ Ωm+i ⊗ (xm+i+1 − Ωm+i+1 ) ⊗ xm+i+2 ⊗
= ¯¯
i=m+1
¯¯2
¯¯
⊗ · · · ⊗ xn ¯ ¯
≤
n
X
||xi − Ωi ||2 +
i=m+1
≤
X
2|1 − ci | +
X
X
Y
m+j+1
(1 − cm+i )(cm+j − 1)
i<j
ck
k=m+i+1
|1 − cm+j | · |cm+j − 1| < ε + ε2
i<j
ove ci := (Ωi , xi ), e tenendo conto che (xk − Ωk , xk ) = 1 − (Ωk , xk ), |ci | ≤ 1 (per
l’ipotesi ||xi || = 1) e che
X X
X
X
(
zj ,
zi ) =
||zi ||2 + Re
(zi , zj )
j
i
i
i<j
e
||yi − Ωi ||2 = 2 − 2 Re(ci ) ≤ 2|1 − ci |
qed
Spieghiamo ora la rilevanza fisica di questi concetti: consideriamo due sistemi
quantistici S e S 0 totalmente indipendenti, Q e Q0 delle questioni (cfr. 17.1)
relative a questi sistemi e ω, ω 0 stati di S e S 0 ; allora ω(Q) esprime la probabilità
di trovare la proprietà Q nello stato ω, e quindi la probabilità che nel sistema
congiunto formato da S e S 0 le Q e Q0 siano simultaneamente verificate nei
rispettivi stati è
ω(Q)ω 0 (Q0 )
Ad esempio, se gli stati sono puri, avremo che
ω(Q) = (ξ, Qξ) ,
ω 0 (Q0 ) = (ξ 0 , Q0 ξ 0 )
Se consideriamo H ⊗ H0 , gli stati puri corrispondono agli elementi ξ ⊗ ξ 0 e
(ξ ⊗ ξ 0 , Q ⊗ Q0 (ξ ⊗ ξ 0 )) = ω(Q)ω 0 (Q0 )
Se il sistema si evolve nel tempo come
U (t) = eiHt ,
U 0 (t) = eitH
0
702
Capitolo 19. Seconda quantizzazione
allora, sempre nell’ipotesi dell’indipendenza dei due sistemi, nel sistema congiunto abbiamo
e (t)(ξ ⊗ ξ 0 ) = U (t)ξ ⊗ U 0 (t)ξ 0
U
cioè
e(t) = U (t) ⊗ U 0 (t)
Il generatore di questo gruppo è
µ
¶
1 d e
e
H=
U (t)
= H ⊗ I + I ⊗ H0
i dt
t=0
(formula di Leibniz).
Più in generale, se esiste un’interazione fra i sistemi S e S 0 , il sistema congiunto è ancora descritto da H ⊗ H0 ma l’evoluzione temporale subisce una
perturbazione
K = H ⊗ I + I ⊗ H0 + V
Ricordiamo che nel nostro approccio ai fenomeni quantistici abbiamo modellizzato il sistema microscopico S scindendo il processo di misura (concretamente: lo
strumento stesso di misura) in una parte microscopica A ed una macroscopica M :
dobbiamo allora immaginare S e A come sistemi da comporre per tenere conto
dell’influenza del processo di misura stesso sul fenomeno da misurare. Se prima
della misura lo stato del sistema è ω, dopo la misura di una questione E = E ∗ E
lo stato è ancora ω se ω(E) = 1 o ω(I − E) = 1; se lo stato ω, dopo il processo
di misurazione, è tale che ω(E) 6= 1, 0 allora si ha un miscuglio statistico
ω(E)ω1 + ω(I − E)ω0
Gli stati ω0 , ω1 sono determinati come segue: diagonalizziamo per mezzo di un
autoaggiunto A dell’algebra degli osservabili
PE : A 7−→ ESE + (I − E)A(I − E)
e consideriamo
ω 0 (A) = ω(EAE) + ω((I − E)A(I − E))
Allora
ω1 (A) =
ω(EAE)
ω(E)
ω0 (A) =
ω((I − E)A(I − E))
ω(I − E)
Una evoluzione temporale
ω 7−→ ω ◦ αt
manda stati puri in stati puri e la misura
ω 7−→ ω(E)ω1 + ω(I − E)ω0
703
19.2. Rappresentazione di Fock
manda stati puri in miscugli statistici: si presentano in questo modo diversi fenomeni (riduzione del pacchetto d’onda, paradosso di Podolskij–Einstein–Rosen,
gatto di Schrödinger...).
Una spiegazione di questa situazione, seguendo von Neumann, procede come
segue: supponiamo che, prima della misura, S sia nello stato x0 e A in ψ0 , sicché
il sistema composto sia nello stato x0 ⊗ ψ0 ; dopo una interazione di lunghezza T
abbiamo
U (T ) = U
operatore unitario che trasforma x0 ⊗ ψ0 in un nuovo stato
U (x0 ⊗ ψ0 ) = Ex0 ⊗ ψ1 + (I − E)x0 ⊗ ψ2
ove le ψi sono tali che
(ψ1 , ψ2 ) = 0
||ψi || = 1
L’osservazione di von Neumann è che ciò descrive il processo di misura, dato che
ogni stato di B(H) si scrive
ω(A) = tr(T A) = (z, A ⊗ Iz)
per un opportuno vettore z di norma 1. Dunque lo stato è restrizione a B(H) di
uno stato puro di B(H ⊗ K), e
(U x0 ⊗ ξ0 , A ⊗ I(U x0 ⊗ ξ0 )) = (Ex0 , AEx0 ) + ω((I − E)A(I − E)) + 0
dove 0 sono i termini non diagonali: (ψ1 , ψ2 ) = 0), il che spiega perché ω 7−→ ωαg
porti stati puri in stati puri mentre ω 7−→ ω(E)ω1 + ω(I − E)ω2 porti stati puri
in miscugli statistici.
19.2
Rappresentazione di Fock
Consideriamo qui sistemi con infiniti gradi di libertà: vogliamo per prima cosa
scrivere in questo caso le relazioni di Weyl:
0
W (z)W (z 0 ) = eiσ(z,z ) W (z + z 0 )
ove σ(z, z 0 ) = 12 Im(z, z 0 ). Nel caso di infiniti gradi di libertà, le variabili z non
varieranno più in uno spazio di dimensione finita Cn , ma in uno spazio vettoriale
topologico X qualsiasi; possiamo in ogni caso considerare una forma simplettica
fortemente non degenere σ su X ed il gruppo di Heisenberg
HX = X o R
704
Capitolo 19. Seconda quantizzazione
degli elementi (z, λ) ∈ X × R col prodotto
(z, λ)(z 0 , λ0 ) = (z + z 0 , λ + λ0 + σ(z, z 0 ))
Naturalmente HX è localmente compatto se e solo se dim X < ∞, nel qual caso
si tratta del gruppo di Heisenberg Hdim X .
Non possiamo quindi applicare a HX gran che della teoria dei gruppi topologici, che dipendeva in massima parte dall’integrale di Haar (che esiste solo nel
caso localmente compatto): ad esempio la teoria delle rappresentazioni non si
può dare come nel caso dei gruppi localmente compatti, per i quali l’abbiamo in
larga misura desunta dalla teoria delle rappresentazioni delle C*-algebre associate; un ponte fra le due teorie è il teorema di Bochner, la cui validità è del tutto
generale, e che ricordiamo qui di seguito:
Definizione. Una funzione ϕ : G −→ C si dice di tipo positivo se ϕ(e) = 1 e,
per ogni f : G −→ C a supporto finito:
X
f (g)f (h)ϕ(g −1 h) ≥ 0
g,h∈G
Se G è un gruppo topologico qualsiasi e U una rappresentazione (fortemente
continua) di G che possieda un vettore ciclico ξ, allora la funzione
ϕ(g) = (ξ, U (g)ξ)
è una funzione (continua) di tipo positivo: sappiamo che vale anche il viceversa:
Teorema. ϕ è una funzione di tipo positivo su G se e solo se esiste una rappresentazione unitaria U : G −→ U(H) tale che
ϕ(g) = (ξ, U (g)ξ)
ove ξ ∈ H è un vettore ciclico per U con ||ξ|| = 1. Inoltre ϕ è continua se e solo
se U è fortemente continua.
Ricordiamo come possiamo associare ad una funzione di tipo positivo una rappresentazione: data ϕ consideriamo lo spazio vettoriale delle funzioni a supporto
finito con la forma sesquilineare
X
hp, qi :=
p(g)q(h)ϕ(g −1 h)
g,h∈G
Ovviamente hp, pi ≥ 0 e, quozientando per il sottospazio delle funzioni p tali che
hp, pi = 0 e completando si ottiene uno spazio di Hilbert H sul quale gli operatori
U (g)[p] := [pg ]
705
19.2. Rappresentazione di Fock
(con [p] si indica la classe in H della funzione a supporto finito p) definiscono la
rappresentazione unitaria richiesta.
Se ϕ è continua allora U è fortemente continua:
g−→e
||U (g)U (h)ξ − U (h)ξ||2 −−−→ 0
Infatti, se ϕ −→ 1 per g −→ e:
||U (g)U (h)ξ − U (h)ξ|| =2 − 2 Re(U (h)ξ, U (gh)ξ) = 2 − 2 Re(ξ, U (h−1 gh)ξ)
g−→e
=2 − 2 Re ϕ(h−1 gh) −−−→ 0
g−→e
(dato che h−1 gh −−−→ e).
qed
Ispirati da questo risultato, proviamo a cercare delle funzioni di tipo positivo
nel caso del gruppo di Heisenberg HX .
Supponiamo ad esempio che, come nel caso di un numero finito di gradi
di libertà, X sia uno spazio pre-hilbertiano, con prodotto scalare (.) e quindi
definiamo
1
σ(z, z 0 ) = Im(z, z 0 )
2
Evidentemente la funzione ϕ : HX −→ R
(†)
ϕ(z, λ) := eiλ e− 4 ||z||
1
2
è di tipo positivo, oltre che continua nella topologia di HX prodotto della topologia di R con la topologia su X indotta dalla seminorma ||.||.
19.2.1 Definizione La rappresentazione unitaria fortemente continua U associata alla funzione di tipo positivo (†) si dice rappresentazione di Fock.
Notiamo che se X è uno spazio vettoriale e σ una forma simplettica su X e
U(z, λ) = eiλ U(z, 0) = eiλ W (z)
vogliamo che questa rappresentazione unitaria possegga almeno la proprietà di
continuità seguente: per ogni fissato z ∈ X, la funzione
λ 7−→ W (λz)
è fortemente continua. In questo caso infatti, possiamo usare il teorema di Stone
14.3.6 per dedurre che W (λz) = eiλΦ(z) .
706
Capitolo 19. Seconda quantizzazione
19.2.2 Teorema La rappresentazione di Fock esiste, è fortemente continua ed
irriducibile.
Dimostrazione: Dimostriamo che la ϕ definita in (†) è una funzione continua
di tipo positivo, il che ci darà la prima parte del teorema.
Se g1 , ..., gn ∈ HX sono elementi della forma gi = (zi , λi ) allora zk sta in un
sottospazio Xk di dimensione finita di X e, dato che X è pre-hilbertiano, Xk è
isomorfo ad uno spazio di Hilbert Cnk ; in questi spazi la
X
cj ch ϕ(gj−1 gh ) ≥ 0
j,h
è soddisfatta, dato che la ϕ è di tipo positivo in Cnk .
Dimostriamo ora che la rappresentazione di Fock associata alla funzione ϕ è
irriducibile. Sia (WF , ΩF ) la rappresentazione ciclica delle relazioni di Weyl associata a σ(z, z 0 ) = 12 Im(z, z 0 ) e determinata dalla ϕ; possiamo allora considerare la
C*-algebra A ottenuta chiudendo in norma la *-algebra generata dagli operatori
della rappresentazione WF , cioè la chiusura in norma del sottospazio vettoriale
generato da WF (z) per z ∈ X: vogliamo dimostrare che A è irriducibile, nel senso
che lo stato definito da ΩF è uno stato puro.
(0)
Possiamo approssimare A come la chiusura An dei sottospazi An generati
da WF (z) (z ∈ Xn ):
[
[ 0)
A=
An =
An (∗)
n
n
ove la corrispondenza n 7−→ An conserva l’ordine (n < m implica An ⊂ Am ).
Se ω ∈ S(A) è uno stato tale che ω|An è puro allora ω è puro in A, dato che,
scrivendo ω = αω1 + βω2 si trova
ω|An = αω1 |An + βω2 |An
e quindi, per purezza si ω|An , ω1 − ω2 è nullo su An per ogni n, sicché ω è puro,
per la (*). Quindi
Ã
!
X
X
1
2
ω
cj WF (zj ) =
cj e− 4 ||zj ||
j
j
Se prendiamo zj ∈ Xn allora, se ΩS è la rappresentazione di Schrödinger, e Xn è
identificato a Cn per mezzo dell’isomorfismo unitario V , si ha (per la (*)):
ωn := ω|An = (ΩSdim Xn , WS (VZ )ΩSdim Xn ) = e− 4 ||V z|| = e− 4 ||z||
1
2
1
2
L’irriducibilità della rappresentazione di Schrödinger implica allora la purezza
dello stato ω.
qed
707
19.2. Rappresentazione di Fock
Abbiamo quindi determinato, con la rappresentazione di Fock, una rappresentazione irriducibile fortemente continua delle relazioni di Weyl:
0
WF (x)WF (x0 ) = eiσ(x,x ) WF (x + x0 )
e è il completamento di X la forte continuità di WF ci
Osserviamo che se H = X
dice che per ogni x ∈ H, per ogni successione (xn ) in X convergente a x si ha
lim WF (xn ) = WF (x)
n∈N
Ma {WF (x)}x∈X · ΩF è un sottospazio la cui chiusura è una rappresentazione
ciclica delle relazioni di Weyl: questa chiusura è
{WF (x)}x∈X · ΩF = {Sottosp. vett. generato da WF (x)}x∈H · ΩF
(per la forte continuità); in altri termini possiamo tranquillamente considerare
H in luogo di X. Ci riferiremo quindi anche a Γ(H) = Γ(X) come allo spazio di
Fock.
Vogliamo ora discutere la covarianza della rappresentazione di Fock , ovvero
la sua funtorialità.
Consideriamo quindi un operatore unitario U ∈ U(H): allora2
e− 4 ||x|| = e− 4 ||U x||
1
1
2
2
e definiamo
(∗)
Γ(U )WF (x)ΩF = WF (Ux )ΩF
Intanto mostriamo che la posizione (*) ha senso: basta evidentemente ragionare
sul sottospazio denso di H: l’operatore
Ã
!
X
X
Γ(U )
ai WF (xi )ΩF =
ai WF (xi )ΩF
i
i
esiste ed è isometrico. La funzione
U 7−→ Γ(U )
α
Si rammenti che se A è una C*-algebra e G −
→ Aut(A) e ω ∈ S(A) allora per ogni g ∈ G
tale che ω ◦ αg = ω, se πω è la GNS, la rappresentazione (πω , Uω ) è covariante:
2
∀A ∈ A
Uω (g)πω (A)ξω = πω (αg (A))ξω
708
Capitolo 19. Seconda quantizzazione
è una rappresentazione del gruppo unitario U(H):
Γ(U )Γ(U 0 ) = Γ(U U 0 )
precisamente una rappresentazione unitaria fortemente continua da U(H) munito della topologia forte a U(Γ(H)) pure topologizzato con la topologia forte.
fortemente
Nuovamente ragionando sul sottoinsieme denso troviamo che, se Uα −−−−−−→ U
allora
fortemente
Γ(Uα )WF (x)ΩF −−−−−−→ Γ(U )WF (x)ΩF
Questo, ed il fatto che
WF (Uα x)ΩF −→ WF (U x)ΩF
ci permettono di concludere che
19.2.3 Teorema Γ è un funtore, la rappresentazione di Fock è irriducibile,
fortemente continua e Γ(C) = L2 (R, ds).
Vale inoltre la seguente “proprietà esponenziale” del funtore Γ:
Γ(H1 ⊕ H2 ) = Γ(H1 ) ⊗ Γ(H2 )
Si tratta di chiedersi se esista un operatore unitario V tale che
(2)
(2)
(1)
(1)
V WF (x ⊕ y)ΩF := WF (x)ΩF ⊗ WF (y)ΩF
Intanto osserviamo che, se un tale V esiste, allora
(†)
0
0
0
0
(WF (x ⊕ y)ΩF , WF (x0 ⊕ y 0 )ΩF ) = e−iσ(x⊕y,x ⊕y ) e− 4 ||x ⊕y −x⊕y||
1
2
Infatti:
(WF (x0 )ΩF ⊗ WF (y 0 )ΩF , WF (x)ΩF ⊗ WF (y)ΩF ) =
(1)
(1)
0
0
0
(2)
(2)
(1)
(1)
(2)
(2)
0
=e−iσ(x,x ) e− 4 ||x −x|| e−iσ(y,y ) e− 4 ||y −y|| ‡)
1
2
1
2
(()
(la forma simplettica σ è la parte immaginaria del prodotto hilbertiano, quindi i
secondi membri della (†) e (‡) sono uguali).
Quindi l’operatore V effettivamente esiste ed è tale che
V : Γ(H) −→ Γ(H1 ) ⊗ Γ(H2 )
con
V WF (x ⊕ y) = WF (x) ⊕ WF (y)V
il che dimostra la prima parte del seguente
709
19.2. Rappresentazione di Fock
19.2.4 Teorema
Γ(H ⊕ K) = Γ(H) ⊗ Γ(K)
e, più in generale:
Γ
Ã
M
!
Hα
(n)
{ΩF }
O
=
Γ(Hα ))
α
α
Dimostrazione: Per definizione x ∈ H ⇐⇒ x =
X
||x||2 =
||xn ||2
P∞
n=1
xn con
n
La definizione di V si legge allora come
!
̰
∞
X
O
(n)
(n)
xn Ω F =
WF (xn )ΩF
V WF
n=1
Ora ricordiamo che
(WF (xn )ΩF , ΩF ) = e− 4 ||xn ||
(n)
e quindi che, se
(∗)
n=1
1
(n)
(n)
2
¯
X ¯¯
1
2¯
¯1 − e− 4 ||xn || ¯ < ∞
n
(si tratta della condizione affinché il prodotto tensoriale di infiniti termini sia
definito) allora possiamo definire V come nel caso di n = 2: in effetti la (*) è
verificata, dato che
∀λ ≥ 0 1 − e−λ ≤ λ
e quindi possiamo scrivere
X
X
P
P 0
P 0 2
1 P
(WF (
xn )ΩF , WF (
xn )ΩF ) = e−iσ( n xn , n xn ) e− 4 || n xn − n xn ||
n
n
P
0
P
0
= e−i n σ(xn ,xn ) e− 4 n ||xn −xn ||
Y
1
0 2
0
=
eiσ(xn ,xn ) e− 4 ||xn −xn ||
1
2
n
Y (n)
(n)
(n)
(n)
=
(WF (xn )ΩF , WF (x0n )ΩF )
n
Possiamo cioè definire V come
V WF (x) =
∞
O
(n)
{ΩF }
(n)
WF (xn )V
n=1
qed
710
Capitolo 19. Seconda quantizzazione
19.2.5 Esempio
• Nel caso H = C si ha Γ(C) = L2 (R, ds) e W (z) = ei(αq+βp) , ove z = α + iβ
e q, p sono gli operatori della rappresentazione di Schrödinger.
• Se H è uno spazio di Hilbert separabile con base ortonormale {en } allora
∞
M
en C
H=
n=1
e quindi
Γ(H) =
∞
O
{ΩF }
L2 (R, ds)
n=1
ove ΩF = Ω0 è lo stato fondamentale dell’oscillatore armonico e
∞
Y
W (x) =
ei(αn q+βn p)
n=1
ove αn + iβn = (en , x): in altri termini Γ(H) descrive nel caso separabile
assemblee di oscillatori armonici.
19.3
Caratterizzazioni della rappresentazione di Fock
Cominciamo con l’osservare che, se U ∈ U(H) allora Γ(U ) ∈ U(Γ(H)) e
Γ(U )WF (x)Γ(U )−1 = WF (U x)
e
L∞
Quindi, se U Hi = Hi allora U = i=1 Ui e
∞
O
V Γ(U ) =
Γ(Ui )V
Γ(U )ΩF = ΩF
i=1
Vogliamo ora considerare una “versione infinitesimale” del funtore Γ: consideriamo
U (t) = eiAt
U è fortemente continuo in t e quindi anche Γ(U (t)) lo è (rispetto alla topologia
forte degli operatori), sicché
Γ(U (t)) = Γ(eiAt ) = eidΓ(A)t
ove, per il teorema di Stone 14.3.6, dΓ(A) esiste ed è unico: si tratta di una
rappresentazione di algebre di Lie.
Se consideriamo U (t) = eit I allora dΓ(I) è autoaggiunto ma non limitato, ed
è il numero delle particelle N ; si noti che
eiN t WF (x)e−iN t = WF (eit x)
e che
19.3. Caratterizzazioni della rappresentazione di Fock
711
19.3.1 Lemma N ΩF = 0
L
Si noti in generale che, se H = i Hi allora
∞
O
iλ
Γ(e ) =
Γ(n) (eiλ )
n=1
Ora, sia A =
L
n
An , quindi eiAt =
L
eiAn t sicché
n
(n)
{ΩF }
Γ(eiAt ) =
M
Γ(n) (eiAn t )
n
e
dΓ(A) =
∞
X
Bn
n=1
ove
Bn = I ⊗ I ⊗ · · · ⊗ I ⊗ dΓ(An ) ⊗ I ⊗ · · ·
ed il fattore chePnon è l’identità si trova al posto n-simo; osserviamo inoltre che
dΓ(I) = N = i Ni ove Ni è dΓ(1) (l’elemento 1 ∈ C) nel fattore n-simo e 1
altrove e dove, tenendo conto che
dΓ(1)Ωn = nΩn
si ha
1 2
(p + q 2 − I)
2
Ricordiamo ora che, se z = α + iβ, α, β ∈ Rn e
dΓ(1) = η ∗ η =
eiΦ(z) := ei((α,q)+(β,p)) = W (z)
le relazioni di Weyl
0
W (z)W (z 0 ) = eiσ(z,z ) W (z + z 0 )
implicano la regola di commutazione
[Φ(z), Φ(z 0 )] ⊂ 2iσ(z, z 0 )I
(dato che z 7−→ Φ(z) è R-lineare scriviamo z = α + iβ e z 0 = α0 + iβ 0 ed usiamo
la relazione di Heisenberg).
Questo vale anche in infiniti gradi di libertà, considerando z ∈ X (spazio
prehilbertiano) e, per ogni z ∈ X, la mappa
λ 7−→ W (λz)
712
Capitolo 19. Seconda quantizzazione
fortemente continua. Per il teorema di Stone 14.3.6:
W (λz) = eiλΦ(z)
ove Φ(z) è autoaggiunto e quindi
W (z) = eiΦ(z)
Se X 0 è un sottospazio di X di dimensione finita, WX 0 è fortemente continua e
quindi, pensando z, z 0 ∈ X 0 ⊂ X abbiamo che
[Φ(z), Φ(z 0 )] ⊂ 2iσ(z, z 0 )I
Rammentiamo che, nel caso di un grado di libertà:
Φ(z) = αq + βp
e si avevano gli operatori di creazione e distruzione
1
η = √ (p − iq)
2
Vogliamo imitare questa costruzione nel caso di infiniti gradi di libertà.
Cominciamo con l’osservare che p = Φ(i) e q = Φ(1), sicché la relazione
precedente diviene
1
η = √ (Φ(i) − Φ(1))
2
Scriviamo
1
a(z) := √ (Φ(iz) − iΦ(z))
2
ed osserviamo che (antilinearità di z 7−→ a(z)).
1
i
a(iz) = √ (−Φ(z) − iΦ(iz)) = − √ (Φ(iz) − iΦ(z)) = −ia(z)
2
2
Ma allora
1
√ (Φ(iz) + iΦ(z)) ⊂ a(z)∗
2
sicché
[a(z), a(z 0 )] ⊂ 0
e
[a(z), a(z 0 )∗ ] ⊂ (z, z 0 )I
(ove (z, z 0 ) è il prodotto scalare in X) rammentando z, z 0 ∈ X 0 sottospazio finitodimensionale di X e la relazione per Φ.
19.3. Caratterizzazioni della rappresentazione di Fock
713
La rappresentazione di Fock possiede il vettore ciclico ΩF , il livello fondamentale dell’oscillatore armonico: ηΩF = 0, e si ha in questo caso
∀z ∈ H a(z)ΩF = 0
Si noti che ΩF è nell’intersezione dei domini di a e a∗ , e che
a(z1 )∗ · · · a(zn )∗ ΩF
è un vettore analitico intero per Φ(z) (si ricordi che η ∗n ΩF sono i vettori di stato
per i livelli eccitati dell’oscillatore armonico). La dimostrazione di questo fatto
procede come nel caso di un grado di libertà.
Sia A l’algebra generata dai polinomi negli operatori {Φ(z)}z∈H che applicati
a ΩF diano vettori analitici; dato che
{WF (z)ΩF }z∈H
è totale e che (teorema di Stone 14.3.6 ed analiticità di ΩF )
iΦ(z)
WF (z)ΩF = e
ΩF =
∞ n
X
i
n=0
n!
Φ(z)n ΩF
gli elementi di A applicati a ΩF sono uno spazio denso, cioè A possiede ΩF come
vettore ciclico, dato che la chiusura di tale algebra applicata a ΩF contiene un
sottoinsieme totale.
Osserviamo inoltre che
(
)
Y
a# (zi )ΩF
{zi }∈{Sottoinsiemi finiti di H}
i
è totale, ove a# rappresenta a oppure a∗ ; infatti nella stringa
a# a# · · ·
possiamo eliminare gli a, dato che
a# (z1 ) · · · a# (zn−2 )a(zn−1 )a(zn )∗ ΩF =a# (z1 ) · · · a# (zn−2 )[a(zn−1 ), a(zn )∗ ]ΩF +
+a# (z1 ) · · · a# (zn−2 )a(zn )∗ a(zn−1 )ΩF
Ora consideriamo il vettore
vn(z) := a(z1 )∗ · · · a(zn )∗ ΩF
Allora
714
Capitolo 19. Seconda quantizzazione
19.3.2 Lemma
X
(vn (z), vm (z 0 )) = δnm
(z1 ⊗ z2 ⊗ · · · ⊗ zm , U (p)z10 ⊗ · · · ⊗ zn0 )
p∈Sn
ove Sn è il gruppo simmetrico su n elementi e
U (p)(z1 ⊗ · · · ⊗ xn ) := xp−1 (1) ⊗ · · · ⊗ xp−1 (n)
è la rappresentazione unitaria di H⊗n data dall’azione di Sn .
Dimostrazione:
(vm (z), vn (z 0 )) =(a(z2 )∗ · · · a(zm )∗ ΩF , a(z1 )a(z10 )∗ a(z20 )∗ · · · a(zn0 )ΩF )
=(a(z2 )∗ · · · a(zm )∗ ΩF , [a(z1 ), a(z10 )∗ ]a(z20 )∗ · · · a(zn0 )ΩF )+
+ (a(z2 )∗ · · · a(zm )∗ ΩF , a(z10 )∗ a(z1 )a(z20 )∗ · · · a(zn0 )ΩF )
=(z1 , z10 )(a(z2 )∗ · · · a(zm )∗ ΩF , a(z20 )∗ · · · a(zn0 )ΩF )
Iterando il procedimento otteniamo
(vm (z), vn (z 0 )) =(z1 , z10 )(a(z2 )∗ · · · a(zm )∗ ΩF , a(z20 )∗ · · · a(zn0 )ΩF )+
+ (z1 , z20 )(a(z2 )∗ · · · a(zm )∗ ΩF , a(z10 )∗ a(z30 )∗ · · · a(zn0 )ΩF )
0
· · · + (z1 , zn0 )(a(z2 )∗ · · · a(zm )∗ ΩF , a(z10 )∗ · · · a(zn−1
)ΩF )
che è zero se n 6= m, dato che
(ΩF , a(x)∗ · · · a(y)∗ ΩF ) = 0
Altrimenti, se n = m, abbiamo che
(vm (z), vn (z 0 )) =
X
((z1 , zi1 )(z2 , zi02 ) · · · ) =
i1 i2 ···in
n
XY
(zi , zp0 −1 (i) )
p∈Sn i=1
ove i2 6= i1 e i3 6= i1 , i2 e... e in 6= i1 , ..., in−1 .
qed
In generale, se G è un gruppo finito e U : G −→ U(H) una rappresentazione
unitaria allora vige il teorema ergodico elementare:
X
1
E0 = E{x|∀g∈G U (g)x=x} =
U (g)
Card G g∈G
Nel caso del gruppo simmetrico Sn il secondo membro è il simmetrizzatore
1 X
S :=
U (p)
n! p∈S
n
19.3. Caratterizzazioni della rappresentazione di Fock
Lo spazio di Hilbert
715
S n H := S(H⊗n )
è la n-sima potenza simmetrica.
Consideriamo (z1 , ..., zn ) ∈ Hn ed associamogli
1
a(z1 )∗ · · · a(zn )∗ ΩF
n!
Possiamo inoltre associargli il simmetrizzatore S(z1 ⊗ · · · ⊗ zn ): per il lemma
esiste un operatore Vn tale che
µ
¶
1
∗
∗
Vn √ a(z1 ) · · · a(zn ) ΩF = S(z1 ⊗ · · · ⊗ zn )
n!
e
1
0
(vn (z), vm (z 0 )) = δnm (S(z1 ⊗ · · · ⊗ zm ), S(z10 ⊗ · · · ⊗ zm
))
n!
L’operatore Vn è unitario, sempre per il lemma, quindi
Γ(H) =
∞
M
Γn (H)
n=0
ove Γn (H) ∼
= S n H cioè lo spazio di Fock coincide con l’algebra dei tensori
simmetrici sullo spazio di Hilbert H.
Partendo da V0 (λΩF ) := λ ∈ C possiamo combinare i V1 , V2 , ... per ottenere
l’isomorfismo V : Γn (H) −→ S n H.
Possiamo ora capire come agiscono gli operatori di creazione e distruzione:
√
µ
¶
1
n+1
∗
∗
∗
a(z) √ a(z1 ) · · · a(zn ) ΩF = p
a(z)∗ a(z1 )∗ · · · a(zn )∗ ΩF
n!
(n + 1)!
L’aggiunto (si rammenti: z 7−→ a(z) è antilineare) è
´
³ 1
∗
∗
a(z) √ a(z1 ) · · · a(zn ) ΩF
n!
n
1 X
=√
(z1 , zi )a(z1 )∗ · · · a(zi−1 )∗ a(zi+1 )∗ · · · a(zn )∗ ΩF
n! i=1
n
1 X
1
=√
(z, zi ) p
a(z1 )∗ · · · a(zi−1 )∗ a(zi+1 )∗ · · · a(zn )a∗ ΩF
n i=1
(n − 1)!
Questo suggerisce la seguente caratterizzazione dello spazio di Fock:
Γ(H) =
∞
M
n=0
S nH
716
Capitolo 19. Seconda quantizzazione
con
a(z)∗ (S(x1 ⊗ · · · ⊗ xn )) :=
√
n + 1S(z ⊗ x1 ⊗ · · · ⊗ xn )
1 X
a(z)(S(x1 ⊗ · · · ⊗ xn )) := √
(z, xi )S(x1 ⊗ · · · ⊗ xi−1 ⊗ xi+1 ⊗ · · · ⊗ xn )
n i
ΩF := 1 ⊕ 0 ⊕ 0 ⊕ · · ·
Quindi
a(z)ΩF = 0
ed i campi di Segal si definiscono come
1
Φ(z) := √ (a(z)∗ − a(z))
i 2
Abbiamo quindi tre presentazioni equivalenti dello spazio di Fock:
• Come rappresentazione del gruppo di Heisenberg generata dalla rappresentazione
1
2
(z, λ) 7−→ eiλ e− 4 ||z||
• Come prodotto tensoriale hilbertiano
Γ(H) =
∞
O
{Ωn }
Γ(C)
n=1
• Come spazio dei tensori simmetrici:
Γ(H) =
∞
M
S nH
n=0
Vogliamo dare una ulteriore caratterizzazione: consideriamo la terza interpretazione di Γ(H) e le formule per gli operatori di creazione e distruzione:
x1 = x2 = · · · = xn
Allora
1
1
a(x)∗n ΩF = √ x⊗n
n!
n!
Ma ΩF è un vettore analitico, quindi possiamo definire
∞
X
1
∗
e :=
a(x)∗n ΩF = ea(z) ΩF
n!
n=0
x
19.3. Caratterizzazioni della rappresentazione di Fock
e constatare che
(ex , ey ) =
∞
X
(x, y)n
n!
n=0
717
= e(x,y)
Inoltre {e }x∈H è un insieme totale in H, dato che, per
x
x=
n
X
λ i zi
i=1
abbiamo
µ
∂ n ex
∂λ1 · · · ∂λn
¶
= a(z1 )∗ · · · a(zn )∗ ΩF
λ1 =···=λn =0
ed i vettori al secondo membro formano un insieme totale. Possiamo allora
considerare lo spazio E generato dagli elementi della forma ex con le relazioni
(ex , ey ) = e(x,y) , considerare in esso il sottospazio N dei vettori di lunghezza zero
e definire
Γ(H) = E/H
Notiamo che, avendosi
Γ(U )WF (x)Γ(U )−1 = WF (U x)
e
W (x) = eiΦ(x)
ne segue
Γ(U )Φ(x)Γ(U )−1 = Φ(U x)
cioè
Γ(U )a(x1 )∗ · · · a(xn )∗ ΩF = a(U x1 )∗ · · · a(xn )∗ ΩF
Quindi, se
Γn (U )S(x1 ⊗ · · · ⊗ xn ) := S(U x1 ⊗ · · · ⊗ U xn )
si ha pure
Γ(U ) =
∞
M
Γn (U )
n=0
e
dΓ(A) =
M
dΓn (A)
n
ove
dΓn (A) =
n
X
i=1
I ⊗ ··· ⊗ I ⊗ A ⊗ I ⊗ ··· ⊗ I
718
Capitolo 19. Seconda quantizzazione
(nel prodotto tensoriale i termini sono n e A figura all’i-simo.) Ad esempio
dΓn (I) = nI e dΓ(I) = N , autoaggiunto non limitato.
Si noti inoltre che se W (z) è ad esempio una rappresentazione irriducibile
delle relazioni di Weyl in un grado di libertà, allora
z 7−→ αz (A) := W (z)AW (z)−1
(con A ∈ B(H)) definisce un morfismo fortemente continuo di gruppi:
R2 −→ Aut B(H)
Non si tratta tuttavia di una rappresentazione unitaria, perché se lo fosse avremmo
αz (A) = Vz AVz−1
e la C*-algebra (commutativa!) generata dai Vz sarebbe quella dei W (z), che è
irriducibile: essendo commutativa ciò è impossibile.
In questo caso i teoremi di Wigner e Bargmann non sono soddisfatti, il che
dà conto dei fenomeni non relativistici della teoria.
19.4
Teorema di Gårding–Wightman
Consideriamo
Γ(H) ∼
=
∞
O
{Ω0 }
Γ(C)
n=1
ove {en } è una base ortonormale; abbiamo che
N∼
=
∞
X
I ⊗ I ⊗ · · · ⊗ η∗η ⊗ · · · ⊗ I
i=1
W(
X
i
λi ei ) ∼
=
∞
O
W (λn )
n=1
∞
X
X
∼
Φ(
λi ei ) =
I ⊗ · · · ⊗ (αn q + βn p) ⊗ · · · ⊗ I
i
n=1
sicché
a(en ) = I ⊗ · · · ⊗ I ⊗ η ⊗ I ⊗ · · ·
(il fattore non I si trova al posto n-simo) e
N=
∞
X
n=1
a(en )∗ a(en )
719
19.4. Teorema di Gårding–Wightman
Cioè, nella rappresentazione di Fock:
dΓ(I) = N =
∞
X
∗
a(en ) a(en ) =
n=1
∞
X
1
n=1
2
(p2n + qn2 − I)
Ora sia X lo spazio vettoriale dei vettori della forma
X
λi ei
i
ove λi hanno supporto finito; si tratta di uno spazio prehilbertiano denso in H
ed ha senso porre, per ogni x ∈ X:
∞
Y
X
W (x) = W (
W (λi ei )
λi ei ) =
i
i=1
Un risultato chiave è il
19.4.1 Teorema (Gårding–Wightman) La rappresentazione W è quasi equivalente alla rappresentazione di Fock se e solo se l’operatore
∞
X
a(en )∗ a(en )
n=1
è densamente definito.
Piuttosto che dimostrare questo teorema ci limitiamo a darne un esempio di
applicazione.
Si consideri una funzione
n : N \ {0} −→ N
i 7−→ ni
(cioè un elemento di (N \ {0})N ) e
X1
2
(p2i + qi2 − ni I)
Esiste una rappresentazione nella quale questo operatore è essenzialmente autoaggiunto; ma il teorema di Gårding–Wightman ci dice inoltre che per ogni
funzione n ∈ (N \ {0})N esiste una rappresentazione irriducibile Wn delle relazioni
di Weyl tale che questo operatore sia essenzialmente autoaggiunto e
Wn ∼
= Wn0 ⇐⇒ [n] = [n0 ]
720
Capitolo 19. Seconda quantizzazione
(le parentesi quadre denotano le classi di equivalenza modulo N0 , che è lo spazio
delle funzioni n∈(N\{0})N a supporto finito). Abbiamo cioè una infinità continua
di rappresentazioni irriducibili.
Stabiliamo ora una notazione: Ω0 è lo stato fondamentale dell’oscillatore
armonico in Γ(C), e Ωn lo stato eccitato n-simo:
1
Ωn = √ η ∗n Ω0
n!
(ηΩ0 = 0). Consideriamo
Hn :=
∞
O
{Ωni }
Γ(C)
i=1
e
∞
X
O
Wn (
λi ei ) =
W (λi )
i=1
che possiede solo un numero finito di fattori diversi da 1 (dato che le λi hanno
supporto finito; la Wn è irriducibile, il che si vede come nel caso della rappresentazione di Fock.
Definiamo ora un operatore N per Wn . Sia
b
eiN λ Wn (x)Ωn = Wn (eiλ x)Ωn
Questa posizione determina un operatore unitario se i prodotti scalari sono conservati, e se questo è vero la forte continuità implica che siamo in presenza di un
gruppo di unitari fortemente continuo e quindi, per il teorema di Stone 14.3.6,
b è autoaggiunto.
N
Ma si ha
∞
Y
(Wn (e x)Ωn , Wm (e x)Ωm ) = (W (eiλ λi )Ωni , W (eiλ , µi )Ωni )
iλ
iλ
i=1
∞
Y
= (eiλN W (λi )e−iλni Ωni , W (eiλ , µi )Ωni )
=
i=1
∞
Y
(eiλ(N −ni )I W (λi )Ωni , W (eiλ , µi )Ωni )
i=1
∞
Y
= (W (λi )Ωni , W (eiλ , µi )Ωni )
i=1
ove abbiamo usato
721
19.4. Teorema di Gårding–Wightman
• al secondo passaggio il fatto che in un grado di libertà si ha N = η ∗ η e
W (eiλ z) = eiN λ W (z)e−iN λ (z ∈ C);
∗
• nel terzo membro l’implicazione η ∗ ηΩn = nΩn ⇒ eiλη η Ωn = eiλn Ωn ;
• nell’ultimo passaggio l’unitarietà di eiλ(N −ni)I .
Ne segue che
iλ
Wn (e x)Ωn =
=
∞
O
j=1
∞
Y
iλ
W (e λj )Ωnj =
∞
O
eiλ(N −nj I) W (λj )Ωnj
j=1
eiλ(Nj −nj I)
∞
O
W (λj )Ωnj
j=1
j=1
P
(N
−n
I)
iλ ∞
j
j
j=1
Wn (x)Ωn
=e
ove
Nj = I ⊗ · · · ⊗ I ⊗ η ∗ η ⊗ I ⊗ · · · = a(ej )∗ a(ej )
(il fattore non identico figura al posto j-simo), sicché
b=
N
∞
X
(Nj − nj I)
j=1
Infine mostriamo che
Wn ∼
= Wn0 ⇐⇒ n − n0 ∈ N0
Che la condizione sia sufficiente è ovvio: se n − n0 ∈ N0 allora possiamo passare
da Ωn a Ωn0 senza cambiare la rappresentazione Hn (a meno di isomorfismi).
Per dimostrare che la condizione è necessaria, supponiamo n 6= n0 ; se fosse
Wn ∼
= Wn0 allora esisterebbe U unitario tale che
∀x ∈ X
U Wn (x)U −1 = Wn0 (x)
e, preso
Ωn =
∞
O
Ωnj ∈ Hn
j=1
avremmo
Φ := U (Ωn ) ∈
∞
O
{Ωn0 }
j
Γ(C)
j=1
Il vettore Φ verificherebbe cioè la
(Φ, Wn0 (x)Φ) = (U Ωn , U Wn (x)U −1 U Ωn ) = (Ωn , Wn (x)Ωn )
722
Ma se x ∈
Capitolo 19. Seconda quantizzazione
Pm
j=1 ej C
per un certo m, allora gli elementi
W (x) =
M
Ws(k) (x)
(somma di copie della rappresentazione di Schrödinger) generano un’algebra di
von Neumann che è della forma B(Hl ) ⊗ I, e dove Hm = ⊕m
j=1 ek jC.
Dunque, per ogni B ∈ B(Hl )
(Φ, B ⊗ IΦ) = (Ωn , B ⊗ IΩn )
Notiamo inoltre che, in questo caso, esisterebbe Tm ∈ (B(Hm ) ⊗ I)0 tale che
Tm Ωm = Φ
Infatti
B(H) ⊗ I ∼
=
(∞
M
)
A | A ∈ B(H)
i=1
(dato che H ⊗ K = ⊕i∈Card K H e quindi
0
(B(H) ⊗ I)0 ∼
= {⊕A}
che è un’algebra di matrici a blocchi negli elementi di C(H) (si confronti la
discussione sui teoremi di densità). Gli operatori di quest’algebra che hanno la
forma (aij I) ∈ ⊕H hanno come immagini in H ⊗ K gli elementi B ⊗ I e quindi
(B(H) ⊗ I)0 = I ⊗ B(K)
Ora
0
Hm ⊗ Hm
= Hn
ed abbiamo un vettore Φ tale che
(Φ, B ⊗ IΦ) = (Ω(m) ⊗ Ω0 , B ⊗ IΩ(m) ⊗ Ω0 )
cioè
Φ = Tm Ω(m) ⊗ Ω0 = Ω(m) ⊗ Ω00
Dunque
Φ = Ωn1 ⊗ Ωn2 ⊗ · · · ∈
∞
O
{Ωn0 }
j
Γ(C)
j=1
il che è possibile solo se n = n0 , dato che la successione
Ψm := Ωn1 ⊗ · · · ⊗ Ωnm ⊗ Ωn0m+1 ⊗ · · ·
723
19.5. Sul concetto di campo
è di Cauchy: se m À 0 e l > m:
||Ψm − Ψl ||2 < ε
Ma abbiamo anche
||Ψm − Ψl ||2 =||Ωnm+1 ⊗ · · · ⊗ Ωnl − Ωn0l+1 ⊗ · · · ⊗ Ωn0l ||
=2(1 − Re
l
Y
(Ωnk , Ωn0k )
k=m+1
che è 2 se n 6= n0 .
19.5
Sul concetto di campo
In Meccanica Quantistica3 un campo è una distribuzione a valori in un’algebra
di operatori, cioè una funzione lineare
A : S −→ A
ove S è lo spazio delle funzioni di Schwartz su R4 e A un’algebra di operatori
autoaggiunti su uno spazio di Hilbert H. Il caso al quale questa definizione si
ispira è
Z
A(f ) =
f (x)A(x)dx
Supponiamo che esista un D0 ⊂ H denso tale che per ogni f ∈ S si abbia D0 ⊂
DA(f ) (contenuto nel dominio dell’operatore A(f )) e tale che, per ogni ψ, ψ 0 ∈ D0 ,
la funzione
f 7−→ (ψA(f ), ψ 0 )
sia una distribuzione (cioè un elemento di S 0 ).
Una teoria dei campi consiste in una serie di assiomi per i campi stessi che rispondano alle esigenze fisiche e siano matematicamente coerenti; ne introdurremo
alcuni.
Osserviamo intanto che se A è la C*-algebra degli osservabili di un sistema
quantistico (in R4 visto come spazio-tempo) abbiamo in A delle sottoalgebre
A(O) associate ad aperti O di R4 , che immaginiamo come regioni limitate dello
spazio-tempo: tipicamente una tale regione sarà intersezioni di coni di luce, che
sono aperti stabili rispetto alle trasformazioni di Lorentz (la richiesta minima se
si vuole una compatibilità con la Relatività Ristretta).
3
Seguendo Wightman, Ph. Rev. 1956.
724
Capitolo 19. Seconda quantizzazione
Consideriamo dunque la famiglia K
dei coni “doppi”, cioè di coni la cui
intersezione sia un bordo spaziale: si
tratta di una famiglia di insiemi stabile per l’azione del gruppo di Poincaré.
Possiamo inoltre definire, per O ∈ K:
O0 := {y ∈ R4 | ∀x ∈ O ||y − x||2M < 0}
(ove ||.||M è la norma di Minkowski).
Si noti che, in generale, O ⊂ O00 ma
che
O ∈ K ⇒ O00 = O
(O ∈ K è causalmente completo). La funzione
O 7−→ A(O)
si dice corrispondenza di Haag–Kastler , e soddisfa alla seguente proprietà di
monotonia:
O1 ⊂ O2 ⇒ A(O1 ) ⊂ A(O2 )
Con ciò ({A(O)} è un insieme parzialmente ordinato dall’inclusione) la
corrispondenza di Haag-Kastler è un morfismo di insiemi ordinati.
Inoltre l’insieme
[
A(O)
O∈K
è una sotto-*-algebra di A e vogliamo imporre la condizione
A=
[
||−||
A(O)
O∈K
Veniamo ora ad un assioma fondamentale di ogni teoria dei campi:
19.5.1 Postulato di Località Siano O1 e O2 tali che non possano esservi segnali temporali (timelike) fra essi: in altri termini che siano causalmente disgiunti, vale a dire
O1 ⊂ O20
Allora
∀A1 ∈ A(O1 ) ∀A2 ∈ A(O2 )
[A1 , A2 ] = 0
725
19.5. Sul concetto di campo
Il significato di questo assioma è che eventi osservati in regioni dello spazio
che non possono comunicare fra loro debbono essere indipendenti.
Perché una teoria assiomatica soddisfi il requisito base della coerenza basta
far vedere che possiede un modello, vale a dire che ne esistono esempi: nel caso
delle teorie dei campi questo avviene costruendo i campi liberi.
Consideriamo lo spazio di Fock Γ(H) e la funzione Φ(x): vogliamo costruire
un campo libero, cioè una distribuzione a valori in Γ(H). Consideriamo H =
L2 (Ω+
m , dΩm ) (particella di massa m e spin 0) e ricordiamo che
dΩm (p) =
e
Z
Z
f (p)dΩ+
m
=
f
³p
p~2
dp
2p0
Z
´
dp
+ m , p~ p
=: f (p)δ(p2 − m2 )ε(p0 )dp
2
2
2 p~ + m
2
e che esiste la rappresentazione indotta
(U(a, Λ)f )(p) = eipa f (Λ−1 p)
Per f reale definiamo la distribuzione
³ ´
T f := fb
e quindi
Ω+
m
µ ¯
¯
ϕ(f ) := Φ fb¯
¶
Ω+
m
(Φ è lineare sulle funzioni reali) estendendola a funzioni complesse come
ϕ(f ) := ϕ(Re f ) + iϕ(Im f )
Su S agisce il gruppo di Poincaré come
g · f := fg
essendo g = (a, Λ) e
fg (x) = f (g −1 x)
Allora
T fg = U(g)T f
sicché, estendendo la rappresentazione allo spazio di Fock come
Υ(a, Λ) = Γ(U(a, Λ))
726
Capitolo 19. Seconda quantizzazione
per funtorialità otteniamo
Υ(g)Φ(x)Υ(g)−1 = Φ(U(g)x)
ovvero
ϕ(fg ) = Φ(T fg ) = Φ(U(g)T f ) = Υ(g)Φ(f )Υ(g)−1 = Υ(g)Tf Υ(g)−1
In altri termini il campo f 7−→ ϕ(f ) possiede una rappresentazione unitaria
fortemente continua del gruppo di Poincaré g 7−→ Υ(g) in modo che
Υ(g)T f Υ(g)−1 = ϕ(fg )
Notiamo che Υ(g)Ω = Ω.
Estendiamo ora la funzione R-lineare f 7−→ ϕ(f ) ai complessi nel modo ovvio:
ϕ(f ) := ϕ(f − 1) + iϕ(f2 )
e rammentiamo che
eiϕ(f ) = eiΦ(T f ) = W (T f )
da cui, per f, h ∈ S(R4 )
[ϕ(f ), ϕ(h)] = i Im(T f, T h)
ovvero
eiϕ(f ) eiϕ(h) = ei Im(T f,T h) eiϕ(h) eiϕ(f )
Si noti che T è un operatore di allacciamento:
T fg = Υ(g)T f
e quindi
e
Υ(g)W (x)Υ(g)−1 = W (U(g)x)
Υ(g)ϕ(f )Υ(g)−1 = ϕ(fg )
Per cui, se ϕ(f ) è una distribuzione regolare, della forma
Z
ϕ(f ) = f (x)ϕ(x)dx
allora
Υ(a, Λ)ϕ(x)Υ(a, Λ)−1 = ϕ(Λx + a)
727
19.5. Sul concetto di campo
Vogliamo ora presentare ϕ come soluzione di un’equazione differenziale (nel senso
delle distribuzioni): precisamente consideriamo l’equazione4
((¤ + m2 )ϕ)(f ) = ϕ((¤ + m2 )f )
Ma (usando le trasformate di Fourier)
(¤\
+ m2 )f (p) = (m2 − p2 )fb(p)
e quindi (p2 = m2 )
¯
¯
(¤\
+ m2 )f ¯
Ω+
m
=0
Dunque otteniamo, per la distribuzione T f = fb|Ω+m :
ϕ((¤ + m2 )f ) = Φ(T (¤ + m2 )f ) = 0
(dato che T (¤ + m2 )f = (¤\
+ m2 )f , il che ci permette di caratterizzare le ϕ
come soluzioni dell’equazione differenziale
(¤ + m2 )ϕ = 0
Ora consideriamo la questione dell’irriducibilità della nostra rappresentazione: intanto ricordiamo che la funzione
x 7−→ W (x)
(x ∈ H) è fortemente continua, quindi lo sono le
f 7−→ eiϕ(f )
e
f 7−→ ϕ(f )Φ
(f ∈SR (R4 ) e la topologia su S è data da ||T f ||2 = ||f ||2 ): per avere l’irriducibilità
basta quindi dimostrare il
19.5.2 Teorema L’immagine T SR (R4 ) è densa in H[m,0] .
Dimostrazione: Intanto osserviamo che
Z
dp
2
|fb(p)|2 p
||f || =
2
p~ + m2
Ω+
Z m
dp
=
|fb(p)|2 (1 + p~ 2 )2r (1 + p~ 2 )−2r p
≤ c||(1 + p~ 2 )rf ||2∞
2
2
+
p~ + m
Ωm
4
Si rammenti come si derivano le distribuzioni: T 0 (f ) = −T (f 0 ), sicché (∇T )f = T (∇f ) e
(¤T )f = T (¤f )
728
Capitolo 19. Seconda quantizzazione
p
con r opportuno, in modo che (1 + p~2 )−2r / p~2 + m2 sia in L1 e quindi abbia
luogo la maggiorazione, dove c è una costante. Ma
q(f ) := sup |(1 + p~2 )r f (p)|
p
è una seminorma per la topologia di S ed ovviamente ||f || ≤ q(f ), sicché la
norma ||.|| è continua per la topologia di S.
Dunque T manda insiemi densi in insiemi densi, sicché basta dimostrare il
teorema su
DR = {f ∈ SR | supp f compatto}
(che è denso in S).
2
3
Per farlo, consideriamo f : Ω+
m −→ C appartenente a L (R , dΩm ), vale a dire
tale che
Z
dp
|f (~p)|2 p
<∞
2 p~ 2 + m2
Ã
e definiamo
gb(p) := f (~p)h
p0 −
p
p~ 2 + m2
m
!
ove h ∈ D(R) è una funzione a supporto compatto tale che h(0) = 1 e supp h ⊂
(−1, 1); allora la gb ha supporto compatto e, se
gb1 (p) := gb(p) + gb(−p)
allora g1 ∈ S e
p
(T g1 )( p~ 2 + m2 , p) = f (~p)
729
19.5. Sul concetto di campo
(si rammenti che se f ∈ SR allora fb(p) = fb(−p)).
qed
Le distribuzioni che qui ha interesse considerare sono, rispetto alle variabili
spaziali, delle funzioni (infinitamente differenziabili) vere e proprie.
Ricordiamo ora che per le distribuzioni può definirsi un prodotto tensoriale
nel modo seguente: consideriamo F ∈ D(Rn )0 e G ∈ D(Rm )0 ; allora possiamo
definire una distribuzione F ⊗ G in D(Rn+m )0 come
hF ⊗ G, f ⊗ gi = hF, f ihG, gi
ove abbiamo usato l’isomorfismo
D(Rn ) ⊗ D(Rm ) ∼
= D(Rn+m )
che dà luogo al teorema del nucleo di L. Schwartz :
D(Rn )0 ⊗ D(Rm )0 ∼
= D(Rn+m )0
(i prodotti tensoriali sono definiti in modo unico perché questi spazi vettoriali
topologici sono nucleari: cfr. [31], p.531).
Il prodotto tensoriale di distribuzioni è una generalizzazione del prodotto di
misure, ed il teorema del nucleo può vedersi come una versione più generale del
teorema di Fubini.
19.5.3 Esempio Consideriamo una funzione g ∈ D(R3 ) e la misura di Dirac
δ0 ∈ D(R)0 concentrata in un punto x0 : possiamo considerare i prodotti tensoriali
f1 = δ0 ⊗ g
e
f2 = δ00 ⊗ g
(che sono distribuzioni in R4 , ove δ00 è la derivata nel senso delle distribuzioni,
cfr. capitolo ?? §4); allora
fb1 (p) = gb(~p)
fb2 (p) = ip0 gb(~p)
e
Formalmente:
Z
hf1 , ϕi =
Z
ϕ(0, ~x)g(~x)d~x
e
hf2 , ϕi =
ϕ0 (0, ~x)g(~x)d~x
Data la distribuzione T , consideriamo ora la funzione IT : SR (R4 )⊗SR (R4 ) −→
R definita come
IT (f, g) = − Im(T f, T g)
730
Capitolo 19. Seconda quantizzazione
Si tratta di una funzione bilineare e continua nelle due variabili rispetto alla
topologia di SR (R4 ). Per (a, Λ) ∈ P si ha
(T f(a,Λ) , T g(a,Λ) ) = (U(a, Λ)T f, U(a, Λ)T g) = (T f, T g)
e, formalmente, possiamo scrivere
Z
IT (f, g) = F (x, y)f (x)g(y)dxdy
cioè esprimere la funzione bilineare IT come un operatore integrale con nucleo F tale che F (x, y) = F (x + a, y + a). Inoltre, per invarianza rispetto alle
trasformazioni di Lorentz si ha
F (x, y) = ∆(x − y)
ove ∆(λz) = ∆(z) e ∆ è una distribuzione in R4 .
Naturalmente la distribuzione ∆ si comporta solo formalmente come un nucleo, ma possiamo comunque scrivere delle regole di commutazione5 almeno a
livello formale, usando il seguente ragionamento:
Z
Z
IT (f, g) = − Im T f (p)T g(p)dΩm = − Im fb(p)b
g (p)dΩ+
m
Z
³
´
1
p
b
b
=
f
(p)b
f
(p)b
g
(p)
d3 p
g
(p)
−
√
2 {p0 = p~2 +m2 }
2 p~2 + m2
f e g sono a valori reali, quindi fb(p) = fb(−p) e gb(p) = gb(−p), sicché
Z
−
1
dΩ+
m (p) − dΩm (p)
b
p
f
(p)b
=
g
(p)
2 {p0 =√p~2 +m2 }
p~2 + m2
b m (p)fb) = (g, ∆m ∗ f )
=(b
g, ∆
(nell’ultima formula integrale abbiamo integrato rispetto alla differenza delle
misure). Abbiamo cioè, a meno di scambiare l’ordine di g e f , la formula per il
nucleo:
Z
¡
¢
1
−
∆m (x) =
eipx dΩ+
m (p) − dΩm (p)
2
(2π)
5
La principale motivazione che von Neumann fornisce, nel suo trattato Mathematical Foundations of Quantum Mechanics [24], all’introduzione della teoria degli operatori negli spazi
di Hilbert come metodo matematico fondamentale per le questioni quantistiche, è proprio la
mancanza di rigore che la formulazione di Dirac [6] aveva all’epoca: il principale ostacolo era
l’impossibilità di scrivere gli usuali operatori, come la funzione hamiltoniana, in forma di operatori integrali: per questo Dirac faceva uso delle sue “funzioni improprie” la cui natura non
contraddittoria fu chiarita solo in seguito da Schwartz ed altri con l’introduzione del concetto
di “distribuzione”; si confronti specialmente i §I–3 e §III–6 del libro di Von Neumann.
19.5. Sul concetto di campo
731
Intuitivamente, abbiamo la seguente formula, anche se priva di senso:
[f (ϕ), g(ϕ)] = IT (f, g) = i(f, ∆ ∗ g) = i∆m (x − y)I
Si noti che, se ∆m ha supporto nel doppio cono di luce futuro/passato V , vale a
dire se per ogni f, g ∈ S i cui supporti siano spazialmente separati, l’integrale di
∆m sulle f e g dà ovviamente zero, dato che
[f (ϕ), g(ϕ)] = −[ϕ(x), ϕ(y)]
e quindi ∆(−z) = −∆(z); inoltre la ∆(λz) = ∆(z) (che è come dire h∆, fΛ i =
h∆, f i) implica ∆ = 0 sui vettori spacelike, perché possiamo scrivere
(−)
∆m (x) = ∆(+)
m (x) − ∆m (−x)
Quindi
Z
ϕ(x)f (x)dx = ϕ(x)
è tale che, se Im(T f, T g) = 0, allora eiλf (ϕ) = W (λT f ) e eiµg(ϕ) commutano in
senso forte: questo è il caso, ad esempio, se i supporti di f e g sono spazialmente
separati.
Naturalmente questo si ricollega al postulato di località: se
A(O) := {W (T f ) | f ∈ SR (R4 ) , supp f ⊂ O}00
e O1 , O2 sono aperti spazialmente separati, i.e. O1 ⊂ O20 allora W (T f ) e W (T g)
commutano (per ogni f ∈ A(O1 ) e g ∈ A(O2 )):
A(O1 ) ⊂ A(O2 )0
e viceversa.
In realtà si potrebbe dimostrare il seguente risultato
19.5.4 Teorema Se O ∈ K è un cono doppio e se consideriamo la C*-algebra
A(O0 ) generata dalle sottoalgebre {A(Oλ )}Oλ ⊂O0 allora
A(O) = A(O0 )0
(dualità di Araki).
dove l’inclusione A(O) ⊂ A(O0 )0 è ovvia.
Bibliografia
[1] V.I. Arnol’d, Metodi matematici della meccanica classica, Ed. Riuniti,
Roma, 1979.
[2] R. Abraham, J. Marsden, Foundations of Mechanics, Benjamin, 1978.
[3] C. Chevalley, Theory of Lie groups, I, Princeton Unversity Press, 1946.
[4] P.J. Cohen, Set Theory and Continuum Hypotesis, Benjamin, 1963.
[5] P.M. Cohn, Universal Algebra,, 1965.
[6] P.A.M. Dirac, The Principles of Quantum Mechanics, Oxford,.
[7] J. Dixmier, Les C*-algebres et leurs representations, Gauthier–Villairs.
[8] Dunford, Schwartz, Linear Operators. Spectral Theory. Vol II, Wiley.
[9] Haag, Local Quantum Physics, Springer.
[10] N. Jacobson Lie Algebras, Wiley, 1962.
[11] Kadison, Ringrose, Fundamentals of the Theory of operator Algebras Vol.
I, Addison–Wesley.
[12] Kadison, Ringrose, Fundamentals of the Theory of operator Algebras Vol.
II, Addison–Wesley.
[13] Y. Katznelson, An Introduction to Harmonic Analysis, Wiley.
[14] J. Kelley, General Topology, Van Nostrand.
[15] A.A. Kirillov, Elements of Representation Theory, Springer, 1976.
[16] Kirillov, Gvisiani, Teoremi e problemi dell’Analisi funzionale, MIR.
[17] S. Kobayashi, K. Nomizu Foundations of Differential Geometry, Vol.I,
Wiley, New York, 1963.
732
[18] A.I. Markuševič, Elementi di teoria delle funzioni analitiche, Editori
Riuniti, Roma, 1988.
[19] Montgomery, Zippin, Topological Transformation Groups,.
[20] F. Murray, An Introduction to Linear Transformations in Hilbert space
Princeton University Press, Princeton, 1941.
[21] M.A. Najmark, Normed Algebras, Van Nostrand.
[22] M.A. Najmark, A.I. Štern, Teoria delle rappresentazioni dei gruppi, Editori
Riuniti.
[23] E. Nelson, Topics in Dynamics, I: Flows, Princeton University Press,
Princeton.
[24] J. Von Neumann, Mathematical Foundations of Quantum Mechanics,
Princeton.
[25] J. von Neumann, Functional Operators, Vol.II, Princeton.
[26] L.S. Pontriagin, Topological Groups, Princeton, 1937.
[27] M.M. Postnikov, Lie Groups and Lie Algebras, MIR.
[28] Reed–Simon, Methods of Modern Mathematical Physics, Vol. I, Academic
Press.
[29] Reed–Simon, Methods of Modern Mathematical Physics, Vol. II, Academic
Press.
[30] H. Royden, Real Analysis, Addison–Wesley.
[31] F. Treves, Topological vector spaces: distributions and kernels, Academic
Press.
[32] A. Weil L’intégration dans les groupes topologiques et ses applications,
Hermann, Paris, 1940.
[33] H. Weyl, The theory of groups and quantum mechanics, Dover.
733
Indice analitico
A-limite, 504
G agisce su X, 124
σ-algebra, 82
σ-algebra di Borel, 82
σ(X, Y )-topologia, 243
p-gruppi, 128
p-gruppo, 128
*-algebra, 153
*-algebra normata, 284
*-modulo, 155
*-omomorfismo, 154
annullatore di S, 557
antiautomorfismo, 477
anticommutatività, 148
antitrasformata di Fourier, 231
antiunitario, 477
aperta, 30
aperti, 24
assemblee di oscillatori armonici, 710
assioma di scelta, 6
associativa, 148
assolutamente continua, 102, 188
attesa, 630
autoaggiunto, 154, 285
azione del gruppo sull’insieme, 124
a base numerabile, 26
abeliano, 118
algebra, 147
algebra di Banach, 282
algebra di Calkin, 473
algebra di gruppo, 521
algebra di Lie del gruppo, 602
algebra di sottoinsiemi, 81
algebra di von Neumann, 365
algebra di von Neumann inviluppante, 460
algebra esterna, 165, 166
algebra simmetrica, 162
algebra tensoriale, 161
algebre di Boole, 81
algebre di Lie, 598
amenabile, 531
analitica, 325
analitica in, 299
analitiche, 324
analitico, 548
anche non chiusi, 432
banale, 25, 134, 426, 618
base, 25
base di intorni, 26
base di seminorme, 239
base ortonormale, 208
base simplettica, 668
basica, 392
bilatero, 151
biunivoca, 5
boreliani, 82
buon ordinamento, 7
C*-algebra, 285
C*-algebra del gruppo G, 530
C*-algebra ridotta, 530
calcolo funzionale continuo, 345
cammino, 47
cammino costante, 49
campo, 723
734
campo di vettori, 601
campo hamiltoniano, 672
campo invariante a sinistra, 602
carattere, 141, 142, 554
cardinalità, 9, 14
cardinalità del continuo, 16
carta locale, 584
categoria, 17
categoria dei funtori, 22
categoria opposta, 20
catena, 7
causalmente disgiunti, 724
centralizzante, 128, 363
centro, 127, 151
che commutino fra loro, 252
chiudibile, 480
chiusi, 24
chiuso, 32, 480
chiusura, 24, 480
cicli, 49
ciclico, 122, 383, 393
classi, 1
classi coniugate, 128
classi laterali, 120
cobordo, 613
cocatena, 612
cociclo, 613
coefficiente di Fourier, 221
coefficienti della rappresentazione, 130
commutante, 156, 363
commutativa, 149
commutativi, 20
commutativo, 118
commutatore delle matrici, 578
compatibili, 632
compattificazione, 37
compattificazione a un punto, 37
compattificazione di Alexandroff, 37
compattificazione di Bohr, 558
compatto, 32, 377
completa, 87
completa riducibilità di moduli, 155
completamento, 66, 178
completo, 87, 408, 603
componente connessa, 48
composizione, 17
con identità, 149
con unità, 149
condizione di compatibilità per carte
locali, 589
confine superiore (inferiore), 7
congiunge due punti, 79
coniugato, 125
connesso, 45
connesso per archi, 47
cono, 546
cono duale, 445
continua, 30
continua da destra, 111
continuazione analitica, 330
contraibile, 53
contrazione, 66
controgradiente, 135
converge fortemente, 215
convergente, 28
convergenza, 177
convessi, 237
convoluzione, 222, 230, 274
convoluzione di funzioni, 146
coordinate, 584
coordinate canoniche, 588
corpo, 149
corpo dei quaternioni, 150
corrispondenza di Haag–Kastler, 724
costante di accoppiamento, 430
costanti di struttura, 150
covariante, 642
covarianti, 20, 655
covarianza dell’equazione di Dirac, 663
735
covarianza della rappresentazione di
Fock, 707
curva continua, 79
curva integrale massimale, 603
curva parametrizzata, 78
curve integrali, 603
duale topologico, 194, 244
dualità di Araki, 731
elemento neutro, 149
ensemble, 630
epimorfismo, isomorfismo, 119
equazione delle classi, 128
equazione di Dirac, 662
equazione di Schrödinger, 535
equazione di Schrödinger relativisticamente invariante, 664
equazione integrale di Fredholm di
seconda specie, 67
equazione integrale di Volterra, 67
equicontinuo, 75
equilimitato, 75
equipotenti, 10
equivalenti, 79, 131, 183, 434, 523,
618
equivalenza, 7, 19
equivalenza naturale, 22
esatta, 120
esista, 53
estende, 479
estensione, 618
estremo, 7
estremo inferiore (superiore), 7
debolmente non degenere, 668
definito positivo, 503
denso, 25
derivata di Radon–Nikodym, 190
derivazioni, 599
di allacciamento, 133, 523
di Cauchy, 62
di Hausdorff, 26
di Jordan, 149
di Lie, 149
di Lindelöf), 43
di ordine finito, 260
di ordine minore di m, 260
di prima categoria, 70
di seconda categoria, 70
di tipo positivo, 532, 704
diffeomorfismi, 594
differenziabile, 594
dimensione, 427
dimensione della varietà, 590
dimensione di una rappresentazione,
130
dimensione hilbertiana, 211
diretto, 7
discreta, 25
diseguaglianza di Cauchy–Schwartz,
176
disgiunte, 133, 434, 523
distribuzione, 254
distribuzioni temperate, 272
domini regolari, 321
dominio, 479
dominio di analiticità, 302
duale, 135
faccia, 250
famiglia spettrale, 371
fattore di tipo III, 428
fattore di tipo II1 , 428
fattore di tipo II∞ , 428
fattore di tipo In , 427
fattori, 426
fedele, 128, 431
fibrazione di Hopf, 572
finita, 87, 427
finitamente generato, 123
finito, 5
fluttuazione quantistica, 635
736
forma aggiunta, 284
forma bilineare, 157
forma di Hilbert–Schmidt, 695
forma di volume, 596
forma sesquilineare, 138
forma simplettica, 668
formula di inversione di Fourier, 231,
268
formula di Poisson, 229
fortemente non degenere, 243, 668
Fredholm, 501
frontiera, 25
funtore, 18
funtore controvariante, 19
funtore di Lie, 606
funzionale di Minkowski, 198
funzionale lineare, 187
funzionale lineare continuo, 187
funzionale lineare limitato, 187
funzione convessa, 113
funzione di distribuzione, 110
funzione di Gauss, 234
funzione di scelta, 6
funzione sesquilineare, 175
funzione unimodulare, 518
funzioni a decrescenza rapida, 264
funzioni semplici, 92
gruppo ad un parametro fortemente
continuo, 534
gruppo delle matrici invertibili di ordine n, 119
gruppo di coomologia, 613
gruppo di Heisenberg, 678
gruppo di Lie, 595
gruppo di Lorentz, 564, 647
gruppo di simmetrie, 641
gruppo di Weyl, 568
gruppo fondamentale, 49
gruppo inomogeneo, 650
gruppo lineare generale, 119, 561
gruppo lineare generale reale, 517
gruppo lineare speciale, 562
gruppo ortogonale, 563
gruppo ortogonale speciale, 564
gruppo quoziente modulo, 120
gruppo simplettico, 565
gruppo simplettico complesso, 565
gruppo spinoriale, 575
gruppo topologico, 515
gruppo unitario, 562
gruppo unitario speciale, 563
hermitiano, 445, 483
hilbertiano, 177
ideale destro, 151
ideale sinistro, 151, 306
identità, 17
identità associativa, 148
identità del parallelogramma, 183
identità di Jacobi, 148
identità di Jordan, 148
identità di polarizzazione, 183
immagine di un morfismo, 309
in dualità, 242
indice, 128
indice del sottogruppo, 126
indice dell’operatore, 501
genera, 251
generano il gruppo, 123
generata, 82
generatore infinitesimale, 534
grafico dell’operatore, 479
grafo, 206
gruppi classici, 566
gruppo, 118
gruppo Sn delle permutazioni, 123
gruppo a n parametri fortemente continuo, 545
gruppo a un parametro, 603
737
indici di difetto, 487
indotta dalla metrica, 57
infinita, 427
infinito, 5
iniettiva, 5
insieme, 2
insieme assorbente, 237
insieme delle parti, 3
insieme equilibrato, 237
insiemi, 1, 2
insiemi di Borel, 108
insiemi di Radon, 108
integrabile, 98, 105
integrale, 95
integrale di Dunford, 346
integrale di Lebesgue–Stieltjes, 112
integrale diretto, 427
integrazione alla Bochner, 276
intera, 331
interferenza, 637
interni, 476
interno, 24
intero, 549
intorno, 26
invariante, 131
invarianti, 134
inverso, 18
invertibile, 149, 286
involuzione, 153
iperboloidi di massa, 648
irriducibile, 459
isometria, 60
isometria parziale, 214
isometrica, 60
isometrici, 60
isomorfismo, 309, 475
isomorfismo (ordinale), 12
isomorfismo di gruppi di Lie, 597
isotropi, 648
Lemma di Krull, 307
limitato, 191, 248
limitato nel senso di Kato, 502
limite, 28
limite induttivo, 697
localmente compatto, 37
localmente connesso, 48
localmente convesso, 237
localmente finita, 43
localmente isomorfi, 604
localmente semplicemente connesso,
573
lunghezza, 79
magro, 70
mai denso, 70
mappa di cobordo, 612
massimale (minimale), 7
matrici di Dirac, 662
media, 143
meno fine, 25
meromorfa, 338
metrica, 57
metrica uniforme, 58
miscuglio statistico, 702
misura, 84, 89
misura # che conta, 85
misura δx0 di Dirac concentrata in x0 ,
85
misura con segno, 99
misura di Dirac, 259
misura di Haar biinvariante, 517
misura di Haar destra, 517
misura di Haar sinistra, 517
misura di Lebesgue, 86
misura di Radon, 108
misura differenziabile, 595
misura esterna, 83
misura esterna di Lebesgue, 83
misura finita, 87
misura prodotto, 104
Lebesgue–Stieltjes, 86
738
misura spettrale, 366
misurabile, 83, 91
misurabile (rispetto a µ∗ ), 83
misurabile secondo Lebesgue, 83
misure spettrali, 360, 392
modulo, 154, 351
modulo irriducibile, 154
modulo su un’algebra di Banach, 309
molteplicità, 381
molteplicità uniforme, 382
molteplicità uniforme n, 383
momenti, 411, 551
momenti angolari, 651
monomorfismo, 119
morfismi, 17, 133
morfismo, 150, 282, 308, 554
morfismo di moduli, 155
mutuamente singolari, 101
numero cardinale, 14
numero delle particelle, 710
numero ordinale, 11
oggetti, 17
olomorfa, 320
omeomorfismo, 30
omomorfismo, 119
omomorfismo di gruppi di Lie, 597
omotope, 51
omotope relativamente, 52
omotopi, 49
omotopia, 49
operatore aggiunto, 284
operatore di allacciamento, 642
operatore di Dirac, 662
operatore di Hilbert–Schmidt, 386
operatore di von Neumann, 677
operatore nucleare, 388
operatore unitario, 212
operatori di allacciamento, 359, 392,
434
operatori di Volterra, 305
operatori diagonali, 304
operatori differenziali del primo ordine, 601
operatori lineari, 191
orbita, 125
orbita è continua, 642
orbite, 126
ordine, 118
ordine dell’elemento g, 122
ordine di connessione del dominio, 321
ordine parziale, 6
ordine totale, 6
orientabili, 596
ortogonale, 185
osservabili, 630
negativo, 99
nidificata, 69
nilradicale, 312
non, 439
non è ultradebolmente continuo, 439
non degenere, 364, 394
non possiede sottogruppi piccoli, 610
non può essere un insieme, 2
norma, 176, 177
norma ridotta, 530
normale, 26, 120, 154, 285, 313, 438
normalizzante, 129
normata, 281
nucleo, 119, 127, 188, 305, 309
nucleo (positivo) di sommabilità, 224
nucleo dell’azione, 128
nucleo dell’equazione integrale, 67
nucleo dell’operatore, 214
nucleo di Fejér, 231
nucleo di sommabilità di Fejér, 223
nullo, 99
numerabile, 10
palla, 203
palla unitaria, 203
739
palle aperte, 57
paracompatto, 43
parentesi di Poisson, 672
parte positiva, 442
più debole, 25
piccola, 19
piena, 17
pieno, 11
polare, 244
polinomi di Hermite, 270, 693
polinomio trigonometrico, 220
polo di ordine m, 336
positivi, 442
positivo, 99, 288, 442
preduale, 417
principio delle contrazioni, 66
principio di uniforme limitatezza, 206
priva di elemento identità, 472
privo di molteplicità, 382, 383
probabilità, 112
probabilità di transizione, 462
problema dei momenti (Hamburger),
552
prodotto, 147
prodotto di Jordan, 148, 632
prodotto di Lie, 148
prodotto diretto, 121
prodotto hilbertiano, 175
prodotto semidiretto, 646
prodotto tensoriale, 159
prodotto tensoriale algebrico, 694
prodotto tensoriale delle rappresentazioni, 137
propria, 38
proprietà caratteristica, 634
proprietà dell’intersezione finita, 29
punti estremali, 251
punto limite, 28
quantizzazione, 673
quasi ovunque, 91
740
quasi-contenuta, 436
quasi-equivalente, 436
quasi-Fredholm, 501
quasi-regolare, 108
quasinorma compatibile, 238
quaternione, 150
questione, 632
quoziente, 131, 150
quoziente del gruppo G modulo il sottogruppo ker f , 120
radicale, 615
raffinamento, 43
raggio di convergenza, 325
raggio spettrale, 303
rango dell’operatore, 479
rappresentazione, 22, 124, 431, 523,
600
rappresentazione aggiunta, 600
rappresentazione coaggiunta, 617
rappresentazione coniugata, 125
rappresentazione della C*-algebra, 358
rappresentazione di Fock, 705
rappresentazione di Schrödinger, 675
rappresentazione di una C*-algebra,
391
rappresentazione identica, 130
rappresentazione lineare, 129
rappresentazione proiettiva, 130
rappresentazione regolare, 124, 529
rappresentazione regolare destra, 125
rappresentazione regolare sinistra, 143,
315
rappresentazione unitaria, 523
rappresentazione universale, 455
raro, 25, 70
regolare, 26, 108, 597
regole di commutazione di Weyl, 675
relativamente limitato, 502
relazione, 4
residuo, 337
rete, 27
reticolo vettoriale, 291
retratto, 52
retratto di deformazione, 53
rettangolo misurabile, 102
ricoprimento, 32
ricoprimento aperto, 32
ricoprimento finito, 30
riducibile, 131
riflessivo, 194
risolubile, 615
risolvente di A, 299
risolvente relativo ad A, 341
ritrazione, 52
rivestimento, 572
simmetrizzatore, 714
simplettomorfismo, 670
singolare, 336, 474
singolarità eliminabile, 336
singolarità essenziale, 336
sistema di coordinate locali, 584
sistema induttivo, 697
sistema ortonormale, 208
sollevamento, 54
somma diretta delle rappresentazioni, 394
somma diretta di moduli, 155
somma diretta di sottorappresentazioni, 135
sottoalgebra, 150, 282
sottobase, 25
sottocategoria, 17
sottogruppo, 119
sottogruppo generato da S, 121
sottoinsieme totale, 218
sottomodulo, 154
sottorappresentazione, 131, 436, 523
sottospazio determinante, 300
sottosuccessione, 28
spazi Lp , 113
spaziali, 647
spazio (di Hilbert) della rappresentazione, 391
spazio connesso, 44
spazio degli degli stati, 447
spazio delle fasi, 672
spazio di Banach, 177
spazio di Fréchet, 238
spazio di Hilbert, 177
spazio di misura, 85
spazio di probabilità, 112
spazio di Schwartz, 264
spazio metrico, 57
spazio misurabile, 83
spazio normato, 177
schema di assiomi, 2
se lo spazio X è connesso per archi,
50
segmenti nidificati, 69
Segmento iniziale, 7
Segmento iniziale aperto, 7
Segmento iniziale chiuso, 7
semialgebra di insiemi, 102
seminorma, 198
semisemplice, 135, 152, 614, 621
semplice, 121, 134, 151, 309, 426, 614,
621
semplicemente connesso, 51
separa i punti, 405
separabile, 72
separabilità, 72
serie di Fourier, 221
serie di Laurent, 333
serie di potenze, 324
serie trigonometrica, 221
settori di superselezione, 638
sezioni, 104
shift pesato, 304
shift unilatero, 213
simmetria sugli osservabili, 640
741
spazio pre-hilbertiano, 175
spazio simplettico, 669
spazio topologico, 24
spazio topologico quoziente, 30
spazio vettoriale topologico, 236
speranza matematica, 112
spettro congiunto, 341
spettro continuo, 353
spettro di A, 299
spettro essenziale, 356
spettro fisico, 631
spettro puntuale, 353
spezzata di Eulero, 77
spin, 570
stabilizzatore, 125
stati, 630
stati puri, 448, 631
stati vettoriali, 466
stato dominato, 448
stato regolare, 642
stessa cardinalità, 10
subordinata, 41
successione, 15
successione di Cauchy, 62
successione generalizzata, 27
successore, 5
superiormente, 111
supporto, 41, 108, 259
supporto centrale, 438
supporto di uno stato, 464
supremo essenziale, 113
suriettiva, 5
svanire, 258
teorema del nucleo di L. Schwartz,
729
teorema di Bochner, 532
teorema di Peano, 76
teorema di unicità di Dirac–Dixmier,
680
teorema ergodico elementare, 714
topologia, 24
topologia *-debole, 244
topologia cofinita, 73
topologia debole, 31, 244
topologia di Zariski, 27
topologia discreta, 25
topologia forte, 216
topologia indotta, 26
topologia prodotto, 31
topologia quoziente, 30
topologia relativa, 25
topologia ultradebole, 413
topologia ultraforte, 414
topologicamente irriducibile, 431, 523
topologicamente nilpotente, 311
topologicamente regolare, 109
toro n-dimensionale, 567
toro di dimensione 1, 31
toro massimale, 567
totalmente atomica, 402
totalmente limitato, 74
traccia, 428
traccia dell’operatore nucleare, 389
transitiva, 127
transitivo, 11
trasformata di Cayley, 487, 597
trasformata di Fourier, 229, 265, 274,
278
trasformata di Gel’fand, 311
trasformazione lineare simplettica, 670
trasformazione naturale, 21
trasformazioni ortocrone, 648
trasposta, 246
tangente, 250
temporali, 648
tensori, 159
tensori antisimmetrici, 166
tensori simmetrici, 162
teorema del grafo chiuso, 203
742
uniformemente continua, 60
uniformemente convergente, 325
unimodulare, 518
unità matriciali, 421
unitaria, 138, 139
unitariamente equivalenti, 139, 359,
391
universale, 22, 29, 573
valor medio, 634
valore assoluto, 102
variabile aleatoria, 112
varianza, 112
variazione totale, 102
varietà di Calabi–Rosenlicht, 593
varietà differenziabile, 589
vettore analitico, 501
vettore di unicità, 500, 551
vettore differenziabile, 499
743