UNIVERSITÀ DEGLI STUDI DI BERGAMO
Facoltà di Lingue e Letterature Straniere
Corso di laurea in Comunicazione Interculturale per la Cooperazione Internazionale,
l'impresa e l'ambiente
ANALISI STATISTICA
DELL'IMPRONTA
ECOLOGICA
Elaborato di Statistica Sociale
Anno accademico 2011/2012
Prof. Natale Carra
A cura di:
Vania Andreoli - 1010672
Andrea Sem Castelli - 1012877
1
SOMMARIO
Introduzione ...................................................................................................................................................... 3
Misure di tendenza centrale e di dispersione ................................................................................................... 9
Le misure di tendenza centrale ..................................................................................................................... 9
Le misure di dispersione ................................................................................................................................ 9
Indice di diversità (D) ................................................................................................................................. 9
Indice di variazione qualitativa (IVQ)....................................................................................................... 10
Il campo di variazione .............................................................................................................................. 10
La deviazione assoluta media (DAM) ...................................................................................................... 10
La varianza (S2Y)e la deviazione standard (sy) .......................................................................................... 10
Gli indici di forma (indice di asimmetria) ................................................................................................ 11
GLi indici di confronto (valori Z) .............................................................................................................. 11
Calcolo delle misure di tendenza centrale .................................................................................................. 11
Calcolo delle misure di dispersione nel caso analizzato .............................................................................. 15
Fonti ................................................................................................................................................................. 16
Analisi della varianza (ANOVA) ........................................................................................................................ 17
Il modello ANOVA: Teoria generale del modello ANOVA............................................................................ 20
Le tavole anova ............................................................................................................................................ 20
Analisi dei dati categoriali................................................................................................................................ 24
Il test chi-quadrato (χ2) ................................................................................................................................ 25
La misura di associazione Gamma (γ).......................................................................................................... 27
Misura di associazione Odds ....................................................................................................................... 28
Regressione e correlazione bivariata .............................................................................................................. 29
Diagramma di dispersione e modello di regressione .................................................................................. 29
Criterio dei minimi quadrati: ................................................................................................................... 30
Lo stimatore OLS...................................................................................................................................... 31
La somma dei quadrati: ........................................................................................................................... 35
Il coefficiente di determinazione:............................................................................................................ 35
Il coefficiente di correlazione: ................................................................................................................. 36
Test di significatività: ............................................................................................................................... 36
Il quoziente F: .......................................................................................................................................... 36
Conclusioni ...................................................................................................................................................... 37
2
INTRODUZIONE
INTRODUZIONE AL TEMA TRATTATO E SPIEGAZIONE DEI DIVERSI APPROCCI TEMATICI
Abbiamo voluto approfondire le nostre conoscenze riguardo ad indici alternativi utilizzati dagli organismi
internazionali per misurare lo stato di malessere o di benessere del nostra biosfera, seguendo la vocazione
ambientale del nostro corso di studi.
Dal momento che abbiamo a disposizione solo un pianeta bisogna intervenire sul proprio stile di vita, ma
anche a livello amministrativo. In entrambi i casi è necessario riconoscere il ruolo centrale della natura per
la salute e il benessere dell'umanità ed evitare il collasso. Per il WWF c'è bisogno di una rapida inversione di
tendenza e diventa fondamentale includere i servizi degli ecosistemi nei nuovi indicatori di sviluppo.
Innanzi tutto bisogna prendere coscienza di come il nostro stile di vita influisca negativamente sul
conteggio dell’impronta ecologica. Non tutti sono consapevoli che le risorse a nostra disposizione non sono
illimitate, che non si rigenerano con la stessa velocità con la quale ce ne disfiamo; quindi il reale primo
passo dovrebbe essere la sensibilizzazione: sul web molti sono i siti che pubblicano i continui studi sulla
salute del nostro pianeta e sulle problematiche energetiche e ambientali, primo fra tutti il sito del WWF, più
in particolare il Global Footprint Network. Il secondo passo è quello di assumere delle eco-abitudini per
ridurre l'impatto che le nostre azioni, tanto direttamente che indirettamente, hanno sull'ambiente in
termini di CO2 quali, tra le tante, optare per sistemi di produzione efficienti, riducendo la domanda di
risorse idriche, territorio, energia; vivere nei limiti ecologici della Terra ovvero con modelli di consumo
globali in equilibrio con la biocapacità del Pianeta, conseguibile cambiando i modelli alimentari e riducendo
gli sprechi, ma soprattutto i consumi, utilizzando l’energia in modo molto più razionale e intelligente e
promuovendo l’utilizzo di fonti energetiche rinnovabili. A grandi linee, tutti questi consigli sono riducibili
alla regola delle tre R: ridurre, riutilizzare, riciclare, ovvero non acquistare ciò di cui non si ha davvero
bisogno, utilizzare i prodotti il più possibile e soprattutto riciclare seguendo i metodi di smaltimento più
corretti. Bisogna rinunciare quindi alla tendenza del consumismo a favore di uno stile di vita più sano.
Da alcuni anni infatti sono emersi indici per misurare lo stato di "benessere" di ciascun Paese del mondo,
che esulano dal prodotto interno lordo. Noi ne abbiamo presi due in particolare per elaborare la nostra
ricerca: l'impronta ambientale e l'indice di sviluppo umano.
L'IMPRONTA ECOLOGICA:
L'impronta ecologica è un indicatore utilizzato per valutare il consumo umano di risorse naturali rispetto
alla capacità della Terra di rigenerarle (detta biocapacità). Essa misura l'area biologicamente produttiva di
mare e di terra necessaria per rigenerare le risorse consumate da una popolazione umana e per assorbire i
rifiuti prodotti. Utilizzando l'impronta ecologica, è possibile stimare quanti "pianeta Terra" servirebbero per
sostenere l'umanità, qualora tutti vivessero secondo un determinato stile di vita. Confrontando l'impronta
di un individuo (o regione, o stato) con la quantità di terra disponibile pro-capite (cioè il rapporto tra
superficie totale e popolazione mondiale) si può capire se il livello di consumi del campione è sostenibile o
meno.
Per calcolare l'impronta ecologica si mette in relazione la quantità di ogni bene consumato (es. grano, riso,
mais, cereali, carni, frutta, verdura, radici e tuberi, legumi, ecc.) con una costante di rendimento espressa in
kg/ha (chilogrammi per ettaro). Il risultato è una superficie espressa quantitativamente in ettari. Si può
esprimere l’impronta ecologica anche da un punto di vista energetico, considerando l’emissione di diossido
3
di carbonio espressa quantitativame
tativamente in tonnellate, e di conseguenza laa quantità
quanti di terra forestata
necessaria per assorbire le suddette
ddette to
tonnellate di CO2.
Modalità di calcolo:
Si considera l'utilizzo di sei categorie
egorie p
principali di territorio:
•
•
•
•
•
•
terreno per l'energia: superfic
superficie necessaria per assorbire l'anidride carbonica
arbonica prodotta dall'utilizzo
di combustibili fossili;
terreno agricolo: superficie
erficie aarabile utilizzata per la produzione di alimenti
aliment ed altri beni (iuta,
tabacco, ecc.);
pascoli: superficie destinata
stinata al
all'allevamento;
foreste: superficie destinata
stinata al
alla produzione di legname;
superficie edificata: superficie dedicata agli insediamenti abitativi, aglii impianti
impiant industriali, alle aree
per servizi, alle vie di comunica
comunicazione;
mare: superficie marina
na dedica
dedicata alla crescita di risorse per la pesca.
L'intera superficie delle terre emerse è composta all'incirca da:
•
•
•
•
•
foreste ed aree boschive
ive (34%
(34%)
pascoli permanenti (23%)
terra arabile (10%)
terra costruita (2%)
altri suoli: ghiacciai, rocce,
cce, dese
deserti, ecc. (32%).
Le diverse superfici vengono ridotte aad una misura comune, attribuendo a ciascuna
ascuna un
u peso proporzionale
alla sua produttività media mondiale
mondiale; si individua così l'"area equivalente"" necessaria
necessa per produrre la
quantità di biomassa usata daa una da
data popolazione (mondiale, nazionale, regionale
ionale, locale), misurata in
"ettari globali" (gha). L'impronta
ta ecolo
ecologica F viene calcolata con la formula:
dove Ei è l'impronta ecologica
gica der
derivante dal consumo Ci del prodotto i-esimo
esimo e qi, espresso in
ettari/chilogrammo, è il reciproco
roco della produttività media per il prodotto i-esimo.
L'impronta ecologica pro capite f vien
viene calcolata dividendo per la popolazione N residente nella regione
considerata:
ella Terra di rigenerare le risorse di un dato
o territorio)
territor è il risultato della
Il deficit di biocapacità (capacità della
sottrazione tra l'indice d'impronta
onta eco
ecologia e l'indice di biocapacità.
L'INDICE DI SVILUPPO UMANO:
L'Indice di sviluppo umano (in ingle
inglese: HDI-Human Development Index) è un indicatore
in
di sviluppo
macroeconomico realizzato dall'econo
all'economista pakistano Mahbub ul Haq nel 1990.
90. È stato
sta utilizzato, accanto
al PIL (Prodotto Interno Lordo),
o), dall'O
dall'Organizzazione delle Nazioni Unite a partire
rtire dal 1993 per valutare la
qualità della vita nei paesi membri.
embri. In precedenza, veniva utilizzato soltanto il PIL, indicatore
i
di sviluppo
macroeconomico che rappresenta
senta il valore monetario dei beni e dei servizi
zi prodotti
prodot in un anno su un
4
determinato territorio nazionale
ale e ch
che si basa quindi esclusivamente sulla crescita
rescita e non tiene conto del
capitale (soprattutto naturale)
le) che viene perso nei processi di crescita. Questi parametri misurano
esclusivamente il valore economico
omico to
totale o una distribuzione media del reddito.
ddito. In pratica, un cittadino
molto ricco ridistribuisce la sua ricch
ricchezza su molti poveri falsando in tal modo
odo il livello
liv
di vita di questi
ultimi.
Si cercò quindi, attraverso l'Indice
'Indice d
di sviluppo umano, di tener conto di differenti
different fattori, oltre al PIL
procapite, che non potevano
no esser
essere detenuti in modo massiccio da un singolo
singo individuo, come
l'alfabetizzazione e la speranzaa di vita.
La scala dell'indice è in millesimi
mi decre
decrescente da 1 a 0 e si suddivide, in base aii quartili (dal 2010), in quattro
gruppi: paesi a molto alto sviluppo
luppo um
umano, paesi ad alto sviluppo umano, paesi
esi a medio
med sviluppo e paesi a
basso sviluppo umano.
Il concetto di sviluppo umano
o viene eelaborato, alla fine degli anni ottanta, dal programma
prog
delle Nazioni
Unite per lo Sviluppo UNDP, al fine di superare ed ampliare l'accezione tradizionale
izionale di
d sviluppo incentrata
solo sulla crescita economica. Lo svil
sviluppo umano coinvolge e riguarda alcuni
ni ambiti
ambit fondamentali dello
sviluppo economico e sociale:
le: la pr
promozione dei diritti umani e l'appoggio
gio alle istituzioni locali con
particolare riguardo al diritto alla conv
convivenza pacifica, la difesa dell'ambiente e lo sviluppo
svilu
sostenibile delle
risorse territoriali, lo sviluppo dei serv
servizi sanitari e sociali con attenzione prioritaria
ritaria ai
a problemi più diffusi
ed ai gruppi più vulnerabili, il migliora
miglioramento dell'educazione della popolazione,
e, con particolare
p
attenzione
all'educazione di base, lo sviluppo
iluppo eeconomico locale, l'alfabetizzazione e l'educazione
l'educazi
allo sviluppo, la
partecipazione democratica, l'equità
'equità d
delle opportunità di sviluppo e d'inserimento
ento nella
nell vita sociale.
Metodo di calcolo:
Dal Report del 2010 è stato introdotto
trodotto un nuovo metodo di calcolo usando le seguenti
eguenti tre dimensioni:
•
•
•
Una vita lunga e sana:: misurat
misurata dall'Aspettativa di vita alla nascita
L'accesso alla conoscenza:
nza: misu
misurata dagli Anni medi di istruzione e daglili Anni previsti
p
di istruzione
Uno standard di vita dignitoso
ignitoso: misurato dal Reddito nazionale lordo (GNI)
GNI) pro capite (in termini di
parità di potere d'acquisto
uisto in d
dollari USA)
Su queste dimensioni vengono calcola
calcolati tre indici come segue:
•
Indice di Aspettativa dii Vita (IA
(IAV)
•
Indice di Istruzione (II)
•
Indice Anni medi di istruzione
struzione (IAMI)
•
Indice Anni previsti di istruzion
istruzione (IAPI)
•
Indice di Reddito (IR)
5
nfine com
come media geometrica dei tre indici, come
e segue:
L'ISU (o HDI) viene calcolato infine
MAX e MIN: sono i valori massimi
ssimi e mi
minimi rilevati per quella dimensione
AV: Aspettativa di Vita alla nascita. Il vvalore MAX per il 2010 è 83,2 (Giappone).
AMI: Anni medi di istruzione (Anni
Anni che una persona con più di 25 anni ha dedicato
cato all'istruzione).
all'ist
Il valore
MAX per il 2010 è 13,2 (Stati Uniti).
API: Anni previsti di istruzione (Anni pr
previsti di istruzione per un bambino di 5 anni in tutta
tu la sua vita). Il
valore MAX per il 2010 è 20,6 (Australi
(Australia). Il valore MAX combinato per il calcolo
lo dell'Indice
dell'Ind di Istruzione (II)
per il 2010 è 0,951 (Nuova Zelanda).
RNLpc: RNL procapite a PPA in USD. Il vvalore MAX per il 2010 è 108.211 (Emirati
ti Arabi Uniti).
U
Il valore MIN
per il 2010 è 163 (Zimbabwe).
CLASSIFICAZIONE
Dal Report 2010 i paesi sono suddivisi in quattro gruppi in base al quartile in cui
ui rientrano:
rientra
• Primo 25% dei paesi: paesi a m
molto alto sviluppo umano
• Dal 25% al 50% dei paesi:
esi: paesi ad alto sviluppo umano
• Dal 50% al 75% dei paesi:
esi: paesi a medio sviluppo umano
• Ultimo 25% dei paesi:paesi
paesi a b
basso sviluppo umano
Fino al 2009 la classificazione avveniva fissando dei valori per le varie fasce:
• Indice sopra 0,9: paesi
si a molto alto sviluppo umano
• Indice tra 0,8 e 0,9: paesi
esi ad al
alto sviluppo umano
• Indice tra 0,5 e 0,8: paesi
esi a me
medio sviluppo umano
• Indice sotto 0,5: paesi
si a basso sviluppo umano
GRAFICI
6
7
8
MISURE DI TENDENZA CENTRALE
TRALE E DI DISPERSIONE
Ogni distribuzione di frequenze
ze può ess
essere riassunta mediante la tendenza centrale
ntrale (o valore medio) di un
insieme di valori o mediante le misure di dispersione cioè un numero che esprime
rime la quantità
q
di variazione
o dispersione che caratterizza una dist
distribuzione.
LE MISURE DI TENDENZA CENTRA
ENTRALE
La moda, la mediana e la media
ia costitu
costituiscono le misure di tendenza centrale più
iù comunemente
comun
usate.
•
•
•
La moda: è la categoria alla qua
quale è associato il numero di osservazionii più elevato,
ele
cioè quella che
contiene più casi delle altre. La categoria modale non è necessariamente
ente quella
qu
che contiene la
maggioranza assoluta deii casi m
ma semplicemente quella che contiene più casi delle altre categorie
(maggioranza relativa). Laa moda è una misura di tendenza centrale applicabile
licabile sia
si a variabili discrete
sia continue.
lo alle vvariabili le cui categorie possono essere ordinante
ordinant in modo crescente.
La mediana: si applica solo
La mediana è quel valore che di
divide una distribuzione ordinata esattamente
nte in due
du metà, in modo tale
che la metà dei casi osservati
sservati ab
abbiano valori inferiori a quello mediano,, e l'altra metà abbiano valori
superiori. In generale, la med
mediana di una data distribuzione è uguale al valore associato
all'osservazione centrale di quell
quella distribuzione quando questa è formata
ata da un
u numero dispari di
osservazioni, mentre uguale
guale all
alla media dei valori associati alle due
e osservazioni
osserv
centrali della
distribuzione quando questa
sta è for
formata da un numero pari di osservazioni.
La media aritmetica: rappresen
appresenta la misura di tendenza centrale più
iù comune.
comun Essa può essere
calcolata per le variabilii continu
continue, secondo la modalità seguente: i valori
alori di tutte le osservazioni
vengono sommati e divisi
si per il nu
numero totale dei casi.
In sostanza la formula della
ella medi
media ci dice di sommare tutti i valori che formano la distribuzione della
variabile Y e di dividere poi
oi la som
somma ottenuta per in numero di casi N.
LE MISURE DI DISPERSIONE
La scelta della misura di dispersione
ne p
più appropriata per descrivere una data distribuzione
distribuz
dipende dal tipo
di variabile analizzata, discretaa o contin
continua.
INDICE DI DIVERSITÀ (D)
L'indice di diversità (D) misura la proba
probabilità che due osservazioni estratte casualment
sualmente da una popolazione
hanno di appartenere a categorie
orie dive
diverse di una data variabile discreta. Per calcolare
alcolare D si eleva al quadrato
la proporzione di casi che rientra
entra in ciascuna delle K categorie discrete della
ella variabile
varia
in questione, si
sommano questi valori e si sottrae
ttrae da u
uno la cifra ottenuta.
= −∑
=
Maggiore è il valore assoluto di D, più equa è la dispersione dei casi fra le categorie
orie della
d
variabile oggetto
di analisi. Il minimo valore di D è 0, cche si ottiene quando tutti i casi osservati
ati appartengono
appar
ad una sola
9
categoria. Il massimo valore di D invece si ottiene quando ogni categoria contiene la stessa proposizione di
casi. Questo valore tuttavia non è costante ma dipende dal numero di categorie in cui si articola una
variabile: maggiore è il numero di categorie, maggiore è il valore massimo che D può assumere.
INDICE DI VARIAZIONE QUALITATIVA (IVQ)
I valori di D calcolati per variabili discrete che hanno un numero diverso di categorie non possono essere
confrontati direttamente. Per ovviare a questo problema si può ricorrere all'IVQ, che standardizza l'indice di
diversità per il numero di categorie.
−∑
=
=
=
(
)
−
=
(
−
)
Il massimo valore di IVQ è sempre pari ad 1 quando i casi si ripartiscono equamente fra le categorie.
Pertanto, questo indice consente di confrontare i livelli di dispersione di variabili discrete che si articolano
in numeri differenti di categorie.
IL CAMPO DI VARIAZIONE
Esso corrisponde alla differenza tra il valore maggiore e il valore minore di una distribuzione. Il limite di
questo indice è che, essendo basato sui soli valori estremi, non dice nulla sulla distribuzione interna dei
casi. Per ovviare a questo problema è possibile ricorrere agli indici seguenti.
LA DEVIAZIONE ASSOLUTA MEDIA (DAM)
La deviazione o distanza di un valore Yi dalla media Ȳ viene calcolata:
=
−
Una volta considerate le singole deviazioni, la deviazione assoluta media corrisponde alla somma in valore
assoluto delle singole deviazioni divise per il numero di osservazione:
=
∑
L'indice DAM assume sempre un valore superiore a 0, tranne quando tutte le osservazioni hanno
esattamente lo stesso valore.
LA VARIANZA (S 2 Y )E LA DEVIAZIONE STANDARD (S Y )
Un'altra procedura che consente di eliminare i segni negati da una distribuzione di deviazioni consiste
nell'elevare queste ultime al quadrato. La media aritmetica è la misura di tendenza centrale che minimizza
la deviazione quadratica media di tutti i valori di una distribuzione. Questa desiderabile proprietà della
media è parte integrante di un'importante misura di dispersione per le variabili continue: la varianza.
∑
=
ovvero
=
−
∑(
=
−
)
=
−
10
In seguito per ripristinare l'unità di misura originaria è necessario calcolare la radice quadrata della varianza
ottenendo in questo modo la deviazione standard.
∑
=
=
=
−
GLI INDICI DI FORMA (INDICE DI ASIMMETRIA)
Esistono inoltre, tra gli indici di dispersione, gli indici di forma, che forniscono informazioni sulla morfologia
di una distribuzione, che hanno l’importante caratteristica di non dipendere dalla scala di misura delle
osservazioni.
Tra gli indici di forma più noti troviamo l’indice di asimmetria, il cui valore indica scostamenti positivi o
negativi dalla media.
(
=
)
−
GLI INDICI DI CONFRONTO (VALORI Z)
Per confrontare le dispersioni di due diverse distribuzioni, occorre esprimere le due misure in modo da
eliminare la dipendenza dall’unità di misura. Per fare questo si ricorre ai valori standardizzati.
Tra gli indici di confronto più noti troviamo l’indice Z.
=
(
−
)
CALCOLO DELLE MISURE DI TENDENZA CENTRALE
Dopo aver spiegato le caratteristiche delle misure di tendenza centrale e aver espresso la formula generale
di ciascuna, di seguito le tabelle dei dati e i rispettivi calcoli del caso analizzato.
ECOLOGICAL FOOTPRINT
Risultati dal National Footprint Accounts 2010, www.footprintnetwork.org. Estratto di Ottobre 2010
Tabella 1.1: Impronta ecologica per ripartizione geografica (Paesi del Mondo1)
Algeria
Angola
Benin
Botswana
Burkina Faso
Burundi
Cameroon
Central African Republic
Chad
Congo
1
1,6
1,0
1,2
2,7
1,3
0,9
1,0
1,3
1,7
1,0
Non per tutti i paesi del mondo è stato possibile calcolare l'impronta ecologica (Global Footprint Network)
11
Congo, Democratic Republic of
Côte d'Ivoire
Egypt
Eritrea
Ethiopia
Gabon
Gambia
Ghana
Guinea
Guinea-Bissau
Kenya
Lesotho
Liberia
Libyan Arab Jamahiriya
Madagascar
Malawi
Mali
Mauritania
Mauritius
Morocco
Mozambique
Namibia
Niger
Nigeria
Rwanda
Senegal
Sierra Leone
Somalia
South Africa
Sudan
Swaziland
Tanzania, United Republic of
Togo
Tunisia
Uganda
Zambia
Zimbabwe
Afghanistan
Armenia
Azerbaijan
Bangladesh
Cambodia
China
Georgia
India
Indonesia
Iran, Islamic Republic of
Iraq
Israel
0,8
1,0
1,7
0,9
1,1
1,4
3,4
1,8
1,7
1,0
1,1
1,1
1,3
3,1
1,8
0,7
1,9
2,6
4,3
1,2
0,8
2,2
2,3
1,4
1,0
1,1
1,1
1,4
2,3
1,7
1,5
1,2
1,0
1,9
1,5
0,9
1,2
0,6
1,8
1,9
0,6
1,0
2,2
1,8
0,9
1,2
2,7
1,3
4,8
12
Japan
Jordan
Kazakhstan
Korea, Democratic People's Republic of
Korea, Republic of
Kuwait
Kyrgyzstan
Lao People's Democratic Republic
Lebanon
Malaysia
Mongolia
Myanmar
Nepal
Occupied Palestinian Territory
Oman
Pakistan
Philippines
Qatar
Saudi Arabia
Singapore
Sri Lanka
Syrian Arab Republic
Tajikistan
Thailand
Timor-Leste
Turkey
Turkmenistan
United Arab Emirates
Uzbekistan
Viet Nam
Yemen
Albania
Austria
Belarus
Belgium
Bosnia and Herzegovina
Bulgaria
Croatia
Czech Republic
Denmark
Estonia
Finland
France
Germany
Greece
Hungary
Ireland
Italy
Latvia
4,7
2,1
4,5
1,3
4,9
6,3
1,2
1,3
2,9
4,9
5,5
1,8
3,6
0,7
5,0
0,8
1,3
10,5
5,1
5,3
1,2
1,5
1,0
2,4
0,4
2,7
3,9
10,7
1,7
1,4
0,9
1,9
5,3
3,8
8,0
2,7
4,1
3,7
5,7
8,3
7,9
6,2
5,0
5,1
5,4
3,0
6,3
5,0
5,6
13
Lithuania
Macedonia TFYR
Moldova
Netherlands
Norway
Poland
Portugal
Romania
Russian Federation
Serbia
Slovakia
Slovenia
Spain
Sweden
Switzerland
Ukraine
United Kingdom
Argentina
Bolivia
Brazil
Chile
Colombia
Costa Rica
Cuba
Dominican Republic
Ecuador
El Salvador
Guatemala
Haiti
Honduras
Jamaica
Mexico
Nicaragua
Panama
Paraguay
Peru
Trinidad and Tobago
Uruguay
Venezuela, Bolivarian Republic of
Canada
United States of America
Australia
New Zealand
Papua New Guinea
4,7
5,7
1,4
6,2
5,6
4,3
4,5
2,7
4,4
2,4
4,1
5,3
5,4
5,9
5,0
2,9
4,9
2,6
2,6
2,9
3,2
1,9
2,7
1,9
1,5
1,9
2,0
1,8
0,7
1,9
1,9
3,0
1,6
2,9
3,2
1,5
3,1
5,1
2,9
7,0
8,0
6,8
4,9
2,1
14
Tabella 1.2: Frequenze Assolute, proporzioni, percentuali e misure di tendenza centrale delle variabili
dell'impronta ecologica ordinate in macroaree geografiche
Ripartizione geografica
Frequenze
Assolute
1,4
1,7
4,6
2,5
7,9
5,3
23,4
Africa
Asia
Europa
America Latina e Caraibi
U.S.A e Canada
Oceania
Totale
Proporzioni
Percentuale
0,1
0,1
0,2
0,1
0,3
0,2
1,0
6,0%
7,3%
19,7%
10,7%
33,8%
22,6%
100,0%
Moda
7,9
Mediana
3,6
Media
3,9
CALCOLO DELLE MISURE DI DISPERSIONE NEL CASO ANALIZZATO
Dopo aver spiegato le caratteristiche delle misure di dispersione e aver espresso la formula generale di
ciascuna, presentiamo di seguito i calcoli sui dati del caso analizzato.
Tabella 1.3: Indice di diversità, indice di variazione qualitativa, campo di variazione, deviazione,
deviazione assoluta media, varianza e deviazione standard dell'impronta ecologia del report 2010:
Ripartizione geografica
Africa
Asia
Europa
America Latina e Caraibi
U.S.A e Canada
Oceania
Totale
Media
D
IVQ
Valore massimo
Valore minimo
Campo di variazione
fi
1,4
1,7
4,6
2,5
7,9
5,3
23,4
pi
0,060
0,073
0,197
0,107
0,338
0,226
1,000
pi2
0,004
0,005
0,039
0,011
0,114
0,051
0,224
di
-2,500
-2,200
0,700
-1,400
4,000
1,400
0,000
di2 DAM
S2y
6,25
4,84
0,49
1,96
16
1,96
31,5 2,033 6,300
Sy
2,510
Z
-0,996
-0,877
0,279
-0,558
1,594
0,558
0
3,9
0,776
0,931
U.S.A e
Canada
Africa
6,5
15
FONTI
I dati statistici li abbiamo raccolti dal rapporto 2010 del Global Footprint Network. Nel 2003 Mathis
Wackernagel e altri hanno fondato il Global Footprint Network, che si propone di migliorare la misura
dell'impronta ecologica e di conferirle un'importanza analoga a quella del prodotto interno lordo.
http://www.footprintnetwork.org/
I dati del HDI invece li abbiamo raccolti attraverso il report 2010 del Programma delle Nazioni Unite per lo
Sviluppo (in inglese United Nations Development Programme, ossia UNDP). Essa è un'organizzazione
internazionale sorta il 1 gennaio 1966, in seguito alla risoluzione dell'Assemblea Generale delle Nazioni
Unite (ONU) del 22 novembre 1965, dalla fusione del Programma Ampliato di Assistenza Tecnica e del
Fondo Speciale delle Nazioni Unite. Il primo (sigla corrente EPTA, dal titolo inglese) era stato istituito per
promuovere il progresso economico dei Paesi sottosviluppati. Il Fondo Speciale invece era stato istituito
come fondo speciale separato dell'ONU, formato dai contributi volontari degli Stati membri della stessa,
degli istituti specializzati e dell'Agenzia Internazionale per l'Energia Atomica, ed era destinato a finanziare
studi preliminari (sulle possibilità economiche di un Paese o di un settore economico e sulle risorse naturali
e l'attrezzatura tecnica) in vista della valutazione delle domande di finanziamento presentate dagli Stati
membri. Il nuovo programma delle Nazioni Unite per lo sviluppo, risultante dalla fusione dei due enti
precedenti, ne continua e combina le finalità e i metodi, operando sotto il controllo del Consiglio
Economico e Sociale dell'Assemblea Generale dell'ONU. I progetti di sviluppo e i programmi per la loro
preparazione, nonché la destinazione dei fondi relativi sono esaminati e approvati (a maggioranza) dal
Consiglio d'Amministrazione (riunito annualmente), che è formato dai rappresentanti di 48 Stati membri, di
cui 27 vengono scelti fra Paesi in via di sviluppo e 21 tra quelli a economia avanzata. La direzione
dell'organizzazione è affidata a un amministratore, che è nominato dal segretario generale dell'ONU ed è
assistito da un Ufficio Consultivo formato dal segretario generale dell'ONU, dai segretari generali degli
istituti specializzati e presieduto dall'amministratore.
http://www.undp.org/
Le parti teoriche dell'impronta ecologica e dei calcoli statistici invece:
• Meadows Donella; Meadows Dennis; Randers Jorgen "I nuovi limiti dello sviluppo. La salute del
pianeta nel terzo millennio", Milano, Oscar Mondadori, 2006
• G. W. Bohrnstedt, D. Knoke "Statistica per le scienze sociali", Bologna, Il Mulino, 1998
• L. Pellizzoni, G. Osti "Sociologia dell'ambiente", Bologna, Il Mulino, 2003
16
ANALISI DELLA VARIANZA (ANOVA)
L'analisi della varianza è una versione particolare del modello lineare generale che presuppone una
variabile indipendente formata da un insieme di categorie discrete e una variabile dipendente composta da
categorie continue.
Sarà qui di seguito utilizzato il modello ANOVA per rispondere al quesito:
HP: la collocazione geografica (NORD/SUD del mondo) influenza il tasso di impronta ecologica?
Più specificatamente ci si chiede se è vero che nelle macroregioni del nord del mondo si registra un indice
di impronta ecologica maggiore rispetto alle macroregioni del sud del mondo. Abbiamo suddiviso le
macroregioni seguendo questo criterio:
•
•
Emisfero Nord: U.S.A. e Canada, Europa, Asia
Emisfero Sud: America Latina e Caraibi, Africa, Oceania
Inoltre abbiamo scelto di vagliare questa ipotesi, partendo dal presupposto della forte industrializzazione e
dello stile di vita consumistico e capitalista più avanzato dell'emisfero Nord rispetto a quello Sud.
L'ipotesi di ricerca iniziale sostiene che le due variabili in questione siano correlate non solo nel campione
analizzato ma anche nella popolazione di riferimento e che quindi le medie µ 1, µ2, µ3 … µj dei J gruppi
siano diverse tra loro. In questo caso essa afferma che l'indice di impronta ecologica sarà maggiore nel nord
del mondo:
H1: µ1 ≠ µ2 ≠ … µj
L'ipotesi nulla sostiene invece che non esiste alcuna relazione fra le due variabili e cioè che le medie µ1, µ2,
µ3 … µj dei J gruppi siano tutte uguali e che corrispondano alla media generale µ. In questo caso, esso
afferma che l'indice di impronta ecologica è uguale in tutte le regioni:
H0: µ1 = µ2 = … = µj = µ
Se si dimostrasse che l'ipotesi nulla è falsa, automaticamente si accetta l'ipotesi di ricerca, dato che
l'accettazione di una ipotesi alternativa ha un carattere condizionato in quanto la verità sulle relazioni fra
variabili può essere valutata solo indirettamente, scartando le ipotesi false.
Il modello ANOVA sottopone a verifica l'ipotesi nulla secondo la quale le medie campionarie dei J gruppi
provengono dalla stessa popolazione e siano quindi uguali.
Il rifiuto dell'ipotesi nulla implica una fra le diverse possibilità alternative:
1. la media di ogni gruppo differisce dalla media di tutti gli altri gruppi,
2. le medie di alcuni sottoinsiemi di gruppi differiscono l'una dalle altre
3. alcune combinazioni di medie differiscono da una singola media o da un'altra combinazione di
medie
17
Tabella 2.1: Impronte ecologiche per ciascuno Stato, raggruppati per emisferi (NORD/SUD)2
NORD
Afghanistan
Armenia
Azerbaijan
Bangladesh
Cambodia
China
Georgia
India
IMPRONTA
0,62
1,75
1,87
0,62
1,03
2,21
1,82
0,91
SUD
Algeria
Angola
Benin
Botswana
Burkina Faso
Burundi
Cameroon
Central African Republic
Impronta
1,58
1,00
1,22
2,67
1,31
0,90
1,04
1,31
Indonesia
Iran, Islamic Republic of
Iraq
Israel
Japan
Jordan
Kazakhstan
Korea, Democratic People's Republic of
1,21
2,68
1,34
4,81
4,72
2,05
4,54
1,32
Chad
Congo
Congo, Democratic Republic of
Côte d'Ivoire
Egypt
Eritrea
Ethiopia
Gabon
1,72
0,96
0,75
1,01
1,65
0,88
1,10
1,41
Korea, Republic of
Kuwait
Kyrgyzstan
Lao People's Democratic Republic
4,86
6,32
1,24
1,27
Gambia
Ghana
Guinea
Guinea-Bissau
3,44
1,75
1,66
0,96
Kenya
Lesotho
Liberia
Libyan Arab Jamahiriya
Madagascar
Malawi
Mali
Mauritania
Mauritius
Morocco
Mozambique
Namibia
Niger
Nigeria
Rwanda
Senegal
Sierra Leone
Somalia
South Africa
Sudan
Swaziland
Tanzania, United Republic of
Togo
1,11
1,07
1,25
3,05
1,79
0,73
1,93
2,60
4,26
1,22
0,77
2,15
2,34
1,43
1,01
1,09
1,05
1,42
2,31
1,73
1,49
1,17
0,97
Lebanon
Malaysia
Mongolia
Myanmar
Nepal
Occupied Palestinian Territory
Oman
Pakistan
Philippines
Qatar
Saudi Arabia
Singapore
Sri Lanka
Syrian Arab Republic
Tajikistan
Thailand
Timor-Leste
Turkey
Turkmenistan
United Arab Emirates
Uzbekistan
Viet Nam
Yemen
2
2,90
4,86
5,53
1,78
3,55
0,74
4,98
0,76
1,29
10,50
5,13
5,33
1,21
1,52
1,00
2,37
0,43
2,69
3,92
10,67
1,74
1,40
0,94
Nel rapporto del Global Footprint Network non sono stati presi in considerazione tutti gli Stati del Mondo
18
Albania
Austria
Belarus
Belgium
Bosnia and Herzegovina
Bulgaria
Croatia
Czech Republic
Denmark
Estonia
Finland
France
Germany
Greece
Hungary
Ireland
Italy
Latvia
Lithuania
Macedonia TFYR
Moldova
Netherlands
Norway
Poland
Portugal
Romania
Russian Federation
Serbia
Slovakia
Slovenia
Spain
Sweden
Switzerland
Ukraine
United Kingdom
Canada
United States of America
Totale
Media
1,91
5,30
3,80
7,99
2,74
4,07
3,74
5,73
8,26
7,88
6,15
5,01
5,08
5,38
2,98
6,29
4,99
5,64
4,66
5,66
1,38
6,19
5,55
4,34
Tunisia
Uganda
Zambia
Zimbabwe
Argentina
Bolivia
Brazil
Chile
Colombia
Costa Rica
Cuba
Dominican Republic
Ecuador
El Salvador
Guatemala
Haiti
Honduras
Jamaica
Mexico
Nicaragua
Panama
Paraguay
Peru
Trinidad and Tobago
4,46 Uruguay
2,70 Venezuela, Bolivarian Republic of
4,40 Australia
2,38 New Zealand
4,05 Papua New Guinea
5,30 Totale
5,42 Media
5,88
5,01
2,90
4,89
7,01
7,99
305,54
3,82
Media Mondo 2,87
1,89
1,53
0,91
1,24
2,59
2,57
2,90
3,23
1,86
2,68
1,85
1,47
1,88
2,03
1,77
0,67
1,91
1,92
2,99
1,55
2,87
3,19
1,53
3,09
5,13
2,89
6,83
4,80
2,13
138,16
1,92
19
IL MODELLO ANOVA: TEORIA GENERALE DEL MODELLO ANOVA
L'analisi della varianza è finalizzata a determinare quale proporzione della variazione totale nella variabile
dipendente Y è attribuibile alle singole osservazioni i appartenenti al gruppo J. Il modello scompone ogni
valore osservato in tre componenti:
Yij=m+aj+eij
Yij = valore dell’osservazione i del gruppo j
µ =media generale, comune a tutte le osservazioni
aj =effetto comune esercitato dal gruppo j
eij=errore o residuo del singolo i del gruppo j. L'errore è quella parte di un valore osservato che non può
essere attribuita né alla componente comune, né alla componente di gruppo.
LE TAVOLE ANOVA
Somma dei quadrati:
Per determinare la proporzione della varianza di Yij attribuibile agli effetti di gruppo (aj) e la proporzione
che invece è attribuibile all'errore (eij) bisogna partire dal numeratore della varianza campionaria:
∑(
)
−
=
Ognuna delle N osservazioni presenti in un campione appartiene a uno dei J gruppi precedentemente
identificati. Se nj indica il numero di osservazioni appartenenti al gruppo j, allora n1 + n2+ … nj = N. pertanto
la somma delle osservazioni appartenenti a ciascuno dei J gruppi è uguale alla dimensione complessiva del
campione N. Se a ciascuna osservazione associamo sia un indice individuale (i) che un indice di gruppo (j),
possiamo riscrivere il numeratore della varianza come segue:
∑ ∑(
=
−
)
=
Questo termine rappresenta la somma dei quadrati totale (SQTOTALE). Equivale alla somma delle deviazioni al
quadrato di ciascun valore dalla media generale di tutti i gruppi (Ȳ).
Ȳ =2,869
Gli indici medi dei singoli gruppi sono invece:
µn = 3.82
µs = 1.92
La SQTOTALE è scomponibile in due parti:
•
La somma dei quadrati fra gruppi SQINTERGRUPPO pari alla somma delle deviazioni al quadrato di
ciascuna media di gruppo dalla media generale dei gruppi.
20
∑ (
SQINTERGRUPPO =
)
−
=
•
La somma dei quadrati nei gruppi SQINTRAGRUPPO pari alla somma delle deviazioni al quadrato delle
osservazioni di ciascun gruppo dalla media di quel gruppo.
∑ ∑(
SQINTRAGRUPPO =
=
)
−
=
Pertanto SQTOTALE = SQINTERGRUPPO + SQINTRAGRUPPO
La somma dei quadrati fra i gruppi esprime l'effetto complessivo esercitato sulla variabile dipendente
continua dalla variabile indipendente discreta. Mentre la somma dei quadrati nei gruppi esprime l'influenza
di fattori non misurati.
Quadrati medi:
Il passo successivo, nell'analisi della varianza, consiste nel calcolare i quadrati medi corrispondenti a
SQINTERGRUPPO e a SQINTRAGRUPPO ; ognuno di essi rappresenta la stima di una varianza: la prima attribuibile
agli effetti di gruppo, la seconda attribuibile all'errore. Se non esiste alcun effetto di gruppo allora le due
stime saranno identiche. Se al contrario, esiste un effetto di gruppo significativo, allora il quadrato medio
fra i gruppi (SQINTERGRUPPO) sarà maggiore del quadrato medio nei gruppi (SQINTRAGRUPPO).
I quadrati medi si ottengono dividendo ciascuna somma di quadrati per i rispettivi gradi di libertà. I gradi di
libertà associati alla varianza fra i gruppi sono pari a J - 1, perché una volta che la media generale e la media
dei primi J - 1 gruppi sono note, la media del gruppo J è determinata automaticamente.
QMINTERGRUPPO =
∑ (
−
)
=
−
I gradi di libertà associati alla varianza nei gruppi sono uguali a N - J. Ciascun gruppo, infatti ha nj -1 gradi di
libertà; sommando i gradi di libertà di tutti i gruppi si ottiene N - J.
QMINTRAGRUPPO =
∑ ∑(
=
−
)
=
−
Quoziente F :
Nell'analisi della varianza, la statistica F viene calcolata semplicemente come rapporto fra i due quadrati
medi:
−
−
=
21
La distribuzione campionaria di F può essere utilizzata per verificare l'ipotesi nulla secondo la quale nessuna
parte della varianza osservata nella variabile dipendente è dovuta agli effetti di gruppo. Devono però essere
soddisfatti due assunti:
1. I J gruppi devono essere estratti indipendentemente da una popolazione normalmente distribuita;
2. la varianza della popolazione deve essere identica alle varianze dei J gruppi (omoschedasticità).
Se entrambi gli assunti vengono rispettati, la statistica F risulta distribuita secondo una distribuzione F con J
- 1 gradi di libertà al numeratore e N - J gradi di libertà al denominatore.
IL MODELLO APPLICATO AL CASO PRESO IN ANALISI:
Tabella 2.2: Varianza campionaria Nord/Sud del mondo e tavole ANOVA applicate:
VARIANZA CAMPIONARIA NORD
5,47
VARIANZA CAMPIONARIA SUD
1,22
SQ intergruppo NORD
SQ intergruppo SUD
SQ intragruppo NORD
SQ intragruppo SUD
SQ intergruppo TOT
SQ intragruppo TOT
SQ totale NORD
SQ totale SUD
SQ totale
=80*(3,82-2,87)^2
=72*(1,92-2,87)^2
=(0,62-3,82)^2+(1,75-3,82)^2+…
=(1,58-1,92)^2+(1,00-1,92)^2+…
SQ intergruppo NORD + SQ intergruppo
SUD
SQ intragruppo NORD + SQ intragruppo
SUD
SQ intergruppo nord + SQ intragruppo
nord
SQ intergruppo sud + SQ intragruppo sud
SQ totale nord + SQ totale sud
72,23
65,00
432,17
86,85
137,23
519,02
504,40
151,85
656,25
Gradi di libertà = J-1 = 2-1 = 1
QM intergruppo NORD
QM intergruppo SUD
QM intergruppo totale
= SQ intergruppo nord/J-1
= SQ intergruppo sud/J-1
QM intergruppo nord + QM intergruppo sud
72,23
65,00
137,23
Gradi di libertà = N-J = 152-2 = 150
QM intragruppo NORD
QM intragruppo SUD
QM intragruppo totale
Quoziente F 1,150
= SQ intragruppo nord/N-J
= SQ intrargruppo sud/N-J
QM intragruppo nord + QM intragruppo sud
2,88
0,58
3,46
39,66
Per α = 0,10 e gradi di libertà 1; 150 il valore critico nella tabella di Fisher corrisponde a 2,71.3
Mentre per α = 0,05 e gradi di libertà 1; 150 il valore critico nella tabella di Fisher è 3,84.2
Essendo 39,66 > 2,71 e 39,66>3,84, bisogna rifiutare l'ipotesi nulla e accettare quella di ricerca. La variabile
indipendente influenza quindi quella dipendente in modo significativo.
3
Tabella di Fischer in allegato alla fine del documento.
22
Tabella 2.3: ANOVA riassuntiva:
Fonte
Intergruppo
Intragruppo
Totale
SQ
137,23
519,02
656,25
Gl
1
150
151
QM
137,23
3,46
F
39,66
Il quoziente di correlazione eta-quadrato:
Dopo aver rifiutato l'ipotesi nulla e avere implicitamente accettato la sua alternativa, è necessario stimare
la forza della relazione fra le due variabili:
η =
In questo caso il quoziente di correlazione è pari a:
Quoziente ETA
0,2091 20,91%
Si dimostra che circa il 20,91% dell'impronta ecologica è legato alla collocazione geografica.
23
ANALISI DEI DATI CATEGORIALI
L’analisi dei dati categoriali studia le relazioni fra le variabili attraverso le tavole di contingenza. Una tavola
di contingenza bivariata (o tavola di frequenza bivariata) rappresenta i modi in cui due variabili discrete si
manifestano congiuntamente in un certo insieme di osservazioni. Le categorie di una o di entrambe le
variabili possono essere ordinate o non ordinate. Siamo interessati a capire quale incidenza ha il livello di
sviluppo di un paese sul superamento o meno della sua biocapacità. Per biocapacità si intende la capacità
degli ecosistemi di produrre materia biologica utile e di assorbire rifiuti generati dall’uomo, usando le
pratiche agricole dominanti e la tecnologia prevalente.
Il deficit di biocapacità quindi indica la differenza fra la biocapacità e l’Impronta Ecologica di una regione o
di un paese. Un deficit ecologico si verifica quando l’Impronta di una popolazione eccede la biocapacità
dell’area disponibile per quella popolazione. Viceversa, si ha un surplus (o riserva) quando la Biocapacità di
una regione supera l’Impronta Ecologica della popolazione residente in quella regione.
Più precisamente prenderemo in considerazione il rapporto tra la quadripartizione ufficiale in “molto alto”,
“alto”, “medio” e “basso” dell’Indice di sviluppo umano dei paesi del mondo (che costituirà la variabile
esplicativa o indipendente) e lo scarto che esiste tra l’impronta ecologica e la disponibilità di risorse di uno
stato. La nostra domanda di ricerca è la seguente:
HP: quale incidenza ha l'indice di sviluppo umano sul superamento del deficit di biocapacità?
Le celle che formano il corpo di una tavola di contingenza contengono il numero dei casi nei quali si
manifesta una particolare combinazione di valori delle due variabili. Le distribuzioni marginali
corrispondono ai totali di riga (marginali di riga) e ai totali di colonna (marginali di colonna).
Tabella 3.1 Tavola di contingenza
Deficit
Reserve
TOTALE
Very high human development
25
6
31
High human development
29
10
39
Medium human development
21
13
34
Low human development
21
18
39
TOTALE
96
47
143
Difficilmente si può stabilire attraverso una tavola di frequenza se due variabili covariano; è quindi
necessario standardizzare la tavola utilizzando un determinatore comune. Questa trasformazione dà
origine alla tavola di frequenze percentuali. Le percentuali vengono sempre calcolate all’interno delle
categorie della variabile indipendente.
24
Tabella 3.2 Tavola di frequenze percentuali (standardizzata)
Deficit
Reserve
Totale
Very high human development
26
13
22
High human development
30
21
27
Medium human development
22
28
24
Low human development
22
38
27
100
100
100
TOTALE
IL TEST CHI-QUADRATO (Χ 2 )
Il test chi-quadrato è un test di significatività statistica finalizzato a determinare se le variabili in questione
sono indipendenti nella popolazione di riferimento. In sostanza, questo test sottopone a verifica l’ipotesi
nulla secondo la quale nella popolazione, dalla quale è stato estratto il campione, non esiste alcun legame
fra le variabili. L’ipotesi sostenuta dalla ricerca afferma invece che le due variabili sono correlate anche
nella popolazione. Il test confronta le frequenze di celle osservate con quelle attese in base all’ipotesi nulla.
Se fra le due variabili non esiste un legame diciamo che sono statisticamente indipendenti: se ciò fosse vero
le categorie della variabile dipendente non varierebbero al variare delle categorie della variabile
indipendente. Nella tabella si noterebbe quindi l’uguaglianza di tutte le distribuzioni percentuali di riga e di
colonna. Poiché nel nostro caso specifico questa uguaglianza sembra mancare, l’ipotesi di indipendenza
statistica fra le due variabili sembra poco plausibile. Per effettuare il test bisogna per prima cosa calcolare
le frequenze congiunte che si osserverebbero se le due variabili fossero statisticamente indipendenti ;
calcoliamo cioè le frequenze attese in base all’ipotesi nulla con la seguente formula
! =
( ! )( ! )
Fij circonflesso = frequenza attesa nella cella situata all’incrocio tra riga i e colonna j
fi.= frequenza totale marginale di riga
f.j= frequenza totale marginale di colonna
N = numerosità del campione
Tabella 3.3 Frequenze attese in base all’ipotesi nulla
Deficit
Reserve
Totale
Very high human development
21
10
31
High human development
26
13
39
Medium human development
23
11
34
Low human development
26
13
39
TOTALE
96
47
143
25
Tabella 3.4 Percentuali di riga e di colonna in base all’ipotesi nulla
Deficit
Reserve
Totale
Very high human development
22
22
22
High human development
27
27
27
Medium human development
24
24
24
Low human development
27
27
27
100
100
100
TOTALE
La statistica chi-quadrato riassume le differenze tra le frequenze osservate e quelle attese in tutte le celle
che formano la tavola di contingenza; la statistica chi-quadrato relativa ad una tavola di contingenza
bivariata è calcolata come segue:
"
χ = ∑∑
=
=
(!
−!
)
!
! ij = frequenza attesa nella cella situata all’incrocio tra riga i e colonna j secondo H0
fij= frequenza osservata nella stessa cella
C = numero di colonne della tavola
R = numero di righe della tavola
Tabella 3.5 Calcolo della statistica chi-quadrato per ogni singolo valore
Deficit
Reserve
Totale
Very high human development
0,84
1,72
2,57
High human development
0,30
0,62
0,92
Medium human development
0,15
0,30
0,44
Low human development
1,03
2,09
3,12
TOTALE
2,32
4,73
7,05
La differenza fra la frequenza attesa e quella osservata in ogni cella viene innanzitutto elevata al quadrato,
al fine di rimuovere i segni positivi e negativi, e quindi divisa per la frequenza attesa in quella cella. In
generale, maggiore è il valore della componente, maggiore è la differenza relativa fra la frequenza attesa e
quella osservata nella cella corrispondente.
In altre parole, i valori che compaiono nelle diverse celle indicano lo scostamento delle frequenze attese
rispetto a quelle osservate, che può equivalere ad una sovrastima o ad una sottostima. Vi è una sovrastima
quando nella matrice dei valori attesi la cella presenta un valore superiore a quello osseravto, sottostima
nel caso contrario.
26
La somma delle componenti della tabella è uguale a 7,05. Pertanto χ2=7,05
Per rifiutare o accettare l’ipotesi nulla, bisogna confrontare questo valore con il valore critico
corrispondente. La statistica del test chi-quadrato segue una distribuzione chi- quadrato con un certo
numero di gradi di libertà. Il numero di gladi di libertà dipende dal numero delle righe e delle colonne della
tavola stessa ; specificatamente, è uguale al prodotto del numero delle righe meno uno, moltiplicato per il
numero delle colonne meno 1.
Gl= (R-1)(C-1)
Gl=(4-1)(2-1)=3
Pertanto, la distribuzione campionaria appropriata per interpretare il valore assunto dalla statistica del test
χ2 (7,05) è la distribuzione campionaria χ2 con 3 gradi di libertà.
Per a= 0,05 e gradi di libertà 3 il valore critico nella tavola è 12,84. Poiché 7,05<12,84 non è possibile
rifiutare l’ipotesi nulla d'indipendenza. La relazione osservata nel campione non è statisticamente
significativa, cioè è improbabile che essa esista anche nella popolazione dalla quale è stato estratto il
campione. Dato che abbiamo dimostrato che la nostra ipotesi non è avvalorata, il modello di analisi dei dati
categoriali termina qui. Tuttavia di seguito dimostriamo attraverso la misura di associazione gamma e la
misura di associazione odds, come avremmo dovuto proseguire qualora la nostra ipotesi fosse stata
confermata.
LA MISURA DI ASSOCIAZIONE GAMMA (Γ)
La misura di associazione Gamma misura la forza dell’associazione fra le coppie di variabili ordinate e il suo
calcolo comporta la valutazione sistematica di tutte le coppie discordanti dissimili e tutte le coppie
concordanti dissimili presenti nella tavola. Può assumere valori compresi tra -1 e +1, con 0 che indica
l’assenza di relazione fra le variabili. Una volta identificate le coppie si può procedere al calcolo di Gamma.
Per essere applicata però necessita che le variabili siano ordinate.
=
−
# +
#
27
MISURA DI ASSOCIAZIONE ODDS
Nel caso in cui le variabili non sono ordinate si ricorre ad altre misure di associazione. Di seguito
descriviamo la misura di associazione odds. In via generale l’odds definisce il rapporto tra la frequenza di
appartenenza ad una categoria e la frequenza di non appartenenza a quella categoria.
L’Odds dei paesi in deficit equivale a: 96/(143-96) = 2,04
LOdds dei paesi in riserva equivale a: 47/(143-147) = 0,49
L’odds si differenzia dalla probabilità che invece definisce il rapporto tra la frequenza di appartenenza ad
una categoria e la frequenza di appartenenza a tutte le categorie.
Odds e probabilità sono così collegati:
$
=
−
Il concetto di odds (semplice) può essere esteso al concetto di odds condizionato. L’odds condizionato
corrisponde al rapporto tra la probabilità di appartenere alla categoria di una determinata variabile e la
probabilità di appartenere alle rimanenti categorie della stessa variabile.
Un odds condizionato corrisponde a 25/(96-25)=0,35
Ciò equivale a sostenere che un paese è tendente ad essere in deficit se appartiene alla categoria a molto
alto sviluppo umano.
Possiamo porre a confronto due odds condizionati e ottenere così l’odds-ratio:
25/(96-25)=0,35 e 6/(47-6)=0,15 → 0,35/0,15= 2,40
Se la nostra ipotesi di ricerca fosse stata confermata, attraverso questa misura di associazione,
dimostravamo che tra i paesi a molto alto sviluppo umano un paese ha circa due volte e mezzo più
probabilità di appartenere ad un paese in deficit di biocapacità.
28
REGRESSIONE E CORRELAZIONE BIVARIATA
In questa parte esamineremo le relazioni fra coppie di variabili continue. Le procedure di regressione e
correlazione bivariata assumono che la forma della relazione fra Y e X sia lineare e che la variabile
dipendente sia distribuita normalmente a ogni livello della variabile indipendente. In particolare
analizzeremo la relazione tra l'indice di sviluppo umano (indipendente X) e il tasso di impronta ecologica
(dipendente Y) per rispondere alla domanda:
HP: è maggiore l'impronta ecologica se è maggiore l'indice di sviluppo umano, negli Stati presi in
considerazione4?
In altre parole ci chiediamo se esiste una correlazione tra l'indice di sviluppo umano e l'impronta ecologica.
DIAGRAMMA DI DISPERSIONE E MODELLO DI REGRESSIONE
Per rappresentare graficamente la relazione fra coppie di variabili continue bisogna realizzare un
diagramma di dispersione. In un piano cartesiano i valori della variabile indipendente X (HDI) verranno
collocati sull'asse delle ascisse mentre i valori della variabile dipendete Y (Impronta ecologica) sull'asse
delle ordinate. In corrispondenza delle ordinate appropriate si traccia nel grafico, sottoforma di punto, la
posizione di tutte le osservazioni. L'insieme dei punti tracciati indica il modo in cui le variabili covariano
(forma lineare positiva, lineare negativa, curvilineare, nessuna relazione).
Grafico 4.1: Diagramma di dispersione tra HDI e impronta ecologica
ECOLOGICAL FOOTPRINT
12
10
8
6
4
2
0
0
0,2
0,4
0,6
0,8
1
HDI
Il nostro grafico assume una forma lineare positiva. Quando stimiamo fra una variabile dipendente Y e una
variabile indipendente X, regrediamo Y rispetto a X, producendo una relazione lineare bivariata o più
semplicemente una regressione bivariata.
In termini algebrici, la forma generale di un'equazione lineare è:
Y= a+bX
a = intercetta (punto in cui la retta incontra l'asse Y);
b = coefficiente di regressione (l'inclinazione della retta);
4
Non per tutti gli Stati è stato possibile calcolare l'HDI o l'impronta ecologica per mancanza di dati. I paesi
indicati sono tutti quelli in possesso di entrambi i tassi.
29
Il punto di partenza è dunque un'equazione predittiva nella quale il valore assunto dalla variabile
dipendente in corrispondenza di ciascuna osservazione i è una funzione lineare esatta del corrispondente
valore della variabile indipendente:
= +& % %
Il deponente di b indica l'ordine della regressione, con la variabile indipendente che segue quella
dipendente. L'accento circonflesso sopra Y, indica che si tratta di un valore atteso che può essere uguale o
diverso rispetto al corrispondente valore osservato (senza circonflesso). I dati analizzati però non seguono
mai relazioni lineari perfette; di conseguenza dobbiamo tenere conto delle deviazioni dalla predizione
lineare formulando un modello di regressione lineare:
= +& % % +
L’errore ei (residuo) rappresenta la porzione del valore Y in i non predetta dalla sua relazione lineare con X.
Esso misura quindi la discrepanza fra i valori osservati di Y e quelli attesi in base all'equazione predittiva.
L’errore ei è detto anche residuo perché:
−
=[ +& % % +
]− [
+& % % ]=
L’analisi di regressione stima i valori di a e b utilizzando i dati osservati. Compito del modello è minimizzare
i residui.
A un diagramma di dispersione è possibile sovrapporre una retta di regressione che, assumendo una data
relazione lineare, predice per ogni valore di Xi un preciso valore di Yi . La posizione delle osservazioni reali
nel grafico cartesiano può essere confrontata con la posizione da esse occupata lungo la retta di
regressione così da determinare l'entità degli errori di predizione.
CRITERIO DEI MINIMI QUADRATI:
Uno dei compiti principali dell'analisi di regressione è stimare i valori dei due coefficienti di regressione
utilizzando i dati stimati. Gli stimatori dei due coefficienti devono soddisfare il criterio dei minimi quadrati:
∑(
=
−
) =∑
=
sommando le differenze al quadrato fra ogni valore osservato Yi e il corrispondente valore Yi stimato
predetto dall'equazione di regressione prescelta, si deve ottenere una quantità minore di quella che si
otterrebbe utilizzando qualsiasi altra regressione lineare. Gli stimatori che soddisfano questo criterio
producono stime dei minimi quadrati comuni (OLS, ordinary least squares) di a e bYX. Lo stimatore OLS del
coefficiente di regressione bivariata bYX è calcolato così:
&% =
∑ ( − )(% − % )
∑ (% − % )
Nel nostro caso: bYX = 8,278
bYX può anche essere calcolato in questo modo: il numeratore bYX diviso per N- 1 determina la covarianza,
indicata come SYX:
30
=
%
∑(
−
)(%
−%
)
−
Il denominatore di bYX diviso per N-1 determina la varianza, indicata come s2x:
%
=
∑ (%
−%
)
−
Poiché N – 1 compare al denominatore di covarianza e varianza, nel rapporto di queste viene eliminato:
%
%
=
∑ ( − )(% − % )( − )
∑ (% − % ) ( − )
Lo stimatore può allora essere così espresso:
&% =
%
%
LO STIMATORE OLS
Lo stimatore OLS dell'intercetta a è invece dato da:
=
−& % %
Nel nostro caso: a = -2,216
Tabella 4.1: Paesi con i rispettivi tassi di impronta ecologic, indice di sviluppo umano e calcoli del modello
di regressione e correlazione bivariata
Y
Algeria
Angola
Benin
Botswana
Burkina Faso
Burundi
Cameroon
Central African Republic
Chad
Congo
Congo, Democratic
Republic of
Côte d'Ivoire
Egypt
Ethiopia
X
( − )(% − % ) (% − % )
bYX
a(OLS)
Ŷi
SQERRORE
SQREGRESSIONE
1,586
1,003
1,228
2,675
1,316
0,904
1,044
1,318
1,726
0,965
0,753
0,677
0,403
0,435
0,633
0,305
0,282
0,460
0,315
0,295
0,489
0,293
-0,069
0,444
0,337
-0,002
0,537
0,717
0,325
0,520
0,417
0,279
0,745
0,002
0,050
0,037
0,000
0,104
0,119
0,028
0,098
0,111
0,019
0,112
3,388
1,120
1,384
3,023
0,308
0,118
1,591
0,391
0,226
1,831
0,209
3,245
0,014
0,024
0,121
1,016
0,618
0,300
0,858
2,250
0,751
0,296
0,167
3,459
2,544
0,002
7,135
8,188
1,927
6,700
7,584
1,318
7,676
1,010
1,660
1,102
0,397
0,620
0,328
0,454
0,010
0,563
0,053
0,000
0,090
1,070
2,916
0,499
0,004
1,578
0,364
3,647
0,004
6,154
31
Gabon
Gambia
Ghana
Guinea
Guinea-Bissau
Kenya
Lesotho
Liberia
Libyan Arab Jamahiriya
Madagascar
Malawi
Mali
Mauritania
Mauritius
Morocco
Mozambique
Namibia
Niger
Nigeria
Rwanda
Senegal
Sierra Leone
South Africa
Sudan
Swaziland
Tanzania, United
Republic of
Togo
Tunisia
Uganda
Zambia
Zimbabwe
Afghanistan
Armenia
Azerbaijan
Bangladesh
Cambodia
China
Georgia
India
Indonesia
Iran, Islamic Republic of
Israel
Japan
Jordan
Kazakhstan
Korea, Republic of
Kuwait
Kyrgyzstan
1,412
3,445
1,752
1,667
0,962
1,112
1,074
1,260
3,051
1,794
0,731
1,931
2,609
4,261
1,221
0,772
2,155
2,349
1,437
1,018
1,095
1,050
2,319
1,734
1,498
1,178
0,648
0,390
0,467
0,340
0,289
0,470
0,427
0,300
0,755
0,435
0,385
0,309
0,433
0,701
0,567
0,284
0,606
0,261
0,423
0,385
0,411
0,317
0,597
0,379
0,498
0,398
-0,032
-0,111
0,197
0,378
0,683
0,294
0,382
0,564
0,009
0,228
0,546
0,334
0,072
0,094
0,107
0,759
0,018
0,231
0,316
0,476
0,408
0,599
0,020
0,310
0,192
0,414
0,000
0,056
0,026
0,083
0,115
0,025
0,040
0,107
0,016
0,037
0,059
0,102
0,038
0,005
0,004
0,118
0,000
0,134
0,042
0,059
0,047
0,097
0,001
0,062
0,017
0,053
3,148
1,012
1,649
0,598
0,176
1,674
1,318
0,267
4,033
1,384
0,971
0,341
1,368
3,586
2,477
0,135
2,800
-0,056
1,285
0,971
1,186
0,408
2,725
0,921
1,906
1,078
3,013
5,921
0,010
1,142
0,618
0,316
0,059
0,985
0,964
0,168
0,058
2,528
1,541
0,455
1,578
0,406
0,416
5,783
0,023
0,002
0,008
0,413
0,165
0,661
0,167
0,010
0,028
3,871
1,769
5,671
7,860
1,704
2,760
7,358
1,111
2,544
4,036
6,959
2,597
0,368
0,252
8,094
0,032
9,214
2,871
4,036
3,217
6,614
0,065
4,238
1,152
3,615
0,974
1,896
1,532
0,912
1,249
0,624
1,751
1,870
0,621
1,035
2,214
1,821
0,913
1,213
2,685
4,818
4,729
2,053
4,544
4,869
6,325
1,247
0,428
0,683
0,422
0,395
0,140
0,349
0,695
0,713
0,469
0,494
0,663
0,698
0,519
0,600
0,702
0,872
0,884
0,681
0,714
0,877
0,771
0,598
0,400
-0,060
0,298
0,481
0,844
0,656
-0,083
-0,095
0,374
0,260
-0,027
-0,081
0,225
0,049
-0,022
0,449
0,448
-0,049
0,135
0,471
0,479
0,051
0,040
0,003
0,042
0,054
0,238
0,078
0,005
0,007
0,025
0,018
0,001
0,005
0,012
0,001
0,006
0,060
0,066
0,003
0,007
0,062
0,021
0,001
1,327
3,437
1,277
1,053
-1,058
0,673
3,537
3,686
1,666
1,873
3,272
3,562
2,080
2,750
3,595
5,002
5,101
3,421
3,694
5,043
4,166
2,734
0,124
2,377
0,065
0,020
5,319
0,002
3,187
3,296
1,091
0,703
1,119
3,031
1,361
2,363
0,828
0,034
0,139
1,872
0,723
0,030
4,662
2,211
2,732
0,210
2,899
3,710
16,297
5,322
0,310
0,499
1,726
1,225
0,085
0,339
0,809
0,053
0,378
4,090
4,502
0,195
0,510
4,259
1,407
0,060
32
Lao People's Democratic
Republic
Malaysia
Mongolia
Myanmar
Nepal
Pakistan
Philippines
Qatar
Saudi Arabia
Singapore
Sri Lanka
Syrian Arab Republic
Tajikistan
Thailand
Timor-Leste
Turkey
Turkmenistan
United Arab Emirates
Uzbekistan
Viet Nam
Yemen
Albania
Austria
Belarus
Belgium
Bosnia and Herzegovina
Bulgaria
Croatia
Czech Republic
Denmark
Estonia
Finland
France
Germany
Greece
Hungary
Ireland
Italy
Latvia
Lithuania
Macedonia TFYR
Moldova
Netherlands
Norway
Poland
Portugal
Romania
Russian Federation
1,279
0,497
0,222
0,017
1,898
0,383
1,170
4,864
5,532
1,788
3,559
0,767
1,296
10,509
5,134
5,335
1,214
1,522
1,000
2,371
0,437
2,699
3,926
10,679
1,743
1,400
0,941
1,911
5,302
3,802
7,998
2,749
4,073
3,746
5,732
8,260
7,881
6,160
5,014
5,082
5,389
2,990
6,293
4,991
5,642
4,669
5,662
1,389
6,195
5,560
4,350
4,465
2,710
4,409
0,744
0,622
0,451
0,428
0,490
0,638
0,803
0,752
0,846
0,658
0,589
0,580
0,654
0,502
0,679
0,669
0,815
0,617
0,572
0,439
0,719
0,851
0,732
0,867
0,710
0,743
0,767
0,841
0,866
0,812
0,871
0,872
0,885
0,855
0,805
0,895
0,854
0,769
0,783
0,701
0,623
0,890
0,937
0,795
0,795
0,767
0,719
0,219
-0,015
0,211
-0,116
0,305
-0,017
1,320
0,268
0,514
-0,054
0,056
0,094
-0,016
0,320
-0,014
0,039
1,442
0,013
0,088
0,385
-0,098
0,519
0,086
1,201
-0,019
0,126
0,107
0,587
1,258
0,903
0,774
0,497
0,541
0,548
0,002
0,886
0,455
0,376
0,262
0,197
0,007
0,843
0,798
0,229
0,249
-0,038
0,130
0,014
0,000
0,031
0,040
0,019
0,000
0,031
0,015
0,048
0,001
0,001
0,002
0,001
0,016
0,003
0,002
0,035
0,000
0,003
0,036
0,008
0,050
0,011
0,057
0,007
0,013
0,019
0,046
0,057
0,034
0,059
0,060
0,066
0,052
0,031
0,071
0,051
0,020
0,024
0,005
0,000
0,069
0,096
0,028
0,028
0,019
0,008
3,942
2,932
1,517
1,327
1,840
3,065
4,431
4,009
4,787
3,230
2,659
2,585
3,197
1,939
3,404
3,321
4,530
2,891
2,519
1,418
3,735
4,828
3,843
4,960
3,661
3,934
4,133
4,745
4,952
4,505
4,994
5,002
5,109
4,861
4,447
5,192
4,853
4,149
4,265
3,586
2,941
5,151
5,540
4,364
4,364
4,133
3,735
0,850
6,760
0,074
4,984
1,151
3,128
36,951
1,266
0,301
4,065
1,293
2,510
0,683
2,257
0,497
0,365
37,806
1,317
1,251
0,227
3,330
0,224
0,002
9,229
0,832
0,019
0,149
0,974
10,943
11,395
1,359
0,000
0,001
0,279
2,124
1,211
0,019
2,230
0,163
4,307
2,408
1,089
0,000
0,000
0,010
2,025
0,453
0,927
0,002
2,139
2,732
1,299
0,007
2,106
1,059
3,266
0,063
0,103
0,156
0,047
1,082
0,180
0,117
2,404
0,008
0,212
2,440
0,571
3,417
0,746
3,924
0,464
0,911
1,330
3,118
3,892
2,328
4,057
4,090
4,537
3,541
2,154
4,896
3,510
1,368
1,653
0,368
0,002
4,715
6,556
1,918
1,918
1,330
0,571
33
Serbia
Slovakia
Slovenia
Spain
Sweden
Switzerland
Ukraine
United Kingdom
Argentina
Bolivia
Brazil
Chile
Colombia
Costa Rica
Dominican Republic
Ecuador
El Salvador
Guatemala
Haiti
Honduras
Jamaica
Mexico
Nicaragua
Panama
Paraguay
Peru
Trinidad and Tobago
Uruguay
Venezuela, Bolivarian
Republic of
Canada
United States of America
Australia
New Zealand
Papua New Guinea
MEDIA
2,389
4,058
5,303
5,421
5,883
5,016
2,902
4,892
2,596
2,574
2,906
3,238
1,869
2,686
1,473
1,885
2,032
1,774
0,676
1,911
1,927
2,996
1,558
2,873
3,192
1,537
3,091
5,131
2,894
0,735
0,818
0,828
0,863
0,885
0,874
0,710
0,849
0,775
0,643
0,699
0,783
0,689
0,725
0,663
0,695
0,659
0,560
0,404
0,604
0,688
0,750
0,565
0,755
0,640
0,723
0,736
0,765
0,696
-0,063
0,205
0,465
0,575
0,747
0,502
-0,006
0,423
-0,056
-0,006
-0,005
0,040
-0,068
-0,029
-0,053
-0,074
-0,030
0,082
0,515
0,025
-0,064
0,002
0,089
-0,014
0,003
-0,137
0,012
0,295
-0,006
0,012
0,036
0,040
0,055
0,066
0,061
0,007
0,049
0,022
0,000
0,005
0,024
0,004
0,009
0,001
0,005
0,001
0,005
0,050
0,001
0,004
0,015
0,004
0,016
0,000
0,009
0,012
0,019
0,005
3,868
4,555
4,638
4,927
5,109
5,018
3,661
4,811
4,199
3,106
3,570
4,265
3,487
3,785
3,272
3,537
3,239
2,419
1,128
2,783
3,479
3,992
2,461
4,033
3,081
3,768
3,876
4,116
3,545
2,188
0,247
0,442
0,244
0,599
0,000
0,576
0,006
2,569
0,283
0,441
1,054
2,617
1,209
3,235
2,727
1,455
0,417
0,204
0,762
2,409
0,991
0,814
1,347
0,012
4,980
0,616
1,029
0,423
0,789
2,482
2,749
3,794
4,537
4,157
0,464
3,356
1,487
0,016
0,348
1,653
0,258
0,649
0,085
0,310
0,067
0,314
3,429
0,038
0,249
1,025
0,269
1,111
0,010
0,622
0,804
1,292
0,320
7,014
7,996
6,839
4,892
2,137
0,888
0,902
0,937
0,907
0,431
1,050
1,376
1,194
0,534
0,166
42,355
0,068
0,075
0,096
0,078
0,039
5,117
5,134
5,250
5,540
5,292
1,351
3,533
7,538
1,687
0,160
0,617
283,736
4,643
5,156
6,556
5,346
2,651
350,606
2,980
8,278
-2,216
0,628
SQTOTALE
R2YX
r YX
QMREGRESSIONE
QMERRORE
F1;142
634,342
0,553
0,743
350,606
1,998
175,466
34
Grafico 4.2: Diagramma di dispersione della relazione tra HDI e impronta ecologica con la relativa retta di
regressione
12
ECOLOGICAL FOOTPRINT
10
8
6
4
2
0
0
0,2
0,4
-2
0,6
0,8
1
HDI
L'equazione di regressione bivariata della nostra retta è la seguente:
Ŷi=a+(bYX*Xi)
Esempio: -2,216+(8,278*0,677)
Se la scala dell'asse orizzontale fosse sufficientemente estesa la retta incrocerebbe l'asse verticale in
corrispondenza del valore a (-2,216).
LA SOMMA DEI QUADRATI:
La somma dei quadrati totale è scomponibile in somma dei quadrati dell'errore e domma dei quadrati della
regressione:
∑(
−
=
) = ∑(
=
−
) + ∑(
)
−
=
SQTOTALE = SQERRORE + SQREGRESSIONE = 283,736 + 350,606 = 634,342
IL COEFFICIENTE DI DETERMINAZIONE:
Se si vuole conoscere la proporzione della variazione totale di Y che è determinata dalla sua relazione
lineare con X bisogna utilizzare il coefficiente di determinazione:
%
=
%
=
∑(
−
)
∑(
−
)
=
=
Esso può assumere valori fra 0 e1. Quando si verifica una predizione perfetta allora R2YX = 1. Quando invece
tutta la variazione osservata è dovuta all'errore, allora R2YX = 0.
Nel nostro caso: R2YX = 0,553 = 55,3 %
Questo significa che il 55,3 % della variazione dell'impronta ecologica è correlata all'indice di sviluppo
umano.
35
IL COEFFICIENTE DI CORRELAZIONE:
il coefficiente di correlazione di Pearson riassume la relazione lineare fra due variabili continue e
corrisponde alla radice quadrata di R2YX.
rYX =
Essa mostra la direzione della relazione fra X e Y attraverso il segno positivo e negativo che accompagna il
coefficiente.
Nel nostro caso: rYX = 0,743
TEST DI SIGNIFICATIVITÀ:
Il test di significatività per R2YX e anche per rYX si basa sulla distribuzione F e consente di trarre inferenze
sulla popolazione partendo dai dati campionari.
In un'analisi di regressione, la somma dei quadrati totale ha gl= N-1, mentre la somma dei quadrati della
regressione ha gl= 1.
Per questo motivo i gradi di libertà possono essere così ripartiti:
glTOTALE = glREGRESSIONE + glERRORE
N - 1 = 1 + glERRORE
glERRORE = N - 2
I quadrati medi della regressione e dell'errore vengono calcolati dividendo la somma dei quadrati
corrispondenti per i gradi di libertà ad essa associati:
=
=
=
(
)=(
−
( )(
)
%
)− (
)
−
Nel nostro caso:
QMREGRESSIONE = 350,606
QMERRORE= 1,998
L'equazione di regressione stimata sarà valida anche per la popolazione quando:
SQREGRESSIONE > SQERRORE quindi quando QMREGRESSIONE > QMERRORE
Dato che 350,606 > 1,998possiamo affermare che l'equazione stimata risulta vera anche per la popolazione.
IL QUOZIENTE F:
Il quoziente F corrisponde al rapporto fra i due quadrati medi:
−
=
Nel nostro caso: F1,142= 175,466
Per α = 0,10 il valore critico nella tabella di Fisher corrisponde a 2,71. 2
Mentre per α = 0,05 il valore critico nella tabella di Fisher corrisponde a 3,84. 2
36
Poiché la nostra statistica del test F (175,466 > 2,71 e 175,466 > 3,84) supera ampiamente il valore critico,
possiamo rifiutare l'ipotesi nulla e affermare che nella popolazione il coefficiente di determinazione è
maggiore di zero. Possiamo accettare in altre parole la nostra ipotesi di ricerca.
CONCLUSIONI
Qui di seguito sintetizzeremo le domande e i risultati relativi ai tre modelli.
Analisi della Varianza - ANOVA
HP: la collocazione geografica (NORD/SUD del mondo) influenza il tasso di impronta ecologica?
Nel primo modello abbiamo analizzato il rapporto fra la collocazione geografica e il tasso di impronta
ecologica. Più specificatamente ci siamo chiesti se la suddivisione NORD/SUD del mondo influenza il
consumo della capacità ambientale. È emerso che fra queste due variabili esiste un legame significativo:
attraverso il modello è stato possibile rifiutare l'ipotesi nulla.
Si dimostra che circa il 20,91% dell'impronta ecologica è legato alla collocazione geografica. È risaputo
infatti che i paesi più industrializzati, notoriamente collocati nell'emisfero settentrionale, hanno livelli di
consumo del territorio e uno stile di vita al di sopra delle possibilità ecologiche.
Analisi dei dati categoriali
HP: quale incidenza ha l'indice di sviluppo umano sul superamento del deficit di biocapacità?
Nel secondo modello abbiamo preso in considerazione l'indice di sviluppo umano (HDI) e l'impronta
ecologica. In particolare la nostra domanda prende in analisi il deficit di biocapacità (dato dalla differenza
fra la biocapacità e l’Impronta Ecologica di una regione o di un paese. Un deficit ecologico si verifica quando
l’Impronta di una popolazione eccede la biocapacità dell’area disponibile per quella popolazione. Viceversa,
si ha un surplus quando la Biocapacità di una regione supera l’Impronta Ecologica della popolazione
residente in quella regione). Il nostro scopo è di comprendere in che modo la quadripartizione dell'indice di
sviluppo umano influenzi il deficit di biocapacità.
Dai calcoli è emerso che l'HDI non riveste un ruolo statisticamente significativo in relazione al superamento
o meno del carico ecologico.
Questo non è un dato molto confortante in quanto da un Paese ad alto sviluppo umano ci si aspetterebbe
maggior rispetto ed equilibrio nei confronti delle risorse territoriali.
Abbiamo quindi dimostrato che essere un paese ad alto sviluppo umano non significa necessariamente
avere le risorse economiche, sociali, politiche e tecnologiche per la tutela ambientale.
Regressione e correlazione bivariata
HP: è maggiore l'impronta ecologica se è maggiore l'indice di sviluppo umano, negli Stati presi in
considerazione?
Nel terzo ed ultimo modello abbiamo preso ancora in considerazione la relazione tra impronta ecologica e
indice di sviluppo umano, questa volta in modo da verificare se tra queste due variabili esiste una
correlazione. Dai calcoli è emerso che esiste una correlazione lineare crescente rispetto ai dati presi in
considerazione. Abbiamo riscontrato che il 53,3 % della variazione dell'impronta ecologica è spiegata
dall'indice di sviluppo umano.
37
Dal modello si evidenzia che minore è lo sviluppo umano di un Paese, minore è la sua impronta ecologica
sul pianeta.
A tal proposito è utile ricordare come nel continente africano, ad esempio, l’ambiente naturale rappresenta
un fattore indispensabile per il mantenimento dell’organizzazione sociale, della struttura economica e
politica, delle credenze e delle pratiche religiose. Molte comunità hanno sviluppato un accumulo di
esperienze e conoscenze empiriche sul funzionamento degli ecosistemi naturali ed elaborato istituzioni e
strategie, spesso di carattere religioso, destinate ad introdurre limitazioni nell’uso delle risorse naturali e
ambientali. “Pur interagendo con l’ambiente circostante e modificandolo, sembra quindi che le popolazioni
ne conservassero intenzionalmente le risorse per le generazioni future.” (C. Cencini, 2005, p.37).
Grafico 5.1: Relazione Ecological Footprint - HDI per macroaree geografiche
Relazione Ecological Footprint - HDI
9,000
ECOLOGICAL FOOTPRINT
8,000
7,000
6,000
Africa
5,000
Asia
4,000
Europe
3,000
Latin America and the Caribbean
2,000
United States and Canada
Oceania
1,000
0,000
0,000
0,200
0,400
0,600
0,800
1,000
HUMAN DEVELOPMENT INDEX
38
39
40