5 Ud Estadistica
5 Ud Estadistica
5 Ud Estadistica
DIDCTICA 12
1.
Caractersticas de la estadstica
La Estadstica es un conjunto de tcnicas. Tcnicas analticas para ver
en unos datos lo que nuestra mirada no es capaz de ver porque son
muy numerosos. En Estadstica hay tres tipos de tcnicas, tres
actividades
bsicas,
tres
acciones:
Descripcin,
Relacin
y
Comparacin.
Descripcin: Tcnicas donde no se infiere, slo se mira lo que se tiene:
la muestra. Se le calculan descriptores que capten aspectos relevantes
de ella. Se dibujan grficos que la resuman. La muestra es el fin, no un
medio.
Relacin: Tcnicas que buscan relaciones entre variables, entre
diferentes caractersticas medidas a una serie de individuos. Se busca
la existencia de relacin entre ellas y se pretende establecer relaciones
matemticas entre ellas.
______________________________________________________________________________________________________________________________________________________________________
Ramas de la estadstica
Segn el colectivo a partir del cual se obtenga la informacin y el
objetivo que persiga a la hora de analizar esos datos, le estadstica de
llama descriptiva o inferencial.
Conceptos y Terminologa
Poblacin: Una poblacin es el conjunto de todos los elementos a los
que se somete a un estudio estadstico. No debe confundirse la
poblacin en sentido demogrfico y la poblacin en sentido estadstico.
La poblacin en sentido demogrfico es un conjunto de individuos
(todos los habitantes de un pas, todas las ratas de una ciudad),
mientras que una poblacin en sentido estadstico es un conjunto de
datos referidos a determinada caracterstica o atributo de los individuos
(las edades de todos los individuos de un pas, el color de todas las
ratas de una ciudad).
Individuo: Un individuo o unidad estadstica es cada
elementos que componen la poblacin.
uno
de los
Cuantitativos:
Son
aquellos
que
se
Determinan variables estadsticas que pueden ser:
pueden
medir.
______________________________________________________________________________________________________________________________________________________________________
un
la
letra
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un
determinado valor y el nmero total de datos: es un tanto por uno.
Se puede expresar en tantos por ciento y se representa por ni.
de tablas
de
frecuencias se
utiliza
con variables
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes
temperaturas mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30,
29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de
menor a mayor, en la segunda hacemos el recuento y en la tercera
anotamos la frecuencia absoluta.
xi
Recuent
o
fi
Fi
ni
Ni
27 I
0.03
2
0.032
28 II
0.06
5
0.097
29
0.19
4
0.290
30
16
0.22
6
0.051
6
31
24
0.25
8
0.774
32 III
27
0.09
7
0.871
33 III
30
0.09
7
0.968
34 I
31 0.03
______________________________________________________________________________________________________________________________________________________________________
10
2
31
11
Ci
fi
Fi
ni
Ni
[0, 5)
2.5
0.025
0.025
[5, 10)
7.5
0.025
0.050
[10, 15)
125
0.075
0.125
[15, 20)
17.5
0.075
0.200
[20, 25)
22.5
11
0.075
0.2775
[25, 30)
27.5
17
0.150
0.425
[30, 35)
32.5
24
0.175
0.600
[35, 40)
37.5
10
34
0.250
0.850
[40, 45)
42.5
38
0.100
0.950
[45, 50)
47.5
40
0.050
40
12
fi
AB
9
N
2
0
Polgonos de frecuencias
Variables discretas
Los polgonos de frecuencias se realizan trazando los puntos que
representan las frecuencias y unindolos mediante segmentos.
Ejemplo
Las temperaturas en un da de otoo de una ciudad han sufrido las
siguientes variaciones:
Hor
a
Temperatur
a
12
12
14
15
11
18
12
21
10
24
______________________________________________________________________________________________________________________________________________________________________
13
fi
Fi
[50, 60)
55
[60, 70)
65
10
18
[70, 80)
75
16
34
[80, 90)
85
14
48
[90, 100)
95
10
58
[100, 110)
110
63
[110, 120)
115
65
65
Diagrama de sectores
Un diagrama de sectores se puede utilizar para todo tipo de variables,
pero se usa frecuentemente para las variables cualitativas.
Los datos se representan en un crculo, de modo que el ngulo de
cada sector es proporcional a la frecuencia absoluta correspondiente.
El diagrama circular se construye con la ayuda de un transportador de
ngulos.
Ejemplo
______________________________________________________________________________________________________________________________________________________________________
14
Alumnos ngulo
Baloncesto
12
144
Natacin
36
Ftbol
108
Sin deporte 6
72
Total
360
30
Histograma
Un histograma es una representacin grfica de una variable en forma
de barras. Se utilizan para variables continuas o para variables
discretas, con un gran nmero de datos, y que se han agrupado
en clases.
En el eje abscisas se construyen unos rectngulos que tienen por base
la amplitud del intervalo, y por altura, la frecuencia absoluta de
cada intervalo.
La superficie de
cada barra es proporcional a
los valores representados.
la frecuencia de
fi
Fi
______________________________________________________________________________________________________________________________________________________________________
15
[50, 60)
55
[60, 70)
65
10
18
[70, 80)
75
16
34
[80, 90)
85
14
48
[90, 100)
95
10
58
[100, 110)
105
63
[110, 120)
115
65
65
de
amplitud
que calcular las alturas de
______________________________________________________________________________________________________________________________________________________________________
16
fi
hi
[0, 5)
15
[5, 7)
20
10
[7, 9)
12
[9, 10)
50
Parmetros estadsticos
Un parmetro estadstico es un nmero que se obtiene a partir de
los datos de una distribucin estadstica.
Los parmetros estadsticos sirven para sintetizar la informacin dada
por una tabla o por una grfica.
Hay tres tipos parmetros estadsticos:
De centralizacin.
De posicin.
De dispersin.
______________________________________________________________________________________________________________________________________________________________________
17
Medidas de centralizacin
Nos indican en torno a qu valor (centro) se distribuyen los datos.
Las medidas de centralizacin son:
Media aritmtica
La media aritmtica es el valor promedio de la distribucin.
La media
aritmtica es
el valor obtenido
al sumar todos
los datos y dividir el resultado entre el nmero total de datos.
es el smbolo de la media aritmtica.
Ejemplo
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso
medio.
______________________________________________________________________________________________________________________________________________________________________
18
xi
fi
xi fi
[10, 20)
15
15
[20, 30)
25
200
[30,40)
35
10
350
[40, 50)
45
405
[50, 60
55
440
[60,70)
65
260
[70, 80)
75
150
42
1 820
19
fi
[60, 63)
61.5
[63, 66)
64.5
18
[66, 69)
67.5
42
[69, 72)
70.5
27
[72, )
8
100
20
[63, 66)
18
[66, 69)
42
[69, 72)
27
[72, 75)
8
100
______________________________________________________________________________________________________________________________________________________________________
21
hi
[0, 5)
15
[5, 7)
20
10
[7, 9)
12
[9, 10)
50
Parmetros de posicin
Las medidas de posicin dividen un conjunto de datos en grupos con el
mismo nmero de individuos.
Para calcular las medidas de posicin es necesario que los datos estn
ordenados de menor a mayor.
La medidas de posicin son:
Mediana: La mediana divide la serie de datos en dos partes
iguales.
Cuartiles: Los cuartiles dividen la serie de datos en cuatro
partes iguales.
______________________________________________________________________________________________________________________________________________________________________
22
23
Ejemplo
Calcular la mediana de una distribucin estadstica que viene dada por
la siguiente tabla:
fi
Fi
[60, 63)
[63, 66)
18
23
[66, 69)
42
65
[69, 72)
27
92
[72, 75)
100
100
100 / 2 = 50
Clase modal: [66, 69)
Mediana
La mediana es la puntacin de la escala que separa la mitad
superior de la distribucin y la inferior, es decir divide la serie de datos
en dos partes iguales.
Es el valor que ocupa el lugar central de todos los datos cuando stos
estn ordenados de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar slo para variables cuantitativas.
______________________________________________________________________________________________________________________________________________________________________
24
Clculo de la mediana
1 Ordenamos los datos de menor a mayor.
2 Si la serie tiene un nmero impar de medidas la mediana es
la puntuacin central de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5
3 Si la serie tiene un nmero par de puntuaciones la mediana es
la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12 Me=
9.5
Cuartiles
Los cuartiles son los tres valores de la
variable que dividen a
un conjunto de datos ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y
al 75% de los datos.
Q2 coincide con la mediana.
Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez
partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90%
de los datos.
D5 coincide con la mediana.
Percentiles
Los percentiles son los 99 valores que dividen la serie de datos en 100
partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al
99% de los datos.
P50 coincide con la mediana.
Clculo de los cuartiles
1 Ordenamos los datos de menor a mayor.
2 Buscamos
el
lugar
que
ocupa
la
expresin
.
Nmero impar de datos
2, 5, 3, 6, 7, 4, 9
______________________________________________________________________________________________________________________________________________________________________
25
Fi
[50, 60)
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
63
[110, 120)
65
65
26
Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez
partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90%
de los datos.
D5 coincide con la mediana.
Clculo de los deciles
En primer lugar buscamos la clase donde se encuentra
en la tabla de las frecuencias acumuladas.
Fi
[50, 60)
[60, 70)
10
18
[70, 80)
16
34
______________________________________________________________________________________________________________________________________________________________________
27
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
63
[110, 120)
65
65
Clculo del primer decil
28
Percentiles
Los percentiles son los 99 valores que dividen la serie de datos en 100
partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al
99% de los datos.
P50 coincide con la mediana.
Clculo de los percentiles: En primer lugar buscamos la clase donde se
encuentra
Fi
[50, 60)
[60, 70)
10
18
______________________________________________________________________________________________________________________________________________________________________
29
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
63
[110, 120)
65
65
Percentil 35
Percentil 60
Medidas de dispersin
Las medidas de dispersin nos informan sobre cunto se alejan del
centro los valores de la distribucin.
Las medidas de dispersin son:
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una
distribucin estadstica.
Desviacin media
La desviacin media es la media aritmtica de los valores absolutos de
las desviaciones respecto a la media.
Varianza
La varianza es
la media
aritmtica del cuadrado
desviaciones respecto a la media.
de
las
Desviacin tpica
La desviacin tpica es la raz cuadrada de la varianza.
______________________________________________________________________________________________________________________________________________________________________
30
Desviacin media
La desviacin respecto a la media es la diferencia entre cada valor de la
variable estadstica y la media aritmtica.
Di = x - x
La desviacin media es la media aritmtica de los valores absolutos de
las desviaciones respecto a la media.
La desviacin media se representa por
Ejemplo
Calcular la desviacin media de la distribucin:
9, 3, 8, 8, 9, 8, 9, 18
Ejemplo
Calcular la desviacin media de la distribucin:
xi
fi
xi fi
|x - x|
|x - x| fi
[10, 15)
12.5
37.5
9.286
27.858
[15, 20)
17.5
87.5
4.286
21.43
[20, 25)
22.5
157.5
0.714
4.998
[25, 30)
27.5
110
5.714
22.856
[30, 35)
32.5
65
10.174
21.428
______________________________________________________________________________________________________________________________________________________________________
31
21
457.5
98.57
Varianza
La varianza es la media aritmtica del cuadrado de las desviaciones
respecto a la media de una distribucin estadstica.
La varianza se representa por .
fi
xi fi
xi2 fi
[10, 20)
15
15
225
[20, 30)
25
200
5000
[30,40)
35
10
350
12 250
______________________________________________________________________________________________________________________________________________________________________
32
[40, 50)
45
405
18 225
[50, 60
55
440
24 200
[60,70)
65
260
16 900
[70, 80)
75
150
11 250
42
1 820
88 050
Propiedades de la varianza
1 La varianza ser siempre un valor positivo o cero, en el caso de que
las puntuaciones sean iguales.
2 Si
a
todos
los valores de
la
variable
se
les suma un nmero la varianza no vara.
3 Si
todos
los valores de
la
variable
se multiplican por
un nmero la varianza queda multiplicada por
el cuadrado de
dicho nmero.
4 Si tenemos varias distribuciones con la misma media y conocemos
sus respectivas varianzas se puede calcular la varianza total.
Si todas las muestras tienen el mismo tamao:
Si las muestras tienen distinto tamao:
33
fi
xi fi
xi2 fi
[10, 20)
15
15
225
[20, 30)
25
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
405
18 225
[50, 60)
55
440
24 200
[60,70)
65
260
16 900
[70, 80)
75
150
11 250
______________________________________________________________________________________________________________________________________________________________________
34
42
1 820
88 050
______________________________________________________________________________________________________________________________________________________________________
35
______________________________________________________________________________________________________________________________________________________________________
36
3.
EL INFORME
descriptiva.
ESTADSTICO:
estadstica
4.
EL ESTUDIO
inferencial.
ESTADSTICO:
estadstica
______________________________________________________________________________________________________________________________________________________________________
37
______________________________________________________________________________________________________________________________________________________________________
38
Ejercicios resueltos
______________________________________________________________________________________________________________________________________________________________________
39
______________________________________________________________________________________________________________________________________________________________________
40
b)
Diagrama de barras de frecuencia absoluta y polgono de
frecuencias
Representar el diagrama de barras de frecuencia absoluta
______________________________________________________________________________________________________________________________________________________________________
41
42
______________________________________________________________________________________________________________________________________________________________________
43
Interpretacin
La mayora de los nios, 23 tiene un peso comprendido entre 3 y 3,5 kg.
Los nios con menor peso [2,5 - 3) son muy pocos solo 6.
Ejemplo de un diagrama de sectores
En un hipermercado se han producido las siguientes ventas en euros:
juguetes 125, plantas 175, discos 250, alimentacin 450.
a) Calcular las frecuencias, porcentajes y ngulo correspondiente.
b) Realizar un diagrama de sectores.
a) Colocamos los datos en una tabla.
Las variable xi son los productos vendidos.
Las frecuencias absolutas f i son las ventas en euros de cada producto.
Las frecuencias relativas hi se obtienen dividiendo las frecuencias
absolutas entre el total de euros 1000 .
El porcentaje % se calcula multiplicando la frecuencia relativa por 100.
b) Diagrama de sectores
Para realizar el diagrama de sectores necesitamos conocer el ngulo.
Para hallar el ngulo multiplicamos la frecuencia relativa por 360 que
se corresponden con el total. Ver datos en la tabla.
Dibujamos los ngulos obtenidos en un crculo, unos a continuacin de
otros.
______________________________________________________________________________________________________________________________________________________________________
44
______________________________________________________________________________________________________________________________________________________________________
45
frecuencia fi
4
11
11
6
6
2
40
Fi xi fi
4
8
15 33
26 44
32 30
38 36
40 14
165
______________________________________________________________________________________________________________________________________________________________________
xi2 fi
16
99
176
150
216
98
755
46
Marca de
clase xi
35
Frecuencia
xi fi xi2 fi
fi
6
210 7350
______________________________________________________________________________________________________________________________________________________________________
47
40 - 50
45
18
810
50 - 60
55
76
4180
60 - 70
65
70
4550
70 - 80
75
22
1650
80 - 90
85
680
1208
0
200
36450
22990
0
29575
0
12375
0
57800
75100
0
______________________________________________________________________________________________________________________________________________________________________
48
______________________________________________________________________________________________________________________________________________________________________
49
______________________________________________________________________________________________________________________________________________________________________
De todas los parmetros estudiados, los ms significativos son la media para las
medidas de centralizacin y la desviacin tpica para las medidas de dispersin.
Vamos a hacer un estudio conjunto de ambas para entender mejor su significado.
La media aritmtica es el centro de gravedad de la distribucin estadstica. Si nos
imaginamos el diagrama de barras o el histograma de frecuencias apoyado en un
punto del eje horizontal de forma que quedase en equilibrio, el valor de este punto
en dicho eje sera el valor de la media.
Como ya hemos comentado, no es suficiente con un parmetro de centralizacin,
______________________________________________________________________________________________________________________________________________________________________
______________________________________________________________________________________________________________________________________________________________________
un conjunto de perros con una media de 40 kilos y una desviacin tpica de 10 kilos.
Qu grupo de animales es ms homogneo?
Un razonamiento falso sera decir que el conjunto de perros es ms homogneo
porque su desviacin tpica es ms pequea, pero si calculamos el coeficiente de
variacin para ambos:
Vv = 50/500 = 0.1
Vp = 10/40 = 0.25
Por tanto, es ms homogneo el conjunto de las vacas.
______________________________________________________________________________________________________________________________________________________________________
Como las dos variables tipificadas tienen la misma media y la misma desviacin
tpica, tiene ms peso el animal que tiene mayor puntuacin normalizada, es decir,
el perro.
En la siguiente escena se puede calcular el coeficiente de variacin y las
puntuaciones normalizadas o tipificadas:
1.
4 , 7 , 4 , 3 , 9 , 1 , 6 , 8 , 5 , 1 , 7 , 7 , 2 , 4 , 8 , 10 , 8 ,
3 , 6 ,7
2.
3.7
4.8
5.4
6.1
6.2
6.7
7.5
7.8
3.
Calificacin de los alumnos de 3 E.S.O. en un examen de Matemticas.
Calificaci
1
2
3
4
5
6
7
8
9
10
n
N
8
10 12 21 19 21 16 13 11 4
135
alumnos
4.
El precio de dos productos en 40 supermercados distintos viene reflejado en
las siguientes tablas.
1 l. leche
0.67 0.69 0.70 0.71 0.72 0.74 0.77
______________________________________________________________________________________________________________________________________________________________________
N
mercados
1
kg
0.84
azcar
N
4
mercados
10
40
0.87
0.88
0.90
0.91
0.93
0.95
xi
2.2
2.4
2.6
fi
12
38
63
112 150 75
450
1/6
1/4
1/3
1/2
2/3
3/4
75
66
60
45
39
22
40
5.
2.8
6.
xi
fi
0
85
400
7.
La siguiente tabla refleja el peso de 1000 nios en el momento del
nacimiento.
Peso
[2.5,3) [3,3.5) [3.5,4) [4,4.5) [4.5,5]
N de nios
8.
248
317
206
145
84
1000
______________________________________________________________________________________________________________________________________________________________________
Horas
[0,1)
N
de
39
alumnos
[1,2)
[2,3)
[3,4)
[4,5)
[5,6]
74
92
92
46
17
360
9.
Estatura de un grupo de personas asistentes a un congreso.
Altura
en [1.4,1. [1.5,1. [1.6,1. [1.7,1. [1.8,1. [1.9,2
metros
5)
6)
7)
8)
9)
]
N
de
2
13
49
33
19
12
128
personas
10.
Horas de funcionamiento de
determinada empresa.
[80,9 [90,10 [100,1 [110,1
Horas
0)
0)
10)
20)
N pilas 880 951
1450
1324
11.
A continuacin
de una empresa.
Puntuaci
[5,1
[0,5)
n
0)
N
1
3
personas
15
23
29
______________________________________________________________________________________________________________________________________________________________________
37
40
155
12.
A={
B={
C={
13.
Con los datos del ejercicio 4,
a) Si en un supermercado encontramos la leche a 0.74 euros y el azcar a 0.97
euros, qu producto se puede considerar ms barato dentro de su grupo ?
b) En otro supermercado un litro de leche vale 0.70 euros y un kilo de azcar 0.89
euros, qu producto es ms barato ?
______________________________________________________________________________________________________________________________________________________________________