Estadistica Descriptiva
Estadistica Descriptiva
Estadistica Descriptiva
TESIS
Rafael Meier DEUDOR GOMEZ
Aracely Leslie VICUÑA
II
CAPARACHIN
ESTADÍSTICA DESCRIPTIVA
La distribución de frecuencias. Puede ser relativa en porcentajes
simples o acumulada. Los gráficos más utilizados son los histogramas y
los gráficos circulares.
Las medidas de tendencia central: Moda, Mediana y Media.
3
DISTRIBUCION DE
FRECUENCIA
Distribución de frecuencia es la representación estructurada, en forma de tabla, de toda la información que se ha
recogido sobre la variable que se estudia.
Donde:
Xi : los distintos valores que puede tomar la variable. (i=1,2,3...k).
fi : el número de veces que se repite cada valor.
hi : el porcentaje que la repetición de cada valor supone sobre el total. n
: el número de observaciones realizadas.
4
PROPIEDADES O TIPOS DE
FRECIENCIA
FRECUENCIA ABSOLUTA ACUMULADA (Fi):
La frecuencia absoluta acumulada es el resultado de ir sumando las frecuencias absolutas de las
observaciones o valores de una población o muestra. Se representa por Fi. Para calcular la frecuencia
absoluta acumulada, hay que calcular primero la frecuencia absoluta (fi) de la población o muestra.
La suma de las frecuencias absolutas simples desde la primera clase hasta la clase enésima es igual a la
frecuencia absoluta acumulada de la clase enésima.
𝐹
𝑖 =𝑓 1+ 𝑓 2 +𝑓 3+ … … …+𝑓 𝑖
Solo para la primera clase, la frecuencia absoluta acumulada de la primera clase es igual a la
frecuencia absoluta simple de la primera clase, mientras que la frecuencia absoluta acumulada de la
ultima clase siempre debe ser igual al numero total de datos.
𝐹1 =𝑓 1
N
5
FRECUENCIA RELATIVA SIMPLE (hi):
La frecuencia relativa simple es el cociente entre la frecuencia absoluta de un determinado intervalo y el
número total de datos.
Se puede expresar en tantos por ciento y se representa por hi
La suma de las frecuencias relativas es igual a 1.
𝑓𝑖 𝑓𝑖
h𝑖 =
𝑁
h𝑖 %=
𝑁 ( ). 100 h
+h +h +… .. h =1
1 2 3 𝑛
6
PARA DATOS NO
AGRUPADOS
EJEMPLO 1
Medimos la altura de los niños de una clase y obtenemos los siguientes resultados (cm):
a.- Construir una tabla de frecuencias para la información del cuadro anterior.
n=30
7
TABLA DE FRECUENCIAS DE LOS ALUMNOS DE UNA CLASE
VALOR conteo f
1.20 I 1
1.21 IIII 4
1.22 IIII 4
1.23 II 2
1.24 I 1
1.25 II 2
1.26 III 3
1.27 III 3
1.28 IIII 4
1.29 III 3
1.30 III 3
𝑓𝑖 Los valores más representativos son: 13.3% de alumnos de la clase ti ene como
h𝑖 %=
𝑁 ( ). 100 talla 1.21 , 1.22 , 1.28 y un solo alumno ti ene un talla de 1.20 que representa el
3.3% de todos los alumnos de la clase. 8
PARA DATOS
AGRUPADOS
CONSTRUCCION DE UNA TABLA DE DATOS AGRUPADOS
EJEMPLO 1
Los siguientes valores son mediciones del peso (en miles de toneladas) de grandes tanques de petróleo:
229, 232, 239, 232, 259, 361, 220, 260, 231, 229, 249, 254, 257, 214, 237, 253, 274, 230, 223, 253, 195, 269,
231, 268, 189, 290, 218, 313, 220, 270, 277, 375, 222, 290, 231, 258, 227, 269, 220, 224.
n=40
9
4º
Se procede a calcular el Numero de Intervalos de Clase (k), Para el que se utilizara la
Relación de Sturges:
10
Medidas de posición central
MEDIA
ME Informan
DID sobre los
AS valores
MEDIANA
DE medios de
POS Las medidas la serie de
ICIÓ de posición datos
N nos facilitan
MODA
información
sobre la serie
de datos que
estamos Medidas de posición no centrales
analizando y
nos permiten CUARTILES
informan
conocer sus
de cómo
diversas
se
características.
distribuye
DECILES
el resto de
los valores
de la serie.
PERCENTILES
11
MEDIDAS DE POSICIÓN CENTRAL
Es el valor medio ponderado de la serie de datos. Se pueden calcular diversos ti pos de media, siendo las más
MEDIA utilizadas:
MEDIA ARITMÉTICA
EJEMPLO:
Los siguientes valores son mediciones del peso (en miles de toneladas) de grandes tanques de petróleo.
229, 232, 239, 232, 259, 361, 220, 260, 231, 229, 249, 254, 257, 214, 237, 253, 274, 230, 223, 253, 195, 269,
231, 268, 189, 290, 218, 313, 220, 270, 277, 375, 222, 290, 231, 258, 227, 269, 220, 224.
12
se calcula multiplicando cada
valor por el número de veces que
Media aritmética
se repite. La suma de todos estos
datos agrupados:
productos se divide por el total de
datos de la muestra:
EJEMPLO
: Vamos a
utilizar la 1.20
tabla de 4.84
distribución 4.88
de 2.46
frecuencias
con los
1.24
2.5
3.78
∑ 𝒇 𝒊 𝑿𝒊
1.253
datos de la
3.81
estatura de
5.12
los 3.87
n=3
alumnos. 3.9 0
13
MARCA DE CLASE :
Ejemplo :
Los siguientes valores son mediciones del peso (en miles de toneladas) de grandes tanques de petróleo.
818
4239
3464.5
595
∑ 𝒇 𝒊 𝑿𝒊
10164
328.5
719
n=4
0
Luego:
14
MEDIA GEOMÉTRICA
Ejemplo:
Se ti ene la siguiente información 1, 4, 8, 10, 15. Se pide calcular la media
geométrica.
15
Ejemplo:
Los siguientes valores son mediciones del peso (en miles de toneladas) de grandes tanques de petróleo.
Media armónica
Supongamos que tenemos un conjunto de n datos que genéricamente
representaremos por: X1 , X2 ,….., Xk , asociadas a las frecuencias
absolutas f1 , f2 ,….., fk , respectivamente. La media armónica está dado
por:
Ejemplo:
Hallar la media armónica de la siguiente información 3, 6,9.
16
MEDIANA
Es el valor de la serie de datos ordenados ascendente o descendente que se sitúa justamente en el centro de la
muestra (un 50% de valores son inferiores y otro 50% son superiores).
Mediana datos simples: Supongamos que tenemos un conjunto de n datos que genéricamente
representaremos por: X₁, X₂,….., Xn. La mediana se calcula:
La mediana será el valor de la variable que La mediana será la media aritmética de los valores de las
ocupa la posición (n+1)/2, esto es: variables que ocupan las posiciones n/2 y n/2+1, esto es:
Ejemplo:
Ejemplo:
Supongamos que los datos son: 3, 5, 2, 4, 6 , 8, 7, 7, 6 Supongamos que los datos son: 3, 5, 2, 4, 6, 8, 7, 7
17
Mediana datos con intervalos: Es el valor que se sitúa justamente en el centro de la muestra (un 50% de
valores son inferiores y otro 50% son superiores).
MODA
18
Moda datos con intervalos: Se encuentra en el intervalo que ti ene mayor frecuencia absoluta.
Ejemplo:
Determinar la moda de la siguiente información:
←
19
MEDIDAS DE POSICIÓN NO CENTRAL
Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que no
son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la
muestra en tramos iguales:
Son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en
Cuartiles (Q)
cuatro tramos iguales en los que cada uno de ellos concentra el 25% de los datos.
Donde:
Q₁: 1º Cuartil
Q₂: 2º Cuartil
Q₃: 3º Cuartil
Percentiles (P): Son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en
cien tramos iguales en los que cada uno de ellos concentra el 1% de los resultados.
Datos agrupados:
20
Para datos con intervalos de
clase se utiliza la siguiente
fórmula:
Vamos a calcular los cuartiles de la serie de datos referidos a la estatura de un grupo de alumnos.
21
MEDIDAS DE DISPERSIÓN
Estudia la distribución de los valores de la serie, analizando si
estos se encuentran más o menos concentrados o más o menos
dispersos.
22
23
24
25
26
27
Gracias
Rafael DEUDOR GOMEZ
Aracely L. VICUÑA CAPARACHIN
[email protected]
[email protected]