Probabilidad y Estadística Descriptiva PPT 2

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 33

Medidas de tendencia central

Medidas de tendencia central

Medidas de Posición: son aquellos valores numéricos que nos


permiten o bien dar alguna medida de tendencia central, dividiendo
el recorrido de la variable en dos, o bien fragmentar la cantidad de
datos en partes iguales. Las más usuales son la media, la mediana, la
moda, los cuartiles, quintiles, deciles y percentiles.
.
La Media
medias de los diferentes conjuntos. 3) Es posible hallar la media
de La idea de media o promedio (también llamada media
aritmética) formaliza el concepto intuitivo de punto de equilibrio
de las observaciones. Es decir, es el punto medio del recorrido de
la variable según la cantidad de valores obtenidos.

Ese valor tiene varias propiedades importantes. 1) Si se suma la


distancia de todos los valores respecto de la media, esa suma da
cero. 2) Si se toman una cantidad cualesquiera de conjuntos de
valores, cada uno con su respectiva media, la media del conjunto
general es igual a la suma de cada una de las un conjunto de
valores de una variable a partir de tomar la distancia de las
observaciones a un valor cualquiera (pertenezca o no al recorrido
de la variable) 4) si a un conjunto de observaciones de una
variable se le realiza una operación matemática usando un valor
constante, entonces la media del nuevo grupo de valores así
obtenidos es igual a la aplicación de la misma operación
matemática usando ese valor constante sobre la media original.
El cálculo de la Media

Dado un conjunto de observaciones

la media se representa mediante y se obtiene dividiendo la suma de todos los


datos por el número de ellos, es decir:

La interpretación de la media como centro (o punto de equilibrio) de los datos se


apoya en una propiedad que afirma que la suma de las desviaciones

de un conjunto de observaciones a su media es igual a cero; es decir, puede


probarse que
Media aritmética (I)

La media aritmética de un conjunto de datos es el cociente entre la suma


de todos los datos y el número de estos.

Ejemplo: las notas de Juan en escala universitaria


el año pasado fueron:
50, 60, 40, 70, 80, 40, Hay 7 datos
60
que suman 400
La nota media de Juan es:

50  60  40  70  80  40  60 400
Nota media =   57
7 7
PROPIEDADES DE LA MEDIA
• Si a cada uno de los datos se aumenta o disminuye en una
constante K, la media aumenta o disminuye en K unidades.
• Si a cada uno de los datos se multiplica o se divide por una
constante K, la media se multiplica o divide por k unidades.
Media aritmética (II)

Cálculo de la media aritmética cuando los datos se repiten.


1º. Se multiplican los datos por sus frecuencias absolutas respectivas, y
se suman.
2º. El resultado se divide por el total de datos.

Ejemplo. Las notas de un grupo de alumnos fueron:

Notas Frecuencia Notas x Datos por frecuencias


absoluta F. absoluta
3 5 15
5 8 40 129
6 10 60 Media   5,1
25
7 2 14
Total 25 129
Total de datos
Mediana

La mediana, es el dato que divide a los datos en dos partes iguales.


Debemos considerar cuando los datos son pares o impares.

En caso en que N es par,


promediamos el dato
en caso que N sea impar obtenido y el siguiente.
La mediana

La mediana de un conjunto de datos es un valor del mismo tal que el número de


datos menores que él es igual al número de datos mayores que él.

Los pesos, en kilogramos, de 7 jugadores de un


Ejemplo:
equipo de fútbol son: 72, 65, 71, 56, 59, 63, 72

1º. Ordenamos los 56, 59, 63, 65, 71, 72, 72


datos:
2º. El dato que queda en el centro es La mediana vale 65.
65.
Caso: Si el número de datos fuese par, la mediana es la
media aritmética de los dos valores centrales.

Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana es: 63  65
 64
2
Moda
La moda, es aquel dato, aquel valor de la
variable que más se repite; es decir, aquel
valor de la variable (que puede no ser un
único valor) con una frecuencia mayor.
La moda

La moda de un conjunto de datos es el dato que más se repite.

Ejemplo. Una zapatería ha vendido en una semana los zapatos


que se reflejan en la tabla:

Nº de calzado 38 39 40 41 42 43 44 45
Nº de personas 16 21 30 35 29 18 10 7

El número de zapato más


vendido, el dato con mayor
Lo compran 35 personas
frecuencia absoluta, es el 41.

La moda es 41.
MEDIDAS DE POSICION
Cuartil, Quintiles, Deciles, Percentiles

Los cuartiles, deciles, percentiles son los números que


•  dividen un numero de datos en partes iguales.
Por esta razón los cuartiles (Q) dividen los datos en 4
partes iguales, los quintiles (quintil) dividen los datos en
5 partes iguales, los deciles (D) lo dividen en 10 partes
iguales y los percentiles (P) en 100.
En datos no agrupados para calcular cada uno de ellos
utilizados las siguientes expresiones.
MEDIDAS DE TENDENCIA CENTRAL PARA
DATOS AGRUPADOS.

PROMEDIOS

JUAN JOSÉ VENEGAS MORENO


OBJETIVOS

Al finalizar la Tema, el alumno será capaz de:

1. Diferenciar los diversos tipos de medidas de resumen


que se pueden aplicar a un conjunto de datos agrupados.
2. Calcular e interpretar las principales medidas de
tendencia central para datos agrupados.
CONTENIDO

Principales medidas de tendencia central para datos


agrupados.

 Medias
 Mediana
 Moda
LA MEDIA ARITMÉTICA
Cálculo a partir de datos agrupados.
El cálculo de la media aritmética, cuando los datos
disponibles se encuentran en tablas de distribución de
frecuencias, se realiza utilizando la formula siguiente
n
 fi Xi
x  i 1
n
 fi
donde: :media i 1

x
:frecuencia absoluta de la clase i
f :marca de la clase i
i
Xi
Ejemplo:
La distribución de frecuencias siguiente, representa los puntajes
obtenidos en una evaluación del desempeño, aplicado al personal
técnico de un Centro de Salud. El puntaje máximo en la prueba
es 50. Calcule e interprete en media.
Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Primero se calcularán las marcas de clase ( Xi );
es decir, el valor intermedio de cada clase
Marca de Frecuencia
clase x
clase ( ) absoluta(fi)
i
12 - 16 14 4
17 - 21 19 8
22 - 26 24 15
27 - 31 29 23
32 - 36 34 10
Total 60

14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10)


x  x  1575
4 + 8 + 15 + 23 + 10 60
x  26.25
Interpretación: Si se elige al azar a un trabajador técnico de este
hospital, se espera que tenga un puntaje de 26,25 en su
evaluación de desempeño.
Para realizar cálculos de Mediana, Moda, se deben considerar
limites reales de los intervalos. Estos limites están dados por el
promedio entre el limite aparente superior de un intervalo y el
limite aparente inferior del intervalo superior.

Desempeño Número de En este caso el limite real superior del primer


(puntos) técnicos intervalo seria el promedio entre 16 y 17, lo
que nos da un valor de 16,5. El limite
12 - 16 4
inferior se considera 11,5 ya que en este
17 - 21 8 intervalo van valores que pueden partir desde
22 - 26 15 11,5 hasta el 16,5.
27 - 31 23 El limite real superior del segundo intervalo
es el promedio entre 21 y 22 , lo que da el
32 - 36 10
valor de 21,5.
TOTAL 60
d) Cálculo de la Mediana a partir de datos agrupados.

n 
2   F  
donde: Md  Li   c
:  f Md 
 
Md mediana
Li : limite real (o frontera) inferior de la clase
mediana.(Intervalo donde la frecuencia acumulada
es mayor o igual que n/2)

n : número total de datos.


F : Frecuencia acumulada anterior al intervalo de la
mediana.
f Md : frecuencia absoluta de la clase mediana
c : amplitud de clase
Ejemplo: La tabla siguiente muestra la experiencia laboral
(años) del personal de seguridad que labora en un gran hospital.
Calcule e interprete la mediana.
Lugar de la mediana:
Experiencia Número de n 69
laboral trabajadores   34,5
(años) de seguridad 2 2
0-3 4
4-7 12  69  (16) 
Clase Md  7,5   2 4
8 - 11 24  24 
Mediana  
12 - 15 16
16 - 19
20 - 23
10
3  7,5 
 34,5  16  4
69  24 
Mediana = 10,5 años
Interpretación:

La mitad del personal de seguridad que


labora en este hospital tienen una experiencia
laboral igual o menor a 10 años 6 meses. La
otra mitad de este personal tiene una
experiencia laboral igual o mayor a 10 años y
6 meses.
Ventajas y desventajas
Ventajas:
Los valores extremos no afectan a la mediana
como en el caso de la media aritmética.
Es fácil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos,
registrados bajo una escala ordinal.
Desventajas:
Como valor central, se debe ordenar primero la
serie de datos.
LA MODA

Cálculo a partir de datos agrupados

 1 
Mo  L    c
donde: i  
 1 2
Mo: moda
L : limite real (o frontera) inferior de la clase
i modal (Intervalo que posee la mayor frecuencia)
: frecuencia de la clase modal menos la
 frecuencia de la clase anterior
1
: frecuencia de la clase modal menos la
 frecuencia de la clase siguiente
2
: amplitud de clase
c
Las clases mediana y modal pueden coincidir pero
conceptualmente son diferentes.
Ejemplo: La tabla siguiente muestra los errores de facturación
durante un mes, en una Clínica. Calcule e interprete la moda.

Errores de
facturación Días
0-3 6  6
1
Clase Clase moda : (4 - 7)
4-7 12
Modal
 6 
8 - 11 8  4 Mo  3.5    4
64
2
12 - 15 3
16 - 19 1
Total 30 Mo = 5,9
Interpretación: Durante un mes, el número más frecuente de
errores de facturación en esta clínica es 6.
Ventajas y desventajas de la moda.

Ventajas:
Se puede utilizar tanto para datos cualitativos como
cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan una o más clases
abiertas.
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribución amodal).
En otros casos la distribución tiene varias modas, lo que
dificulta su interpretación.
Medidas de Posición. Cuartiles, quintiles, deciles,
percentiles.

 
Recordemos que estas medidas de posición separan los datos en partes iguales,
Cuartil es la división de los en 4 partes iguales (1 cuartil es percentil 25%)
Quintil es la división de los datos en 5 partes iguales.(primer quintil es el percentil
20% y así sucesivamente)
Decil es la división de los datos en 10 partes iguales.
Percentil es la división de los datos en 100 partes iguales.

Para calcular las distintas medidas de posición se utiliza la expresión

 [a,b[ : intervalo que tiene la frecuencia acumulada F, de al menos datos.


Puntaje Frecuencia Frecuencia
Absoluta acumulada
350----------399 4
400----------449 6
450-----------499 9
500-----------549 20
550-----------599 31
600------------649 80
650------------699 42
700-----------749 10
750------------799 8
800-----------849 2
a) Determine media, mediana y moda de los datos del puntaje
de PSU obtenidos en una generación de un Colegio.
b) Determina el cuartil 3 de los datos e interprétalo.
c) Determina el decil 9 de los datos e interpreta su valor.
d) Determina el cuartil 2
Intervalo frecuencia
1,65-----1,69 6
1,70-----1,74 12
1,75-----1,79 33
1,80------1,84 22
1,85------1,89 8
1,90------1,94 2

a) Determine media, mediana y moda de los datos del puntaje de


PSU obtenidos en una generación de un Colegio.
b) Determina el cuartil 2 de los datos e interprétalo.
c) Determina el decil 8 de los datos e interpreta su valor.
Cantidad de abdominales Cantidad de estudiantes
[20, 28[ 3
[28, 36[ 9
[36, 44[ 15
[44, 52[ 18
[52, 60[ 8
[60, 68[ 5

a) ¿Cuantos abdominales como máximo logro hacer el 25% del total de los
estudiantes con rendimiento mas bajo?
b) ¿Cuantos abdominales como mínimo realizaron el 50% de los estudiantes
con mejor rendimiento?
c) ¿Cuantos abdominales como mínimo hicieron los estudiantes que se
encuentran en el 10% con mejor rendimiento?
Masa corporal f F
[50-60[ 18 18
[60,70[ 32 50
[70, 80[ 45 95
[80, 90[ 17 112
[90, 100[ 8 120

 a) Calcular

También podría gustarte