Unidad 3, Estadística

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 17

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO, UASD

Medidas de Tendencia Central y no Central o


de Posición
Unidad 3

Prof. Lilliam V. Peña Amador


Diciembre 2015
Tabla de contenido

Medidas de Tendencia central…………………………………………………………..…..…………………..3


Media aritmética ..................................................................................................................................... .3

Característica de la media Aritmética ........................................................................................... 4

Media Aritmética para datos en Distribución de frecuencia simple…………….………………..4

Media Aritmética para datos en Distribución de frecuencia Agrupada ................... .5

Media Ponderada ........................................................................................ 6

Mediana ..................................................................................................... 6

Característica de la Mediana……………………………………………………….……..…………………………….....6

Procedimiento para Determinar la Mediana…………….…….…………………………………….…………...7

Mediana Para Datos en Distribución de Frecuencia Agrupada..………..……………….......8

La Moda………………………………………………………………………………………………………………………..9

Características de la Moda…………….…….…………………………………….……………………………………….10
Moda Para Datos en Distribución de Frecuencia Agrupada…………….……….….………………..10
Medidas de tendencia no centrales o de posición…………….…….…………….…….………….11
Medidas de Posición para datos Simples o sueltos …………………………………………………..13
Medidas de Posición para datos Simples o sueltos..………..……………………………….......14

BIBLIOGRAFIA…………………………………………………………………………………………………………………………..17

2
Medidas de Tendencia central

Resulta de interés saber en torno a que valor se concentran los datos recolectados o
más bien cual valor representa el conjunto de datos, tener este conocimiento es de
gran utilidad tanto en los niveles de decisión como en los de ejecución. Para esto
recurrimos a las medidas de tendencia central, que tal como indica su nombre son
los valores que representan a un conjunto de datos y hacia los cuales tienden a
agruparse la mayoría de los datos, suele decirse el centro de la variable.
Las principales medidas de tendencia central son:

 Media aritmética o promedio


 Media ponderada
 Mediana
 Moda

Estas medidas se calculan para variables cuantitativas, para las variables


cualitativas solo se puede calcular la moda

Media Aritmética o Promedio aritmético ( X ) es la medida de tendencia central


más conocida y utilizada, generalmente alrededor de esta se ubica la parte central
de la distribución de los datos. La media se representa por X , y resulta al dividir la
suma de todos los valores de la variable entre la cantidad de datos o más bien el
numero de las observaciones (n)
n

x i
x i

Ejemplo No.1: En cinco consultorios de medicina general de un centro de salud


donde se atendieron a 18, 26, 22, 19, 34 pacientes, se determina el promedio de
pacientes atendidos por consultorio.
n

x i
= 18+ 26+22+19+ 34 ; X = 23.8 pacientes
x i

n 5

El promedio de pacientes atendidos en un consultorio es de 23.8 pacientes


3
Características de la Media Aritmética

1) Se calcula para datos en escala de intervalo y razón


2) Es única y es el centro de gravedad en un conjunto dado de datos
3) Es sensible a valores extremos, aberrantes o atípicos
4) La suma de los desvíos de los datos con respecto a la media es igual a 0
5) No se puede calcular con clases abiertas

Con el promedio obtenido a partir de una muestra se puede estimar el total de


unidades de la población. Si se habilitan 10 consultorios, el total de pacientes
atendidos es:

Total = N × X 10* X 10 * 23.8= 238 pacientes

Media Aritmética Para Datos Distribución de frecuencia simple

Si se dispone de una base de datos de gran tamaño, resulta trabajoso calcular X ; Si


estos datos se tienen en una tabla de distribución simple podemos obtener el
promedio de la siguiente manera: multiplicar los valores de la variable “x“ por las
respectivas frecuencias finalmente se suman y este total se divide por la cantidad
de datos (n = Ʃfi). La formula a utilizar presenta una pequeña variación a la vista
anteriormente, donde:
x i
 xi f i
n

Ejemplo No.2: puntaje de pacientes evaluados en la unidad de terapia del lenguaje.

x f x*f F
Puntaje Pacientes evaluados x*f Frecuencia acumulada
0 1 0 1
1 1 1 2
2 1 2 3
3 2 6 5
4 3 12 8
5 3 15 11
6 4 24 15
7 8 56 23
8 3 24 26
9 2 18 28
10 2 20 30
Total 30 178
4
Al determinar el puntaje promedio obtenido

x
xf
i i i =178/30
n

Media Aritmética para Datos en Distribución de Frecuencia Agrupada

k  k 
 xi fi  xi fi
Para este caso la formula a utilizar se modifica por esta: x i 1
 i 1
k

f
n
i
i 1

Donde Xi: representa cada valor de la variable o el punto medio si estas se


presentan agrupadas
fi: frecuencia absoluta simple de cada valor.

El primer paso es identificar como están presentados los datos, luego escribir la
fórmula adecuada, debemos observar que se realiza el producto de dos valores
punto medio y frecuencia (ya conocida para cada grupo o clase). Es necesario
calcular el punto medio
1.-formula
2.- X = PM=(Ls+ Li )/2
3.-Multiplicar cada PM por su frecuencia
4.-sumar los productos, así ese valor sustituyen el numerador de la formula
5.- Se divide el numerador entre la suma de la frecuencia que está en el
denominador

k  k 
 xi fi  xi fi
x i 1
 i 1
k

f
n
i
i 1

Ejemplo No.3:
Tiempo de gestación (en semanas), de 60 mujeres atendidas en una maternidad

5
Tiempo de
gestación f
PM PM * f
x
xf
i i i
4-127 9 8 72 n
12-204 18 16 288
20-28 16 24 384
28-36 17 32 544
Total 60 1288 X = 1288 a, X s= 21.47 semanas de gestación
60

Media ponderada

Esta medida se utiliza en caso que los valores de las variables a considerar para
calcular el promedio aritmético tienen distintos pesos o importancia previa.

Ejemplo No.4:
10 personas suben a un teleférico, 4 mujeres y 6 hombres, el peso promedio de las
mujeres es 135 libras y el de los hombres 170 libras. Cuál es el peso promedio de las
10 personas en el ascensor?

4(135)+6(170) = 540+1020 = 156 libras


10 10

La Mediana

Es la medida que divide en dos grupos iguales la distribución de los datos, es el


valor central (percentil 50).
Se usa generalmente cuando los datos son muy dispersos, si los datos siguen una
distribución asimétrica o cuando se tienen intervalos, grupos o clases en que
algunos límites no están bien definidos.

Características de la Mediana

Todo conjunto de datos tiene una solo una mediana


No se ve afectada por valores extremos o atípicos
Se puede utilizar en datos agrupados en distribuciones de frecuencia con clases
abiertas.
Se puede utilizar en datos cualitativos, cuando estos están expresados en una
escala ordinal.
Su valor cambia cuando cambia el tamaño de la muestra

6
Procedimiento para determinar la Mediana

1.-Ordenar los datos de forma ascendente o descendente


2.-Calcular el orden de la mediana al calcular, (n+1)/2
3.-Ubicla el valor de mediana en los datos ya ordenados (contar hasta la posición
que indica el orden de la mediana

Ejemplo No.5 Se tiene el tiempo que esperan 5 pacientes para una cita con el
especialista que le atiende.

Datos: 18, 26, 22, 19, 30

1. Orden de los datos: 18, 19, 22, 26, 30

(5+1)/2 =3.

Se ubica la posición 3 en el conjunto ordenado de datos, corresponde a 22


Me = 22 dias

Interpretación: la mitad 50%, de los pacientes esperan menos de 22 días y el resto


más de 22 días para ser atendidos

Si los datos están organizados en una tabla de frecuencia simple

no. días interno (x) Cantidad pacientes (f)


0 2
1 4
2 3
3 7
4 5
5 4
( Total 25

1.-Se verifica que los datos están previamente ordenados


2.- Se extiende una columna para calcular la frecuencia acumulada
3.- se calcula el orden mediana y el resultado se busca en la frecuencia acumulada
que sea igual o mayor que este resultado

Ejemplo No. 6

7
no. días interno (x) Cantidad pacientes (f) F
0 2 2
1 4 6
2 3 9
3 7 16
4 5 21
5 4 25
Total 25

El orden de la mediana se obtiene con igual procedimiento que con los datos
simples, es decir, (25+1)/2 =13.
El valor en la tabla, el orden es 16 (mayor, ya que no hay 13), corresponde al
cuarto valor de la variable, que es 3, luego concluimos con la siguiente
interpretación, se informa que la mitad de los pacientes, 50% permanece
hospitalizado menos de 3 días y el resto más de 3 días.

Mediana Para Datos en Distribución de Frecuencia Agrupada

Para este caso la formula a utilizar es la siguiente:

n 1  F
Me  Li  2 a
x C
f
n 1
OM 
2

Donde Li: límite inferior de la clase seleccionada o clase que contiene a la mediana
OM : Orden de la mediana, tal como se observa resulta de dividir el total más 1
entre dos
Fa: F mayúscula, frecuencia acumulada en este caso de la clase anterior a la clase
seleccionada
f: frecuencia absoluta simple de la clase mediana
C: Intervalo o ancho de la clase mediana
N: tamaño de la muestra, total

Ejemplo No.7: se recopila y presenta las edades de 119 pacientes recibidos en el


hospital Dr. Darío contreras durante el fin de semana

8
Para determinar la edad mediana, se observa que la tabla presenta los datos en
orden, así que lo primero es extender la tabla con la columna donde se obtiene la
frecuencia acumulada, luego se calcula el orden de la mediana (OM)

n  1 119  1
OM    60, se selecciona la segunda clase ( no hay 60 en la frec , el mayor es 70)
2 2

Todos los elementos de la formula se sustituyen a partir de los datos de la clase


seleccionada

Li = 35
OM = 60
Fa= 40 60  40 ; Me  35  0.666 x10 
Me  35  x 10
f = 30 30
I = 10 Me=41.66 años

La mitad de los pacientes tienen menos de 41.66 años y los demás tienen más de
esa edad.

La Moda

Es el valor o los valores que se presentan o repite con mayor frecuencia en un


conjunto de observaciones. Si existen dos modas se denomina unimodal, y si hay
más de dos se denomina multimodal.
Es muy útil cuando se trata de una variable cualitativa, como cuando preguntamos
a los afiliados a la seguridad social, cual fue el motivo de su visita,
Si I es información, Q queja, R reclamación

Ejemplo No. 8, Respuestas de los afiliados : I, I, Q, I, Q, R, I, R, I, I, I

Mo= I, lo que más demandan los afiliados es información


9
Ejemplo No.9:
a) se registra el peso de RN en la maternidad nuestra señora de la Altagracia:
6.5 , 6.8, 7, 8, 7, 8.5, 7
Mo=7 el peso más frecuente, o lo más común es que los RN tengan 7 libras

Ejemplo No.10
b) 6.5, 6.8, 7.0, 7.5, 8.0
Mo=no hay moda, entre los recién nacidos no hay un peso común

Características de la Moda

Esta se utiliza tanto par datos cualitativos como cuantitativos


Su valor no se obtiene por procedimientos algebraicos
En un conjunto de datos pueden existir más de una moda o no existir moda (cuando
no se repite ningún valor o cuando las repeticiones de varios valores coincidan, se
dé un empate)

Moda Para Datos en Distribución de Frecuencia Agrupada

En este caso, con datos agrupados en una distribución de frecuencia, para obtener
la moda se utiliza la siguiente fórmula (se presentan dos formas):

1 Da
Mo  Li  h  Mo  Li  xC
1   2 Da  DP
Donde:

Mo: Moda
Li : límite inferior de la clase modal
Δ1=Da: Diferencia entre la frecuencia de la clase modal y frecuencia de la clase
anterior a ésta
Δ2=Dp : Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
posterior a ésta
I=C : Intervalo de la clase modal(ancho de la clase)

Ejemplo No.11
Edades Pacientes(f)
25- 35 40
35- 45 30
45- 55 20
55- 65 20
65- 75 9
Total 119
10
La mayor frecuencia identifica la clase modal, con la que trabajaremos y
obtenemos los elementos a sustituir en la fórmula
Así: La clase modal es la primera, ya que 40 es la mayor de las frecuencias, donde
Li = 25 y las diferencias serán:

La diferencia entre la frecuencia de la clase modal y la clase anterior (para este


caso que no existe clase anterior el valor es 0)
Da= 40 – 0 = 40

La diferencia entre la frecuencia de la clase modal y la clase siguiente o posterior


Dp= 40-30 = 10
Ancho de la clase, C= 5

Al sustituir obtenemos la moda

40  40 
Mo  25  x 5 , Mo  25    x 5 ; Mo  25  (0.8 x5)
40  10  50 

Mo=25+4, Mo =29, la edad más común entre los pacientes es 29 años

Medidas de tendencia no centrales o de posición

Las medidas de posición tienen gran utilidad, ya que nos permiten conocer puntos
específicos no centrales que caracterizan el conjunto de los datos que estamos
estudiando. Estas medidas dividen los datos en grupos con la misma cantidad de
elementos o individuos.

Las medidas más utilizadas son:


 Cuartiles, ( Qk)
 Deciles (Dk)
 Percentiles (Pk)

Al estudiar la mediana aprendimos que esta medida divide el conjunto de datos en


dos partes iguales y que para obtener este valor se debe seguir un procedimiento.
Con estas medidas seguiremos el mismo procedimiento y en el orden de la mediana
al orden k y varia el denominador que es en la cantidad de grupos a dividir en
partes iguales, cuando para obtener la mediana dividimos entre 2, para el cuartil,
será entre 4, así sucesivamente.

11
Podemos definir la separación según nuestro interés, ya que si buscamos otorgar un
reconocimiento, un programa de entrenamiento o decidir sobre cierto nivel una
cirugía gástrica, en lugar de utilizar el valor mediano utilizamos el valor percentil,
decil, o cuartil de un orden k alto, los que se ubican sobre 80%, para este valor nos
referimos a D8 o P80.

Los cuartiles: son medidas de posición no central que dividen al conjunto de datos
ordenados en cuatro partes iguales, donde cada parte representa un 25 %. Así al
primer punto o ubicación le corresponde el 25%, el segundo punto 50%, al tercero
75%

25% 25% 25% 25%

Q1 Q2 Q3
25% 50% 75%

El cuartil 1, separa el 25% de los datos menores del resto 75% que se encuentra
sobre este valor.
El cuartil 2 al igual que la mediana separa el 50% de los datos menores del 50%
restante que esta sobre este valor
El cuartil 3 separa el 75 % de datos menores del restante 25% que esta sobre este
valor.

Los Deciles: son medidas de son medidas de posición no central que dividen al
conjunto de datos ordenados en diez partes iguales, donde cada parte representa
un 10 %. Así al primer punto le corresponde el 10%, al segundo 20%, al tercero 30%,
así sucesivamente. Observe que la ubicación del quinto decil coincide con la
mediana y con el cuartil 2

10% 10% 10% 10% 10% 10% 10% 10% 10% 10%

D1 D2 D5 D9

Los Percentiles: son medidas de son medidas de posición no central que dividen al
conjunto de datos ordenados en cien partes iguales, donde cada parte representa
un 1 % de la población. Así al primer punto le corresponde el 1%, al segundo 2%, al
tercero 3%, así sucesivamente, hasta llegar el punto 99 al que le corresponde el 99%

12
Medidas de Posición para datos Simples o sueltos

Procedimiento

1.-Ordenar los datos de forma ascendente o descendente


2.-Calcular el orden de la medida que se trate, si es:
a) Cuartil, será Qk=k(n+1)/4

b) Decil, Dk=k(n+1)/10

c) Percentil Pk=k(n+1)/100

3.-Ubicar el valor de obtenido en el punto anterior en los datos ya ordenados


(contar hasta la posición que indica el orden de la mediana.
La mediana se expresa a través del cuartil 2, decil 5 y percentil 50

Ejemplo No.12:
Con las edades de 16 personas seleccionadas al azar de una población diabética:
24,41, 38, 29, 39, 53, 23, 33, 43, 45, 27, 35, 29, 30, 32, 25

Paso No. 1,
Ordenamos : 23, 24, 25, 27, 29, 29 30, 32, 33, 35, 38, 39, 41, 43,
45, 53
1 2 3 4 5 8 9

Paso No.2
n=16, Determinar el cuartil 1
Q1 sustituir en Qk=k(n+1)/4 ; en Q1=1(16+1)/4 Q1=4.25

Si el resultado es 4 el valor sería 27 años, según el resultado, ahora debemos


interpolar entre la cuarta posición que es 27 y la quinta 29.
La diferencia entre ambos es 2, luego multiplicamos esa diferencia por la parte
decimal de la posición 0.25
2 x 0.25= 0.5
Q1 =27+0.5= 27.5 años
Interpretación: el 25% de los diabéticos atendidos tienen menos de 27.5 años y el
restante 75 % más de 27.5 años

Ejemplo No. 13

13
Para obtener el Percentil P50; Pk=k(n+1)/100 Pk0=50(16+1)/100

P50=50(0.17)=8.5
Posición 8 corresponde a 32
Posición 9 corresponde a 33
Diferencia=1
Decimal de la posición 0.5 ; 1 x 0.5= 0.5
P50 =32+0.5= 32.5 años
En muchos casos no es necesario interpolar ya que se identifica el valor en la
posición exacta

Medidas de posición para datos agrupados

El procedimiento para calcular estas medidas cuando se trata de datos agrupados


en una distribución de frecuencias es el mismo que aplicamos para obtener la
mediana, en ese sentido será reafirmamos lo aprendido, evocamos los saberes
previos o aprovechamos para comprender y reforzar lo tratado al iniciar esta
unidad.

Ejemplo No.14
Retomando el ejercicio “edad de los pacientes atendidos”, obtendremos el valor de
algunas de estas medidas.

Edades Pacientes(f) F
25- 35 40 40
35- 45 30 70
k (n  1 )  Fa
45- 55 20 90 Qk  Li  4 x C
55- 65 20 110 f
65- 75 9 119
Total 119

Para determinar un cuartil u otra de estas medidas ya clasificadas, se observa que


la tabla presenta los datos en orden, así que lo primero es extender la tabla con la
columna donde se obtiene la frecuencia acumulada, luego se calcula el orden tipo
del cuartil (OQ)
Cuartil 3

k (n  1) 3(119  1)
Ok    90, se selecciona la tercera clase (la frec acumulada dondeesta 90)
4 4
14
Todos los elementos de la formula se sustituyen a partir de los datos de la clase
seleccionada

Li = 45
OQ 3 = 90
Fa= 70 90  70
Q3  45  x 10
f = 20 20 ; Q3  45  1 x10   55 años
I = 10

Concluimos que el 75% de los pacientes tiene menos de 55 años, mientras que el
25% restante tiene más de 55 años.

Las demás medidas se obtienen de manera similar

Ejemplo No.15

Si estamos interesados en el grupo más joven por debajo del 20% de las edades
declaradas, utilizamos el decil 2, ya que el primero separa el 10% menor, decil 2,
el 20%, 3 el 30%, y así sucesivamente. Observe que si Fa es la primera, antes de
esta no hay valor, entonces tenemos cero.

Para determinar un Percentil sobre el cual se ubican los pacientes adolescentes de


mayor peso (pacientes obesos)

Edades Pacientes(f) F k (n  1 )  Fa
Pk  Li  100 x C
125- 135 35 35
f
135- 145 30 65
145- 155 20 85
155- 165 20 105 85(119  1 )
165- 175 14 119 100  102
Total 119
15
102  85
P85  155  x 10 P85  155  0.85 x10 
20

Pk  163.5 libras

De tal forma que el 85% de los pacientes adolescentes que acuden al servicio de
endocrinología y metabolismo, tienen menos de 163.5 libras, y el 15% más de 163.5
libras.

16
Bibliografia

 Triola, Mario F. (2009) Estadística (décima edición) México: Pearson Education


 Familia, César (2012) Introducción a la Estadística Elemental Aplicada tomo 1 , República
Dominicana: Editora Trébol
 Johnson Robert / Kuby Patricia (2008) Estadística Elemental, lo esencial (decima edición)
México: Cengage Learning

 Apuntes cátedra de bioestadística. Prof. Cumsille. Maestría bioestadística(1999)


Universidad de Chile.

 Custodio, Carlos (2007) Estadística Básica, (cuarta edición) República Dominicana:


Editora Búho.

WEBGRAFÍA:

 Texto en línea y descargable de Mario Triola

17

También podría gustarte