Medidas Estadísticas
Medidas Estadísticas
Medidas Estadísticas
2 MEDIDAS ESTADÍSTICAS
PARA UNA VARIABLE
2.1 INTRODUCCIÓN
2.2 Objetivos
Dada una base de datos de una variable cuantitativa de respuesta abierta o
puntual, Calcular para esta: media aritmética, Mediana, Moda, Cuartiles,
Percentiles, Rango, Rango intercuartílico, Rango interpercentílico, Varianza,
Desviación Estándar, Coeficiente de Variación, Coeficiente de Asimetría y
Curtosis, dando una interpretación del valor que resulta.
Calcular: Media aritmética, Varianza, Desviación estándar, Coeficiente de
variación, a partir de una base de datos de una variable cuantitativa de respuesta
abierta o puntual directamente con la calculadora.
Efectuar descripciones de bases de datos de variables cuantitativas de respuesta
abierta o puntual a partir de medidas estadísticas, utilizando los software Excel y
SPSS.
Dada una base de datos de una variable cuantitativa de respuesta cerrada o
categórica Calcular la media aritmética, Mediana, Moda, Cuartiles, Percentiles,
Rango, Rango intercuartílico, Rango interpercentílico, Varianza, Desviación
Estándar, Coeficiente de Variación, Coeficiente de Asimetría y Curtosis, dando
una interpretación del valor que resulta.
Calcular: Media aritmética, Varianza, Desviación estándar y Coeficiente de
variación, a partir de una base de datos de una variable cuantitativa de respuesta
cerrada o categórica directamente con la calculadora.
Por la unidad anterior, ya debe ser claro que cuando se hace referencia a una variable
cuantitativa de respuesta abierta, lo que se está señalando es que se tienen datos no
agrupados; es decir, situaciones en las que el valor correspondiente a la observación
se obtiene directamente mediante una medición o en forma libre o espontánea como
respuesta a una pregunta.
Una vez que se tiene una base de datos de una variable cuantitativa, toman valor cada
una de las siguientes preguntas con el propósito de obtener más información: ¿Cuál
es la normalidad de los datos, lo típico o lo representativo en ellos?, ¿Qué ubicación
asumen con respecto a los demás, según la distribución ordenada?, ¿Qué variación o
variabilidad presentan los datos respecto a lo que se reconoce como típico
observado?, ¿Cuál es la forma de los datos?, ¿Hay algún modelo teórico que los
describa?, ¿se presentan valores extremos con respecto a la generalidad?, ¿más
hacia la derecha que hacia la izquierda?, ¿más hacia la izquierda que hacia la
derecha?, ¿Cómo se concentran los datos con respecto a lo típico observado en la
distribución? ¿Se presentan concentraciones muy altas? ¿Son normales las
concentraciones en la forma en que se presentan? ¿Las concentraciones que se
presentan son muy bajas?
Para responder este grupo de preguntas, según el orden formulado se puede hacer
uso de los siguientes elementos:
Las especificaciones anteriores nos centran en el estudio de cuatro medidas para una
variable: Medidas de Tendencia Central, Medidas de Posición, Medidas de Dispersión
y Medidas de Forma.
Observación: Las medidas podrán calcularse para una población o para una muestra.
En el primer caso se les denomina Parámetros y en el segundo se les denomina
Estimadores o Estadígrafos.
Notación:
Parámetro Estimador
X
La media aritmética es denominada Media Aritmética Simple cuando se calcula para
datos No Agrupados.
n
Xi = Cada uno de los datos X i = X1 + X2 + X3 +.....+ Xn
i 1
N = Número de datos en la población
n = Número de datos en la muestra
Ejemplo 1.
Los siguientes son los descuentos en matricula (en miles de pesos) que por diversas
razones recibieron 15 estudiantes de una Universidad de la ciudad: X 1= 48,5; X2 =
53; X3 = 62; X4 =55; X5 = 67; X6 = 52; X7 = 56; X8 =63; X9 = 60,3; X10 = 54; X11 =55,6;
X12 = 60; X13 =52; X14 = 60,8; X15 = 65; para estos datos se pide calcular la media
aritmética.
Observación:
En la medida que los datos provengan de poblaciones o muestras de características
homogéneas la conclusión será más precisa y por lo tanto representativa del grupo
observado. Se puede afirmar que la Media Aritmética es representativa del conjunto (lo
resume bien), si se quiere promediar cantidades semejantes que presentan
variaciones dentro de un margen razonable o también si los datos de la variable que
se observa siguen un comportamiento normal o aproximadamente normal. Una
alternativa para el cálculo de la media cuando se registran datos muy grandes o muy
pequeños (atípicos) es eliminarlos, teniendo en cuenta que se les debe hacer
seguimiento para verificar las causas de su presencia. Otra alternativa podría ser
calcular otra medida de tendencia central; para el caso, se puede tomar la mediana.
Ejercicio 1.
Calcular la Media Aritmética para los siguientes datos: 2 - 16 - 32 - 4 - 64 - 8 - 128 -
256. ¿Es representativa la media aritmética en este caso?, ¿si, no?, ¿Por qué?
Ejercicio 2.
La gerencia de una empresa manufacturera desea hacer una investigación entre sus
trabajadores con el fin de establecer si a través de cursos de entrenamiento y
programas de mejoramiento de las condiciones de trabajo tanto en la empresa como
en su vida familiar, se logra elevar el rendimiento del personal. Con la ayuda de un
experto en estudios de tiempo y movimiento, además de una trabajadora social, se
realiza una encuesta con una muestra de 24 trabajadores, con el propósito de reunir
información preliminar sobre algunas variables de interés. La siguiente base de datos
muestra los resultados:
V1: Ingresos Quincenales en miles de pesos.
V2: Tiempo necesario para realizar un trabajo (Minutos)
V3: Gastos quincenales en alimentación (miles de pesos)
V4: Peso (Kilogramos)
V5: Tiempo dedicado a la familia los fines de semana (horas)
Con la información anterior, se pide calcular la media aritmética para cada una de las
variables. Elabore una interpretación del cálculo realizado.
Mediana
Notación:
Parámetro Estimador
Me Me
Cálculo:
X 18 X 19
Me
2
Otra forma de calcular la Mediana es a partir de la expresión
Me X Ant ( X Post X Ant ).Dec , donde Dec es la parte decimal del cálculo de la
posición; es decir, 0,5. Así, para la idea que se está presentando quedaría:
Me X18 ( X19 X18 ).0,5
Ejemplo 2.
Los siguientes son los descuentos en matricula (en miles de pesos) que por diversas
razones recibieron 15 estudiantes de una Universidad de la ciudad: 48,5; 53; 62; 55;
67; 52; 56; 63; 60,3; 54; 55,6; 60; 52; 60,8; 65. Para estos datos se pide calcular la
mediana.
Solución.
Según la teoría expuesta, primero se ordenan los datos.
48,5 – 52 – 52 – 53 – 54 – 55 – 55,6 – 56 – 60 – 60,3 – 60,8 – 62 – 63 – 65 – 67
Ahora se determina la posición o ubicación de la mediana,
n 1
P = 16/2 = 8 Así entonces la mediana se determina contando
Me 2
hasta la octava posición ordenada: Me = $56.000
Según el cálculo anterior, se podrá afirmar que el 50% de los estudiantes observados
recibieron un descuento en el valor de la matrícula inferior a $56.000. y el 50%
restante un descuento igual o superior a $56.000.
Ejercicio 3.
Con la información que proporciona la base de datos del ejercicio 2, para cada una de
las variables, calcule e interprete la mediana.
Ejemplo 2.
¿Qué se interpreta cuando se afirma para un crédito que este se cancela
generalmente en un tiempo mediano de 2 años?
Solución. Se podrá interpretar que el 50% de las personas que toman este tipo de
créditos lo cancelan antes de los dos años y el 50% restante en dos o más años.
Moda
Notación:
Parámetro Estimador
Md Md
Podrá aplicarse también como promedio en aquellos casos de distribuciones para las
que no se conocen los valores extremos.
Ejemplo 3.
Los siguientes son los descuentos en matricula (en miles de pesos) que por diversas
razones recibieron 15 estudiantes de una Universidad de la ciudad: 48,5; 53; 62; 55;
67; 52; 56; 63; 60,3; 54; 55,6; 60; 52; 60,8; 65. Para estos datos se pide calcular la
Moda.
Solución.
Según el concepto de moda se tendrá entonces que Md = $52.000.
Lo anterior simplemente evidencia que el dato más frecuente en la observación
realizada es $52.000.
Ejercicio 4.
Con la información que proporciona la base de datos del ejercicio 2, para cada una de
las variables, calcule e interprete la moda.
Media Geométrica
Notación:
Parámetro Estimador
Mg Mg
Concepto: Si se tiene una variable y de ella una serie de datos X0, X1, X2, X3, .......,Xn,
cuyo comportamiento como serie se ajusta a un modelo geométrico o exponencial, su
media, denominada geométrica o tasa promedio de crecimiento geométrico en las
unidades en que se observó se podrá determinar como la raíz n-sima del producto de
las tasas de crecimiento de una observación a otra:
Mg n t t t .... t n ( 2,6 )
1 2 3
X X X Xn
Dónde t1 1 , t 2 2 , t 3 3 , ......., t n
X0 X1 X2 X n 1
Según la expresión anterior, la media geométrica o promedio de crecimiento
exponencial de los datos de una variable en las unidades observadas, se podrá
interpretar como un porcentaje de crecimiento entre observaciones.
Para el cálculo de la media geométrica deberá tenerse en cuenta que ninguno de los
datos sea igual a cero; así como tampoco deberá ser negativo. En el caso en que un
dato sea cero, se eliminará de la serie para realizar el cálculo de esta medida.
Ejemplo 5.
Se ha hecho un seguimiento durante ocho quinquenios a una población con un alto
índice de crecimiento. Los siguientes datos corresponden con el número de personas
(En miles) que viven en dicha población, observadas por quinquenio: 101, 203, 408,
822, 1656, 3334, 6714 y 13521. Se sabe que inicialmente la población tenía 40000
habitantes. Con los datos que se han colectado, se pide calcular el promedio de
crecimiento exponencial de personas por quinquenio en la población.
Solución.
Para iniciar es importante notar que los datos de la variable que se observa siguen un
comportamiento exponencial, por lo tanto el promedio adecuado, es la media
geométrica.
Mg n t t t .... t n
1 2 3
101 203 13521
Dónde t1 2,525 , t 2 2,010 , ......, t 8
40 101 6714
Mg = 8 2,525 2,010 2,010 2,015 .... 2,014 = 2,070x100 = 207%
Por lo tanto se puede concluir que la población observada ha crecido a una tasa
promedio del 107%/quinquenio según la información recabada durante los 8
quinquenios observados.
Ejercicio 5.
1. Los siguientes datos corresponden con los saldos de una cuenta de ahorros en
los últimos cinco períodos liquidados: 158340 – 160715,1 – 163125,83 –
165572,71 – 168056,30. Se sabe que la base para la liquidación del primer
periodo fue de 156000. Con la información anterior determine el crecimiento
medio geométrico por periodo de los saldos observados.
2. Asuma que la siguiente serie de valores se ajusta a un comportamiento
geométrico: 235 – 300 – 405 – 515 – 638 - 800 – 990 – 1255 – 1585 – 1987 –
2450. Con la información anterior determine el crecimiento medio geométrico.
Se les denomina medidas de posición debido a que tales valores se identifican a partir
de la localización de una posición entre los valores observados.
En algunas ocasiones, al estudiar las diferentes variables que puede mostrar una
población, cabe la posibilidad que por algún interés particular o por factores de
curiosidad se centre la observación en sectores específicos de dichas variables. Los
cuartiles, deciles y percentiles, se constituyen como herramientas que facilitan la
observación sectorizada o centrada en rangos más pequeños de la distribución de la
variable.
Cuartiles
Notación:
Parámetro Estimador
Qi Qi
No se tendrán en cuenta los cuartiles cero y cuatro por su equivalencia con los valores
mínimo y máximo.
Cuartil 1 Valor que supera el 25% de los valores ordenados de la variable y a su vez
es superado por el 75% restante.
Cuartil 2 Valor que supera el 50% de los valores ordenados de la variable y a su vez
es superado por el 50% restante.
Cuartil 3 Valor que supera el 75% de los valores ordenados de la variable y a su vez
es superado por el 25% restante.
Cálculo:
Donde Dec: Parte decimal corresponde con el valor de la parte decimal del
cálculo de la posición del cuartil.
Ejemplo 6.
Los siguientes son los descuentos en matricula (en miles de pesos) que por diversas
razones recibieron 15 estudiantes de una Universidad de la ciudad: 48,5 – 53 – 62 –
55 – 67 – 52 – 56 – 63 - 60,3 – 54 - 55,6 – 60 – 52 - 60,8 - 65. Para estos datos se
pide calcular e interpretar el cuartil 3.
Luego el valor del cuartil 3 está determinado por el dato en la posición número 12 de
los datos ordenados.
Q3 = X12 = $ 62.000
Con este resultado se podrá interpretar que entre los estudiantes observados, el 75%
de ellos recibió descuentos por debajo de los $62.000 y el 25% restante de $62.000 o
más.
Deciles
Notación:
Parámetro Estimador
Di Di
Xmin Xmax
* * * * * * * * *
D1 D2 D3 D4 D5 D6 D7 D8 D9
Decil 1: Valor de la variable que supera el 10% de los valores ordenados de la variable
y a su vez es superado por el 90% restante.
Decil 2: Valor de la variable que supera el 20% de los valores ordenados de la variable
y a su vez es superado por el 80% restante.
n 1
PDi i ( ) i representa el número del decil y n el número de datos. ( 2,10 )
10
Al igual que con los cuartiles, la posición de un decil dice donde se ubica, más no su
valor. Para determinar su valor es necesario tener en cuenta el siguiente proceso:
Si el valor calculado es entero, entonces el valor del decil será aquel que
corresponda en forma ordenada con la posición calculada.
Di = XPDi ( 2,11 )
Si el valor calculado es decimal, entonces se toman los valores anterior y
posterior de posición entera Xant; Xpost tal y como en los casos anteriores. El
decil podrá calcularse a partir de la expresión.
Di X Ant ( X Post X Ant ).Dec ( 2,12 )
Donde Dec: Parte decimal corresponde con el valor de la parte decimal del
cálculo de la posición del decil.
Ejemplo 7.
Con los datos del ejemplo 6 calcule e interprete el decil 7
Solución. Según la teoría expuesta, primero se ordenan los datos.
48,5 – 52 – 52 – 53 – 54 – 55 – 55,6 – 56 – 60 – 60,3 – 60,8 – 62 – 63 – 65 – 67
Con este resultado se podrá interpretar que entre los estudiantes observados, el 70%
de ellos recibió descuentos por debajo de $61.040 y el 30% restante de $61.040 o
más.
Percentiles
Notación:
Parámetro Estimador
Pi Pi
Gráficamente:
Xmin Xmax
* * * * * * * * *
P10 P20 P30 P40 P50 P60 P70 P80 P90
Percentil 15: Valor de la variable que supera el 15% de los valores ordenados de la
variable y a su vez es superado por el 85% restante.
Percentil 45: Valor de la variable que supera el 45% de los valores ordenados de la
variable y a su vez es superado por el 55% restante.
.
Percentil 90: Valor de la variable que supera el 90% de los valores ordenados de la
variable y a su vez es superado por el 10% restante.
Las fórmulas y procesos de cálculo para los percentiles son similares a las utilizadas
en los cuartiles y deciles; basta con cambiar la notación que los representa.
Al igual que con los cuartiles, la posición de un percentil dice donde se ubica, más no
su valor. Para determinar su valor es necesario tener en cuenta el mismo proceso
utilizado.
Ejercicio 6.
1. Con la información que proporciona la base de datos del ejercicio 2, para cada
una de las variables, calcule e interprete: Cuartil 1, Cuartil 3, Decil 2, Decil 9,
Percentil 10, Percentil 90.
2. A partir de la teoría que se le ha presentado, es posible pensar en quintiles,
sixtiles, eptales, octales, nonales, etc. Diseñe los procesos necesarios para el
cálculo de quintiles y octales. A partir de los procesos diseñados, calcule con base
en los datos del ejemplo 6 el quintil 3 y el octal 5.
Rango
Notación:
Parámetro Estimador
R R
Valores altos del rango, señalan alta dispersión o variación de la variable. Valores
pequeños señalan baja dispersión o alta uniformidad entre los valores de la variable.
Ejemplo 8.
Con los datos del ejemplo 6 calcular el rango.
Solución.
R = XMax - XMin = 67 - 48,5 = $18.500
Según el resultado anterior, se puede afirmar que entre el descuento más alto
otorgado y el más pequeño hay una diferencia de $18.500.
Ejercicio 7.
Con la información que proporciona el ejercicio 6, para cada una de las variables,
calcule e interprete: Rango intercuartil y rango interpercentil.
Dispersiones
Notación:
Parámetro Estimador
di di
di X i ( 2,17 )
Se podrá notar que la dispersión puede ser positiva, negativa o cero. En el primer
caso, se interpreta que el dato está a la derecha de la media, en el segundo caso, a la
izquierda y en el tercer caso el dato es igual a la media aritmética.
Ejemplo 9.
Con los datos del ejemplo 1 calcule la dispersión para los valores de la variable 50 y
61. Interprete.
Solución.
d1 50 57,61 $7,61 d 2 61 57,61 $3,39
Según lo anterior, se puede concluir que el dato 1 se encuentra a 7,61 unidades de la
variable a la izquierda de la media y en el caso del dato 2 a 3,39 unidades de la
variable a la derecha de la media. Es fácil notar que el dato 1 presenta mayor
dispersión que el dato 2.
MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE
80 ESTADÍSTICA Y PROBABILIDAD
Varianza
Notación:
Parámetro Estimador
2 S2
N 2 n
di di2
i 1
2 1
i
( 2,18 ) s2
n 1
( 2,19 )
N
Ejemplo 10.
Los siguientes son los datos de gastos semanales en alimentación (miles de pesos) de
una muestra de cinco personas: 48,5 – 53 – 62 – 55 - 67; para estos datos se pide
calcular la varianza.
Solución.
Como los datos son de una muestra, entonces la varianza se calcula mediante la
n
di2
i 1
expresión s2
n 1
Poder aplicar la fórmula anterior requiere el conocimiento de la media aritmética; por
tanto al calcularla se tiene X 57,1 ¡verifíquelo! Es adecuado también presentar los
datos en forma vertical, esto facilita observar las relaciones que pretende la fórmula.
d X x
2
2
Xi
i i
48,5 73,96
53 16,81
62 24,01
55 4,41 S2 = 217,2/4 = 54,3 Pesos2.
67 98,01
217,2
Observaciones
Las unidades de la varianza son cuadradas, razón por la cual su interpretación
resulta compleja. Así por ejemplo, si se calcula la varianza para valores de ingresos,
sus unidades serian de la forma $2; la pregunta que resulta es: ¿cómo lograr una
interpretación adecuada a esta respuesta? Resulta incómodo la interpretación de las
unidades de orden dos.
La varianza debe ser siempre un valor positivo. Por lo general se le utiliza para
comparar dos o más distribuciones que observen la misma dimensión con el
propósito de establecer su dispersión absoluta. A mayor varianza, mayor dispersión
absoluta.
La razón para que se utilice n-1 en el denominador del cálculo de la varianza
muestral, en lugar de n, obedece al hecho de que si se toman todas las muestras
de tamaño n de una población dada y se calculan sus respectivas varianzas y se
promedian estos resultados, entonces este promedio no tiende a igualarse a la
varianza poblacional a menos que en su cálculo se utilice n -1 en el denominador. El
empleo de n-1 convierte a la varianza de la muestra en un estimador sin sesgo de la
varianza de la población.
Ejercicio 8.
Con la información que proporciona el ejercicio 2, para cada una de las variables,
calcule e interprete la varianza.
Desviación Estándar
Notación:
Parámetro Estimador
S
La desviación estándar se define como la raíz cuadrada positiva de la varianza.
= 2 2 s=
2 s2 ( 2,20 )
Observación:
Las unidades de la desviación estándar son lineales; situación que facilita la
interpretación de los resultados.
Al igual que la varianza, la desviación estándar permite la comparación de dos o
más distribuciones, cuando están dadas en la misma unidad de medida, para
determinar cuál de ellas presenta mayor o menor grado de variabilidad absoluta.
Ejemplo 11.
Ejercicio 9.
Con la información que proporciona el ejercicio 8, para cada una de las variables,
calcule e interprete la desviación estándar.
Coeficiente de Variación
Notación:
Parámetro Estimador
C.V. c.v.
s
c.v. *100
(2,21)
C.V . *100
x
Ejemplo 12.
Suponga que para una cierta variable se sabe que su media aritmética es de 22,5
Unid. y su desviación estándar es de 4,85 Unid. Se pide calcular el coeficiente de
variación.
Solución. C.V . *100 = 4,85/22,5 * 100 = 21,56%
Ejercicio 10.
Con la información que proporciona el ejercicio 2 y el ejercicio 8, para cada una de las
variables, calcule e interprete el coeficiente de variación.
Notación:
Parámetro Estimador
Z z
Edwin Dugarte Peña
ESTADÍSTICA Y PROBABILIDAD 83
d d (2,22)
Z i Z i
s
Ejemplo 13.
Suponga que para una cierta variable en una muestra se sabe que su media aritmética
es 25.8 y su desviación estándar 6.3. ¿Cuál es el valor estandarizado para un valor de
la variable de 22.3?
Asimetría
Coeficiente De Asimetría
Notación:
Parámetro Estimador
A A
Observación
1. En cualquier distribución, el valor de la mediana, se localiza entre la media y la
moda; así:
Sí Media = Mediana = Moda; entonces la distribución se dice Simétrica.
Sí Media < Mediana < Moda; entonces la distribución se dice Asimétrica negativa.
Sí Moda < Mediana < Media; entonces la distribución se dice Asimétrica positiva.
3 * ( Me) 3 * ( X Me)
A (2,24) A (2,25)
s
Si el cálculo se realiza utilizando el coeficiente de asimetría de Pearson, el resultado
que se obtiene es: 0,8548, La conclusión es la misma, aunque no se obtiene el mismo
valor
Ejemplo 14.
Con los datos del ejemplo 10, se pide calcular el Coeficiente de Asimetría.
Solución.
Poder aplicar la fórmula para el cálculo del Coeficiente de Asimetría requiere el
conocimiento de la media aritmética; y la desviación estándar, por tanto al calcularla se
tiene X = 57,1 y s =7,37 ¡verifíquelo!
Edwin Dugarte Peña
ESTADÍSTICA Y PROBABILIDAD 85
Es adecuado también presentar los datos en forma vertical, esto facilita observar las
relaciones que pretende la fórmula.
X (di/s)3
48,5 -1,5889
53 -0,1722 (di/s)3 = 0,9335
62 0,2939
55 -0,0231
67 2,4238
0.9335
d
3
n i 5
A
0,9335 0,3890
(n 1)(n 2) s 4 3
Ejercicio 11.
Con la información que proporciona el ejercicio 2, para cada una de las variables,
calcule e interprete el coeficiente de asimetría. Realice los cálculos según los dos
coeficientes que se presentan y haga comparaciones de sus resultados con el que se
obtiene a partir del criterio generado con la media, la mediana y la moda. Interprete en
cada caso el resultado que obtenga.
Curtosis
Notación:
Parámetro Estimador
C C
Cálculo:
d
4
n.(n 1) 3.(n 1) 2
C . i ( 2,26 )
(n 1).(n 2).(n 3)
s
( n 2).(n 3)
donde, n = tamaño de muestra, xi = Cada uno de los datos, X = Media aritmética
El valor de C podría ser: Mayor que cero (C>0) en cuyo caso se afirma que las
concentraciones de información alrededor de la media son altas. Se categoriza este
tipo de curtosis como Leptocurtica; menor que cero (C<0) en cuyo caso se afirma que
las concentraciones de información alrededor de la media son bajas. Se categoriza
este tipo de curtosis como Platicurtica y finalmente igual a cero (C=0) en cuyo caso se
categoriza como Mesocurtica o de igual elevación que la normal.
Ejemplo 15.
Con los datos del ejemplo 10, se pide calcular la Curtosis.
Solución.
Poder aplicar la fórmula de la curtosis requiere el conocimiento de la media aritmética;
X (di/s)4
48,5 1,8541
53 0,0958 (di/s)4 = 5,4078
62 0,1954
55 0,0066
67 3,2559
5.4078
di
4
n.(n 1) 3.(n 1) 2
C . =
( n 1).(n 2 ).(n 3) s ( n 2 ).(n 3)
5 6 3 (4) 2
C 5,4078 = -1,2403
4 3 2 (3) (2)
Lo anterior señala que la distribución es más achatada comparada con la distribución
normal es decir es platicurtica y por lo tanto existe baja concentración de información
alrededor de la media aritmética.
Ejercicio 12.
Con la información que proporciona el ejercicio 2, para cada una de las variables,
calcule e interprete la curtosis.
Para que los cálculos de las medidas que se han presentado en esta unidad sean
realizados en forma más eficiente y óptima respecto al tiempo que se requiere para
ejecutarlos, se puede optar por realizarlos directamente con la calculadora. El proceso
requiere que primero se identifiquen las diferentes relaciones a utilizar con la
calculadora.
RCL hyp
Para obtener la VARIANZA: 2 basta con elevar al cuadrado el valor que se obtuvo
como desviación estándar; de igual forma con la muestra VARIANZA: s2.
MODE MODE 1
1
En algunas calculadoras de notación directa; es decir, aquellas que muestran un cursor titilando en
pantalla, al oprimir la secuencia INV AC se apaga la calculadora. En estos casos se opera la secuencia
INV DEL AC para ejecutar borrado. La verificación de borrado se ejecuta en la misma forma.
MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE
88 ESTADÍSTICA Y PROBABILIDAD
SHIFT MODE 1 = AC
Si hace la secuencia
SHIFT 1
Para obtener la VARIANZA: 2 basta con elevar al cuadrado el valor que se obtuvo
como desviación estándar; de igual forma con la muestra VARIANZA: s2.
SHIFT 9 1 = AC
MODE 3 1
Al hacerlo se despliega una columna para introducir los datos uno por uno. Para
ello se digita el dato y se pulsa igual, dato por dato y hasta terminar.
SHIFT 1 5
Ejemplo 16.
Los siguientes datos corresponden con la producción semanal de calzado en una
empresa de la ciudad, observada durante 20 semanas.
Media Aritmética:
X = 153,5 pares 154 pares (verifique el cálculo)
Mediana:
Primero se ordenan los datos:
120 – 130 – 130 – 130 – 130 – 140 – 140 – 140 – 140 – 140 – 145 – 145 – 150 – 160 –
160 – 170 – 185 – 190 – 205 - 220
Cuartil 3
PQ3 = 3.(n+1)/4 = 63/4 = 15,75 El valor del cuartil en este caso será
Q3 = Xant + (Xpost – Xant)*dec.= 160 + (170 – 160)*0,75 = 167,5
Q3 = 167,5 pares
Percentil 10.
Pp10 = 10*(n+1)/100 = 2,1
P10 = X2 + (X3 – X2)*0,1 = 130 + (130 – 130)*0,1 P10 = 130 Pares
Percentil 90
Pp90 = 90*(n+1)/100 = 18,9
P90 = X18 + (X19 – X18)*0,9 = 190 + (205 – 190)*0,9 P90 = 203,5 pares
Rango
R = XMax - XMin = 220 - 120 = 100 pares
Rango Intercuartílico
RQ = Q3 - Q1 =167,5 – 132,5 = 35 pares
Rango Interpercentílico
RP = P90 - P10 =203,5 – 130 = 73,5 pares
Varianza
S2 = 745 pares2
Desviación estándar
S = 27,29 pares
Coeficiente de variación
s
c.v. .100 = (27.29/153.5)*100 c.v. = 17,78%
x
Coeficiente de Asimetría
X X
3
A
n i
20
20,27 1,1854
A= 1,1854
(n 1)(n 2) s 19 18
3 * ( X Me)
A = 3*(153,5 – 142,5)/27,29 A = 1,21 asimetría positiva
s
Puntaje Estandarizado
Xi X
Z = (138 – 153,5)/27,29 Z = -0,57
s
Coeficiente de Curtosis
xi x
4
n (n 1) 3 (n 1)
2
C =
(n 1) (n 2) (n 3) s (n 2) (n 3)
20 21 3 (19) 2
C 57,8460 C= 0,6395 Leptocúrtica
19 18 17 (18) (17)
Para calcular cada una de las medidas estadísticas utilizando el software Excel, se
tomará como referente la siguiente base de datos.
Ejemplo 17.
Unidad De Observación: Clientes de una distribuidora
Población: 250 clientes
Muestra: 20 clientes
Instrumento Para La Colecta De Información: Encuesta
Variables Naturaleza
V1: Tiempo de relaciones comerciales (meses) Cuantitativa
V2: Valor del último pedido (Miles de pesos) Cuantitativa
V3: Abono al pedido (Miles de pesos) Cuantitativa
V4: Opinión del servicio Cualitativa
1: Excelente
2: Bueno
3: Regular
4: Deficiente
V5: Edad (años cumplidos) Cuantitativa categórica
1: 35 a 45
2: Más de 45 a 55
3: Más de 55 a 65
4: Más de 65 a 75
V6: Peso (Kg.) Cuantitativa categórica
1: 40 a 50
2: Más de 50 a 60
3: Más de 60 a 70
4: Más de 70 a 80
5: Más de 80 a 90
V7: Género Cualitativa
1: Femenino
2: Masculino
Cuadro 2. Base de datos
Cliente V1 V2 V3 V4 V5 V6 V7
1 6 145 95 1 2 1 1
2 3 140 95 1 2 2 1
3 3 145 100 2 3 3 1
4 4 160 100 2 4 1 1
5 3 150 100 2 3 2 1
MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE
92 ESTADÍSTICA Y PROBABILIDAD
6 3 190 95 2 3 1 1
7 12 220 110 4 3 2 2
8 3 140 90 2 2 3 2
9 6 130 95 2 3 3 1
10 10 130 95 2 1 5 2
11 3 205 98 2 4 2 1
12 3 160 89 1 4 1 1
13 6 130 90 2 1 1 1
14 12 140 90 2 2 3 1
15 12 170 85 1 3 1 1
16 12 130 90 1 3 2 1
17 3 140 100 2 1 5 2
18 3 120 100 2 2 5 2
19 6 140 90 2 3 3 1
20 12 185 90 2 4 5 1
Es importante notar ante todo que la base de datos maneja información tanto de
variables cuantitativas de respuesta abierta (V1, V2, V3), como de variables
cuantitativas categóricas (V5, V6), como de variables cualitativas (V4, V7). Recuerde, el
ejercicio que se pretende realizar es sólo de cálculo. Las variables categóricas ni las
cualitativas se tendrán en cuenta para este proceso.
Disponga toda la información de la base de datos en una hoja Excel de tal manera que
las variables cuantitativas queden una después de la otra y después de estas las
variables cuantitativas categóricas y finalmente las variables cualitativas. (ver figura 2)
Ahora que las variables se tienen ordenadas según su naturaleza, se pretende calcular
para cada una de ellas las medidas: Media aritmética, mediana, Moda, Cuartil 1,
Cuartil 3, Percentil 10, percentil 90, rango, rango intercuartílico, rango interpercentílico,
Varianza, Desviación Estándar, Coeficiente de variación, Coeficiente de Asimetría,
coeficiente de curtosis.
Figura 2. Base de datos en hoja Excel del ejemplo 17 ordenada por naturaleza de
variable
Edwin Dugarte Peña
ESTADÍSTICA Y PROBABILIDAD 93
Los procesos que se realicen para lograr el cálculo de la medida de interés, sólo se
harán para la primera variable; para las demás variables bastará con copiar y pegar la
fórmula según sean de la misma naturaleza. Primero presentemos el nombre de cada
medida por calcular.
Para el cálculo de la media aritmética, una vez ubicados en la celda sobre la que
queremos presentar el resultado de la medida, se da clic sobre el icono pegar
función. Notará que de inmediato se despliega un nuevo cuadro de diálogo
llamado insertar función. Se le presenta la opción Seleccionar una categoría.
Una vez se tiene el resultado, se replica para las demás variables de interés y se
obtiene el mismo cálculo para ellas. (Ver figura 6)
Las medidas mediana, moda, media geométrica se obtienen de la misma forma que la
media. La varianza se obtiene también de la misma forma, solo que, si pretende
calcular la varianza muestral, la conseguirá como VAR pero si busca la varianza
poblacional, la conseguirá como VARP. La desviación estándar poblacional la
consigue como DESVESTP mientras que la desviación estándar muestral como
DESVEST. En el cálculo del coeficiente de variación necesitará recordar que este se
obtiene dividiendo el valor de la desviación estándar entre el valor de la media
aritmética presentando el resultado en formato porcentaje.
Para ejecutar este último cálculo, una vez ubicado en la celda que corresponde,
digitará igual, hará clic sobre la celda que tiene el resultado de la desviación estándar,
digitará el signo de división, hará clic sobre la celda que tiene el resultado de la media
aritmética y finalmente dará Enter y al valor que resulte le dará formato porcentaje.
Para calcular cuartiles, deciles y percentiles, inicie tal y como lo hizo con los casos
anteriores. Notará que en el cuadro de diálogo que se despliega se pide definir la
matriz de datos. Para ello, se digitan las coordenadas de la primera y última celda de
los datos de la variable por procesar (B2:B21) (o también se hace clic sostenido sobre
el primer dato y se arrastra el puntero hasta alcanzar la totalidad de los datos por
procesar). Frente a la opción cuartil, se escribe el número del cuartil que se pretende:
1, 2 o 3 según corresponda y finalmente se da aceptar.
Para los percentiles se hace algo similar, solo que al definir el percentil se escribe
como un número entre cero y uno; es decir, se divide por 100 el valor del percentil que
se busca. Así por ejemplo, para el percentil 38 se escribirá 0,38.
En los deciles el proceso se ejecuta como percentil. Así por ejemplo, si se busca el
decil 4, en realidad se está buscando el percentil 40, por lo tanto, se hacen los cálculos
para el percentil 40; lo mismo se hace con quintiles, octales o cualquier otro caso.
Figura 7. Resultados del cálculo de las medidas estadísticas para los datos del
ejemplo 17.
Otra forma más eficiente para calcular algunas de las medidas utilizando Excel es la
siguiente: Una vez dispuesta y ordenada la base de datos por variables según su
naturaleza, se ingresa por el botón Herramientas y se busca en el cuadro de diálogo
que se despliega la opción Análisis de datos. En el caso en que no esté, es
necesario actualizar el sistema. Para ello, si su Office es una versión anterior a la
2007, una vez más de clic en Herramientas, y en el cuadro de diálogo que se
despliega sobre la opción Complementos (ver figura 8).
Observación
Si usted tiene instalado Office 97, es posible que la computadora le indique que no
tiene disponibles estas herramientas. En este caso, le pedirá el CD 2 del Office que
usted tiene instalado para poderlo incorporar y ejecutar.
Para actualizar la opción de análisis de datos desde Office 2007, una vez abierto un
archivo de Excel, se da clic sobre el botón de Office y en la ventana que se abre,
sobre el botón Opciones de Excel. (Ver figura 10)
Figura 10. Primer paso para activar complementos desde Office 2007.
MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE
98 ESTADÍSTICA Y PROBABILIDAD
Al lado izquierdo del cuadro de opciones que se abre, se da clic sobre Complementos
y en estos, en los que corresponden con Complementos de Aplicaciones Inactivas,
se pica sobre la opción Herramientas para análisis y a continuación sobre el botón ir
(Ver figura 11)
Figura 11. Segundo paso para activar complementos desde Office 2007.
Figura 12. Tercer paso para activar complementos desde Office 2007.
Al dar clic sobre el botón Aceptar y luego sobre el botón Datos, debe aparecer activo
el complemento al margen derecho de la cinta de opciones. (Ver figura 13)
Figura 13. Cuarto paso para activar complementos desde Office 2007.
Con el complemento activo, todo se hace tal y como en las anteriores presentaciones
de Excel.
Figura 14. Cuadro de diálogo. Análisis de datos. Cálculo de medidas estadísticas por
la herramienta Análisis de datos.
Figura 15. Edición para el cálculo de medidas estadísticas por la herramienta Análisis
de datos.
Figura 16. Cuadro de diálogo para la edición para el cálculo de medidas estadísticas
por la herramienta Análisis de datos.
SPSS sólo puede tener abierta una base de datos; si se pretende manejar dos o más
bases de datos, se hará cada una por separado. Para cualquier tipo de análisis con
SPSS, es necesario realizar tres operaciones básicas:
Para este caso se tendrá en cuenta los elementos del ejemplo 17 (Ver figuras 18 y 19)
Con la base de datos que se quiere procesar abierta, se hace clic en el botón
Analizar, en el cuadro de diálogo que aparece, clic en Estadísticos descriptivos y
finalmente en Descriptivos… Aparece una nueva ventana denominada Descriptivos.
En esta, en el campo del lado izquierdo aparecen los nombres de las variables; se
señala una de ellas o las requeridas, y se transportan al campo variables con el botón
entre campos. Una vez que se han pasado todas las variables de interés, se hace clic
en Opciones, se activan las medidas que se requieran y finalmente se da Aceptar. Se
obtiene en la ventana de edición de resultados las medidas para cada una de las
variables. (Ver figura 20).
Edwin Dugarte Peña
ESTADÍSTICA Y PROBABILIDAD 103
Una vez que se da la orden de ejecutar, los resultados aparecen en una Ventana de
salida (Resultados) que el programa crea. En la parte superior de la ventana aparece
el Menú principal, luego la Barra de Herramientas, bajo la barra de herramientas
aparece el editor de resultados tanto en forma de diagrama de árbol según la
secuencia de los cálculos realizados a la izquierda, como por los resultados
específicos a la derecha. Cada resultado en el diagrama de árbol presenta: Proceso
realizado, Título del proceso, Notas del proceso (Viene por lo general ocultas. Para
verlas se hace doble clic sobre el texto notas), Resumen del proceso, y finalmente el
proceso visto como el resultado.
TALLER 1
1. La gerencia de una empresa manufacturera desea hacer una investigación entre
sus trabajadores con el fin de establecer si a través de cursos de entrenamiento y
programas de mejoramiento de las condiciones de trabajo tanto en la empresa
como en su vida familiar, se logra elevar el rendimiento del personal. Con la ayuda
de un experto en estudios de tiempo y movimiento, además de una trabajadora
social, se realiza una encuesta con una muestra de 112 trabajadores, con el
propósito de reunir información preliminar sobre algunas variables de interés. La
siguiente base de datos muestra los resultados:
V1: Ingresos Quincenales en miles de pesos.
V2: Número de Hijos.
V3: Tiempo necesario para realizar un trabajo (Minutos)
V4: Gastos quincenales en alimentación (miles de pesos)
V5: Peso (Kilogramos)
V6: Tiempo dedicado a la familia los fines de semana (horas)
V7: Monto total en deudas (miles de pesos)
4. Un profesor de ingenierías afirma que entre sus estudiantes, los resultados de las
evaluaciones son mejores en las pruebas de análisis matemático que en las pruebas
de comprensión lectora. Para evidenciar su interés estandarizó dos pruebas: una en
comprensión lectora y otra en análisis matemático, seleccionó una muestra de 30
estudiantes y las aplicó. Los siguientes son los resultados de su observación:
Prueba de Prueba de 60 75 65 79
Comprensión Análisis 54 65 63 70
Lectora Matemático 60 60 60 75
80 85 45 65 50 65
60 75 75 85 50 60
54 62 84 98 55 60
50 60 75 80 50 65
65 75 84 95 65 80
80 90 82 90 55 65
80 85 76 85 74 80
60 70 60 70
Utilizando las herramientas de Excel así como las de SPSS, calcular para cada caso:
Media aritmética, mediana, Moda, Cuartil 1, Cuartil 3, Percentil 10, percentil 90, rango,
rango intercuartílico, rango interpercentílico, Varianza, Desviación Estándar, Coeficiente
de variación, Coeficiente de Asimetría, coeficiente de curtosis. ¿En cuál de las dos
pruebas se presenta mayor grado de dispersión absoluta?, justifique.
Utilizando las herramientas de Excel así como las de SPSS, calcular para cada caso:
Media aritmética, mediana, Moda, Cuartil 1, Cuartil 3, Percentil 10, percentil 90, rango,
rango intercuartílico, rango interpercentílico, Varianza, Desviación Estándar, Coeficiente
de variación, Coeficiente de Asimetría, coeficiente de curtosis. ¿En cuál de los dos casos
se presenta mayor grado de dispersión absoluta?, justifique.
7. Población
Unidad De Observación: Historial laboral de trabajadores del sector calzado de
sexo femenino de una ciudad de Colombia.
N = 1357 historias laborales.
Muestra: 137 historias laborales
Instrumento Para La Colecta De Información: Cuestionario
Utilizando las herramientas de Excel así como las de SPSS, calcular para cada caso:
Media aritmética, mediana, Moda, quintil 1, Octal 5, Percentil 78, rango, rango
intercuartílico, rango interpercentílico, Varianza, Desviación Estándar, Coeficiente de
variación, Coeficiente de Asimetría, Curtosis. ¿En cuál de los casos se presenta mayor
grado de dispersión relativa?, justifique.
El cálculo de medidas estadísticas para este tipo de variables requiere del conocimiento
de cada uno de los siguientes elementos:
Ejemplo 18.
La siguiente base de datos se ha construido a partir de la información suministrada por
una muestra de 46 registros de producción, respecto del tiempo requerido para realizar un
proceso. La variable y respectivas categorías consideradas en el proceso de observación
son:
Total - 46
Ejemplo 19.
Con los datos del ejemplo 18, determinar las frecuencias acumuladas asociadas con cada
categoría.
Solución.
Frecuencia Frec. Acumulada
11 11
15 26
8 34
8 42
4 46
46 -
Así por ejemplo para la primera categoría del ejemplo 18 se puede determinar que su
amplitud es Ci = 7 – 4 = 3 unidades.
Notación:
Parámetro Estimador
X
Ejemplo 20.
Con la información proporcionada por el ejemplo 18 calcular la media Aritmética
Solución.
Peso (Kg.) Yi .fi
[4 - 7] 5,5 11
(7 - 10] 8,5 15
(10 - 13] 11,5 8
(13 - 16] 14,5 8
(16 - 19] 17,5 4
Total - 46
Para calcular la media aritmética en este caso, se debe tener en cuenta que para datos
agrupados la fórmula de cálculo es la ponderada. Como ya se conocen los valores de las
marcas de clase y sus respectivas frecuencias, se calculan los productos de estos valores
yi.fi.
yi.fi
60,5
127,5
92
116
70
466
m
y .f
i i
Finalmente x 1
i
466
10,13
m 46
f
i
i 1
Ejemplo 21.
Calcular la media Aritmética para los datos que se presentan en el cuadro, que
corresponden con una población.
Variable f
2,5 10,5 12
10,5 18,5 13
18,5 26,5 15
26,5 34,5 10
34,5 42,5 8
58
Solución. Primero se determinan las marcas de clase, se calculan los valores que se
requieren y así finalmente se determina la media aritmética.
y y .f
i i i
6,5
14,5
m
y .f
i i
78
188,5 = 1217/58 = 20,98 unid.
22,5
i 1 337,5
30,5 m 305
38,5 f 308
i
i 1
1217
Observación.
En los casos que las clases o categorías no estén totalmente definidas, no será posible el
cálculo de la media aritmética. Así por ejemplo si se pide calcular la Media Aritmética para
el siguiente cuadro, no será posible ya que no se puede calcular las marcas de clase de la
primera y última categoría.
Variable f
Menos de 5 2
5 a 20 15
20 a 35 20
35 a 50 12
Más de 50 6
55
TALLER 2
1. Calcular la media aritmética para los datos que se presentan en el cuadro.
Variable f
2,5 10,5 12
10,5 18,5 13
18,5 26,5 15
26,5 34,5 10
34,5 42,5 8
58
2. Población
Unidad De Observación: Estudiantes de una Universidad.
Tamaño: 5000 estudiantes
Muestra: 200 estudiantes
Instrumento Para La Colecta De Información: Encuesta.
Variable Naturaleza
V1: Tiempo que dedican semanalmente al deporte (horas) Cuantitativa-Categórica
1: 0 a 2
2: más de 2 a 4
3: más de 4 a 6
4: más de 6 a 8
5: más de 8 a 10
6: más de 10 a 12
Base De Datos
V1 2 3 1 2 2 5 5 2 3 3
3 2 2 3 2 2 5 5 5 5 3
1 2 2 1 2 6 2 5 2 2 4
1 1 3 2 5 2 5 5 3 2 3
1 1 2 3 2 2 2 2 3 3 3
1 3 2 1 2 2 5 2 2 2 4
1 2 1 1 2 5 5 5 3 1 3
2 2 1 1 3 2 2 5 3 2 3
1 3 3 3 2 2 2 5 3 3 3
3 1 2 2 2 2 5 2 3 2 2
3 3 1 3 2 2 2 2 3 2 3
1 2 3 3 2 4 2 2 6 2 3
1 2 2 3 2 2 5 5 6 4 2
3 5 3 2 2 5 5 2 2 3 2
3 3 2 3 4 3 3 3 3 2
3 3 3 3 3 3 4 3 3 3
2 3 3 4 6 3 3 3 4
2 3 3 3 6 3 3 4 2
3 3 2 3 6 2 2 3 3
Con la información anterior, calcular la media aritmética.
3. Población
Unidad De Observación: Profesores que laboran en una universidad, que fuman al
menos un cigarrillo por día.
Tamaño: 80 profesores
Instrumento Para La Colecta De Información: Encuesta
Variable Naturaleza
V1: Grado de tabaquismo. Cuantitativa Categórica
1: 1 a 4 cigarrillos por día (Grado Bajo)
2: 5 a 8 cigarrillos por día (Grado Moderado)
3: 9 a 12 cigarrillos por día (Grado Alto)
4: 13 a 16 cigarrillos por día (Grado Cotidiano)
Base De Datos
V1 1 4 2 3 3 3 1 2
1 3 3 3 2 2 2 3 3
2 3 1 1 1 1 1 2 1
4 1 2 3 3 3 2 1 4
2 3 4 1 2 3 3 4 3
4 1 3 2 3 3 1 2 1
2 2 1 1 2 2 2 1 2
4 2 2 3 1 1 3 3 1
2 4 2 1 2 2 2 1 3
Con la información anterior, calcular la media aritmética.
4. Población
Unidad De Observación: Usuarias de un cierto tipo de telefonía celular
Tamaño: 2500 Usuarias
Muestra: 100 usuarias
Instrumento Para La Colecta De Información: Guía de observación
Variables Naturaleza
V1: Tiempo como usuaria (meses) Cuantitativa-categórica
1: 0 a 6
2: 6 a 12
3: 12 a 18
4: 18 a 24
5: 24 a 30
Base De Datos
V1 3 1 4 4 5 1 4 3 4
1 4 2 3 3 2 2 1 2 3
1 5 1 1 2 5 2 2 1 1
1 1 2 2 1 1 3 4 1 1
2 1 4 4 5 2 3 2 3
4 4 5 5 3 2 2 2 1
2 2 1 2 4 3 3 3 1
2 1 2 1 2 5 5 5 3
3 1 1 2 2 4 4 4 5
2 2 2 2 2 3 2 1
2 3 3 2 2 2 3 2
Con la información anterior, calcular la media aritmética.
5. Población
Unidad De Observación: Usuarias de un cierto tipo de telefonía celular
Tamaño: 2500 Usuarias
Muestra: 115 usuarias
Instrumento Para La Colecta De Información: Guía de observación
Variables Naturaleza
V1: Edad Cuantitativa –Categórica
1: 15 a 20
2: 20 a 25
3: 25 a 30
4: 30 a 35
5: 35 a 40
Base De Datos
V1 2 3 3 4 3 3 3 3 4 3
2 2 2 4 4 2 2 2 3 4 2
2 2 2 4 3 2 3 1 3 2 3
3 2 2 4 2 4 3 1 2 2 4
4 2 2 3 3 2 2 2 2 3 4
3 2 3 2 2 4 2 3 2 4 1
4 3 3 2 2 4 4 2 3 2
4 3 3 2 2 4 4 2 5 3
3 3 3 4 3 2 4 3 2 4
3 4 3 4 2 2 3 4 3 4
3 4 4 3 3 3 4 4 2 2
ASIGNATURA Créditos
Ecuaciones Diferenciales 4
Termodinámica 3
Microeconomía 3
Estadística I 3
Principios de Administración 3
Contabilidad General 3
Si sus resultados en cada asignatura, fueron respectivamente: 4,2 - 4,5 – 3,2 – 3,8 –
3,5 y 3,6, ¿Cuál es el promedio de semestre de este estudiante?
Mediana.
Notación:
Parámetro Estimador
Me Me
Se construye F.
n
Se determina la Posición del valor mediano. PMe ; n = fi
2
Se busca PMe en F.
Variable f F
fJ FJ
Lim Inf J Lim Sup J
Variable F F
PMe FJ 1
La mediana podrá calcularse como Me Lim Inf j C j . (2,31 )
fJ
Donde Cj es la amplitud del intervalo j. (CJ = Lim Sup J -Lim Inf J)
Ejemplo 22.
Calcular la mediana para los datos que se presentan en el cuadro, supuestos de una
muestra.
Variable f
10 20 5
20 30 8
30 40 15
40 50 10
50 60 8
46
PMe FJ 1 23 13
Me Lim Inf j C j . Me 30 10. = 36,67 Unid.
fJ 15
Ejercicio 13.
Con los datos del Taller 2 calcular la Mediana.
Moda. Md.
Notación:
Parámetro Estimador
Md Md
Sólo se debe tener en cuenta la clasificación con mayor frecuencia. Se requiere que los
intervalos tengan la misma amplitud.
Y`i-1 Y`i f
2,5 10,5 12
10,5 18,5 13 fj-1
18,5 26,5 15 fj
26,5 34,5 10 fj+1
34,5 42,5 8
58
Solución. Como se puede observar la frecuencia modal es 15 (fj); por lo tanto la moda se
f J 1 10
calcula como: Md Lim Inf j C j . Md 8,5 8. = 21,98 Unid.
f J 1 f J 1 10 13
Ejercicio 14.
Para cada uno de los ejercicios del taller 2 calcular la moda.
Cuartiles. Qi
Notación:
Parámetro Estimador
Qi Qi
F
12 Fj-1
25 Fj
40
50
58
----------
PQ1 = 1*n/4 = 58/4 = 14,5
Deciles. Di
Notación:
Parámetro Estimador
Di Di
Las fórmulas y procesos de cálculo para los deciles son similares a las utilizadas en los
cuartiles, basta con cambiar la notación que los representa.
n
PDi i (2,36 ) Di Lim Inf j ( 2,37 )
10
PDi FJ 1
Di Lim Inf j C j . ( 2,38 )
fj
Percentiles. Pi
Notación:
Parámetro Estimador
Pi Pi
Al igual que en cuartiles y deciles, las fórmulas y procesos de calculo manejan los mismos
procesos; bastará con cambiar la notación.
n
PPi i ( 2,39 ) Pi Lim Inf j ( 2,40 )
100
PPi FJ 1
Pi Lim Inf j C j . ( 2,41 )
fj
Ejercicio 15.
Para cada uno de los ejercicios del taller 2 calcular: Cuartil 3, Cuartil 1, Decil 2, percentil
90, Percentil 10.
Varianza
Notación:
Parámetro Estimador
2 S2
Y x . f i
m m
Y . fi
2 2
i i
2 i 1
( 2,42 ) S2 i 1
( 2,43 )
m
m
f
i 1
i fi 1
i 1
Ejemplo 25. Calcular la varianza para los datos que se presentan en el cuadro,
supuestos de una variable continua y que corresponden con una población.
Variable f
2,5 10,5 12
10,5 18,5 13
18,5 26,5 15
26,5 34,5 10
34,5 42,5 8
58
Solución.
m
Y . fi
2
i La fórmula anterior dice que primero se deben
2 i 1
m determinar las marcas de clase y la media aritmética.
f
i 1
i
Yi Yi.fi ( Yi - )2*fi
6,5 78 (6,5 – 20,98)2*12 = 2516,04
14,5 188,5 545,88
22,5 337,5 34,66
30,5 305 906,30
38,5 308 2455,60
----- 1217 6458,48
Desviación Estándar
Notación:
Parámetro Estimador
S
Ejemplo 26.
Con los datos del ejemplo 25 determinar la desviación estándar
Solución.
Se tendrá = 2 = 111,35 = 10,55 Unid.
Ejercicio 16.
Para cada uno de los ejercicios del taller 2, calcular la varianza y la desviación estándar,
Rango, Rango intercuartílico, Rango interpercentílico.
Coeficiente de Variación
Notación:
Parámetro Estimador
C.V. c.v.
s
C.V . 100 ( 2,46 ) c.v. 100 ( 2,47 )
x
Valores Estandarizados
Notación:
Parámetro Estimador
Z z
Yi Yi x
Z ( 2,48 ) Z ( 2,49 )
s
Coeficiente De Asimetría
Notación:
Parámetro Estimador
A A
3.( Me )
A ( 2,50 ) Si A > 0 entonces la asimetría se dice positiva
Si A < 0 entonces la asimetría se dice negativa
A
f.Y X
i
i
3
Coeficiente de Curtosis
Notación:
Parámetro Estimador
C C
f x
m
4
i i x
C i 1
( 2,52 )
n.s 4
El valor de C podría ser: Mayor que tres (C>3) en cuyo caso de la distribución se afirmará
que es Leptocurtica o muy elevada respecto de la distribución normal; Menor que tres
(C<3) en cuyo caso de la distribución se afirmará que es Platicurtica o más achatada que
la distribución normal y finalmente igual a tres (C=3) en cuyo caso de la distribución se
afirmará que es Mesocurtica o de igual elevación que la normal.
Ejercicio 17.
Para cada uno de los ejercicios del taller 2, calcular: Coeficiente de variación, Valores
estandarizados para cada una de las marcas de clase, Coeficiente de asimetría y
Coeficiente de curtosis.
Para que los cálculos de las medidas que se han presentado en esta unidad sean
realizados en forma más eficiente y óptima respecto al tiempo que se requiere para
ejecutarlos, se puede optar por realizarlos directamente con la calculadora. El proceso es
similar al presentado para datos no agrupados o variables de respuesta puntual. La
diferencia está en cómo se ingresa la información; por lo tanto, una vez que la calculadora
esté dispuesta para el ingreso de la información, los datos se guardan haciendo la
secuencia
Una vez que se tienen los datos en la memoria de la calculadora, se pide la información
de las medidas correspondientes de la misma forma que en datos no agrupados.
Se realizan los pasos uno y dos tal y como si fueran datos no agrupados. Para introducir
los datos se hace la misma secuencia realizado con las Casio TL:
SHIFT 9 1 = AC
1: ab/c 2: d/c
3: CMPLX 4: STAT
5: Disp 6:CONT
Frequency?
1: ON 2: OFF
Pulse 1. A continuación pulse
MODE 3 1
3. se pulsa la secuencia
SHIFT 1 5
y luego dependiendo de lo que se quiera calcular se pulsa
Si se quiere el tamaño de la muestra y se da = 1
Si se quiere la media aritmética y se da =
2
Si se quiere la desviación estándar de la población y se da =
Si lo que se quiere es la desviación estándar de la muestra y se da =. 3
Ejercicio 18.
Para cada uno de los ejercicios del taller 2, calcular media aritmética, desviación
Proporciones
Notación:
Parámetro Estimador
P p
Cálculo:
Si A = Número de unidades en la población con la categoría A observada
N = Número de unidades de la población
P = A/N ( 2,53 )
Si a = Número de unidades en la muestra con la categoría A observada
n = Número de unidades en la muestra
p = a/n ( 2,54 )
Es importante notar que los valores que generan las proporciones varían entre cero y uno.
Se les puede llamar a estos resultados valores operacionales de una proporción; sin
embargo, las proporciones también se presentan como porcentajes. Para esto bastará
con multiplicar por 100 el resultado calculado. Se les denomina a estos resultados
valores de interpretación.
Haciendo una comparación con las medidas que se utilizan en datos cuantitativos, la
proporción da una idea de lo que representa la media aritmética.
Varianza
Notación:
Parámetro Estimador
2 S2
Desviación Estándar
Notación:
Parámetro Estimador
S
La desviación estándar se define como la raíz cuadrada positiva de la varianza.
= 2 2 s=
2 s2 ( 2,59 )
Ejemplo 27.
Para una muestra de 30 estudiantes, se sabe que 12 de ellos son de sexo femenino.
Determine la proporción de estudiantes de sexo femenino, su proporción complementaria,
su varianza y desviación estándar.
Solución.
a
p a = Número de elementos en el grupo con la característica ser femenino.
n
n = Número de estudiantes en el grupo.
12
p 0,4 40% q 1 p 1 0,4 0,6
30
s 2 p q 0,4 0,6 0,24
s p q 0,24 0,4899
Ejercicio 19.
En el siguiente cuadro se registra la distribución por opinión frente al servicio de una
población de usuarios de una sucursal bancaria. Complete los espacios en la tabla.
¿El servicio
es?
# Usuarios P Q 2 PQ PQ
Excelente 12320
Bueno 14520
Regular 9560
Deficiente 37860
Total
Cambio Porcentual
Se utiliza para medir que tanta variación porcentual hay de un periodo base a otro con
respecto a una categoría en una variable de interés.
( )
Ejercicio 20.
Según el informe Comportamiento del Mercado Laboral, presentado en Síntesis de
Coyuntura, Dirección de Políticas Sectoriales, No. 31 Diciembre 04 de 2007 publicado por
la Secretaría Distrital de Planeación y la Subsecretaría de planeación Socioeconómica de
Bogotá Disponible en Internet: http://www.sdp.gov.co/www/resources/coyuntura_31.pdf,
página 4, la siguiente es la estadística de Ocupados por Posición Ocupacional en Bogotá
entre Agosto y Octubre de 2006 y 2007.
Siguiendo con la información proporcionada por el ejemplo 17, Para realizar los cálculos
en proporciones de la variable V4: Opinión del servicio y la variable V7: Género, se utiliza
la herramienta análisis de datos utilizando la función para análisis, Histograma.
2: Masculino
Para iniciar el proceso, para el caso de la variable opinión del servicio, se copia de la base
de datos la información de la variable y se pega en la hoja de cálculo en la que se
pretende trabajar. Introduzca un filtro para la variable. A partir de este se podrá verificar
la correspondencia con las diferentes clasificaciones o atributos de la variable.
Se escribe en la columna siguiente el resultado del filtrado y a continuación se elimina la
acción de filtro. La primera recibirá el nombre de rango de entrada y la columna que
presenta el resultado del filtrado rango de clases. (Ver figura 21).
Figura 21. Rango de entrada y rango de clases para la variable Opinión del servicio
Con esta información se construirá un cuadro de frecuencias. Se hace clic sobre la opción
Herramientas, (Botón Datos para el caso Office 2007), en la ventana que se abre se
hace clic sobre la opción Análisis de Datos y en esta sobre la opción Histograma y
finalmente aceptar. Se abrirá una nueva ventana. En el subcuadro Entrada, digite en el
espacio para Rango de Entrada las coordenadas correspondientes (A1:A21); ubique el
puntero sobre el espacio para Rango de Clases y en este digite sus coordenadas
(B1:B4). Active la opción Rótulos (Título de la variable), ya que en los rangos anteriores
se debieron incluir. Ahora active en las opciones de salida, Rango de salida ubicando el
puntero en la barra de escritura frente a Rango de Salida. Haga clic sobre la cualquier
celda frente a la base de datos en la hoja Excel que está manejando; a partir de esta
coordenada se darán los resultados del proceso. (Ver figura 22).
Figura 22. Proceso Distribución de frecuencias para la variable Opinión del servicio
Cambie en la última fila la palabra y mayor… por total, calcule la suma de los valores de
frecuencia y siguiendo los elementos que se le presentaron en la teoría de la unidad,
finalmente calcule los valores de proporción p, q, varianza y deviación (Ver figura 24)
Ejercicio 21.
Otras formas de medir en variables de tipo cualitativo son las razones y las tasas.
Procure hacer una revisión bibliográfica al respecto y presentar un informe.
TALLER 3
A continuación se le presentan algunos ejercicios con los que se pretende que usted
afiance los diferentes conceptos que hasta ahora se han desarrollado.
1. Población
Unidad De Observación: Trabajadores de la empresa manufacturera La Garantía
Tamaño: 385 trabajadores de la empresa.
Muestra: 70 trabajadores
Instrumento Para La Colecta De Información: Encuesta
Variables Naturaleza
V1: Monto Total en Deudas (Miles de Pesos) Cuantitativa Categórica
2500 - 5000: 1
5000 - 7500: 2
7500 - 10000: 3
10000 - 12500: 4
12500 - 15000: 5
V2: Ingresos Quincenales (Miles de Pesos) Cuantitativa
V3: Grado de escolaridad Cualitativa
1: Primaria
2: Secundaria
3: Universitaria
4: Especialista
Con la información de la muestra anterior, complete las celdas de los siguientes cuadros.
Primaria
Secundaria
Universitaria
Especialista
Total - - -
2. Población
Ir al cine
Bailar
Deporte
Dormir
Total - - -
V1 V2 V3 V4 3 2 25 2 3 3 60 3 6 4 18 0
3 2 12 3 3 3 180 3 5 5 12 0 5 5 36 2
3 2 7 0 3 3 24 4 4 4 30 2 5 3 60 0
5 2 50 0 2 2 120 4 5 4 12 3 4 2 24 2
3 1 5 2 5 3 120 0 2 5 24 1 3 4 42 0
2 2 96 0 4 2 12 2 1 2 24 4 3 3 18 1
2 2 96 3 3 2 72 1 2 3 36 0 2 5 120 4
2 2 24 1 2 3 84 0 5 4 30 3 5 4 36 0
3 2 96 3 5 2 36 2 2 4 6 4 5 3 18 0
4 2 85 0 3 3 12 3 5 3 12 3 6 5 12 2
4 2 60 1 5 2 24 3 2 2 24 4 5 2 30 0
3 2 24 1 3 3 84 3 4 3 24 3 2 4 72 0
1 2 18 0 2 3 24 1 4 4 12 4 3 4 132 2
3 2 35 2 4 3 60 3 6 3 36 3 5 3 96 2
4 2 7 2 2 2 12 3 5 2 24 4 5 4 24 0
2 2 12 1 5 3 36 4 2 3 4 4 4 5 36 2
2 2 108 2 3 4 36 3 1 3 8 0 3 4 12 0
2 2 35 0 2 5 36 0 5 4 18 3 3 2 112 1
2 2 36 1 3 4 6 3 5 3 18 2
3 2 24 2 3 5 12 3 3 5 36 0
2 2 90 0 5 3 36 3 5 3 48 2
Periódico
Aviso Inmueble
Cartelera oficina
Referencia Amigos
Otro
Total - - -
4. Población
Unidad De Observación: Historia laboral de trabajadores del sector calzado de sexo
femenino de una ciudad de Colombia.
N = 1357 historias laborales.
Muestra: 137 historias laborales
Instrumento Para La Colecta De Información: Cuestionario
La siguiente es la base de datos proporcionada por las preguntas de una escala Likert:
Se pide realizar para la escala la calificación para cada uno de los sujetos observados.
Con la información generada por la calificación final de la escala, determine e interprete:
Media Arítmética, Mediana, Cuartil 3, Quintil 2, Octal 5, Percentil 80.
5. Las siguientes son algunas estadísticas registradas por una facultad para los
estudiantes de primer semestre de una universidad durante los semestres I y II del
año 2006.
Cambio
Característica I - 2006 II - 2006
Porcentual
Inscritos 151 81
Admitidos (Primer Nivel) 126 69
Admitidos (Transferencia) 5 6
Promedio ICFES 402,9 402
Desviación Estándar ICFES 35,93 33,21
RUMBO AL ECAES
4) En una evaluación de talla a escolares, se encontró que el dato central en las medidas
de posición es 1,16 m. Este valor corresponde con la
a) Moda
b) Media
c) Varianza
d) Mediana
6) En cuál de estos casos será la moda más útil como indicador de la tendencia central
a) Cada valor en un conjunto de datos ocurre exactamente una vez
b) Todos los valores en un conjunto de datos ocurren 100 veces cada uno
c) Cada valor en un conjunto de datos tiene el mismo valor
d) Todos los valores en un conjunto de datos ocurre una sola vez, excepto por el
primero y el último dato los cuales se repiten 50 veces cada uno
7) Al probar nueve muestras con cada uno de los cuatro diseños de soporte para una
prensa hidráulica, se encontró para la variable: Tiempo (hr) que tardó cada diseño en
fallar las siguientes medidas:
8) La medida de tendencia central que puede ser usada para variables numéricas
(Cuantitativas) y para variables categóricas (cualitativas) es
a) La media aritmética
b) La mediana
c) La moda
d) La media geométrica
10) Una persona ha gastado $10000 en cada una de tres tiendas diferentes. En la primera
compró artículos a $2000 la unidad, en la segunda compró a $2500 la unidad y en la
tercera a $5000 la unidad. El precio promedio que ha pagado por el artículo se calcula
mediante
a) Media armónica
b) Mediana
c) Media ponderada
d) Media geométrica
11) La Junta Directiva de una empresa textil está considerando adquirir una compañía y
se le presentan dos alternativas de compra. Para esto se examinan minuciosamente
los resultados de estas dos compañías con el fin de realizar una mejor inversión.
Durante los pasados 5 años la compañía A tuvo una recuperación promedio anual de
lo invertido del 21% con una desviación estándar de 3,9% y un coeficiente de
variación de 18,57%. La compañía B tuvo una recuperación promedio anual de lo
invertido de 37,8% con una desviación estándar de 4,8% y un coeficiente de variación
de 12,68%. Si se considera riesgoso invertir en una compañía que tenga una alta
dispersión con respecto a la media anual de recuperación, entonces
a) las dos compañías han desempeñado estrategias igualmente riesgosas
b) la compañía B ha estado desempeñando una estrategia más riesgosa
c) la compañía A ha estado desempeñando una estrategia más riesgosa
d) Ninguna de las dos compañías ha tenido riesgos en la implementación de sus
estrategias
12) Puesto que una muestra es un subconjunto de la población, la media de la muestra
a) es siempre más pequeña que la de la población
b) es siempre más grande que la de la población
15) Para este tipo de medidas se tiene que su función es la de representar o resumir lo
relevante de un conjunto de valores mediante un único valor denominado promedio
a) Medidas de asimetría
b) Medidas de tendencia central
c) Medidas de dispersión
d) Medidas de Curtosis
16) Cuando para un cierto tipo de inversión se afirma que el 50% de las veces produce
una rentabilidad inferior del 15% y el 50% restante la rentabilidad es mayor, el
concepto que se aplica en la afirmación es.
a) Media aritmética
b) Mediana
c) Moda
d) Media geométrica
17) Los resúmenes de datos en los que se tabulan, representan gráfica o numéricamente
los datos son…
a) Inferencia estadística
b) Estadística descriptiva
c) Cálculo de probabilidades
d) Un informe
18) En una muestra de 800 estudiantes de una universidad, el 30 por ciento son
delegados. El 30 por ciento es un ejemplo de….
a. Muestra
b. Población
c. Inferencia estadística
d. Estadística descriptiva
19) En una muestra de 400 estudiantes de una universidad, el 20 por ciento son
delegados. Sobre la base de esta información, el periódico universitario informa que el
20 por ciento de todos los estudiantes de la universidad son delegados. Esta
información es un ejemplo de….
a. Muestra
b. Población
c. Inferencia estadística
d. Estadística descriptiva
20) Se encuesta a quinientos residentes de una ciudad para obtener la información sobre
intenciones de voto en una elección próxima. Los quinientos residentes en este
estudio son un ejemplo de
a. Muestra
b. Población
c. Observación
d. Censo
21) Un profesor de estadística pregunta en clase las edades de los estudiantes. Sobre la
base de esta información, el profesor establece que la edad media de todos los
estudiantes en la universidad es de 24 años. Esto es un ejemplo de…
a) Censo
b) Estadística descriptiva
c) Experimento
d) Inferencia estadística
23) En un estudio reciente que consiste en examinar a 200 hogares en una ciudad, se
encontró que 80 no pagaba una o más tasas locales. Este dato es un ejemplo de
a) Censo
b) Experimento
c) Estadística descriptiva
d) Inferencia estadística
24) El proceso de analizar datos de una muestra con el objetivo de inducir conclusiones
acerca de características de la población se denomina….
a) Estadística descriptiva
b) Inferencia estadística
c) Análisis de datos
d) Resumen de datos
25) En una oficina de correos, los sobres son numerados desde 1 a 4500. Estos números
son….
a) Un dato cualitativo
b) Un dato cuantitativo
26) Para celebrar los 15 años de una facultad de una universidad, la asociación de
egresados programó dos actividades: Un concierto y una presentación del grupo de
teatro. Ambos eventos recibieron publicidad; el primero por la radio y el segundo por el
canal regional de televisión. Para el primer evento se proyectó una asistencia de 450
estudiantes y para el segundo de 600. Se presentaron 300 para el primero y 455 para
el segundo. Con base en lo que se presentó
a) Fue más eficaz la radio que la televisión regional en el anunciar los eventos
b) Fue más eficaz la televisión regional que la radio en el anunciar los eventos
c) Fueron igualmente eficaces los medios utilizados.
d) No se puede realizar una valoración de la eficacia entre los medios.
"EN EL INTENTO POR SER CREATIVO MIRA PRIMERO QUE EL CONCEPTO QUE DE
TI MISMO TIENES ES EL MEJOR QUE PUEDES TENER"