Medidas Estadísticas

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 77

66 ESTADÍSTICA Y PROBABILIDAD

2 MEDIDAS ESTADÍSTICAS
PARA UNA VARIABLE

2.1 INTRODUCCIÓN

Cuando se reúne información utilizando para ello un instrumento de observación


previamente validado, para ajustar esta información a un análisis estadístico y agregar
valor a la información reunida, lo primero que se hace con ella es consolidarla en una
base de datos. Es importante tener claridad en la naturaleza de cada una de las
variables que constituyen el estudio. Una forma de conseguir valor es calculando
medidas estadísticas. Con base en estas se lograrán interpretaciones más cercanas a
la idea general de sus comportamientos en el o los grupos observados. Es relevante
asumir que una medida se presenta como el valor con el que se resume o describe el
comportamiento de una serie de datos o también como el algoritmo que permite
generar una caracterización de un conjunto de datos. Tal caracterización se logra
generalmente mediante un único valor. Así por ejemplo, una caracterización de la
edad de los sujetos que conforman un grupo se consigue a partir de su edad promedio
(media aritmética de las edades).

2.2 Objetivos
 Dada una base de datos de una variable cuantitativa de respuesta abierta o
puntual, Calcular para esta: media aritmética, Mediana, Moda, Cuartiles,
Percentiles, Rango, Rango intercuartílico, Rango interpercentílico, Varianza,
Desviación Estándar, Coeficiente de Variación, Coeficiente de Asimetría y
Curtosis, dando una interpretación del valor que resulta.
 Calcular: Media aritmética, Varianza, Desviación estándar, Coeficiente de
variación, a partir de una base de datos de una variable cuantitativa de respuesta
abierta o puntual directamente con la calculadora.
 Efectuar descripciones de bases de datos de variables cuantitativas de respuesta
abierta o puntual a partir de medidas estadísticas, utilizando los software Excel y
SPSS.
 Dada una base de datos de una variable cuantitativa de respuesta cerrada o
categórica Calcular la media aritmética, Mediana, Moda, Cuartiles, Percentiles,
Rango, Rango intercuartílico, Rango interpercentílico, Varianza, Desviación
Estándar, Coeficiente de Variación, Coeficiente de Asimetría y Curtosis, dando
una interpretación del valor que resulta.
 Calcular: Media aritmética, Varianza, Desviación estándar y Coeficiente de
variación, a partir de una base de datos de una variable cuantitativa de respuesta
cerrada o categórica directamente con la calculadora.

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 67

 Calcular las proporciones en que se presentan las diferentes clasificaciones de una


variable cualitativa a partir de ejemplos tipo.
 Calcular la varianza y desviación estándar a partir de una base de datos de una
variable cualitativa.
 Presentar una estadística descriptiva para cada una de las variables involucradas
en un proceso de observación.

2.3 MEDIDAS ESTADISTICAS

2.3.1. Medidas Estadísticas Utilizadas Para El Análisis De Una Variable


Cuantitativa De Respuesta Abierta

Por la unidad anterior, ya debe ser claro que cuando se hace referencia a una variable
cuantitativa de respuesta abierta, lo que se está señalando es que se tienen datos no
agrupados; es decir, situaciones en las que el valor correspondiente a la observación
se obtiene directamente mediante una medición o en forma libre o espontánea como
respuesta a una pregunta.

Una vez que se tiene una base de datos de una variable cuantitativa, toman valor cada
una de las siguientes preguntas con el propósito de obtener más información: ¿Cuál
es la normalidad de los datos, lo típico o lo representativo en ellos?, ¿Qué ubicación
asumen con respecto a los demás, según la distribución ordenada?, ¿Qué variación o
variabilidad presentan los datos respecto a lo que se reconoce como típico
observado?, ¿Cuál es la forma de los datos?, ¿Hay algún modelo teórico que los
describa?, ¿se presentan valores extremos con respecto a la generalidad?, ¿más
hacia la derecha que hacia la izquierda?, ¿más hacia la izquierda que hacia la
derecha?, ¿Cómo se concentran los datos con respecto a lo típico observado en la
distribución? ¿Se presentan concentraciones muy altas? ¿Son normales las
concentraciones en la forma en que se presentan? ¿Las concentraciones que se
presentan son muy bajas?

Para responder este grupo de preguntas, según el orden formulado se puede hacer
uso de los siguientes elementos:

 Determinar un promedio de los datos. El más representativo según el


comportamiento de la variable observada: Media Aritmética, Mediana, Moda,
Media Geométrica, Media Armónica, entre otros.

 Calcular los niveles de dispersión de los datos en la distribución para la


variable observada, estos pueden calcularse a partir de medidas tales como: El
Rango, Rango intercuartílico, Rango interpercentílico, Varianza, Desviación
Estándar, Coeficiente de Variación, entre otros.

 Determinar el grado de Asimetría de los datos en la distribución para la variable


observada.

 Determinar el grado de Agudeza de la curva que representa la distribución para


la variable observada.

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


68 ESTADÍSTICA Y PROBABILIDAD

Las especificaciones anteriores nos centran en el estudio de cuatro medidas para una
variable: Medidas de Tendencia Central, Medidas de Posición, Medidas de Dispersión
y Medidas de Forma.

Observación: Las medidas podrán calcularse para una población o para una muestra.
En el primer caso se les denomina Parámetros y en el segundo se les denomina
Estimadores o Estadígrafos.

2.3.1.1 Medidas De Tendencia Central

Función: Representar o resumir lo relevante de un conjunto de valores mediante un


único valor denominado promedio.
Se les denomina medidas de centralización o de tendencia central, debido a que tales
valores tienden a situarse en el sector central del conjunto de datos ordenados según
lo representativas que resulten para estos. Es importante tener en cuenta que la mejor
medida de tendencia central para un grupo de datos es la que mejor los representa.

Media Aritmética Simple

Notación:
Parámetro Estimador

 X
La media aritmética es denominada Media Aritmética Simple cuando se calcula para
datos No Agrupados.

La media aritmética simple Se interpreta como el cociente entre la suma de los


valores de los datos de la variable, y el número de datos; es decir,
n
 X N
i 1 i  Xi
x  i 1
(2,1)  (2,2)
n N

n
Xi = Cada uno de los datos  X i = X1 + X2 + X3 +.....+ Xn
i 1
N = Número de datos en la población
n = Número de datos en la muestra

Ejemplo 1.
Los siguientes son los descuentos en matricula (en miles de pesos) que por diversas
razones recibieron 15 estudiantes de una Universidad de la ciudad: X 1= 48,5; X2 =
53; X3 = 62; X4 =55; X5 = 67; X6 = 52; X7 = 56; X8 =63; X9 = 60,3; X10 = 54; X11 =55,6;
X12 = 60; X13 =52; X14 = 60,8; X15 = 65; para estos datos se pide calcular la media
aritmética.

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 69

Solución. Como los datos corresponden a una muestra entonces:


n
 X
i  1 i 864,2
x    $57.610
n 15
Según el cálculo anterior se podrá concluir que el descuento promedio en el valor de la
matrícula que recibieron los estudiantes observados fue de $57.610.

Observación:
En la medida que los datos provengan de poblaciones o muestras de características
homogéneas la conclusión será más precisa y por lo tanto representativa del grupo
observado. Se puede afirmar que la Media Aritmética es representativa del conjunto (lo
resume bien), si se quiere promediar cantidades semejantes que presentan
variaciones dentro de un margen razonable o también si los datos de la variable que
se observa siguen un comportamiento normal o aproximadamente normal. Una
alternativa para el cálculo de la media cuando se registran datos muy grandes o muy
pequeños (atípicos) es eliminarlos, teniendo en cuenta que se les debe hacer
seguimiento para verificar las causas de su presencia. Otra alternativa podría ser
calcular otra medida de tendencia central; para el caso, se puede tomar la mediana.

Su mayor desventaja radica en la imposibilidad de ser aplicada en aquellas


distribuciones que no tienen definidos sus valores extremos; además no se
recomienda su uso cuando la variable presenta un crecimiento exponencial.

Ejercicio 1.
Calcular la Media Aritmética para los siguientes datos: 2 - 16 - 32 - 4 - 64 - 8 - 128 -
256. ¿Es representativa la media aritmética en este caso?, ¿si, no?, ¿Por qué?

Ejercicio 2.
La gerencia de una empresa manufacturera desea hacer una investigación entre sus
trabajadores con el fin de establecer si a través de cursos de entrenamiento y
programas de mejoramiento de las condiciones de trabajo tanto en la empresa como
en su vida familiar, se logra elevar el rendimiento del personal. Con la ayuda de un
experto en estudios de tiempo y movimiento, además de una trabajadora social, se
realiza una encuesta con una muestra de 24 trabajadores, con el propósito de reunir
información preliminar sobre algunas variables de interés. La siguiente base de datos
muestra los resultados:
V1: Ingresos Quincenales en miles de pesos.
V2: Tiempo necesario para realizar un trabajo (Minutos)
V3: Gastos quincenales en alimentación (miles de pesos)
V4: Peso (Kilogramos)
V5: Tiempo dedicado a la familia los fines de semana (horas)

Cuadro 1. Base de datos


Trab V1 V2 V3 V4 V5 13 360 55,8 138 90 16
1 285 25,3 180,5 48 12 14 352 62 125,5 92 19
2 350 35 150 58 15 15 325 54 162 94 15
3 263 32 100 65,5 25 16 360 51 175 85 16
4 320 35,4 120,3 95 32 17 340 29 183 76 17
5 320 35,3 145,2 88 40 18 350 28 184,5 75 10

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


70 ESTADÍSTICA Y PROBABILIDAD

6 350 35 155 98,5 35 19 250 35 195 64 20


7 380 32 180 110 20 20 280 36,2 163 68 30
8 385 35,4 192,5 63 30 21 280 31 172,5 65 22
9 375 36 197 75 35 22 320 34 164 70 35
10 420 45 135 86 10 23 360 37 190 79,5 20
11 420 53 142 75,5 15 24 350 26 128 80 21
12 350 55,5 190 83,5 18

Con la información anterior, se pide calcular la media aritmética para cada una de las
variables. Elabore una interpretación del cálculo realizado.

Mediana

Notación:
Parámetro Estimador
Me Me

La mediana se interpreta como el Valor de la variable que supera la mitad de las


observaciones ordenadas y a su vez es superado por la otra mitad ordenada de las
observaciones.

Según el concepto anterior, para determinar la mediana se requiere de un


ordenamiento previo de los datos, así como también la identificación de la posición
central o punto medio exacto de los datos. Su cálculo no requiere que los datos sean
homogéneos.

Cálculo:

 Se ordenan los datos.


 Se determina la posición del valor Mediano.
n 1 n = número de datos ( 2,3 )
P 
Me 2
 El valor de la variable que determina la mediana depende del cálculo anterior.
Si el cálculo resulta entero (caso en el que n sea impar) entonces el valor de la
mediana está determinado por el dato que ocupa la posición que dio tal
resultado;
Me=XPMe ( 2,4 )
Así por ejemplo, si el cálculo de PMe fue 15, entonces la mediana es el valor del
dato que ocupa la posición 15 ordenada; Me=X15.

 Si la posición es decimal (caso en el que n sea par), entonces el valor de la


mediana se obtiene promediando los datos en posición entera anterior y en
posición entera posterior al cálculo de posición obtenido.
X Ant a PMe  X Post a PMe
Me  ( 2,5 )
2
Así por ejemplo, si el cálculo fue de 18,5 entonces deberán promediarse los datos
que ocupen las posiciones 18 y 19.

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 71

X 18  X 19
Me 
2
Otra forma de calcular la Mediana es a partir de la expresión
Me  X Ant  ( X Post  X Ant ).Dec , donde Dec es la parte decimal del cálculo de la
posición; es decir, 0,5. Así, para la idea que se está presentando quedaría:
Me  X18  ( X19  X18 ).0,5

Ejemplo 2.
Los siguientes son los descuentos en matricula (en miles de pesos) que por diversas
razones recibieron 15 estudiantes de una Universidad de la ciudad: 48,5; 53; 62; 55;
67; 52; 56; 63; 60,3; 54; 55,6; 60; 52; 60,8; 65. Para estos datos se pide calcular la
mediana.
Solución.
Según la teoría expuesta, primero se ordenan los datos.
48,5 – 52 – 52 – 53 – 54 – 55 – 55,6 – 56 – 60 – 60,3 – 60,8 – 62 – 63 – 65 – 67
Ahora se determina la posición o ubicación de la mediana,
n 1
P  = 16/2 = 8 Así entonces la mediana se determina contando
Me 2
hasta la octava posición ordenada: Me = $56.000

Según el cálculo anterior, se podrá afirmar que el 50% de los estudiantes observados
recibieron un descuento en el valor de la matrícula inferior a $56.000. y el 50%
restante un descuento igual o superior a $56.000.

Observación. Si asumimos que el número de estudiantes observados no es 15 sino


16, El estudiante 16 recibió un descuento de 58, ¿Cómo cambia el proceso anterior?

Primero se ordenan los datos.


48,5 – 52 – 52 – 53 – 54 – 55 – 55,6 – 56 – 58 - 60 – 60,3 – 60,8 – 62 – 63 – 65 –
67
Segundo, se determina la posición o ubicación de la mediana,
n 1
P  = 17/2 = 8,5 Así entonces la mediana se determina promediando
Me 2
los valores ordenados que se encuentren en la octava y novena posición ordenada:
X 8  X 9 56  58
Me    57
2 2
Según el cálculo anterior, se podrá afirmar que el 50% de los estudiantes
observados recibieron un descuento en el valor de la matrícula inferior a $57.000. y
el 50% restante un descuento igual o superior a $57.000.

Ejercicio 3.
Con la información que proporciona la base de datos del ejercicio 2, para cada una de
las variables, calcule e interprete la mediana.

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


72 ESTADÍSTICA Y PROBABILIDAD

Ejemplo 2.
¿Qué se interpreta cuando se afirma para un crédito que este se cancela
generalmente en un tiempo mediano de 2 años?

Solución. Se podrá interpretar que el 50% de las personas que toman este tipo de
créditos lo cancelan antes de los dos años y el 50% restante en dos o más años.

Moda

Notación:
Parámetro Estimador
Md Md

Concepto: Valor de la variable observada o atributo que presenta la mayor densidad,


repetición, frecuencia o porcentaje.

Cálculo: Según el concepto, su cálculo se centra en la observación.

Podrá aplicarse también como promedio en aquellos casos de distribuciones para las
que no se conocen los valores extremos.

Una distribución puede presentar una, varias o ninguna moda; así:


Ninguna Moda: Amodal; cuando todas las clases o valores diferentes presentan la
misma repetición.
Una Moda: Modal; cuando hay un valor que se repite más que los otros.
Dos Modas: Bimodal; cuando hay dos valores con la misma frecuencia máxima.
Más de Dos Modas: Multimodal; Cuando hay más de dos valores (sin ser todos)
con la misma frecuencia máxima.

Ejemplo 3.
Los siguientes son los descuentos en matricula (en miles de pesos) que por diversas
razones recibieron 15 estudiantes de una Universidad de la ciudad: 48,5; 53; 62; 55;
67; 52; 56; 63; 60,3; 54; 55,6; 60; 52; 60,8; 65. Para estos datos se pide calcular la
Moda.
Solución.
Según el concepto de moda se tendrá entonces que Md = $52.000.
Lo anterior simplemente evidencia que el dato más frecuente en la observación
realizada es $52.000.

Ejercicio 4.
Con la información que proporciona la base de datos del ejercicio 2, para cada una de
las variables, calcule e interprete la moda.

Media Geométrica

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 73

Notación:
Parámetro Estimador
Mg Mg

Concepto: Si se tiene una variable y de ella una serie de datos X0, X1, X2, X3, .......,Xn,
cuyo comportamiento como serie se ajusta a un modelo geométrico o exponencial, su
media, denominada geométrica o tasa promedio de crecimiento geométrico en las
unidades en que se observó se podrá determinar como la raíz n-sima del producto de
las tasas de crecimiento de una observación a otra:

Mg  n t  t  t  .... t n ( 2,6 )
1 2 3
X X X Xn
Dónde t1  1 , t 2  2 , t 3  3 , ......., t n 
X0 X1 X2 X n 1
Según la expresión anterior, la media geométrica o promedio de crecimiento
exponencial de los datos de una variable en las unidades observadas, se podrá
interpretar como un porcentaje de crecimiento entre observaciones.

Observación: La media geométrica corresponde con la razón de crecimiento


exponencial de la progresión que describen los datos; de tal manera que si
an  a1 .r n1 entonces Mg = r.
Ejemplo 4.
Son situaciones que generan datos cuyo comportamiento se asume geométrico o
exponencial.
Datos del número de sujetos en poblaciones humanas a través del tiempo.
Datos del número de bacterias en colonias observadas en el tiempo.
Datos de saldos de cuentas de ahorros en el tiempo.

Para el cálculo de la media geométrica deberá tenerse en cuenta que ninguno de los
datos sea igual a cero; así como tampoco deberá ser negativo. En el caso en que un
dato sea cero, se eliminará de la serie para realizar el cálculo de esta medida.
Ejemplo 5.
Se ha hecho un seguimiento durante ocho quinquenios a una población con un alto
índice de crecimiento. Los siguientes datos corresponden con el número de personas
(En miles) que viven en dicha población, observadas por quinquenio: 101, 203, 408,
822, 1656, 3334, 6714 y 13521. Se sabe que inicialmente la población tenía 40000
habitantes. Con los datos que se han colectado, se pide calcular el promedio de
crecimiento exponencial de personas por quinquenio en la población.
Solución.
Para iniciar es importante notar que los datos de la variable que se observa siguen un
comportamiento exponencial, por lo tanto el promedio adecuado, es la media
geométrica.

Mg  n t  t  t  .... t n
1 2 3
101 203 13521
Dónde t1   2,525 , t 2   2,010 , ......, t 8 
40 101 6714
Mg = 8 2,525  2,010  2,010  2,015  ....  2,014 = 2,070x100 = 207%

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


74 ESTADÍSTICA Y PROBABILIDAD

Por lo tanto se puede concluir que la población observada ha crecido a una tasa
promedio del 107%/quinquenio según la información recabada durante los 8
quinquenios observados.

Ejercicio 5.
1. Los siguientes datos corresponden con los saldos de una cuenta de ahorros en
los últimos cinco períodos liquidados: 158340 – 160715,1 – 163125,83 –
165572,71 – 168056,30. Se sabe que la base para la liquidación del primer
periodo fue de 156000. Con la información anterior determine el crecimiento
medio geométrico por periodo de los saldos observados.
2. Asuma que la siguiente serie de valores se ajusta a un comportamiento
geométrico: 235 – 300 – 405 – 515 – 638 - 800 – 990 – 1255 – 1585 – 1987 –
2450. Con la información anterior determine el crecimiento medio geométrico.

2.3.1.2 Medidas De Posición

Función: Facilitar la observación y análisis de la variable de interés, por sectores o


grupos de valores ordenados.

Se les denomina medidas de posición debido a que tales valores se identifican a partir
de la localización de una posición entre los valores observados.

Cuartiles Deciles Y Percentiles

En algunas ocasiones, al estudiar las diferentes variables que puede mostrar una
población, cabe la posibilidad que por algún interés particular o por factores de
curiosidad se centre la observación en sectores específicos de dichas variables. Los
cuartiles, deciles y percentiles, se constituyen como herramientas que facilitan la
observación sectorizada o centrada en rangos más pequeños de la distribución de la
variable.

Cuartiles
Notación:
Parámetro Estimador
Qi Qi

Se denominan cuartiles a los valores de la variable ordenada, que la fraccionan en


cuatro partes que almacenan la misma cantidad de información (25%). Gráficamente:

Xmin * 25% * 25% * 25% * 25% Xmáx


Q0 Q1 Q2 Q3 Q4

No se tendrán en cuenta los cuartiles cero y cuatro por su equivalencia con los valores
mínimo y máximo.

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 75

Cuartil 1 Valor que supera el 25% de los valores ordenados de la variable y a su vez
es superado por el 75% restante.

Cuartil 2 Valor que supera el 50% de los valores ordenados de la variable y a su vez
es superado por el 50% restante.

Cuartil 3 Valor que supera el 75% de los valores ordenados de la variable y a su vez
es superado por el 25% restante.

Cálculo:

 Se ordenan los datos.


 Se determina la posición del cuartil por calcular.
n  1 i representa el número del cuartil y n el número de datos.( 2,7 )
P  i( )
Qi 4
 El valor de la variable que determina el cuartil depende del cálculo anterior.
 Si el valor calculado es entero, entonces el valor del cuartil será aquel que
corresponda en forma ordenada con la posición calculada.
Qi = XPQi ( 2,8 )
 Si el valor calculado es decimal, entonces se toman los valores anterior y
posterior de posición entera Xant, Xpost. El cuartil podrá calcularse a partir de
la expresión.
Qi  X Ant  ( X Post  X Ant ).Dec (2,9 )

Donde Dec: Parte decimal corresponde con el valor de la parte decimal del
cálculo de la posición del cuartil.

Ejemplo 6.
Los siguientes son los descuentos en matricula (en miles de pesos) que por diversas
razones recibieron 15 estudiantes de una Universidad de la ciudad: 48,5 – 53 – 62 –
55 – 67 – 52 – 56 – 63 - 60,3 – 54 - 55,6 – 60 – 52 - 60,8 - 65. Para estos datos se
pide calcular e interpretar el cuartil 3.

Solución. Según la teoría expuesta, primero se ordenan los datos.


48,5 – 52 – 52 – 53 – 54 – 55 – 55,6 – 56 – 60 – 60,3 – 60,8 – 62 – 63 – 65 – 67

Con los datos ordenados se calcula la posición del cuartil

PQ3 = 3*(n+1)/4 = 3*16/4 = 12

Luego el valor del cuartil 3 está determinado por el dato en la posición número 12 de
los datos ordenados.
Q3 = X12 = $ 62.000

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


76 ESTADÍSTICA Y PROBABILIDAD

Con este resultado se podrá interpretar que entre los estudiantes observados, el 75%
de ellos recibió descuentos por debajo de los $62.000 y el 25% restante de $62.000 o
más.

Deciles

Notación:
Parámetro Estimador
Di Di

Se denominan deciles a los valores de la variable que fraccionan la distribución


ordenada en 10 partes que almacenan la misma cantidad de información (10%).
Gráficamente:

Xmin Xmax
* * * * * * * * *
D1 D2 D3 D4 D5 D6 D7 D8 D9

Decil 1: Valor de la variable que supera el 10% de los valores ordenados de la variable
y a su vez es superado por el 90% restante.

Decil 2: Valor de la variable que supera el 20% de los valores ordenados de la variable
y a su vez es superado por el 80% restante.

…Decil 9: Valor de la variable que supera el 90% de los valores ordenados de la


variable y a su vez es superado por el 10% restante.
Las fórmulas y procesos de cálculo para los deciles son similares a las utilizadas en
los cuartiles, basta con cambiar la notación que los representa.

En general la posición de un decil se calcula a partir de la expresión

n 1
PDi  i ( ) i representa el número del decil y n el número de datos. ( 2,10 )
10

Al igual que con los cuartiles, la posición de un decil dice donde se ubica, más no su
valor. Para determinar su valor es necesario tener en cuenta el siguiente proceso:

 Si el valor calculado es entero, entonces el valor del decil será aquel que
corresponda en forma ordenada con la posición calculada.
Di = XPDi ( 2,11 )
 Si el valor calculado es decimal, entonces se toman los valores anterior y
posterior de posición entera Xant; Xpost tal y como en los casos anteriores. El
decil podrá calcularse a partir de la expresión.
Di  X Ant  ( X Post  X Ant ).Dec ( 2,12 )

Donde Dec: Parte decimal corresponde con el valor de la parte decimal del
cálculo de la posición del decil.

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 77

Ejemplo 7.
Con los datos del ejemplo 6 calcule e interprete el decil 7
Solución. Según la teoría expuesta, primero se ordenan los datos.
48,5 – 52 – 52 – 53 – 54 – 55 – 55,6 – 56 – 60 – 60,3 – 60,8 – 62 – 63 – 65 – 67

Con los datos ordenados se calcula la posición del decil

PD7 = 7*(n+1)/10 = 7*16/10 = 11,2

Con lo anterior, Xant=X11=60,8; Xpost=X12= 62; Parte Decimal=0,2

Luego el valor del decil 7 está determinado por:

D7  X11  ( X12  X11 ).Dec = 60,8 + (62 – 60,8).0,2 = $61.040

Con este resultado se podrá interpretar que entre los estudiantes observados, el 70%
de ellos recibió descuentos por debajo de $61.040 y el 30% restante de $61.040 o
más.

Percentiles

Notación:
Parámetro Estimador
Pi Pi

Se denominan percentiles a los valores de la variable que fraccionan la distribución


ordenada en 100 partes que almacenan la misma cantidad de información (1%).

Gráficamente:

Xmin Xmax
* * * * * * * * *
P10 P20 P30 P40 P50 P60 P70 P80 P90

Percentil 15: Valor de la variable que supera el 15% de los valores ordenados de la
variable y a su vez es superado por el 85% restante.

Percentil 45: Valor de la variable que supera el 45% de los valores ordenados de la
variable y a su vez es superado por el 55% restante.
.
Percentil 90: Valor de la variable que supera el 90% de los valores ordenados de la
variable y a su vez es superado por el 10% restante.

Las fórmulas y procesos de cálculo para los percentiles son similares a las utilizadas
en los cuartiles y deciles; basta con cambiar la notación que los representa.

En general la posición de un percentil se calcula a partir de la expresión

n  1 , i representa el número del percentil y n el número de datos. ( 2,10 )


Pp  i ( )
i 100

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


78 ESTADÍSTICA Y PROBABILIDAD

Al igual que con los cuartiles, la posición de un percentil dice donde se ubica, más no
su valor. Para determinar su valor es necesario tener en cuenta el mismo proceso
utilizado.

Ejercicio 6.
1. Con la información que proporciona la base de datos del ejercicio 2, para cada
una de las variables, calcule e interprete: Cuartil 1, Cuartil 3, Decil 2, Decil 9,
Percentil 10, Percentil 90.
2. A partir de la teoría que se le ha presentado, es posible pensar en quintiles,
sixtiles, eptales, octales, nonales, etc. Diseñe los procesos necesarios para el
cálculo de quintiles y octales. A partir de los procesos diseñados, calcule con base
en los datos del ejemplo 6 el quintil 3 y el octal 5.

2.3.1.3 Medidas De Dispersión, Variación O De Variabilidad

Función: Cuantificar el grado de variación de los datos de la variable observada bien


sea a partir de sus valores extremos o con respecto a un valor específico que
generalmente es la media aritmética.

¿Por qué la dispersión de la variable es una característica tan importante de entender


y medir?
Rta: Suministra información complementaria que permite juzgar la confiabilidad de la
medida de tendencia Central. “A mayor dispersión, menos representativa será la
localización central”.
Rta: Se requiere la capacidad de reconocer que los datos están muy dispersos, para
poderlos abordar y llegar a decisiones más apropiadas.

Rango

Notación:
Parámetro Estimador
R R

Dos valores de gran importancia en un proceso de observación son los valores


extremos (XMax - XMin). Se denomina Campo de variación de la variable al espacio de
esta comprendido entre el XMax y el XMin.

Se interpreta por rango a la longitud del campo de variación de la variable; es decir, la


diferencia entre los valores extremos.

R = XMax - XMin ( 2,14 )

Valores altos del rango, señalan alta dispersión o variación de la variable. Valores
pequeños señalan baja dispersión o alta uniformidad entre los valores de la variable.

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 79

Ejemplo 8.
Con los datos del ejemplo 6 calcular el rango.
Solución.
R = XMax - XMin = 67 - 48,5 = $18.500
Según el resultado anterior, se puede afirmar que entre el descuento más alto
otorgado y el más pequeño hay una diferencia de $18.500.

Otros rangos que también se acostumbran en el proceso descriptivo son los


determinados a partir de los cuartiles y de los percentiles.
En el primer caso, se le denomina rango intercuartílico y se calcula como la diferencia
entre el tercer y primer cuartil.
Notación y cálculo: RQ RQ = Q3 - Q1 ( 2,15 )
En el segundo caso, se le denomina rango interpercentílico y se le calcula como la
diferencia entre el percentil 90 y el percentil 10.
Notación y Cálculo: RP RP = P90 - P10 ( 2,16 )

Ejercicio 7.
Con la información que proporciona el ejercicio 6, para cada una de las variables,
calcule e interprete: Rango intercuartil y rango interpercentil.

Dispersiones

Notación:
Parámetro Estimador
di di

Para un valor de la variable o dato, su dispersión está determinada por la diferencia en


unidades de la variable entre el valor del dato y la media aritmética de los datos.

di  X i   ( 2,17 )
Se podrá notar que la dispersión puede ser positiva, negativa o cero. En el primer
caso, se interpreta que el dato está a la derecha de la media, en el segundo caso, a la
izquierda y en el tercer caso el dato es igual a la media aritmética.

Ejemplo 9.
Con los datos del ejemplo 1 calcule la dispersión para los valores de la variable 50 y
61. Interprete.

Solución.
d1  50  57,61  $7,61 d 2  61  57,61  $3,39
Según lo anterior, se puede concluir que el dato 1 se encuentra a 7,61 unidades de la
variable a la izquierda de la media y en el caso del dato 2 a 3,39 unidades de la
variable a la derecha de la media. Es fácil notar que el dato 1 presenta mayor
dispersión que el dato 2.
MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE
80 ESTADÍSTICA Y PROBABILIDAD

Varianza

Notación:
Parámetro Estimador
2 S2

La varianza para un grupo de datos de una población se puede interpretar como el


promedio del cuadrado de las dispersiones generadas por los datos observados. En el
caso que los datos sean de una muestra, este promedio se calcula no dividiendo por el
número total de datos sino por este disminuido en uno; se dice entonces que el cálculo
se hace con n-1grados de libertad

N 2 n
 di  di2
i 1
 2  1
i
( 2,18 ) s2 
n 1
( 2,19 )
N

Ejemplo 10.
Los siguientes son los datos de gastos semanales en alimentación (miles de pesos) de
una muestra de cinco personas: 48,5 – 53 – 62 – 55 - 67; para estos datos se pide
calcular la varianza.
Solución.
Como los datos son de una muestra, entonces la varianza se calcula mediante la
n
 di2
i 1
expresión s2 
n 1
Poder aplicar la fórmula anterior requiere el conocimiento de la media aritmética; por
tanto al calcularla se tiene X  57,1 ¡verifíquelo! Es adecuado también presentar los
datos en forma vertical, esto facilita observar las relaciones que pretende la fórmula.

d  X  x 
2
2
Xi
i i

48,5 73,96
53 16,81
62 24,01
55 4,41 S2 = 217,2/4 = 54,3 Pesos2.
67 98,01
 217,2

Según el resultado anterior, se puede concluir que la dispersión promedio en unidades


cuadradas entre los valores de la variable y la media aritmética es de 54,3.

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 81

Observaciones
 Las unidades de la varianza son cuadradas, razón por la cual su interpretación
resulta compleja. Así por ejemplo, si se calcula la varianza para valores de ingresos,
sus unidades serian de la forma $2; la pregunta que resulta es: ¿cómo lograr una
interpretación adecuada a esta respuesta? Resulta incómodo la interpretación de las
unidades de orden dos.
 La varianza debe ser siempre un valor positivo. Por lo general se le utiliza para
comparar dos o más distribuciones que observen la misma dimensión con el
propósito de establecer su dispersión absoluta. A mayor varianza, mayor dispersión
absoluta.
 La razón para que se utilice n-1 en el denominador del cálculo de la varianza
muestral, en lugar de n, obedece al hecho de que si se toman todas las muestras
de tamaño n de una población dada y se calculan sus respectivas varianzas y se
promedian estos resultados, entonces este promedio no tiende a igualarse a la
varianza poblacional a menos que en su cálculo se utilice n -1 en el denominador. El
empleo de n-1 convierte a la varianza de la muestra en un estimador sin sesgo de la
varianza de la población.

Ejercicio 8.
Con la información que proporciona el ejercicio 2, para cada una de las variables,
calcule e interprete la varianza.

Desviación Estándar

Notación:
Parámetro Estimador
 S
La desviación estándar se define como la raíz cuadrada positiva de la varianza.

 = 2 2 s=
2 s2 ( 2,20 )

Observación:
 Las unidades de la desviación estándar son lineales; situación que facilita la
interpretación de los resultados.
 Al igual que la varianza, la desviación estándar permite la comparación de dos o
más distribuciones, cuando están dadas en la misma unidad de medida, para
determinar cuál de ellas presenta mayor o menor grado de variabilidad absoluta.

Ejemplo 11.

Con los datos del ejemplo anterior, determinar la desviación estándar.


2 s2
Solución. Se tendrá: S= = 2 54,3 pesos2 = 7,37 pesos

Ejercicio 9.
Con la información que proporciona el ejercicio 8, para cada una de las variables,
calcule e interprete la desviación estándar.

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


82 ESTADÍSTICA Y PROBABILIDAD

Coeficiente de Variación

Notación:
Parámetro Estimador
C.V. c.v.

El coeficiente de variación, se interpreta como el cociente que resulta al dividir la


desviación estándar de los datos de la variable observada entre su media aritmética,
expresando el resultado en términos porcentuales”.

 s
c.v.  *100
(2,21)
C.V .  *100
 x

El coeficiente de variación es una medida de dispersión relativa que se emplea


fundamentalmente para:

 Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas


de unidades de medida.
 Comparar la variabilidad entre grupos de datos obtenidos por dos o más personas
distintas.
 Comparar dos grupos de datos con distinta media.
 Determinar la representatividad de la media aritmética en una distribución
cualquiera. A mayor coeficiente de variación menos representativa será la media
aritmética.
Según los tres primeros usos, se podrá afirmar que a mayor coeficiente de
variación, mayor dispersión relativa se atribuirá a los valores de la variable.

Ejemplo 12.
Suponga que para una cierta variable se sabe que su media aritmética es de 22,5
Unid. y su desviación estándar es de 4,85 Unid. Se pide calcular el coeficiente de
variación.


Solución. C.V .  *100 = 4,85/22,5 * 100 = 21,56%

Ejercicio 10.
Con la información que proporciona el ejercicio 2 y el ejercicio 8, para cada una de las
variables, calcule e interprete el coeficiente de variación.

Valores Estandarizados o Normalizados

Notación:
Parámetro Estimador
Z z
Edwin Dugarte Peña
ESTADÍSTICA Y PROBABILIDAD 83

Para un valor de la variable, su valor estandarizado se interpreta como el cociente


entre su dispersión y la desviación estándar de los datos observados.

d d (2,22)
Z i Z i
 s

Permiten establecer la "posición relativa" o unidades de desviación estándar de un


dato respecto a la media aritmética. A partir de ellos se podrá comparar dos o más
datos de la misma distribución o de distribuciones diferentes con el propósito de
determinar cuál de ellos presenta mejor posición relativa.

Un valor Z=–2 traduce que el dato se encuentra disperso 2 desviaciones estándar a la


izquierda de la media aritmética; si fuese +1,35, se podría afirmar que el dato se
encuentra disperso 1,35 desviaciones estándar a la derecha de la media aritmética. En
el caso cero, el dato y la media son iguales, por lo tanto, no hay dispersión o variación
con respecto a la media.

Ejemplo 13.

Suponga que para una cierta variable en una muestra se sabe que su media aritmética
es 25.8 y su desviación estándar 6.3. ¿Cuál es el valor estandarizado para un valor de
la variable de 22.3?

Solución. Según los datos el valor estandarizado se determina como


d 22,3  25,8
Z i = Z = - 0,56
s 6,3
Lo anterior interpreta que el dato 22,3 se encuentra a 0,56 desviaciones estándar a la
izquierda de la media aritmética.

2.3.1.4 Medidas De Forma

Función: Son utilizadas para evaluar las deformaciones laterales o verticales de la


distribución empírica de los valores de la variable contra la distribución normal de
probabilidad. En el caso de una deformación lateral se hace referencia de la asimetría
y para la deformación vertical o por concentración de información con respecto a la
media, se hace referencia de la curtosis.

Asimetría

Coeficiente De Asimetría

Notación:

Parámetro Estimador
A A

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


84 ESTADÍSTICA Y PROBABILIDAD

El coeficiente de asimetría se interpreta como un indicador que señala la presencia o


no de valores extremos entre los valores proporcionados por la observación de una
variable con respecto a la media aritmética. Describe la deformación lateral de una
distribución de valores de una variable comparada con la distribución normal.
n 3
A z (2,23)
(n  1)(n  2)
donde, Si A > 0 entonces se registra una asimetría positiva
Si A < 0 entonces se registra una asimetría negativa
Si A = 0 entonces se registra una simetría.

Gráficamente, lo anterior podrá visualizarse aproximadamente así:

CURVA ASIMETRICA CURVA ASIMETRICA CURVA SIMETRICA.


POSITIVA O SESGADA A NEGATIVA O SESGADA A (Coeficiente de asimetría =
DERECHA. (Coeficiente de IZQUIERDA. (Coeficiente de 0)
asimetría > 0) asimetría < 0)

Figura 1. Asimetría y simetría.

Observación
1. En cualquier distribución, el valor de la mediana, se localiza entre la media y la
moda; así:
Sí Media = Mediana = Moda; entonces la distribución se dice Simétrica.
Sí Media < Mediana < Moda; entonces la distribución se dice Asimétrica negativa.
Sí Moda < Mediana < Media; entonces la distribución se dice Asimétrica positiva.

2. Otro método para el cálculo de la asimetría es a partir del coeficiente de asimetría


de Pearson:

3 * (   Me) 3 * ( X  Me)
A (2,24) A (2,25)
 s
Si el cálculo se realiza utilizando el coeficiente de asimetría de Pearson, el resultado
que se obtiene es: 0,8548, La conclusión es la misma, aunque no se obtiene el mismo
valor

Ejemplo 14.
Con los datos del ejemplo 10, se pide calcular el Coeficiente de Asimetría.
Solución.
Poder aplicar la fórmula para el cálculo del Coeficiente de Asimetría requiere el
conocimiento de la media aritmética; y la desviación estándar, por tanto al calcularla se
tiene X = 57,1 y s =7,37 ¡verifíquelo!
Edwin Dugarte Peña
ESTADÍSTICA Y PROBABILIDAD 85

Es adecuado también presentar los datos en forma vertical, esto facilita observar las
relaciones que pretende la fórmula.

X (di/s)3
48,5 -1,5889
53 -0,1722 (di/s)3 = 0,9335
62 0,2939
55 -0,0231
67 2,4238
0.9335
d 
3
n  i  5
A  
 0,9335  0,3890
(n  1)(n  2) s 4  3
 

Lo anterior señala que la distribución de los valores observados de la variable presenta


valores de gran tamaño hacia la derecha comparados con la generalidad de estos y
por lo tanto es Asimétrica positiva.

Ejercicio 11.
Con la información que proporciona el ejercicio 2, para cada una de las variables,
calcule e interprete el coeficiente de asimetría. Realice los cálculos según los dos
coeficientes que se presentan y haga comparaciones de sus resultados con el que se
obtiene a partir del criterio generado con la media, la mediana y la moda. Interprete en
cada caso el resultado que obtenga.

Curtosis

Notación:
Parámetro Estimador
C C

La curtosis se puede interpretar como el valor que señala la presencia o no de


posibles concentraciones o acumulaciones de valores de la variable observada
alrededor de la media aritmética.

Cálculo:
 d  
4
 n.(n  1)  3.(n  1) 2
C .  i    ( 2,26 )
 (n  1).(n  2).(n  3)
  s  
( n  2).(n  3)
donde, n = tamaño de muestra, xi = Cada uno de los datos, X = Media aritmética

El valor de C podría ser: Mayor que cero (C>0) en cuyo caso se afirma que las
concentraciones de información alrededor de la media son altas. Se categoriza este
tipo de curtosis como Leptocurtica; menor que cero (C<0) en cuyo caso se afirma que
las concentraciones de información alrededor de la media son bajas. Se categoriza
este tipo de curtosis como Platicurtica y finalmente igual a cero (C=0) en cuyo caso se
categoriza como Mesocurtica o de igual elevación que la normal.

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


86 ESTADÍSTICA Y PROBABILIDAD

Ejemplo 15.
Con los datos del ejemplo 10, se pide calcular la Curtosis.

Solución.
Poder aplicar la fórmula de la curtosis requiere el conocimiento de la media aritmética;

y la desviación estándar, por tanto al calcularla se tiene


x
= 57,1 y s =7,37
¡verifíquelo!
Es adecuado también presentar los datos en forma vertical, esto facilita observar las
relaciones que pretende la fórmula.

X (di/s)4
48,5 1,8541
53 0,0958 (di/s)4 = 5,4078
62 0,1954
55 0,0066
67 3,2559
 5.4078
  di  
4
 n.(n  1)  3.(n  1) 2
C .     =

 ( n  1).(n  2 ).(n  3)  s   ( n  2 ).(n  3)

 5 6  3  (4) 2
C  5,4078  = -1,2403
4  3 2  (3)  (2)
Lo anterior señala que la distribución es más achatada comparada con la distribución
normal es decir es platicurtica y por lo tanto existe baja concentración de información
alrededor de la media aritmética.

Ejercicio 12.
Con la información que proporciona el ejercicio 2, para cada una de las variables,
calcule e interprete la curtosis.

2.3.1.5. La Calculadora Como Herramienta Para Ejecutar Cálculos De Medidas


En Estadística
CALCULADORA CASIO fx82TL - fx350TL

Para que los cálculos de las medidas que se han presentado en esta unidad sean
realizados en forma más eficiente y óptima respecto al tiempo que se requiere para
ejecutarlos, se puede optar por realizarlos directamente con la calculadora. El proceso
requiere que primero se identifiquen las diferentes relaciones a utilizar con la
calculadora.

1. Se ingresa al modo para estadística pulsando la tecla


MODE
Al hacerlo se despliegan tres opciones: COMP SD REG asociadas con los
números 1, 2 y 3. Si se pulsa
2
Se activa el modo SD. La opción COMP regresa al modo normal de trabajo la
calculadora, en el caso en que se ingrese a uno cualquiera de los otros dos.
Edwin Dugarte Peña
ESTADÍSTICA Y PROBABILIDAD 87

3. Antes de ingresar cualquier información, se debe verificar que la calculadora en la


memoria que tiene disponible para almacenar información estadística no posee
información alguna. Para esto, se ejecuta la secuencia
4.
SHIFT AC = AC

y luego una de las secuencias

SHIFT 1 o SHIFT 2 o SHIFT 3


X xn xn 1
Y al final para los tres casos
=
En el primer caso se está calculando la media aritmética, en el segundo la desviación
estándar si los datos son de una población y en el tercer caso la desviación estándar si
los datos son de una muestra. En cualquiera de las tres acciones Resultará en pantalla
la descripción error1. Esta descripción indica que la memoria está dispuesta para su
uso. Borre error de la pantalla oprimiendo la tecla.
AC
3. Se ingresan los datos a la memoria. Para tal proceso se utiliza la tecla
M+
DT
Esto es, se digita el dato y se pulsa una vez la tecla señalada y así con todos los
datos.

4. Se debe verificar si se introdujo la cantidad de datos que se tenían dispuestos.


Para esto se pulsa la secuencia

RCL hyp

5. Se pide la información procesada. Para esto se realizan las secuencias presentadas


en el paso (2). No se debe olvidar que la información podría corresponder a una
población o una muestra.

Para obtener la VARIANZA: 2 basta con elevar al cuadrado el valor que se obtuvo
como desviación estándar; de igual forma con la muestra VARIANZA: s2.

CALCULADORA CASIO – fx82MS - fx350MS - fx570MS

1. Se ingresa al modo para estadística haciendo la secuencia

MODE MODE 1

Al hacerlo se despliegan tres opciones: SD REG BASE asociadas con los


números 1, 2 y 3. Si se pulsa
1

1
En algunas calculadoras de notación directa; es decir, aquellas que muestran un cursor titilando en
pantalla, al oprimir la secuencia INV AC se apaga la calculadora. En estos casos se opera la secuencia
INV DEL AC para ejecutar borrado. La verificación de borrado se ejecuta en la misma forma.
MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE
88 ESTADÍSTICA Y PROBABILIDAD

Se activa el modo SD. Si se pulsa la secuencia

MODE MODE MODE MODE MODE 3 NORM 1

La calculadora regresa al modo normal de trabajo, en el caso en que se ingrese a uno


cualquiera de los otros dos. Por ahora la idea es que quede en el modo SD.

2. Se limpia la memoria para el proceso; con tal propósito, se pulsa la secuencia

SHIFT MODE 1 = AC

Para la verificación de borrado oprima la secuencia


SHIFT 2
Se despliegan las opciones X , xn , xn 1 con los números 1 2 3. Si oprime 1 y luego
= obtendrá la media aritmética, si 2 y luego = la desviación estándar si los datos son
de una población, y si 3 y luego = la desviación estándar si los datos son de una
muestra. En todos los casos debe dar como resultado de la acción error. Este
resultado le confirma que en la memoria disponible para el almacenamiento de
información, no hay información; razón por la que se sigue con el paso 3.

3. Se ingresan los datos a la memoria. Para tal proceso se utiliza la tecla


M+
DT
Esto es, se digita el dato y se pulsa una vez la tecla señalada y así con todos los
datos. Al terminar, en la pantalla debe quedar el número de datos que usted
ingresó. Es importante que sepa que la opción que le permite guardar es la DT.

Si hace la secuencia

SHIFT 1

Se despliegan las opciones x ,x2


y n asociados con los números 1, 2, 3. Se
pulsa 3. Debe aparecer en pantalla el número de datos que se introdujo.

4. Una vez ingresada la información, se pasa al proceso de cálculo. Para ello se


realizan las secuencias presentadas en el paso (2). No debe olvidar que la
información podría corresponder a una población o una muestra.

Para obtener la VARIANZA: 2 basta con elevar al cuadrado el valor que se obtuvo
como desviación estándar; de igual forma con la muestra VARIANZA: s2.

CALCULADORA CASIO fx570ES

5. Se limpia la memoria para el proceso; con tal propósito, se pulsa la secuencia

SHIFT 9 1 = AC

6. Se ingresa al modo para estadística haciendo la secuencia


Edwin Dugarte Peña
ESTADÍSTICA Y PROBABILIDAD 89

MODE 3 1
Al hacerlo se despliega una columna para introducir los datos uno por uno. Para
ello se digita el dato y se pulsa igual, dato por dato y hasta terminar.

7. Una vez ingresada la información, se pasa al proceso de cálculo. Para ello, se


limpia la pantalla de la calculadora y se pulsa la secuencia

SHIFT 1 5

y luego dependiendo de lo que se quiera calcular se pulsa


1
Si se quiere el tamaño de la muestra y a continuación =
2
Si se quiere la media aritmética y a continuación =
3
Si se quiere la desviación estándar de la población y a continuación =
4
Si lo que se quiere es la desviación estándar de la muestra y a continuación =.

Para cada cálculo se debe repetir la secuencia


SHIFT 1 5

Ejemplo 16.
Los siguientes datos corresponden con la producción semanal de calzado en una
empresa de la ciudad, observada durante 20 semanas.

Producción semanal (# de pares):


145 – 140 – 145 – 160 – 150 – 190 – 220 – 140 – 130 – 130 – 205 – 160 – 130 – 140 –
170 – 130 – 140 – 120 – 140 – 185

Determinar: Media aritmética, mediana, Moda, Cuartil 1, Cuartil 3, Percentil 10,


percentil 90, rango, rango intercuartílico, rango interpercentílico, Varianza, Desviación
Estándar, Coeficiente de variación, Coeficiente de Asimetría, coeficiente de curtosis y
valor estandarizado para una producción de 138 pares de zapatos.
Solución.

Media Aritmética:
X = 153,5 pares  154 pares (verifique el cálculo)
Mediana:
Primero se ordenan los datos:
120 – 130 – 130 – 130 – 130 – 140 – 140 – 140 – 140 – 140 – 145 – 145 – 150 – 160 –
160 – 170 – 185 – 190 – 205 - 220

PMe = (n+1)/2 = 21/2 = 10,5;


luego la mediana está determinada por el promedio de los datos 10 y 11 ordenados:
Me = (140+145)/2 = 142,5  143 pares.

Moda: Es el dato que más se repite.


Md = 140 pares

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


90 ESTADÍSTICA Y PROBABILIDAD

Cuartil 1 Teniendo la información ordenada por el cálculo de mediana, se determina la


posición del cuartil.
PQ1 = 1*(n+1)/4 = 21/4 = 5,25 El valor del cuartil en este caso será
Q1 = Xant + (Xpost – Xant)* dec.= 130 + (140 – 130)*0,25 = 132,5
Q1 = X5 = 132,5 pares

Cuartil 3
PQ3 = 3.(n+1)/4 = 63/4 = 15,75 El valor del cuartil en este caso será
Q3 = Xant + (Xpost – Xant)*dec.= 160 + (170 – 160)*0,75 = 167,5
Q3 = 167,5 pares

Percentil 10.
Pp10 = 10*(n+1)/100 = 2,1
P10 = X2 + (X3 – X2)*0,1 = 130 + (130 – 130)*0,1 P10 = 130 Pares

Percentil 90
Pp90 = 90*(n+1)/100 = 18,9
P90 = X18 + (X19 – X18)*0,9 = 190 + (205 – 190)*0,9 P90 = 203,5 pares

Rango
R = XMax - XMin = 220 - 120 = 100 pares

Rango Intercuartílico
RQ = Q3 - Q1 =167,5 – 132,5 = 35 pares

Rango Interpercentílico
RP = P90 - P10 =203,5 – 130 = 73,5 pares
Varianza
S2 = 745 pares2

Desviación estándar
S = 27,29 pares

Coeficiente de variación
s
c.v.  .100 = (27.29/153.5)*100 c.v. = 17,78%
x
Coeficiente de Asimetría
X X 
3
A
n  i  
20
20,27  1,1854
  A= 1,1854
(n  1)(n  2)  s 19 18
 

3 * ( X  Me)
A = 3*(153,5 – 142,5)/27,29 A = 1,21 asimetría positiva
s
Puntaje Estandarizado
Xi  X
Z = (138 – 153,5)/27,29 Z = -0,57
s

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 91

Coeficiente de Curtosis
  xi  x  
4
n  (n  1)    3  (n  1)
2
C     =
 (n  1)  (n  2)  (n  3)  s   (n  2)  (n  3)
 20  21  3  (19) 2
C  57,8460   C= 0,6395 Leptocúrtica
19  18  17  (18)  (17)

2.3.1.6 Cálculos De Medidas Para Una Variable Cuantitativa de Respuesta Abierta


A Partir de Excel

Para calcular cada una de las medidas estadísticas utilizando el software Excel, se
tomará como referente la siguiente base de datos.

Ejemplo 17.
Unidad De Observación: Clientes de una distribuidora
Población: 250 clientes
Muestra: 20 clientes
Instrumento Para La Colecta De Información: Encuesta
Variables Naturaleza
V1: Tiempo de relaciones comerciales (meses) Cuantitativa
V2: Valor del último pedido (Miles de pesos) Cuantitativa
V3: Abono al pedido (Miles de pesos) Cuantitativa
V4: Opinión del servicio Cualitativa
1: Excelente
2: Bueno
3: Regular
4: Deficiente
V5: Edad (años cumplidos) Cuantitativa categórica
1: 35 a 45
2: Más de 45 a 55
3: Más de 55 a 65
4: Más de 65 a 75
V6: Peso (Kg.) Cuantitativa categórica
1: 40 a 50
2: Más de 50 a 60
3: Más de 60 a 70
4: Más de 70 a 80
5: Más de 80 a 90
V7: Género Cualitativa
1: Femenino
2: Masculino
Cuadro 2. Base de datos
Cliente V1 V2 V3 V4 V5 V6 V7
1 6 145 95 1 2 1 1
2 3 140 95 1 2 2 1
3 3 145 100 2 3 3 1
4 4 160 100 2 4 1 1
5 3 150 100 2 3 2 1
MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE
92 ESTADÍSTICA Y PROBABILIDAD

6 3 190 95 2 3 1 1
7 12 220 110 4 3 2 2
8 3 140 90 2 2 3 2
9 6 130 95 2 3 3 1
10 10 130 95 2 1 5 2
11 3 205 98 2 4 2 1
12 3 160 89 1 4 1 1
13 6 130 90 2 1 1 1
14 12 140 90 2 2 3 1
15 12 170 85 1 3 1 1
16 12 130 90 1 3 2 1
17 3 140 100 2 1 5 2
18 3 120 100 2 2 5 2
19 6 140 90 2 3 3 1
20 12 185 90 2 4 5 1

Es importante notar ante todo que la base de datos maneja información tanto de
variables cuantitativas de respuesta abierta (V1, V2, V3), como de variables
cuantitativas categóricas (V5, V6), como de variables cualitativas (V4, V7). Recuerde, el
ejercicio que se pretende realizar es sólo de cálculo. Las variables categóricas ni las
cualitativas se tendrán en cuenta para este proceso.

Disponga toda la información de la base de datos en una hoja Excel de tal manera que
las variables cuantitativas queden una después de la otra y después de estas las
variables cuantitativas categóricas y finalmente las variables cualitativas. (ver figura 2)

Ahora que las variables se tienen ordenadas según su naturaleza, se pretende calcular
para cada una de ellas las medidas: Media aritmética, mediana, Moda, Cuartil 1,
Cuartil 3, Percentil 10, percentil 90, rango, rango intercuartílico, rango interpercentílico,
Varianza, Desviación Estándar, Coeficiente de variación, Coeficiente de Asimetría,
coeficiente de curtosis.

Figura 2. Base de datos en hoja Excel del ejemplo 17 ordenada por naturaleza de
variable
Edwin Dugarte Peña
ESTADÍSTICA Y PROBABILIDAD 93

Los procesos que se realicen para lograr el cálculo de la medida de interés, sólo se
harán para la primera variable; para las demás variables bastará con copiar y pegar la
fórmula según sean de la misma naturaleza. Primero presentemos el nombre de cada
medida por calcular.

Para el cálculo de la media aritmética, una vez ubicados en la celda sobre la que
queremos presentar el resultado de la medida, se da clic sobre el icono pegar
función. Notará que de inmediato se despliega un nuevo cuadro de diálogo
llamado insertar función. Se le presenta la opción Seleccionar una categoría.

Despliegue el botón que se encuentra a la derecha en el campo que corresponde con


seleccionar una categoría y entre las que se le presentan, seleccione la que se
presenta como Estadísticas, haciendo clic sobre ella. Una vez hecha la selección,
buscará en Seleccionar una función la opción para el cálculo de la media aritmética,
que la encontrará como Promedio. Si no está a la vista utilice la barra de
desplazamiento vertical para llegar a ella (Ver figura 3)

Figura 3. medidas a calcular a partir de la base de datos del ejemplo 17

Una vez dispuesto lo anterior, de clic sobre aceptar. Aparecerá de inmediato un


cuadro de diálogo. Por defecto, en él se le presentará la matriz de datos que se
pretende procesar (B2:B21), que también la podrá leer en la barra de fórmulas. Si en
algún caso esta matriz no presenta las coordenadas que se pretende procesar,
deberá ubicarse bien sobre la barra de fórmulas o en la barra de escritura frente
a la opción Número 1 y hacer la corrección necesaria para que el cálculo sea el
correcto. (Es importante que lea los textos que aparecen como comentarios en cada
paso para lograr el cálculo que se está realizando). (Ver figuras 4 y 5)

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


94 ESTADÍSTICA Y PROBABILIDAD

Figura 4. Cuadro de diálogo para el cálculo de la media aritmética en el ejemplo 39.

Figura 5. Subcuadro de diálogo para el cálculo de la media aritmética.

Terminadas las revisiones, de clic en aceptar, aparecerá de inmediato el resultado de


la medida en la celda donde se había ubicado inicialmente.

Una vez se tiene el resultado, se replica para las demás variables de interés y se
obtiene el mismo cálculo para ellas. (Ver figura 6)

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 95

Figura 6. Resultados del cálculo de la media aritmética en el ejemplo 17.

Es importante recordar que no es posible replicar la fórmula realizada para las


variables V4, V5, V6 y V7 ya que estas no tienen la misma naturaleza.

Las medidas mediana, moda, media geométrica se obtienen de la misma forma que la
media. La varianza se obtiene también de la misma forma, solo que, si pretende
calcular la varianza muestral, la conseguirá como VAR pero si busca la varianza
poblacional, la conseguirá como VARP. La desviación estándar poblacional la
consigue como DESVESTP mientras que la desviación estándar muestral como
DESVEST. En el cálculo del coeficiente de variación necesitará recordar que este se
obtiene dividiendo el valor de la desviación estándar entre el valor de la media
aritmética presentando el resultado en formato porcentaje.

Para ejecutar este último cálculo, una vez ubicado en la celda que corresponde,
digitará igual, hará clic sobre la celda que tiene el resultado de la desviación estándar,
digitará el signo de división, hará clic sobre la celda que tiene el resultado de la media
aritmética y finalmente dará Enter y al valor que resulte le dará formato porcentaje.

Para calcular cuartiles, deciles y percentiles, inicie tal y como lo hizo con los casos
anteriores. Notará que en el cuadro de diálogo que se despliega se pide definir la
matriz de datos. Para ello, se digitan las coordenadas de la primera y última celda de
los datos de la variable por procesar (B2:B21) (o también se hace clic sostenido sobre
el primer dato y se arrastra el puntero hasta alcanzar la totalidad de los datos por
procesar). Frente a la opción cuartil, se escribe el número del cuartil que se pretende:
1, 2 o 3 según corresponda y finalmente se da aceptar.

Para los percentiles se hace algo similar, solo que al definir el percentil se escribe
como un número entre cero y uno; es decir, se divide por 100 el valor del percentil que
se busca. Así por ejemplo, para el percentil 38 se escribirá 0,38.

En los deciles el proceso se ejecuta como percentil. Así por ejemplo, si se busca el
decil 4, en realidad se está buscando el percentil 40, por lo tanto, se hacen los cálculos
para el percentil 40; lo mismo se hace con quintiles, octales o cualquier otro caso.

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


96 ESTADÍSTICA Y PROBABILIDAD

Definidos los cuartiles, el cálculo del rango intercuartílico se realiza construyendo la


fórmula presentada en este texto aplicada a los valores calculados, de igual forma se
hace para el rango interpercentílico.

Para el cálculo del rango, se hace la fórmula =Max(B2:B21)-Min(B2:B21) y se da enter.


(Ver figura 7)

Figura 7. Resultados del cálculo de las medidas estadísticas para los datos del
ejemplo 17.

Otra forma más eficiente para calcular algunas de las medidas utilizando Excel es la
siguiente: Una vez dispuesta y ordenada la base de datos por variables según su
naturaleza, se ingresa por el botón Herramientas y se busca en el cuadro de diálogo
que se despliega la opción Análisis de datos. En el caso en que no esté, es
necesario actualizar el sistema. Para ello, si su Office es una versión anterior a la
2007, una vez más de clic en Herramientas, y en el cuadro de diálogo que se
despliega sobre la opción Complementos (ver figura 8).

Figura 8. Cuadro de diálogo para incorporar a las herramientas el análisis de datos


Edwin Dugarte Peña
ESTADÍSTICA Y PROBABILIDAD 97

Se despliega un cuadro de diálogo que le presentará entre otras las opciones


Herramientas para análisis y Herramientas para Análisis – VBA. Actívelas,
haciendo clic sobre los cuadritos ubicados en la parte izquierda de cada opción y
finalmente dando aceptar. (Ver figura 9)

Figura 9. Cuadro de diálogo de complementos para las herramientas de Excel.

Observación
Si usted tiene instalado Office 97, es posible que la computadora le indique que no
tiene disponibles estas herramientas. En este caso, le pedirá el CD 2 del Office que
usted tiene instalado para poderlo incorporar y ejecutar.

Para actualizar la opción de análisis de datos desde Office 2007, una vez abierto un
archivo de Excel, se da clic sobre el botón de Office y en la ventana que se abre,
sobre el botón Opciones de Excel. (Ver figura 10)

Figura 10. Primer paso para activar complementos desde Office 2007.
MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE
98 ESTADÍSTICA Y PROBABILIDAD

Al lado izquierdo del cuadro de opciones que se abre, se da clic sobre Complementos
y en estos, en los que corresponden con Complementos de Aplicaciones Inactivas,
se pica sobre la opción Herramientas para análisis y a continuación sobre el botón ir
(Ver figura 11)

Figura 11. Segundo paso para activar complementos desde Office 2007.

Se abre un nuevo cuadro de opciones denominado complementos. Se pueden activar


todos si usted así lo quiere; para el caso de la estadística sólo se requiere que estén
activos Herramientas para análisis y Herramientas para análisis – VBA (Ver figura
12)

Figura 12. Tercer paso para activar complementos desde Office 2007.

Al dar clic sobre el botón Aceptar y luego sobre el botón Datos, debe aparecer activo
el complemento al margen derecho de la cinta de opciones. (Ver figura 13)

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 99

Figura 13. Cuarto paso para activar complementos desde Office 2007.

Con el complemento activo, todo se hace tal y como en las anteriores presentaciones
de Excel.

Ya actualizadas las herramientas, haga clic en el botón Herramientas (Datos en


Office 2007) y a su vez en el cuadro de diálogo siguiente, haga clic sobre la opción
Análisis De Datos y en el cuadro de diálogo que aparece haga clic sobre Estadística
Descriptiva. Se presentará de inmediato una ventana para edición de datos. (Ver
figuras 14, 15)

Figura 14. Cuadro de diálogo. Análisis de datos. Cálculo de medidas estadísticas por
la herramienta Análisis de datos.

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


100 ESTADÍSTICA Y PROBABILIDAD

Figura 15. Edición para el cálculo de medidas estadísticas por la herramienta Análisis
de datos.

Se debe completar cada uno de los campos en la ventana Estadística Descriptiva.

Para completar el campo Rango de entrada, digite las coordenadas de la base de


datos por procesar: (B1:D21) sólo las variables cuantitativas de respuesta abierta.
Note que, en la selección se incluyen los rótulos de las variables. Como la base de
datos se presenta por columnas, siempre se señala frente al campo Agrupado Por la
alternativa Columnas y como se toman los títulos de las variables, se debe hacer clic
en el cuadro a la izquierda de Rótulos en la Primera Fila.

En el campo de Opciones de Salida se hace clic en el círculo a la izquierda de


Rango de Salida para activarlo y se posiciona el puntero sobre la barra de escritura
frente a esta y luego se hace clic sobre la celda en la hoja de cálculo a partir de la cual
se quieren ver los resultados; así por ejemplo, si quiere que los resultados se
muestren a partir de la celda D30, bastará con que pique sobre ella estando en el
campo Rango de salida.

Finalmente se hace clic sobre Resumen de Estadísticas y se da Aceptar. Tal vez


notó que quedaron tres opciones sin activar. La primera, Nivel de confianza para la
media es utilizada en el cálculo de intervalos de confianza. Al activarla, la respuesta
que se proporciona se conoce como error de estimación de la media. La segunda, k-
ésimo mayor y la tercera k-ésimo menor proporcionan el valor máximo y el valor
mínimo de la serie de datos que se observan.(Ver figuras 16 y 17)

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 101

Figura 16. Cuadro de diálogo para la edición para el cálculo de medidas estadísticas
por la herramienta Análisis de datos.

Figura 17. Cálculo de medidas estadísticas por la herramienta Análisis de datos.

2.3.1.7 Trabajando Con SPSS Versión 17


Procedimiento Básico Para un Análisis Estadístico

SPSS sólo puede tener abierta una base de datos; si se pretende manejar dos o más
bases de datos, se hará cada una por separado. Para cualquier tipo de análisis con
SPSS, es necesario realizar tres operaciones básicas:

 Seleccionar o construir una base de datos

Para este caso se tendrá en cuenta los elementos del ejemplo 17 (Ver figuras 18 y 19)

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


102 ESTADÍSTICA Y PROBABILIDAD

Figura 18. Base de datos del ejemplo 17 con SPSS.

Figura 19. Base de datos del ejemplo 17 con SPSS.

 Seleccionar el procedimiento estadístico deseado (menú principal)

Lo que se pretende es calcular las medidas estadísticas para una variable de


naturaleza cuantitativa de respuesta abierta mediante SPSS.

Con la base de datos que se quiere procesar abierta, se hace clic en el botón
Analizar, en el cuadro de diálogo que aparece, clic en Estadísticos descriptivos y
finalmente en Descriptivos… Aparece una nueva ventana denominada Descriptivos.
En esta, en el campo del lado izquierdo aparecen los nombres de las variables; se
señala una de ellas o las requeridas, y se transportan al campo variables con el botón
entre campos. Una vez que se han pasado todas las variables de interés, se hace clic
en Opciones, se activan las medidas que se requieran y finalmente se da Aceptar. Se
obtiene en la ventana de edición de resultados las medidas para cada una de las
variables. (Ver figura 20).
Edwin Dugarte Peña
ESTADÍSTICA Y PROBABILIDAD 103

Figura 20. Medidas estadísticas para variables de respuesta abierta.

Ventana de Salida o de Resultados

Una vez que se da la orden de ejecutar, los resultados aparecen en una Ventana de
salida (Resultados) que el programa crea. En la parte superior de la ventana aparece
el Menú principal, luego la Barra de Herramientas, bajo la barra de herramientas
aparece el editor de resultados tanto en forma de diagrama de árbol según la
secuencia de los cálculos realizados a la izquierda, como por los resultados
específicos a la derecha. Cada resultado en el diagrama de árbol presenta: Proceso
realizado, Título del proceso, Notas del proceso (Viene por lo general ocultas. Para
verlas se hace doble clic sobre el texto notas), Resumen del proceso, y finalmente el
proceso visto como el resultado.

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


104 ESTADÍSTICA Y PROBABILIDAD

TALLER 1
1. La gerencia de una empresa manufacturera desea hacer una investigación entre
sus trabajadores con el fin de establecer si a través de cursos de entrenamiento y
programas de mejoramiento de las condiciones de trabajo tanto en la empresa
como en su vida familiar, se logra elevar el rendimiento del personal. Con la ayuda
de un experto en estudios de tiempo y movimiento, además de una trabajadora
social, se realiza una encuesta con una muestra de 112 trabajadores, con el
propósito de reunir información preliminar sobre algunas variables de interés. La
siguiente base de datos muestra los resultados:
V1: Ingresos Quincenales en miles de pesos.
V2: Número de Hijos.
V3: Tiempo necesario para realizar un trabajo (Minutos)
V4: Gastos quincenales en alimentación (miles de pesos)
V5: Peso (Kilogramos)
V6: Tiempo dedicado a la familia los fines de semana (horas)
V7: Monto total en deudas (miles de pesos)

Trab V1 V2 V3 V4 V5 V6 V7 34 250 2 50 180 104 6 960


1 285 2 25,3 180,5 48 2 150 35 235 2 52 193,8 105,3 7 650
2 350 0 35 150 58 15 285 36 260 2 51 190 106 8 780
3 263 0 32 100 65,5 25 2350 37 282 2 53 175 109 2 760
4 320 0 35,4 120,3 95 32 162 38 263 1 56 179 100 3 1380
5 320 1 35,3 145,2 88 40 165 39 270 1 58 185 96 2 1400
6 350 1 35 155 98,5 35 231 40 280 0 59 188 98,5 10 1500
7 380 1 32 180 110 20 483 41 260 1 54 195 94 5 1600
8 385 0 35,4 192,5 63 30 625 42 230 1 60 196 95 6 1900
9 375 0 36 197 75 35 789 43 290 0 61,5 163 89 10 350
10 420 0 45 135 86 10 1045 44 320 1 62 200 87 6 480
11 420 3 53 142 75,5 15 1063 45 350 1 63 200 86,1 8 560
12 350 2 55,5 190 83,5 8 1125 46 360 1 62,1 79,5 85 4 1380
13 360 2 55,8 138 90 6 1500 47 352 2 60 70 80 5 690
14 352 2 62 125,5 92 9 180 48 362 0 29 86 79,5 7 780
15 325 1 54 162 94 15 1900 49 352 0 32 95 70 6 960
16 360 0 51 175 85 6 2000 50 220 3 26 105 86 5 850
17 340 0 29 183 76 7 280 51 420 2 32 125 50 15 650
18 350 0 28 184,5 75 10 2100 52 435 3 25 136 55 12 780
19 250 3 35 195 64 20 2000 53 520 1 36 150 52 15 1250
20 280 2 36,2 163 68 30 2100 54 320 2 32,5 150 53 18 1450
21 280 0 31 172,5 65 22 380 55 285 3 35 163 65 16 6500
22 320 1 34 164 70 35 560 56 360 1 32 142 85 20 6800
23 360 1 37 190 79,5 20 1400 57 350 4 36 152 54 14 450
24 350 4 26 128 80 2 1800 58 340 2 35 142 65 15 250
25 360 0 28 129 65 6 1900 59 562 0 36 180 62 6 460
26 285 4 25,9 132,5 59 8 1700 60 452 0 35 200 34 12 480
27 268 1 29 148 63,4 8 1650 61 360 2 39 150 75 15 120
28 235 3 35 153 85 10 1800 62 520 0 42 145 52 18 458
29 260 4 39 147 82 12 270 63 524 1 41 130 65 4 650
30 290 1 41 159 95 6 390 64 452 0 40 120 62 20 850
31 280 1 41,5 161 98 5 1460 65 362 3 42 169 52 28 450
32 230 1 45 162,5 100 4 1580 66 352 0 26 205 50 22 620
33 260 0 48 170 105 2 350 67 425 2 29 210 46 25 1450

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 105

68 652 1 23 145 48 26 4520 91 289 2 45 190 82 12 3201


69 325 0 35 260 85 25 4250 92 390 0 41 205 50 8 1205
70 265 4 24 145 56 20 460 93 385 3 42 230 45 9 2103
71 356 2 36 123 52 15 1350 94 395 0 43 260 46 8 2015
72 286 0 25 190 53 14 1640 95 364 2 41 240 63 5 2013
73 295 3 38 200 54 11 5000 96 381 1 40 150 58 4 2000
74 362 0 39 250 52 12 520 97 379 3 50 160 59 5 1200
75 356 1 27 180 58 8 4501 98 450 0 26 180 75 8 1502
76 398 2 36 150 59 5 6210 99 462 2 28 140 85 5 120
77 345 3 35 170 65 4 420 100 470 1 29 160 75 10 1522
78 389 0 34 230 62 2 320 101 485 5 32 205 46 4 1521
79 379 1 26,5 150 53 10 450 102 460 2 36 200 48 5 3214
80 560 4 36,4 250 62 15 6210 103 480 3 35 210 49 8 2510
81 520 0 38 190 64 2 320 104 475 0 34 150 60 7 5121
82 450 2 36 205 71 6 450 105 485 1 35 160 65 4 1574
83 520 1 34 230 72 4 1230 106 462 4 50 180 65 12 1022
84 360 0 33 240 54 8 450 107 463 2 24 190 68 13 1540
85 380 3 36 230 53 12 1254 108 485 3 36 200 70 15 1254
86 540 2 32 210 85 15 2510 109 490 0 35 180 76 10 4522
87 560 1 26 250 90 23 1200 110 526 1 30 150 70 12 4532
88 520 0 28 145 52 15 320 111 530 0 35 120 71 15 2305
89 420 1 29 180 45 10 1205 112 520 3 36 160 75 10 2510
90 453 4 42 160 46 14 4210
Con la información de la muestra anterior y utilizando las herramientas de Excel así
como las de SPSS, complete las celdas del siguiente cuadro.

Cuadro 1. Resumen muestral


Variable
V1 V2 V3 V4 V5 V6 V7
Medida
x
Me
Md
Q1
Q3
RQ
P10
P90
Rp
R
2
S
S
c.v.
A
C
¿Cuál de las variables V1, V2, V3, V4, V5, V6, V7 presenta mayor grado de dispersión
relativa?, justifique.

2. Utilizando la información recabada con la aplicación de la encuesta sobre síndrome


Nicótico, calcule todas las medidas asociadas con cada una de las preguntas
propuestas en el formato.

3. Dentro de cada paréntesis, ubique el número que corresponde con el enunciado


de la izquierda.
MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE
106 ESTADÍSTICA Y PROBABILIDAD

1. Función de los ( ) Medida estadística calculada con base en la


promedios información proporcionada por una población.
2. Función de las ( ) Por lo general se le utiliza para comparar dos o más
medidas de distribuciones que estén dadas en las mismas unidades
Asimetría con el propósito de observar su variabilidad absoluta.
3. Función de las ( ) Evaluar la presencia de valores extremos, muy
medidas de grandes o muy pequeños, comparados con la
dispersión generalidad de los datos que se tengan sobre la variable
4. Parámetro observada.
5. Función de las ( ) Representar o resumir lo relevante de un conjunto de
medidas de posición valores mediante un único valor denominado promedio
6. Desviación Estándar ( ) Cuantificar el grado de variación de los datos de la
variable observada bien sea a partir de sus valores
extremos o con respecto a un valor
( ) Facilitar la observación y análisis de la variable de
interés, por sectores o grupos de interé

4. Un profesor de ingenierías afirma que entre sus estudiantes, los resultados de las
evaluaciones son mejores en las pruebas de análisis matemático que en las pruebas
de comprensión lectora. Para evidenciar su interés estandarizó dos pruebas: una en
comprensión lectora y otra en análisis matemático, seleccionó una muestra de 30
estudiantes y las aplicó. Los siguientes son los resultados de su observación:

Prueba de Prueba de 60 75 65 79
Comprensión Análisis 54 65 63 70
Lectora Matemático 60 60 60 75
80 85 45 65 50 65
60 75 75 85 50 60
54 62 84 98 55 60
50 60 75 80 50 65
65 75 84 95 65 80
80 90 82 90 55 65
80 85 76 85 74 80
60 70 60 70
Utilizando las herramientas de Excel así como las de SPSS, calcular para cada caso:
Media aritmética, mediana, Moda, Cuartil 1, Cuartil 3, Percentil 10, percentil 90, rango,
rango intercuartílico, rango interpercentílico, Varianza, Desviación Estándar, Coeficiente
de variación, Coeficiente de Asimetría, coeficiente de curtosis. ¿En cuál de las dos
pruebas se presenta mayor grado de dispersión absoluta?, justifique.

5. Cuando un laboratorio opta por la automatización, su decisión obedece a uno de los


siguientes motivos: el más apremiante, cuando se produce un aumento del volumen
de trabajo en tal magnitud que atenta contra la calidad del mismo y con el cual la
práctica manual pierde credibilidad: o cuando sin un volumen de trabajo alto donde
todavía la práctica manual puede manejarse dentro de los estándares de calidad se
pretende reportar un mayor número de parámetros que manualmente no se
alcanzaría y que en ese momento son necesarios para que el clínico pueda realizar
una mejor aproximación al diagnóstico.

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 107

Tanto el análisis automático como el manual tienen sus ventajas y desventajas, es


poco probable que alguno reemplace al otro. Los instrumentos automáticos ofrecen
mayor precisión y rapidez en las medidas cuantitativas. La morfología variable y
compleja de los diferentes tipos celulares constituyen un reto tecnológico formidable
para la tecnología actual y es indispensable su revisión manual por un observador
para lograr un diagnóstico morfológico acertado, razón por la cual es importante
determinar si los valores obtenidos de los cuadros hemáticos por técnica manual y
automatizada arrojan diferencias significativas desde el punto de vista estadístico y
clínico. El cuadro hemático está compuesto por el análisis de los tres componentes
celulares de la sangre: los glóbulos rojos, los glóbulos blancos y las plaquetas.
En el área de Hematología de un laboratorio clínico se analizaron las muestras de 20
pacientes, a los cuales se les realizó el cuadro hemático por técnica manual y
automatizada, con el fin de comparar los valores de estos. Se observó el número de
glóbulos blancos/ mm3
Glóbulos Blancos 5 5200 5200 13 9500 9800
# de mm3 6 6300 7500 14 5500 5300
mue Automati Manual 7 3300 2700 15 9800 8500
stra zado 8 10000 10000 16 11700 11400
1 9600 9800 9 9600 9800 17 6400 5000
2 4700 4600 10 6900 6900 18 11300 11000
3 3800 4200 11 7300 8300 19 6600 5400
4 1400 1800 12 6000 7200 20 5700 6200

Utilizando las herramientas de Excel así como las de SPSS, calcular para cada caso:
Media aritmética, mediana, Moda, Cuartil 1, Cuartil 3, Percentil 10, percentil 90, rango,
rango intercuartílico, rango interpercentílico, Varianza, Desviación Estándar, Coeficiente
de variación, Coeficiente de Asimetría, coeficiente de curtosis. ¿En cuál de los dos casos
se presenta mayor grado de dispersión absoluta?, justifique.

6. El gerente de la sucursal de un Banco ha ordenado un estudio sobre el tiempo


laborando que llevan los 42 empleados de su sucursal. Los siguientes datos
corresponden con la información suministrada por el departamento de personal:
(Tiempo en meses).
234 - 144 – 144 – 152 – 200 – 204 – 96 – 96 – 132 – 180 – 88 – 168 – 72 – 108 – 160
– 132 – 132 – 108 – 210 – 122 – 108 – 96 – 216 – 215 – 96 - 192 – 156 – 108 – 204 –
108 – 72 – 252 – 72 – 72 – 85 – 204 – 108 – 206 – 200 – 202 – 180 – 86 Con la
muestra anterior completar el cuadro, utilizando las herramientas de Excel así como
las de SPSS,

Cuadro 1. Resumen Muestral


Variable Tiempo Q3 P10
Medida Laboral Q1 P90
x RQ RP
S2 R A
S C.V. C
Me Md

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


108 ESTADÍSTICA Y PROBABILIDAD

7. Población
Unidad De Observación: Historial laboral de trabajadores del sector calzado de
sexo femenino de una ciudad de Colombia.
N = 1357 historias laborales.
Muestra: 137 historias laborales
Instrumento Para La Colecta De Información: Cuestionario

La siguiente es la base de datos proporcionada por las preguntas de respuesta abierta en


el cuestionario:
Tiempo
Edad al Gastos Total
necesario Accidentes Ingresos
inicio de Tiempo quincenales deuda
Edad para Ausencia Laborales Quincenales
Identificación la ocioso en Fondo de
actual realizar días/Año el último en miles de
actividad (Min/día) alimentación Empleados
un trabajo mes pesos.
laboral ($1000) ($1000)
(Minutos)
1 20 35 25 15 50 3 385 181 1500
2 15 40 35 18 55 0 350 150 2850
3 16 32 32 18 54 3 363 100 2350
4 20 23 35 15 48 3 320 120 1620
5 21 34 35 5 58 0 320 145 1650
6 15 23 35 8 60 4 350 155 2310
7 20 31 32 10 55 3 380 180 4830
8 15 23 35 6 58 3 385 193 6250
9 14 34 36 6 58 0 375 197 7890
10 28 23 45 16 65 4 420 135 1045
11 15 25 53 5 60 2 420 142 1063
12 16 27 56 4 65 3 350 190 1125
13 20 22 56 8 49 4 360 138 1500
14 23 24 62 3 58 1 352 126 1800
15 20 21 54 5 50 4 325 162 1900
16 18 20 51 7 55 0 360 175 2000
17 18 20 29 4 58 0 340 183 2800
18 21 28 28 9 55 6 350 185 2100
19 17 29 35 12 50 4 350 195 2000
20 18 21 36 1 65 4 380 163 2100
21 22 26 31 8 68 1 380 173 3800
22 19 23 34 6 70 2 320 164 5600
23 19 29 37 5 70 4 360 190 1400
24 15 35 26 8 65 2 350 128 1800
25 17 37 28 4 68 3 360 129 1900
26 23 35 26 8 66 3 385 133 1700
27 17 33 29 5 65 1 368 148 1650
28 23 37 35 4 57 0 335 153 1800
29 14 38 39 5 55 2 360 147 2700
30 16 33 41 5 58 4 490 159 3900
31 17 19 42 6 59 3 380 161 1460
32 20 25 45 16 50 0 330 163 1580
33 27 31 48 5 55 5 360 170 3500
34 26 33 50 4 48 0 450 180 9600
35 15 17 52 8 45 3 335 194 6500
36 17 18 51 3 40 1 460 190 7800
37 22 23 53 5 45 2 482 175 7600
38 17 29 56 7 55 3 363 179 1380
39 14 24 58 4 40 0 337 185 1400
40 16 20 59 9 45 3 480 188 1500
41 17 18 54 12 40 0 360 195 1600
42 14 17 60 1 40 3 430 196 1900
43 18 19 62 8 45 0 390 163 3500
44 16 18 62 6 55 1 320 200 4800

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 109

45 18 24 63 5 56 3 350 200 5600


46 15 25 62 8 58 2 360 80 1380
47 16 27 60 4 56 4 352 70 6900
48 18 31 29 8 58 3 362 86 7800
49 14 19 32 5 60 0 352 95 9600
50 14 18 26 4 65 2 420 105 8500
51 22 23 32 5 40 4 420 125 6500

Utilizando las herramientas de Excel así como las de SPSS, calcular para cada caso:
Media aritmética, mediana, Moda, quintil 1, Octal 5, Percentil 78, rango, rango
intercuartílico, rango interpercentílico, Varianza, Desviación Estándar, Coeficiente de
variación, Coeficiente de Asimetría, Curtosis. ¿En cuál de los casos se presenta mayor
grado de dispersión relativa?, justifique.

2.3.2 Medidas Estadísticas Calculadas Para Variables Cuantitativas Categóricas o


de Respuesta Cerrada

Una Variable categórica es toda variable de naturaleza cuantitativa cuyas clases,


denominadas categorías, generalmente diseñadas como intervalos, son definidas con
anterioridad a la colecta de los datos. Son ejemplos de variables cuantitativas categóricas:
Variable 1: Número de estudiantes que ingresan cada hora a una Universidad.
0 a 30
30 a 50
50 a 70
Más de 70
Variable 2: Ingresos mensuales percibidos por empleados del sector oficial en salarios
mínimos legales vigentes mensuales (S.M.L.V.M)
0 a 1 S.M.L.V.M
de 1 a 3 S.M.L.V.M
más de 3 a 5 S.M.L.V.M
más de 5 S.M.L.V.M
Variable 3: Número de órdenes de compra por día en una empresa.
0 a 5
más de 5 a 10
más de 10 a 15
más de 15
Variable 4: Perímetro que ocupa una casa (m).
De 200 a 400 m
Más de 400 a 600 m
más de 600 a 800m
más de 800m

El cálculo de medidas estadísticas para este tipo de variables requiere del conocimiento
de cada uno de los siguientes elementos:

Marcas de Clase o Representantes de Clase (Yi.)


Se obtienen a partir de los límites de las categorías o intervalos, haciendo la semisuma
entre el límite inferior y el superior de cada intervalo; es decir

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


110 ESTADÍSTICA Y PROBABILIDAD

Lim. Inferiori  Lím Superiori


Yi = ( 2,27 )
2

Frecuencia de Ocurrencia o Frecuencia Absoluta ( fi )


Corresponde con el número de repeticiones de cada una de las categorías observadas.
Para ello se tabula la variable; es decir, se establece la repetición observada por
categoría.

Ejemplo 18.
La siguiente base de datos se ha construido a partir de la información suministrada por
una muestra de 46 registros de producción, respecto del tiempo requerido para realizar un
proceso. La variable y respectivas categorías consideradas en el proceso de observación
son:

V1: Tiempo (minutos).


1: 4 a 7
2: más de 7 a 10
3: más de 10 a 13
4: más de 13 a 16
5: más de 16 a 19
La base de datos según la información reunida está determinada por los códigos que
describen sus categorías:
Tiempo 1 2 1 1 4
4 4 1 3 1 2
1 3 5 3 2 3
3 2 2 2 2 2
1 4 4 3 5 2
5 2 3 4 1 1
5 4 2 2 1 3
2 1 2 4 2

Determine para cada categoría su marca de clase y frecuencia de ocurrencia.


Sol.
Para determinar las marcas de clase, para cada categoría se aplica
Lim. Inferior  Lím Superior
Yi = , así por ejemplo para la primera categoría su marca de
2
47
clase sería Y1   5,5 . Contando el número de veces que se presentan los códigos
2
1, 2, 3, 4, 5 que representan cada una de las categorías se obtiene finalmente las
frecuencias de ocurrencia.

Tiempo (min.) Yi Frecuencia


[4 - 7] 5,5 11
(7 - 10] 8,5 15
(10 - 13] 11,5 8
(13 - 16] 14,5 8
(16 - 19] 17,5 4

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 111

Total - 46

Frecuencias Acumuladas (Fi).


Se construyen con el propósito de establecer cuantas observaciones hay por debajo de
un cierto valor, sin necesidad de realizar un conteo. Su construcción Se obtiene sumando
las frecuencias en forma progresiva a partir de la primera y hasta la última. El último valor
acumulado debe ser igual a f.. Los valores obtenidos no se totalizan.

Ejemplo 19.
Con los datos del ejemplo 18, determinar las frecuencias acumuladas asociadas con cada
categoría.
Solución.
Frecuencia Frec. Acumulada
11 11
15 26
8 34
8 42
4 46
46 -

Amplitud de la Categoría o Intervalo (Ci)


Corresponde para cada categoría con la diferencia entre su límite superior y su límite
inferior.

Ci= Lim. Supi – Lim. Infi (2,28)

Así por ejemplo para la primera categoría del ejemplo 18 se puede determinar que su
amplitud es Ci = 7 – 4 = 3 unidades.

Las medidas estadísticas calculados para datos agrupados o información de variables


cuantitativas de respuesta cerrada, difieren en su cálculo de las medidas calculadas para
variables de respuesta abierta o datos no agrupados; sin embargo, su interpretación es la
misma. Una característica en la agrupación, que se debe tener en cuenta, es que debido
a esta, se genera más imprecisión y por lo tanto error. Veamos cada cálculo en el mismo
orden que se vio para datos no agrupados.

2.3.2.1 Medidas de Tendencia Central

Media Aritmética Ponderada

Notación:
Parámetro Estimador
 X

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


112 ESTADÍSTICA Y PROBABILIDAD

Cuando el cálculo se hace a partir de datos agrupados, se denomina a la media aritmética


Ponderada. El término ponderado aplica sobre las frecuencias de ocurrencia o absolutas;
es decir, cada frecuencia según su tamaño o valor, resalta la importancia que tiene cada
marca de clase.
m
 
 y .f
i i
m
 
 y .f
i i
  i 1 x  i 1 ( 2,29 )
m m
 f  f
i i
i 1 i 1
yi: Cada una de las marcas de clase
fi: Cada uno de los respectivos valores de frecuencia asociados con las
marcas de clase
yi.fi: Producto de cada marca de clase con su respectiva frecuencia
Debe notarse que las formas de cálculo son exactamente iguales. Lo que cambia es la
notación en las fórmulas.

Ejemplo 20.
Con la información proporcionada por el ejemplo 18 calcular la media Aritmética

Solución.
Peso (Kg.) Yi .fi
[4 - 7] 5,5 11
(7 - 10] 8,5 15
(10 - 13] 11,5 8
(13 - 16] 14,5 8
(16 - 19] 17,5 4
Total - 46

Para calcular la media aritmética en este caso, se debe tener en cuenta que para datos
agrupados la fórmula de cálculo es la ponderada. Como ya se conocen los valores de las
marcas de clase y sus respectivas frecuencias, se calculan los productos de estos valores
yi.fi.

yi.fi
60,5
127,5
92
116
70
466

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 113

m

 y .f
i i

Finalmente x   1
i 
466
 10,13
m 46
 f
i
i 1

Ejemplo 21.

Calcular la media Aritmética para los datos que se presentan en el cuadro, que
corresponden con una población.

Variable f
2,5 10,5 12
10,5 18,5 13
18,5 26,5 15
26,5 34,5 10
34,5 42,5 8
 58

Solución. Primero se determinan las marcas de clase, se calculan los valores que se
requieren y así finalmente se determina la media aritmética.
y y .f
i i i
6,5
14,5
m
 
 y .f
i i
78
188,5 = 1217/58 = 20,98 unid.
22,5
  i 1 337,5
30,5 m 305
38,5  f 308
i
i 1
 1217

Observación.
En los casos que las clases o categorías no estén totalmente definidas, no será posible el
cálculo de la media aritmética. Así por ejemplo si se pide calcular la Media Aritmética para
el siguiente cuadro, no será posible ya que no se puede calcular las marcas de clase de la
primera y última categoría.

Variable f
Menos de 5 2
5 a 20 15
20 a 35 20
35 a 50 12
Más de 50 6
 55

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


114 ESTADÍSTICA Y PROBABILIDAD

TALLER 2
1. Calcular la media aritmética para los datos que se presentan en el cuadro.

Variable f
2,5 10,5 12
10,5 18,5 13
18,5 26,5 15
26,5 34,5 10
34,5 42,5 8
 58

2. Población
Unidad De Observación: Estudiantes de una Universidad.
Tamaño: 5000 estudiantes
Muestra: 200 estudiantes
Instrumento Para La Colecta De Información: Encuesta.
Variable Naturaleza
V1: Tiempo que dedican semanalmente al deporte (horas) Cuantitativa-Categórica
1: 0 a 2
2: más de 2 a 4
3: más de 4 a 6
4: más de 6 a 8
5: más de 8 a 10
6: más de 10 a 12

Base De Datos
V1 2 3 1 2 2 5 5 2 3 3
3 2 2 3 2 2 5 5 5 5 3
1 2 2 1 2 6 2 5 2 2 4
1 1 3 2 5 2 5 5 3 2 3
1 1 2 3 2 2 2 2 3 3 3
1 3 2 1 2 2 5 2 2 2 4
1 2 1 1 2 5 5 5 3 1 3
2 2 1 1 3 2 2 5 3 2 3
1 3 3 3 2 2 2 5 3 3 3
3 1 2 2 2 2 5 2 3 2 2
3 3 1 3 2 2 2 2 3 2 3
1 2 3 3 2 4 2 2 6 2 3
1 2 2 3 2 2 5 5 6 4 2
3 5 3 2 2 5 5 2 2 3 2

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 115

3 3 2 3 4 3 3 3 3 2
3 3 3 3 3 3 4 3 3 3
2 3 3 4 6 3 3 3 4
2 3 3 3 6 3 3 4 2
3 3 2 3 6 2 2 3 3
Con la información anterior, calcular la media aritmética.

3. Población
Unidad De Observación: Profesores que laboran en una universidad, que fuman al
menos un cigarrillo por día.
Tamaño: 80 profesores
Instrumento Para La Colecta De Información: Encuesta
Variable Naturaleza
V1: Grado de tabaquismo. Cuantitativa Categórica
1: 1 a 4 cigarrillos por día (Grado Bajo)
2: 5 a 8 cigarrillos por día (Grado Moderado)
3: 9 a 12 cigarrillos por día (Grado Alto)
4: 13 a 16 cigarrillos por día (Grado Cotidiano)

Base De Datos

V1 1 4 2 3 3 3 1 2
1 3 3 3 2 2 2 3 3
2 3 1 1 1 1 1 2 1
4 1 2 3 3 3 2 1 4
2 3 4 1 2 3 3 4 3
4 1 3 2 3 3 1 2 1
2 2 1 1 2 2 2 1 2
4 2 2 3 1 1 3 3 1
2 4 2 1 2 2 2 1 3
Con la información anterior, calcular la media aritmética.

4. Población
Unidad De Observación: Usuarias de un cierto tipo de telefonía celular
Tamaño: 2500 Usuarias
Muestra: 100 usuarias
Instrumento Para La Colecta De Información: Guía de observación
Variables Naturaleza
V1: Tiempo como usuaria (meses) Cuantitativa-categórica
1: 0 a 6
2: 6 a 12
3: 12 a 18
4: 18 a 24
5: 24 a 30
Base De Datos
V1 3 1 4 4 5 1 4 3 4
1 4 2 3 3 2 2 1 2 3
1 5 1 1 2 5 2 2 1 1
1 1 2 2 1 1 3 4 1 1

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


116 ESTADÍSTICA Y PROBABILIDAD

2 1 4 4 5 2 3 2 3
4 4 5 5 3 2 2 2 1
2 2 1 2 4 3 3 3 1
2 1 2 1 2 5 5 5 3
3 1 1 2 2 4 4 4 5
2 2 2 2 2 3 2 1
2 3 3 2 2 2 3 2
Con la información anterior, calcular la media aritmética.

5. Población
Unidad De Observación: Usuarias de un cierto tipo de telefonía celular
Tamaño: 2500 Usuarias
Muestra: 115 usuarias
Instrumento Para La Colecta De Información: Guía de observación
Variables Naturaleza
V1: Edad Cuantitativa –Categórica
1: 15 a 20
2: 20 a 25
3: 25 a 30
4: 30 a 35
5: 35 a 40
Base De Datos

V1 2 3 3 4 3 3 3 3 4 3
2 2 2 4 4 2 2 2 3 4 2
2 2 2 4 3 2 3 1 3 2 3
3 2 2 4 2 4 3 1 2 2 4
4 2 2 3 3 2 2 2 2 3 4
3 2 3 2 2 4 2 3 2 4 1
4 3 3 2 2 4 4 2 3 2
4 3 3 2 2 4 4 2 5 3
3 3 3 4 3 2 4 3 2 4
3 4 3 4 2 2 3 4 3 4
3 4 4 3 3 3 4 4 2 2

Con la información anterior, calcular la media aritmética.

6. Un estudiante cursa las siguientes asignaturas con sus respectivos créditos:

ASIGNATURA Créditos
Ecuaciones Diferenciales 4
Termodinámica 3
Microeconomía 3
Estadística I 3
Principios de Administración 3
Contabilidad General 3

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 117

Si sus resultados en cada asignatura, fueron respectivamente: 4,2 - 4,5 – 3,2 – 3,8 –
3,5 y 3,6, ¿Cuál es el promedio de semestre de este estudiante?

Mediana.

Notación:
Parámetro Estimador
Me Me

Su cálculo en variables categóricas requiere del siguiente proceso:

 Se construye F.
n
 Se determina la Posición del valor mediano. PMe  ; n =  fi
2
 Se busca PMe en F.

 Si PMe se encuentra en F entonces se denomina FJ-1 y la siguiente


en posición, se le denomina FJ. cada elemento sobre la fila asume posición
j-1 y j respectivamente.

Variable f F

Lim Inf J-1 Lim Sup J-1 fJ-1 FJ-1 = PMe

fJ FJ
Lim Inf J Lim Sup J

La Mediana podrá calcularse como


Me  Lim Inf j ( 2,30 )

 Si PMe no se encuentra en F entonces se toma el valor inmediato


anterior a PMe que se encuentre en F, y se le denomina FJ-1. La siguiente
en posición, se le denomina FJ. cada elemento sobre la fila asume posición
j-1 y j respectivamente.

Variable F F

Lim Inf J-1 Sup J-1 fJ-1 FJ-1 < PMe

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


118 ESTADÍSTICA Y PROBABILIDAD

Lim Inf J Lim Sup J fJ FJ

PMe  FJ 1
La mediana podrá calcularse como Me  Lim Inf j  C j . (2,31 )
fJ
Donde Cj es la amplitud del intervalo j. (CJ = Lim Sup J -Lim Inf J)

Ejemplo 22.
Calcular la mediana para los datos que se presentan en el cuadro, supuestos de una
muestra.

Variable f
10 20 5
20 30 8
30 40 15
40 50 10
50 60 8
 46

Solución. Al igual que en el caso anterior primero se construyen las frecuencias


acumuladas.
F
5
13 FJ-1
28 FJ
38
46
----

Se Calcula la posición de la mediana. PMe = n/2 = 46/2 = 23.

Como 23 no se encuentra en la columna de las frecuencias acumuladas, entonces se


toma el valor inmediato anterior en dicha columna y se le denomina FJ -1.

Según lo expuesto anteriormente, la mediana se calcula como

PMe  FJ 1 23  13
Me  Lim Inf j  C j . Me  30  10. = 36,67 Unid.
fJ 15

Ejercicio 13.
Con los datos del Taller 2 calcular la Mediana.

Moda. Md.

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 119

Notación:
Parámetro Estimador
Md Md

Sólo se debe tener en cuenta la clasificación con mayor frecuencia. Se requiere que los
intervalos tengan la misma amplitud.

Se determina la frecuencia absoluta más alta (frecuencia modal) y se le denomina fJ. A


partir de esta frecuencia se identifican las frecuencias anterior y posterior en posición en
el cuadro y se les denomina fJ-1 y fJ+1. La moda se calcula:
f J 1
Md  Lim InfJ  C. ( 2,32 )
f J 1  f J 1
Ejemplo 23.
Calcular la moda para los datos que se presentan en el cuadro, supuestos de una variable
continua y que corresponden con una población.

Y`i-1 Y`i f
2,5 10,5 12
10,5 18,5 13 fj-1
18,5 26,5 15 fj
26,5 34,5 10 fj+1
34,5 42,5 8
 58

Solución. Como se puede observar la frecuencia modal es 15 (fj); por lo tanto la moda se
f J 1 10
calcula como: Md  Lim Inf j  C j . Md  8,5  8. = 21,98 Unid.
f J 1  f J 1 10  13

Ejercicio 14.
Para cada uno de los ejercicios del taller 2 calcular la moda.

2.3.2.2 Medidas de Posición.

Cuartiles. Qi
Notación:
Parámetro Estimador
Qi Qi

Se debe tener en cuenta la siguiente secuencia:

 Se determinan las frecuencias absolutas acumuladas


n
 Se calcula la posición del cuartil. PQi  i ( 2,33 )
4
 Se busca el valor calculado en la columna de las frecuencias acumuladas

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


120 ESTADÍSTICA Y PROBABILIDAD

 Si el valor de posición del cuartil se encuentra en las frecuencias acumuladas,


al igual que en la mediana se le denomina Fj-1 y a partir de él se determina la
posición j. El valor del cuartil estará determinado por la expresión
Qi  Lim Inf j ( 2,34 )

 Si el valor de posición del cuartil no se encuentra en la columna de las


frecuencias acumuladas, al igual que en la mediana, se toma el valor inmediato
anterior que se encuentre en la columna de las frecuencias acumuladas y se le
denomina Fj-1 y a partir de este se determina la posición j. El valor del cuartil en
este caso estará determinado por la expresión.....
PQi  FJ 1
Qi  Lim Inf j  C j . ( 2,35 )
fj
Ejemplo 24.
Calcular el cuartil 1 con los datos que se presentan en el cuadro, supuestos de una
población.
Variable f
2,5 10,5 12
10,5 18,5 13
18,5 26,5 15
26,5 34,5 10
34,5 42,5 8
 58
Solución. Según se ha planteado, se deben determinar las frecuencias acumuladas

F
12 Fj-1
25 Fj
40
50
58
----------
PQ1 = 1*n/4 = 58/4 = 14,5

Luego el valor del cuartil número 1 será


PQi  FJ 1 14,5  12
Qi  Lim Inf j  C j . = Q1  10,5  8. = 12,04 Unid.
fj 13

Deciles. Di
Notación:
Parámetro Estimador
Di Di

Las fórmulas y procesos de cálculo para los deciles son similares a las utilizadas en los
cuartiles, basta con cambiar la notación que los representa.
n
PDi  i (2,36 ) Di  Lim Inf j ( 2,37 )
10

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 121

PDi  FJ 1
Di  Lim Inf j  C j . ( 2,38 )
fj

Percentiles. Pi
Notación:
Parámetro Estimador
Pi Pi

Al igual que en cuartiles y deciles, las fórmulas y procesos de calculo manejan los mismos
procesos; bastará con cambiar la notación.
n
PPi  i ( 2,39 ) Pi  Lim Inf j ( 2,40 )
100
PPi  FJ 1
Pi  Lim Inf j  C j . ( 2,41 )
fj
Ejercicio 15.
Para cada uno de los ejercicios del taller 2 calcular: Cuartil 3, Cuartil 1, Decil 2, percentil
90, Percentil 10.

2.3.2.3 Medidas de Dispersión o de Variabilidad

Varianza

Notación:
Parámetro Estimador
2 S2

 Y  x . f i
m m

 Y    . fi
2 2
i i
2  i 1
( 2,42 ) S2  i 1
( 2,43 )
m
 m 
f
i 1
i   fi  1
 i 1 

Ejemplo 25. Calcular la varianza para los datos que se presentan en el cuadro,
supuestos de una variable continua y que corresponden con una población.

Variable f

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


122 ESTADÍSTICA Y PROBABILIDAD

2,5 10,5 12
10,5 18,5 13
18,5 26,5 15
26,5 34,5 10
34,5 42,5 8
 58

Solución.
m

 Y    . fi
2
i La fórmula anterior dice que primero se deben
2  i 1
m determinar las marcas de clase y la media aritmética.
f
i 1
i

Yi Yi.fi ( Yi -  )2*fi
6,5 78 (6,5 – 20,98)2*12 = 2516,04
14,5 188,5 545,88
22,5 337,5 34,66
30,5 305 906,30
38,5 308 2455,60
----- 1217 6458,48

 = Yi.fi = 1217 = 20,98 Unid. Finalmente, la varianza se determina como:


fi 58

2 = 6458,48 = 111,35 Unid2


58

Desviación Estándar

Notación:
Parámetro Estimador
 S

La desviación estándar se define como la raíz cuadrada positiva de la varianza.


= 2 (2,44 ) s  s2 ( 2,45 )

Ejemplo 26.
Con los datos del ejemplo 25 determinar la desviación estándar

Solución.
Se tendrá =  2 = 111,35 = 10,55 Unid.

Ejercicio 16.

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 123

Para cada uno de los ejercicios del taller 2, calcular la varianza y la desviación estándar,
Rango, Rango intercuartílico, Rango interpercentílico.

Coeficiente de Variación

Notación:
Parámetro Estimador
C.V. c.v.
 s
C.V .   100 ( 2,46 ) c.v.   100 ( 2,47 )
 x

Valores Estandarizados

Notación:
Parámetro Estimador
Z z

Yi   Yi  x
Z ( 2,48 ) Z ( 2,49 )
 s

2.3.2.4 Medidas De Forma

Coeficiente De Asimetría

Notación:
Parámetro Estimador
A A

3.(  Me )
A ( 2,50 ) Si A > 0 entonces la asimetría se dice positiva

Si A < 0 entonces la asimetría se dice negativa

A
 f.Y X
i
 i
3

( 2,51 ) Si A = 0 entonces la distribución es simétrica.


3
n.s

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


124 ESTADÍSTICA Y PROBABILIDAD

Coeficiente de Curtosis
Notación:
Parámetro Estimador
C C

 f x 
m
4
i i x
C i 1
( 2,52 )
n.s 4
El valor de C podría ser: Mayor que tres (C>3) en cuyo caso de la distribución se afirmará
que es Leptocurtica o muy elevada respecto de la distribución normal; Menor que tres
(C<3) en cuyo caso de la distribución se afirmará que es Platicurtica o más achatada que
la distribución normal y finalmente igual a tres (C=3) en cuyo caso de la distribución se
afirmará que es Mesocurtica o de igual elevación que la normal.

Ejercicio 17.
Para cada uno de los ejercicios del taller 2, calcular: Coeficiente de variación, Valores
estandarizados para cada una de las marcas de clase, Coeficiente de asimetría y
Coeficiente de curtosis.

2.3.2.5 La Calculadora Como Herramienta Para Ejecutar Cálculos De Medidas En


Datos de Variables Categóricas. (Datos Agrupados)

CALCULADORA CASIO fx82TL - fx350TL

Para que los cálculos de las medidas que se han presentado en esta unidad sean
realizados en forma más eficiente y óptima respecto al tiempo que se requiere para
ejecutarlos, se puede optar por realizarlos directamente con la calculadora. El proceso es
similar al presentado para datos no agrupados o variables de respuesta puntual. La
diferencia está en cómo se ingresa la información; por lo tanto, una vez que la calculadora
esté dispuesta para el ingreso de la información, los datos se guardan haciendo la
secuencia

Clase o marca de SHIFT frecuencia


clase
; DATA

Una vez que se tienen los datos en la memoria de la calculadora, se pide la información
de las medidas correspondientes de la misma forma que en datos no agrupados.

CALCULADORA CASIO – fx82MS - fx350MS - fx570MS

Se realizan los pasos uno y dos tal y como si fueran datos no agrupados. Para introducir
los datos se hace la misma secuencia realizado con las Casio TL:

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 125

Clase o marca de SHIFT frecuencia


clase
; DATA
Y también en este caso, una vez que se tienen los datos en la memoria de la calculadora,
se pide la información de las medidas correspondientes de la misma forma que en datos
no agrupados.

CALCULADORA CASIO fx570ES

1. Se limpia la memoria para el proceso; con tal propósito, se pulsa la secuencia

SHIFT 9 1 = AC

2. Se hace la secuencia de las teclas:


SHIFT MODE

Y la tecla grande en dirección hacia el sur. Se despliegan las siguientes opciones

1: ab/c 2: d/c
3: CMPLX 4: STAT
5: Disp 6:CONT

Se selecciona la opción 4. Se despliega un nuevo cuadro:

Frequency?
1: ON 2: OFF
Pulse 1. A continuación pulse
MODE 3 1

Se presenta un formato con dos columnas. En la columna de la izquierda digite las


marcas de clase para ello digite y pulse igual por cada clase; y en la de la derecha las
frecuencias respectivas, de la misma manera. Terminado el paso anterior pulse la tecla
AC
Y luego ejecute el proceso de cálculo, de la misma manera que para datos de respuesta
abierta:

3. se pulsa la secuencia
SHIFT 1 5
y luego dependiendo de lo que se quiera calcular se pulsa
Si se quiere el tamaño de la muestra y se da = 1
Si se quiere la media aritmética y se da =
2
Si se quiere la desviación estándar de la población y se da =
Si lo que se quiere es la desviación estándar de la muestra y se da =. 3

Para cada cálculo se debe repetir el proceso. 4

Ejercicio 18.
Para cada uno de los ejercicios del taller 2, calcular media aritmética, desviación

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


126 ESTADÍSTICA Y PROBABILIDAD

estándar, varianza y coeficiente de variación, apoyándose en su calculadora.

2.3.3 Medidas Estadísticas Para El Análisis De Una Variable Cualitativa

Cuando se intenta medir el comportamiento de una variable cualitativa, se acude


generalmente a las tasas, las proporciones y las razones. En este texto se centra la
atención en las proporciones.

Proporciones
Notación:
Parámetro Estimador
P p

Concepto: Una proporción en una categoría o clasificación A de una variable cualitativa


cualquiera, observada en un grupo, es el resultado que se obtiene al comparar por
cociente el número de unidades en el grupo que poseen la categoría A observada, con el
total de unidades de dicho grupo.

Cálculo:
Si A = Número de unidades en la población con la categoría A observada
N = Número de unidades de la población
P = A/N ( 2,53 )
Si a = Número de unidades en la muestra con la categoría A observada
n = Número de unidades en la muestra
p = a/n ( 2,54 )
Es importante notar que los valores que generan las proporciones varían entre cero y uno.
Se les puede llamar a estos resultados valores operacionales de una proporción; sin
embargo, las proporciones también se presentan como porcentajes. Para esto bastará
con multiplicar por 100 el resultado calculado. Se les denomina a estos resultados
valores de interpretación.

Con las unidades que no poseen la categoría de interés en la observación y el total de


estas se construye una nueva proporción denominada proporción complementaria. Se le
nota con Q en el caso poblacional y como q en el caso muestral. Entre la proporción de
interés y su correspondiente complementaria se verifica siempre que su suma es igual a
uno.
P+Q=1 ; p+q=1 ( 2,55 )

Por lo tanto, Q=1–P q=1–p ( 2,56 )

Haciendo una comparación con las medidas que se utilizan en datos cuantitativos, la
proporción da una idea de lo que representa la media aritmética.

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 127

Varianza
Notación:
Parámetro Estimador
2 S2

En proporciones también es posible hablar de dispersión. En este sentido se hace


referencia a la varianza y la desviación estándar. Para determinar la varianza, una vez
que la variable ha sido cuantificada a través de las proporciones, se obtiene multiplicando
el valor de P con el valor de Q. Así, se tiene que:

 2  P.Q ( 2,57 ) s 2  p.q ( 2,58 )

Desviación Estándar
Notación:
Parámetro Estimador
 S
La desviación estándar se define como la raíz cuadrada positiva de la varianza.

 = 2 2 s=
2 s2 ( 2,59 )

Ejemplo 27.
Para una muestra de 30 estudiantes, se sabe que 12 de ellos son de sexo femenino.
Determine la proporción de estudiantes de sexo femenino, su proporción complementaria,
su varianza y desviación estándar.
Solución.
a
p a = Número de elementos en el grupo con la característica ser femenino.
n
n = Número de estudiantes en el grupo.
12
p  0,4  40% q  1  p  1  0,4  0,6
30
s 2  p  q  0,4  0,6  0,24
s p  q  0,24  0,4899

Ejercicio 19.
En el siguiente cuadro se registra la distribución por opinión frente al servicio de una
población de usuarios de una sucursal bancaria. Complete los espacios en la tabla.
¿El servicio
es?
# Usuarios P Q  2  PQ   PQ
Excelente 12320
Bueno 14520
Regular 9560
Deficiente 37860
Total

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


128 ESTADÍSTICA Y PROBABILIDAD

Cambio Porcentual

Se utiliza para medir que tanta variación porcentual hay de un periodo base a otro con
respecto a una categoría en una variable de interés.

Si para una clasificación A en una variable de interés se observó en un periodo 1 una


presencia de a unidades y para esta misma en otro periodo 2 una presencia de b
unidades, entonces, el cambio porcentual en la clasificación A de la variable del periodo 2
respecto del periodo 1 se calcula mediante.

( )

Ejercicio 20.
Según el informe Comportamiento del Mercado Laboral, presentado en Síntesis de
Coyuntura, Dirección de Políticas Sectoriales, No. 31 Diciembre 04 de 2007 publicado por
la Secretaría Distrital de Planeación y la Subsecretaría de planeación Socioeconómica de
Bogotá Disponible en Internet: http://www.sdp.gov.co/www/resources/coyuntura_31.pdf,
página 4, la siguiente es la estadística de Ocupados por Posición Ocupacional en Bogotá
entre Agosto y Octubre de 2006 y 2007.

Ocupados por Posición Ocupacional % 2006 % 2007 Cambio


Porcentual
Empleados Particulares 51,43% 55,8%
Empleados del gobierno 5,52% 5,4%
Empleado Doméstico 4,46% 4,0%
Empleado por Cuenta Propia 27,05% 27,4%
Patrón o Empleador 4,05% 5,5%
Trabajador Familiar sin Remuneración 1,81% 1,6%

Con la información anterior, se pide calcular el cambio porcentual en cada clasificación


considerada.

2.3.3.1 Cálculos De Medidas Para Una Variable Cualitativa A Partir de Excel

Siguiendo con la información proporcionada por el ejemplo 17, Para realizar los cálculos
en proporciones de la variable V4: Opinión del servicio y la variable V7: Género, se utiliza
la herramienta análisis de datos utilizando la función para análisis, Histograma.

V4: Opinión del servicio Cualitativa


1: Excelente
2: Bueno
3: Regular
4: Deficiente
V7: Género Cualitativa
1: Femenino

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 129

2: Masculino

Para iniciar el proceso, para el caso de la variable opinión del servicio, se copia de la base
de datos la información de la variable y se pega en la hoja de cálculo en la que se
pretende trabajar. Introduzca un filtro para la variable. A partir de este se podrá verificar
la correspondencia con las diferentes clasificaciones o atributos de la variable.
Se escribe en la columna siguiente el resultado del filtrado y a continuación se elimina la
acción de filtro. La primera recibirá el nombre de rango de entrada y la columna que
presenta el resultado del filtrado rango de clases. (Ver figura 21).

Figura 21. Rango de entrada y rango de clases para la variable Opinión del servicio

Con esta información se construirá un cuadro de frecuencias. Se hace clic sobre la opción
Herramientas, (Botón Datos para el caso Office 2007), en la ventana que se abre se
hace clic sobre la opción Análisis de Datos y en esta sobre la opción Histograma y
finalmente aceptar. Se abrirá una nueva ventana. En el subcuadro Entrada, digite en el
espacio para Rango de Entrada las coordenadas correspondientes (A1:A21); ubique el
puntero sobre el espacio para Rango de Clases y en este digite sus coordenadas
(B1:B4). Active la opción Rótulos (Título de la variable), ya que en los rangos anteriores
se debieron incluir. Ahora active en las opciones de salida, Rango de salida ubicando el
puntero en la barra de escritura frente a Rango de Salida. Haga clic sobre la cualquier
celda frente a la base de datos en la hoja Excel que está manejando; a partir de esta
coordenada se darán los resultados del proceso. (Ver figura 22).

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


130 ESTADÍSTICA Y PROBABILIDAD

Figura 22. Proceso Distribución de frecuencias para la variable Opinión del servicio

Al dar aceptar tendrá un cuadro de frecuencias observadas. A partir de estas, finalmente,


se podrá calcular los valores de las proporciones p, q, varianza y desviación. (Ver figura
23).

Figura 23. Distribución de frecuencias para la variable Opinión del servicio

Cambie en la última fila la palabra y mayor… por total, calcule la suma de los valores de
frecuencia y siguiendo los elementos que se le presentaron en la teoría de la unidad,
finalmente calcule los valores de proporción p, q, varianza y deviación (Ver figura 24)

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 131

Figura 24. Medidas estadísticas para la variable Opinión del servicio

El proceso se repite con cada variable que se considere.

Ejercicio 21.
Otras formas de medir en variables de tipo cualitativo son las razones y las tasas.
Procure hacer una revisión bibliográfica al respecto y presentar un informe.

TALLER 3

A continuación se le presentan algunos ejercicios con los que se pretende que usted
afiance los diferentes conceptos que hasta ahora se han desarrollado.

1. Población
Unidad De Observación: Trabajadores de la empresa manufacturera La Garantía
Tamaño: 385 trabajadores de la empresa.
Muestra: 70 trabajadores
Instrumento Para La Colecta De Información: Encuesta
Variables Naturaleza
V1: Monto Total en Deudas (Miles de Pesos) Cuantitativa Categórica
2500 - 5000: 1
5000 - 7500: 2
7500 - 10000: 3
10000 - 12500: 4
12500 - 15000: 5
V2: Ingresos Quincenales (Miles de Pesos) Cuantitativa
V3: Grado de escolaridad Cualitativa
1: Primaria
2: Secundaria
3: Universitaria
4: Especialista

V1 V2 V3 3 290 1 4 350 1 2 260 1 1 320 1

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


132 ESTADÍSTICA Y PROBABILIDAD

1 320 1 2 250 2 1 260 3 1 350 1 3 360 3


1 350 2 2 280 2 1 250 1 2 360 1 2 520 2
2 380 1 2 280 2 3 240 2 3 350 1 3 520 3
2 390 2 3 320 2 2 260 2 3 220 1 3 450 2
2 380 1 1 360 2 2 280 1 3 420 2 4 360 4
3 420 2 3 350 2 3 260 2 3 440 2 3 350 2
1 420 1 1 360 1 1 270 2 1 520 2 5 430 3
2 350 2 2 290 2 2 280 2 1 320 2 4 650 2
1 360 1 1 270 3 3 260 2 2 290 2 4 330 4
3 350 3 1 240 3 3 230 2 3 360 2 3 270 2
1 330 2 2 260 2 3 290 1 1 350 3
2 360 1 2 290 1 3 320 2 3 340 2
1 340 3 2 280 2 1 350 2 3 560 3
1 350 2 3 230 3 2 360 2 2 450 2

Con la información de la muestra anterior, complete las celdas de los siguientes cuadros.

Cuadro 1. Resumen muestral variables de naturaleza cuantitativa


Variable Monto Total Ingresos P10
Medida en Deudas Quincenales P90
x Rp
R
Me 2
S
Md
S
Q1
c.v.
Q3
A
RQ
C
¿Cuál de las variable V1 y V2 presenta mayor grado de dispersión relativa?

Cuadro 2. Resumen muestral variables de naturaleza cualitativa


Grado de Escolaridad Frecuencia p q s2 s

Primaria
Secundaria
Universitaria
Especialista
Total - - -

2. Población

Unidad De Observación: Trabajadores de la empresa manufacturera La Garantía


Tamaño: 115 trabajadores de la empresa.
Muestra: 43 trabajadores
Instrumento Para La Colecta De Información: Encuesta
Variables Naturaleza
V1: Ingresos Quincenales (Miles de Pesos) Cuantitativa
V2: Gastos Quincenales en alimentación (Miles de Pesos) Cuantitativa
V3: Número de Hijos Cuantitativa
V4: Actividad que más le gusta realizar los fines de semana Cualitativa
1: Ir al cine
2: Bailar
3: Deporte
4: Dormir
Base de Datos

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 133

V1 V2 V3 V4 390 150 2 3 360 180 1 1


290 150 2 1 380 130 0 2 340 120 0 3
350 180 2 1 420 150 1 1 350 120 0 2
260 120 0 1 420 230 3 4 250 130 2 2
320 120 1 1 350 170 1 2 280 140 3 2
320 150 1 1 350 150 1 3 280 130 1 2
350 150 1 2 380 200 1 3 320 140 1 2
380 200 1 1 390 150 2 3 360 160 1 2
390 150 2 2 380 130 0 3 350 170 4 2
380 130 0 1 420 150 1 4 360 200 1 1
420 150 1 2 420 230 3 1 290 140 4 2
420 230 3 4 350 170 1 2 270 130 1 3
350 170 1 3 360 180 2 1 240 130 3 3
350 150 1 4 350 160 3 3 260 120 3 2
380 200 1 2 330 150 1 2

Con la información que le ofrece la muestra, complete el siguiente cuadro

Cuadro 1. Resumen muestral para variables de naturaleza cuantitativa y cualitativa


Variable P10
V1 V2 V3
Medida P90
x Rp
R
Me 2
S
Md
S
Q1
c.v.
Q3
A
RQ
C

¿Cuál de las variables V1, V2 y V3 presenta mayor grado de dispersión relativa?

Cuadro 2. Resumen muestral variables de naturaleza cualitativa


Actividad que más le
Frecuencia p q s2 s
gusta realizar

Ir al cine

Bailar

Deporte

Dormir

Total - - -

3. Unidad De Observación: Usuarios inquilinos de una inmobiliaria


Población: 80 trabajadores de la empresa.
Instrumento Para La Colecta De Información: Encuesta
Variables Naturaleza
V1: Número de personas que ocupan el inmueble Cuantitativa
V2: Valor del canon de arrendamiento (miles de pesos) Cuantitativa – Categórica
1: 150 – 250

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


134 ESTADÍSTICA Y PROBABILIDAD

2: Más de 250 a 350


3: Más de 350 a 450
4: Más de 450 a 550
5: Más de 550 a 650
V3: Tiempo de relaciones comerciales Cuantitativa
V4: Medio por el que se enteró del inmueble. Cualitativa
1: Periódico
2: Aviso del inmueble
3: Cartelera oficina
4: Referencia amigo
5: Otro
Base de Datos

V1 V2 V3 V4 3 2 25 2 3 3 60 3 6 4 18 0
3 2 12 3 3 3 180 3 5 5 12 0 5 5 36 2
3 2 7 0 3 3 24 4 4 4 30 2 5 3 60 0
5 2 50 0 2 2 120 4 5 4 12 3 4 2 24 2
3 1 5 2 5 3 120 0 2 5 24 1 3 4 42 0
2 2 96 0 4 2 12 2 1 2 24 4 3 3 18 1
2 2 96 3 3 2 72 1 2 3 36 0 2 5 120 4
2 2 24 1 2 3 84 0 5 4 30 3 5 4 36 0
3 2 96 3 5 2 36 2 2 4 6 4 5 3 18 0
4 2 85 0 3 3 12 3 5 3 12 3 6 5 12 2
4 2 60 1 5 2 24 3 2 2 24 4 5 2 30 0
3 2 24 1 3 3 84 3 4 3 24 3 2 4 72 0
1 2 18 0 2 3 24 1 4 4 12 4 3 4 132 2
3 2 35 2 4 3 60 3 6 3 36 3 5 3 96 2
4 2 7 2 2 2 12 3 5 2 24 4 5 4 24 0
2 2 12 1 5 3 36 4 2 3 4 4 4 5 36 2
2 2 108 2 3 4 36 3 1 3 8 0 3 4 12 0
2 2 35 0 2 5 36 0 5 4 18 3 3 2 112 1
2 2 36 1 3 4 6 3 5 3 18 2
3 2 24 2 3 5 12 3 3 5 36 0
2 2 90 0 5 3 36 3 5 3 48 2

Con la información que le ofrece la muestra, complete el siguiente cuadro.

Cuadro 1. Resumen muestral para variables de naturaleza cuantitativa y cualitativa


Variable Número Tiempo P10
Valor
De Relaciones
Medida canon P90
personas Comerciales
x Rp
Me R
2
Md S
Q1 S
Q3 c.v.
RQ A
C

¿Cuál de las variables V1, V2 y V3 presenta mayor grado de dispersión relativa?

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 135

Cuadro 2. Resumen muestral variables de naturaleza cualitativa


Medio por el que se enteró
Frecuencia p q s2 S
del inmueble

Periódico

Aviso Inmueble

Cartelera oficina

Referencia Amigos

Otro

Total - - -

4. Población
Unidad De Observación: Historia laboral de trabajadores del sector calzado de sexo
femenino de una ciudad de Colombia.
N = 1357 historias laborales.
Muestra: 137 historias laborales
Instrumento Para La Colecta De Información: Cuestionario

La siguiente es la base de datos proporcionada por las preguntas de una escala Likert:

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


136 ESTADÍSTICA Y PROBABILIDAD

CUESTIONARIO SOBRE SATISFACCIÓN LABORAL. ESCALA LIKERT


El grado en que
La limpieza, El entorno físico La "igualdad" y
Los objetivos, La proximidad y la empresa
higiene y y el espacio de La temperatura Las relaciones La supervisión La forma en que "Justicia" de El apoyo que
metas y tasa de frecuencia con cumple el
salubridad de que dispone en de su local de personales con que ejercen sus superiores trato que recibe de sus
producción que que es convenio, las
su lugar de su lugar de trabajo sus superiores sobre usted juzgan su tarea recibe de su superiores
debe alcanzar supervisado disposiciones y
trabajo trabajo empresa
leyes laborales
3 4 5 3 5 4 2 4 3 4 3
5 3 4 4 3 5 3 4 3 4 3
3 4 4 5 4 5 2 4 3 4 3
5 4 4 4 5 5 2 5 4 4 3
5 4 5 5 5 5 2 5 4 4 3
5 5 5 5 6 4 3 6 4 4 3
5 5 5 6 5 5 3 5 5 5 3
6 5 4 6 4 5 4 4 5 5 3
5 6 5 6 3 5 4 4 5 5 2
6 5 5 6 3 6 4 4 5 5 2
5 6 6 7 3 5 5 5 4 5 2
6 6 4 5 4 5 5 5 4 5 3
7 7 5 6 4 5 5 6 4 5 3
6 6 5 5 5 5 5 6 4 5 3
5 5 6 4 6 6 5 5 4 4 3
5 3 6 4 5 5 5 5 4 4 4
5 5 7 4 4 5 5 4 4 4 4
3 5 6 5 3 5 5 4 3 4 4
3 6 5 6 3 5 5 5 3 4 4
4 7 4 5 3 5 5 5 3 4 4
5 6 4 6 3 3 5 5 3 4 4
4 5 5 6 4 3 5 5 3 5 4
5 3 5 7 4 3 5 6 3 5 4
5 5 6 5 5 3 5 6 3 5 4
6 6 6 6 5 3 5 6 3 5 4
7 6 6 4 6 4 4 5 4 5 4
6 6 7 5 2 4 4 5 4 5 3
5 6 7 6 3 4 4 5 5 5 3
7 5 6 5 3 4 4 4 5 4 3
6 4 6 4 3 5 5 4 5 4 4
5 5 5 3 4 5 5 4 5 4 4
6 5 4 4 4 5 5 4 5 4 4
5 5 4 5 5 5 5 4 5 4 4
6 6 5 6 5 5 5 4 5 4 4
7 3 5 6 6 5 5 5 4 4 4
3 2 6 5 5 5 3 5 4 5 5
4 2 6 4 5 5 4 5 4 5 5
3 4 5 4 4 6 4 5 4 5 5
5 3 4 3 4 6 4 5 3 5 5
6 5 4 3 4 6 4 5 3 5 5

Se pide realizar para la escala la calificación para cada uno de los sujetos observados.
Con la información generada por la calificación final de la escala, determine e interprete:
Media Arítmética, Mediana, Cuartil 3, Quintil 2, Octal 5, Percentil 80.

5. Las siguientes son algunas estadísticas registradas por una facultad para los
estudiantes de primer semestre de una universidad durante los semestres I y II del
año 2006.

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 137

Cambio
Característica I - 2006 II - 2006
Porcentual
Inscritos 151 81
Admitidos (Primer Nivel) 126 69
Admitidos (Transferencia) 5 6
Promedio ICFES 402,9 402
Desviación Estándar ICFES 35,93 33,21

Puntaje Mínimo ICFES 311 321

Puntaje Máximo ICFES 532 481

Con la información anterior, se pide calcular el cambio porcentual en cada característica


considerada.

RUMBO AL ECAES

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


138 ESTADÍSTICA Y PROBABILIDAD

PREGUNTAS DE SELECCIÓN MÚLTIPLE CON ÚNICA RESPUESTA

1) Las medidas de tendencia central son


a) moda, mediana y desviación estándar
b) mediana, media y T-student
c) media, moda y mediana
d) moda, chi cuadrado y varianza

2) La medida que indica la mayor repetición de datos corresponde a


a) Moda
b) Mediana
c) Media
d) Varianza

3) En un curso de evaluación de 50 estudiantes, el promedio de calificación es de 3.4;


este valor corresponde con la
a) Mediana
b) Moda
c) desviación estándar
d) media

4) En una evaluación de talla a escolares, se encontró que el dato central en las medidas
de posición es 1,16 m. Este valor corresponde con la
a) Moda
b) Media
c) Varianza
d) Mediana

5) La media aritmética de los pesos de un grupo conformado por estudiantes de


Medicina y estudiantes de Ingeniería es 70 Kg. Si la media aritmética de los pesos de
los estudiantes de Medicina es 75 Kg, la de los estudiantes de Ingeniería 58 Kg y si
hay 85 estudiantes, ¿Cuántos son estudiantes de Medicina y cuántos de Ingeniería?
a) 58 y 27
b) 75 y 10
c) 60 y 25
d) 45 y 40

6) En cuál de estos casos será la moda más útil como indicador de la tendencia central
a) Cada valor en un conjunto de datos ocurre exactamente una vez
b) Todos los valores en un conjunto de datos ocurren 100 veces cada uno
c) Cada valor en un conjunto de datos tiene el mismo valor
d) Todos los valores en un conjunto de datos ocurre una sola vez, excepto por el
primero y el último dato los cuales se repiten 50 veces cada uno

7) Al probar nueve muestras con cada uno de los cuatro diseños de soporte para una
prensa hidráulica, se encontró para la variable: Tiempo (hr) que tardó cada diseño en
fallar las siguientes medidas:

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 139

Diseño A: x  20 s4 Diseño B: x  23 s3


Diseño C: x  19 s 8 Diseño D: x  21 s  10

De los diseños el mejor según la información suministrada es


a) Diseño A
b) Diseño B
c) Diseño C
d) Diseño D

8) La medida de tendencia central que puede ser usada para variables numéricas
(Cuantitativas) y para variables categóricas (cualitativas) es
a) La media aritmética
b) La mediana
c) La moda
d) La media geométrica

9) Veintiuna personas en un salón de clase tienen una altura promedio de 168


centímetros. Si al salón entra una persona adicional, la altura que debe tener esta
persona para que la altura promedia se incremente en un centímetro, es
a) 169 cm
b) 195 cm.
c) 170 cm.
d) 190 cm.

10) Una persona ha gastado $10000 en cada una de tres tiendas diferentes. En la primera
compró artículos a $2000 la unidad, en la segunda compró a $2500 la unidad y en la
tercera a $5000 la unidad. El precio promedio que ha pagado por el artículo se calcula
mediante
a) Media armónica
b) Mediana
c) Media ponderada
d) Media geométrica

11) La Junta Directiva de una empresa textil está considerando adquirir una compañía y
se le presentan dos alternativas de compra. Para esto se examinan minuciosamente
los resultados de estas dos compañías con el fin de realizar una mejor inversión.
Durante los pasados 5 años la compañía A tuvo una recuperación promedio anual de
lo invertido del 21% con una desviación estándar de 3,9% y un coeficiente de
variación de 18,57%. La compañía B tuvo una recuperación promedio anual de lo
invertido de 37,8% con una desviación estándar de 4,8% y un coeficiente de variación
de 12,68%. Si se considera riesgoso invertir en una compañía que tenga una alta
dispersión con respecto a la media anual de recuperación, entonces
a) las dos compañías han desempeñado estrategias igualmente riesgosas
b) la compañía B ha estado desempeñando una estrategia más riesgosa
c) la compañía A ha estado desempeñando una estrategia más riesgosa
d) Ninguna de las dos compañías ha tenido riesgos en la implementación de sus
estrategias
12) Puesto que una muestra es un subconjunto de la población, la media de la muestra
a) es siempre más pequeña que la de la población
b) es siempre más grande que la de la población

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


140 ESTADÍSTICA Y PROBABILIDAD

c) debe ser igual a la media de la población


d) Puede ser más grande, más pequeña, o igual a la media de la población

13) Varianza es:


a. una medida del promedio, o de valor central de una variable al azar
b. una medida de la dispersión de una variable aleatoria
c. la raíz cuadrada de la desviación típica
d. la suma de las desviaciones cuadráticas de los datos a la media

14) Al observar el peso y la estatura en un grupo de niños, se obtuvo la siguiente


información:
Peso (kg.) Estatura (m.)
Media aritmética 38 115
Desviación estándar 5 13
13,16% 11,30%
Coeficiente de variación
Se puede afirmar que:
a) El peso presenta mayor grado de dispersión relativa que la estatura
b) La estatura presenta mayor grado de dispersión relativa que el peso
c) La dispersión absoluta es mayor en la estatura que en el peso
d) La dispersión absoluta es mayor en el peso que en la estatura

15) Para este tipo de medidas se tiene que su función es la de representar o resumir lo
relevante de un conjunto de valores mediante un único valor denominado promedio
a) Medidas de asimetría
b) Medidas de tendencia central
c) Medidas de dispersión
d) Medidas de Curtosis

16) Cuando para un cierto tipo de inversión se afirma que el 50% de las veces produce
una rentabilidad inferior del 15% y el 50% restante la rentabilidad es mayor, el
concepto que se aplica en la afirmación es.
a) Media aritmética
b) Mediana
c) Moda
d) Media geométrica

17) Los resúmenes de datos en los que se tabulan, representan gráfica o numéricamente
los datos son…
a) Inferencia estadística
b) Estadística descriptiva
c) Cálculo de probabilidades
d) Un informe

18) En una muestra de 800 estudiantes de una universidad, el 30 por ciento son
delegados. El 30 por ciento es un ejemplo de….
a. Muestra
b. Población

Edwin Dugarte Peña


ESTADÍSTICA Y PROBABILIDAD 141

c. Inferencia estadística
d. Estadística descriptiva

19) En una muestra de 400 estudiantes de una universidad, el 20 por ciento son
delegados. Sobre la base de esta información, el periódico universitario informa que el
20 por ciento de todos los estudiantes de la universidad son delegados. Esta
información es un ejemplo de….
a. Muestra
b. Población
c. Inferencia estadística
d. Estadística descriptiva

20) Se encuesta a quinientos residentes de una ciudad para obtener la información sobre
intenciones de voto en una elección próxima. Los quinientos residentes en este
estudio son un ejemplo de
a. Muestra
b. Población
c. Observación
d. Censo
21) Un profesor de estadística pregunta en clase las edades de los estudiantes. Sobre la
base de esta información, el profesor establece que la edad media de todos los
estudiantes en la universidad es de 24 años. Esto es un ejemplo de…
a) Censo
b) Estadística descriptiva
c) Experimento
d) Inferencia estadística

22) El Departamento de Transporte de una ciudad ha notado que hay un promedio de 17


accidentes por día. Este dato es un ejemplo de
a) Muestra
b) Estadística descriptiva
c) Población
d) Inferencia estadística

23) En un estudio reciente que consiste en examinar a 200 hogares en una ciudad, se
encontró que 80 no pagaba una o más tasas locales. Este dato es un ejemplo de
a) Censo
b) Experimento
c) Estadística descriptiva
d) Inferencia estadística

24) El proceso de analizar datos de una muestra con el objetivo de inducir conclusiones
acerca de características de la población se denomina….
a) Estadística descriptiva
b) Inferencia estadística
c) Análisis de datos
d) Resumen de datos
25) En una oficina de correos, los sobres son numerados desde 1 a 4500. Estos números
son….
a) Un dato cualitativo
b) Un dato cuantitativo

MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE


142 ESTADÍSTICA Y PROBABILIDAD

c) Ambos, cualitativo o cuantitativo


d) Puesto que los números son secuenciales, los datos son cuantitativos

26) Para celebrar los 15 años de una facultad de una universidad, la asociación de
egresados programó dos actividades: Un concierto y una presentación del grupo de
teatro. Ambos eventos recibieron publicidad; el primero por la radio y el segundo por el
canal regional de televisión. Para el primer evento se proyectó una asistencia de 450
estudiantes y para el segundo de 600. Se presentaron 300 para el primero y 455 para
el segundo. Con base en lo que se presentó
a) Fue más eficaz la radio que la televisión regional en el anunciar los eventos
b) Fue más eficaz la televisión regional que la radio en el anunciar los eventos
c) Fueron igualmente eficaces los medios utilizados.
d) No se puede realizar una valoración de la eficacia entre los medios.

"EN EL INTENTO POR SER CREATIVO MIRA PRIMERO QUE EL CONCEPTO QUE DE
TI MISMO TIENES ES EL MEJOR QUE PUEDES TENER"

Edwin Dugarte Peña

También podría gustarte