Chebyshev
Chebyshev
Chebyshev
denotan x1, x 2, . . . , xn. Suponga además que ya determinó la media muestral, que es x̄ y la des-
viación estándar muestral, que es s. Para cada valor xi existe otro valor llamado punto z. La ecua-
ción (3.9) permite calcular el punto z correspondiente a cada xi.
PUNTO z
xi x̄
zi (3.9)
s
donde
zi punto z para xi
x̄ media muestral
s desviación estándar muestral
Al punto z también se le suele llamar valor estandarizado. El punto zi puede ser interpretado
como el número de desviaciones estándar a las que xi se encuentra de la media x̄. Por ejemplo
si z1 1.2, esto indica que x1 es 1.2 desviaciones estándar mayor que la media muestral. De ma-
nera similar, z2 0.5 indica que x2 es 0.5 o 1/2 desviación estándar menor que la media mues-
tral. Puntos z mayores a cero corresponden a observaciones cuyo valor es mayor a la media, y
puntos z menores que cero corresponden a observaciones cuyo valor es menor a la media. Si
el punto z es cero, el valor de la observación correspondiente es igual a la media.
El punto z de cualquier observación se interpreta como una medida relativa de la localiza-
ción de la observación en el conjunto de datos. Por tanto, observaciones de dos conjuntos de da-
tos distintos que tengan el mismo punto z tienen la misma localización relativa; es decir, se
encuentran al mismo número de desviaciones estándar de la media.
En la tabla 3.5 se calculan los puntos z correspondientes a los tamaños de los grupos de es-
tudiantes. Recuerde que ya calculó la media muestral, x̄ 44, y la desviación estándar muestral,
s 8. El punto z de la quinta observación, que es –1.50, indica que esta observación está más
alejada de la media; esta observación está 1.50 desviaciones estándar más abajo de la media.
Teorema de Chebyshev
El teorema de Chebyshev permite decir qué proporción de los valores que se tienen en los da-
tos debe estar dentro de un determinado número de desviaciones estándar de la media.
Número de Puntos z
Desviación respecto xi ⴚ x̄
estudiantes
en un grupo (xi)
de la media
(xi ⴚ x̄)
冢 s 冣
46 2 2/8 0.25
54 10 10/8 1.25
42 2 2/8 0.25
46 2 2/8 0.25
32 12 12/8 1.50
03Ander(081-140).qxd 2/29/08 11:28 AM Page 101
TEOREMA DE CHEBYSHEV
Por lo menos (1 1/z 2 ) de los valores que se tienen en los datos deben encontrarse dentro
de z desviaciones estándar de la media, donde z es cualquier valor mayor que 1.
Regla empírica
La regla empírica está Una de las ventajas del teorema de Chebyshev es que se aplica a cualquier conjunto de datos, sin
basada en la distribución importar la forma de la distribución de los datos. En efecto se usa para cualquiera de las distri-
de probabilidad normal, la buciones de la figura 3.3. Sin embargo, en muchas aplicaciones prácticas los datos muestran una
cual se estudiará en el
capítulo 6. La distribución
distribución simétrica con forma de montaña o de campana como en la figura 3.4. Cuando se cree
normal se emplea mucho en que los datos tienen aproximadamente esta distribución, se puede emplear la regla empírica para
todo el libro determinar el porcentaje de los valores de los datos que deben encontrarse dentro de un determi-
nado número de desviaciones estándar de la media.
REGLA EMPÍRICA
Cuando los datos tienen una distribución en forma de campana:
• Cerca de 68% de los valores de los datos se encontrarán a no más de una desvia-
ción estándar desde la media.
• Aproximadamente 95% de los valores de los datos se encontrarán a no más de dos
desviaciones estándar desde la media.
• Casi todos los valores de los datos estarán a no más de tres desviaciones estándar de
la media.
03Ander(081-140).qxd 2/29/08 11:28 AM Page 102
Por ejemplo, los envases con detergente líquido se llenan en forma automática en una línea
de producción. Los pesos de llenado suelen tener una distribución en forma de campana. Si el
peso medio de llenado es de 16 onzas y la desviación estándar de 0.25 onzas, la regla empírica
es aplicada para sacar las conclusiones siguientes:
• Aproximadamente 68% de los envases llenados pesarán entre 15.75 y 16.25 onzas (esta-
rán a no más de una desviación estándar de la media).
• Cerca de 95% de los envases llenados pesarán entre 15.50 y 16.50 onzas (estarán a no
más de dos desviaciones estándar de la media).
• Casi todos los envases llenados pesarán entre 15.25 y 16.75 onzas (estarán a no más de
tres desviaciones estándar de la media).
1. El teorema de Chebyshev es aplicable a cual- nar el número mínimo de los valores de los da-
quier conjunto de datos y se usa para determi- tos que estarán a no más de un determinado nú-
03Ander(081-140).qxd 2/29/08 11:28 AM Page 103
mero de desviaciones estándar de la media. Si 2. Antes de analizar un conjunto de datos, los es-
se sabe que los datos tienen forma de campana tadísticos suelen hacer diversas verificaciones
se puede decir más. Por ejemplo, la regla em- para confirmar la validez de los datos. En estu-
pírica permite decir que cerca de 95% de los dios grandes no es poco común que se cometan
valores de los datos estarán a no más de dos errores al anotar los datos o al ingresarlos en la
desviaciones estándar de la media. El teore- computadora. Identificar las observaciones atí-
ma de Chebyshev sólo permite concluir que picas es una herramienta usada para verificar la
por lo menos 75% de los valores de los datos validez de los datos.
estarán en ese intervalo.
Ejercicios
Métodos
25. Considere una muestra cuyos datos tienen los valores 10, 20, 12, 17 y 16. Calcule el punto z de
cada una de estas cinco observaciones.
26. Piense en una muestra en que la media es 500 y la desviación estándar es 100. ¿Cuáles son los
puntos z de los datos siguientes: 520, 650, 500, 450 y 280?
27. Considere una muestra en que la media es 30 y la desviación estándar es 5. Utilice el teorema de
Auto examen Chebyshev para determinar el porcentaje de los datos que se encuentra dentro de cada uno de los
rangos siguientes.
a. 20 a 40
b. 15 a 45
c. 22 a 38
d. 18 a 42
e. 12 a 48
28. Suponga datos que tienen una distribución en forma de campana cuya media es 30 y desviación
estándar 5. Utilice la regla empírica para determinar el porcentaje de los datos que se encuentra
dentro de cada uno de los rangos siguientes.
a. 20 a 40
b. 15 a 45
c. 25 a 35
Aplicaciones
29. En una encuesta nacional se encontró que los adultos duermen en promedio 6.9 horas por noche.
Auto examen Suponga que la desviación estándar es 1.2 horas.
a. Emplee el teorema de Chebyshev para hallar el porcentaje de individuos que duermen entre
4.5 y 9.3 horas.
b. Mediante el teorema de Chebyshev encuentre el porcentaje de individuos que duermen en-
tre 3.9 y 9.9 horas.
c. Suponga que el número de horas de sueño tiene una distribución en forma de campana. Use
la regla empírica para calcular el porcentaje de individuos que duermen entre 4.5 y 9.3 ho-
ras por día. Compare este resultado con el valor que obtuvo en el inciso a empleando este
resultado.
30. La Administración de Información de Energía informó que el precio medio del galón de gasoli-
na fue $2.30 (Energy Information Administration, 27 de febrero de 2006). Admita que la desvia-
ción estándar haya sido $0.10 y que el precio del galón de gasolina tenga una distribución en
forma de campana.
a. ¿Qué porcentaje de la gasolina se vendió entre $2.20 y $2.40 por galón?
b. ¿Qué porcentaje de la gasolina se vendió entre $2.20 y $2.50 por galón?
c. ¿Qué porcentaje de la gasolina se vendió a más de $2.50 por galón?
31. El promedio de los puntos obtenidos en una sección de un examen a nivel nacional fue 507. Si la
desviación estándar es aproximadamente 100, conteste las preguntas siguientes usando una dis-
tribución en forma de campana y la regla empírica.
03Ander(081-140).qxd 2/29/08 11:28 AM Page 104
Con base en esta muestra de siete, calcule los estadísticos descriptivos siguientes
a. Media, mediana y moda.
b. Rango y desviación estándar.
c. ¿En el caso del huracán Vilma considera el tiempo requerido para restablecer el servicio co-
mo una observación atípica?
d. Estos siete huracanes ocasionaron 10 millones de interrupciones del servicio a los clientes.
¿Indican dichas estadísticas que la empresa debe mejorar su servicio de reparación en emer-
gencias? Discuta.
34. A continuación se presentan los puntos que obtuvieron los equipos en una muestra de 10 juegos
universitarios de la NCAA (USA Today, 26 de febrero de 2004).
Margen de
Equipo ganador Puntos Equipo perdedor Puntos ganancia
Arizona 90 Oregon 66 24
Duke 85 Georgetown 66 19
archivo CD Florida State 75 Wake Forest 70 5
en Kansas
Kentucky
78
71
Colorado
Notre Dame
57
63
21
8
NCAA Louisville 65 Tennessee 62 3
Oklahoma State 72 Texas 66 6
03Ander(081-140).qxd 2/29/08 11:28 AM Page 105
Margen
Equipo ganador Puntos Equipo perdedor Puntos de ganancia
Purdue 76 Michigan State 70 6
Stanford 77 Southern Cal 67 10
Wisconsin 76 Illinois 56 20
a. Calcule la media y la desviación estándar de los puntos obtenidos por los equipos ganadores.
b. Suponga que los puntos obtenidos por los equipos ganadores de la NCAA tienen una distri-
bución en forma de campana. Mediante la media y la desviación estándar halladas en el in-
ciso a, estime cuál es el porcentaje de todos los juegos de la NCAA en que el equipo ganador
obtuvo 84 puntos o más. Calcule el porcentaje en todos los juegos de la NCAA en que el
equipo ganador obtuvo más de 90 puntos.
c. Aproxime la media y la desviación estándar del margen de ganancia. ¿Hay en estos datos
alguna observación atípica? Explique.
35. Consumer Review publica en Internet estudios y evaluaciones de diversos productos. La siguien-
te es una lista de 20 sistemas de sonido con sus evaluaciones (www.audioreview.com). La esca-
la de evaluación es de 1 a 5, siendo 5 lo mejor.