Distribuciones de Muestreo Capitulo 6 Levin
Distribuciones de Muestreo Capitulo 6 Levin
Distribuciones de Muestreo Capitulo 6 Levin
MUESTREO Y
DISTRIBUCIONES
DE MUESTREO
Estadísticas y parámetros
Matemáticamente, podemos describir muestras y
poblaciones al emplear mediciones como la media,
la mediana, la moda y la desviación estándar, que
el capítulo 3 introdujo. Cuando estos términos
describen las características de una muestra, se
denominan estadísticas.
Cuando describen las características de una
población, se llaman parámetros. Una estadística
es una característica de una muestra y un
parámetro es una característica de una
población.
Tipos de muestreo
Existen dos métodos para seleccionar
muestras de poblaciones: el muestreo no
aleatorio o de juicio
y el muestreo aleatorio o de probabilidad. En
el muestreo de probabilidad, todos los
elementos de la población tienen la
oportunidad de ser escogidos para la
muestra.
Tipos de muestreo
En el muestreo de juicio, se emplea
el conocimiento y la opinión personal para
identificar a los elementos de la población
que deben incluirse en la muestra. Una
muestra seleccionada por muestreo de juicio
se basa en la experiencia de alguien con la
población. Un guardabosques, por ejemplo,
reuniría una muestra de juicio si decidiera
con anticipación las zonas de una gran área
arbolada que recorrería para estimar la
cantidad de madera que podría obtenerse.
Muestras sesgadas
El Congreso se encuentra en el debate sobre
algunas leyes de control de armas. Se le pide a
usted que lleve a cabo una encuesta de opinión.
Debido a que los cazadores son los más
afectados por las leyes de control de armas, va
a una hostería de cazadores para hacer las
entrevistas. Después informa que en una
encuesta realizada, cerca del 97% de quienes
respondieron estaba a favor de derogar todas
las leyes de control de armas.
Muestreo aleatorio
Cuatro métodos del muestreo aleatorio:
1. Muestreo aleatorio simple.
2. Muestreo sistemático.
3. Muestreo estratificado.
4. Muestreo de racimo.
Muestreo aleatorio simple
El muestreo aleatorio simple selecciona
muestras mediante métodos que permiten
que cada posible muestra tenga una igual
probabilidad de ser seleccionada y que cada
elemento de la población total tenga una
oportunidad igual de ser incluido en la
muestra.
Muestreo sistemático
En el muestreo sistemático, los elementos
son seleccionados de la población dentro de
un intervalo uniforme que se mide con
respecto al tiempo, al orden o al espacio. Si
tuviera que entrevistar a cada vigésimo
estudiante de una universidad, escogería un
punto de inicio aleatorio entre los primeros
20 nombres del directorio estudiantil y luego
seleccionaría cada veintavo nombre de ahí
en adelante.
El muestreo sistemático difiere del muestreo
aleatorio simple en que cada elemento tiene
igual oportunidad de ser seleccionado, pero
cada muestra no tiene una posibilidad igual
de ser seleccionada.
En el muestreo sistemático existe el problema de
introducir un error en el proceso de muestreo.
Suponga que estuviera muestreando el desecho
de papel producido domésticamente, y decidiera
muestrear 100 casas cada lunes. La probabilidad
de que esa muestra no fuera representativa es
alta porque la basura de los lunes incluiría, muy
probablemente, el periódico dominical. Por tanto,
la cantidad de desechos estaría sesgada hacia
arriba por haber elegido este procedimiento de
muestreo.
Muestreo estratificado
Para utilizar el muestreo estratificado, dividimos la
población en grupos relativamente homogéneos,
llamados estratos.
El muestreo estratificado resulta apropiado cuando la
población ya está dividida en grupos de diferentes
tamaños y deseamos tomar en cuenta esta
condición. Supongamos que los pacientes de un
médico están divididos en cuatro grupos de acuerdo
con su edad, como la tabla 6-4 lo muestra. El médico
desea averiguar cuántas horas duermen sus
pacientes. Para obtener una estimación de esta
característica de la población, podría tomar una
muestra aleatoria de cada uno de los cuatro grupos
de edades y ponderar las muestras de acuerdo con
el porcentaje de pacientes en ese grupo. Éste sería
un ejemplo de una muestra estratificada.
La ventaja de las muestras estratificadas es
que, cuando se diseñan adecuadamente,
reflejan de manera más precisa las
características de la población de la cual
fueron elegidas, en comparación con otro
tipo de muestras.
Muestreo de racimo
En el muestreo de racimo dividimos la población
en grupos, o racimos, y luego seleccionamos una
muestra aleatoria de estos racimos, asumiendo
que cada uno de ellos es representativo de la
población. Si una investigación de mercado tiene la
intención de determinar por muestreo el número
promedio de televisores por casa en una ciudad
grande, podrían usar un mapa de la ciudad para
dividir el territorio en manzanas y luego escoger un
cierto número de éstas (racimos) para entrevistar a
sus habitantes..
Muestreo de racimo
Cada casa perteneciente a cada una de estas
manzanas sería considerada para entrevistar a sus
habitantes. Un procedimiento de muestreo de
racimo bien diseñado puede producir una muestra
más precisa a un costo considerablemente menor
que el de un muestreo aleatorio simple.
Introducción a las distribuciones de muestreo
El capítulo 3 introdujo algunos métodos para
utilizar datos de muestras, con el fin de calcular
estadísticas como la media y la desviación
estándar. Hasta lo que va de este capítulo, hemos
examinado cómo tomar muestras de una
población. Si aplicáramos lo que hemos aprendido
y tomáramos varias muestras de una población,
las estadísticas resultantes para cada muestra no
necesariamente serían iguales, y lo más probable
es que variaran de una muestra a otra.
Introducción a las distribuciones de muestreo
Suponga que cada una de las muestras tomadas
consta de 10 mujeres de 25 años de edad
residentes en una ciudad de 100,000 habitantes. Al
calcular la estatura media y la desviación estándar
correspondiente en cada una de estas muestras,
veríamos rápidamente que la media y la desviación
estándar de cada muestra serían diferentes. Una
distribución de probabilidad de todas las
medias posibles de las muestras es una
distribución de las medias de las muestras. Los
especialistas en estadística la conocen como
distribución de muestreo de la media.
Concepto de error estándar
En vez de decir “la desviación estándar de la
distribución de las medias de la muestra” para
describir una distribución de medias de la muestra,
los especialistas en estadística se refieren al error
estándar de la media. De manera similar, la
“desviación estándar de la distribución de las
proporciones de la muestra” se abrevia como error
estándar de la proporción. EL término error
estándar se utiliza porque da a entender un
significado específico.
Concepto de error estándar
La desviación estándar de la distribución de las
medias de las muestras mide el grado hasta el cual
es de esperar que varíen las medias de las
diferentes muestras, debido a este error cometido
en el proceso
de muestreo. Por tanto, la desviación estándar de
la distribución de una estadística de muestra
se conoce como error estándar de la estadística.
Muestreo de poblaciones normales
Muestreo de poblaciones normales
Un ejemplo ilustrará más ampliamente estas propiedades.
Una institución bancaria calcula que sus cuentas de ahorros
individuales están normalmente distribuidas con una media
de $2,000 y una desviación estándar de $600. Si el banco
toma una muestra aleatoria de 100 cuentas,
¿cuál es la probabilidad de que la media de muestra caiga
entre $1,900 y $2,050?
Ésta es una pregunta con respecto a la distribución de
muestreo de la media; por tanto, es necesario calcular
primero el error estándar de la media. En este caso,
utilizaremos la ecuación para el error estándar de la media
pensada para situaciones en las que la población es infinita.
Muestreo de poblaciones normales
Muestreo de poblaciones normales
El teorema del límite central
Esta relación entre la forma de la distribución de la
población y la forma de la distribución de muestreo se
denomina teorema del límite central. El teorema del límite
central es, tal vez, el más importante de toda la inferencia
estadística, pues asegura que la distribución de
muestreo de la media se aproxima a la normal al
incrementarse el tamaño de la muestra. Hay
situaciones teóricas en las que el teorema del límite
central no se cumple, pero casi nunca se encuentran en
la toma de decisiones práctica. De hecho, una muestra
no tiene que ser muy grande para que la distribución de
muestreo de la media se acerque a la normal.
El teorema del límite central
Los especialistas en estadística utilizan la distribución
normal como una aproximación a la distribución de muestreo
siempre que el tamaño de la muestra sea de al menos 30,
pero la distribución de muestreo de la media puede ser casi
normal con muestras de incluso la mitad de ese tamaño. La
importancia del teorema del límite central es que nos
permite usar estadísticas de muestra para hacer
inferencias con respecto a los parámetros de población,
sin saber sobre la forma de la distribución de frecuencia
de esa población más que lo que podamos obtener de la
muestra.
El teorema del límite central
Ilustremos el uso del teorema del límite central. La
distribución de los ingresos anuales de todos los cajeros
de un banco con cinco años de experiencia está sesgada
de manera negativa, como la gráfica (a) de la figura 6-8 lo
muestra. Esta distribución tiene una media de $19,000 y
una desviación estándar de $2,000. Si extraemos una
muestra aleatoria de 30 cajeros, ¿cuál es la probabilidad
de que sus ganancias promedien más de $19,750
anualmente? La gráfica (b) de la figura 6-8 ilustra la
distribución de muestreo de la media que resultaría, y
hemos sombreado el área que representa los “ingresos
por encima de $19,750”.
El teorema del límite central
Nuestra primera tarea es calcular el error estándar de la media de la
desviación estándar de la población, de la siguiente manera:
POR SU ATENCION