GEOGRAFIA
GEOGRAFIA
GEOGRAFIA
DISTRIBUCIONES
MUESTRALES
Antes de seguir adelante es
conveniente de que Usted tenga
en claro lo que ya vio.-
Si hacemos una recapitulación
de lo que hemos visto hasta
ahora podemos observar tres
temas bien diferentes.-
El primero es la Estadística
Descriptiva y en ella se aprende
una serie de técnicas para
organizar, presentar, analizar e
interpretar un conjunto finito de
observaciones, que según el
objetivo del estudio pueden
constituir una población o una
muestra.-
El segundo tema fue el cálculo
de probabilidades y en esta parte
se define la probabilidad como
una medida de la posibilidad de
ocurrencia de un experimento
aleatorio, extendiendo la noción
de frecuencia relativa a las
poblaciones finitas.-
Luego el tercer tema fue las distribuciones de
probabilidad y a través de ellas se presentan
modelos matemáticos teóricos del
comportamiento (en términos probabilísticos)
de las poblaciones.- Cada distribución surge
como consecuencia de hipótesis establecidas
sobre el comportamiento del fenómeno aleatorio
analizado.- Estas hipótesis son las que permiten
identificar una población con las
correspondientes distribuciones y a su vez cada
distribución depende de parámetros
matemáticos cuyo valor hemos supuesto
conocido.
A partir de este momento vamos a estudiar
métodos que nos permita obtener los valores de
los parámetros poblacionales basándonos en los
resultados de la muestra, y se podrá ver la
integración de los tres grandes temas antes
mencionados.-
En primer lugar, a
menudo es muy difícil En segundo lugar como
obtener y medir a todos veremos en esta Unidad,
los elementos de una pueden utilizarse muestras
población, e incluso bien seleccionadas para
cuando es posible, el realizar estimaciones medidas
costo es muy alto de las característica de la
cuando la población es población que son muy
grande.- cercanas a los valores reales.-
Media
Variancia
Forma funcional
(grafica)
DISTRIBUCION
DISTRIBUCION DE
DE
LA
LA MEDIA
MEDIA DE
DE LA
LA
MUESTRA
MUESTRA
A CONTINUACIÓN VEAMOS UN EJEMPLO DE
CÓMO ELABORAR ESTA DISTRIBUCION
SIGUIENDO LOS PASOS ANTES MENCIONADOS:
1
x
6 8 10 12 14 6 7 8 9 10 11 12 13 14
DISTRIBUCION MUESTRAL DE X: forma funcional
Σ x
μ = = 250 = 10
x 25 25
Σ ( x - μ )²
x
σ² = = 100/25 = 4
x 25
Dada
Dadaunaunapoblación
población dede cualquier
cualquier
forma
formafuncional
funcionalno
nonormal
normal concon unauna
media
media μμyyvariancia
varianciafinita
finitaσ²,
σ²,la
la
distribución
distribuciónmuestral
muestralde dela media x,
lamedia x,
será
serácasi
casinormal
normal con media μμxx yy
con media
variancia
varianciaσ²/n
σ²/n cuando
cuandola la muestra
muestra es es
muy
muygrande.-
grande.-
Observamos que el Teorema Central del Limite permite
tomar muestras a partir de la poblaciones con distribución
no normal y garantizar que se obtengan
aproximadamente los mismos resultados que si la
población tuviera una distribución normal, siempre que se
tome una muestra grande.-
La importancia de esto se demostrara más adelante al
estudiar que una distribución muestral con distribución
normal es una herramienta importante en la inferencia
estadística.-
n ≥ 30 normalidad
N! 5!
CN =
n = = 10
n! (N-n)! 2! 3!
Σ x 7 + 8 + 9 + 10 + 9 + 10 + 11 + 11 + 12 +13
μ x =
= = 10
10 10
Nuevamente se aprecia que la media de la distribución
muestral es igual a la media de la población.-
Cuando
Cuando el el muestreo
muestreo es es sinsin
reemplazo
reemplazo aa partir partir dede unauna
población
población finita,
finita, lala distribución
distribución
muestral de xx tendrá
muestral de tendrá una
una media
media μμ
yyuna
unavariancia;
variancia; σ²
N-n
n N-1
Si el tamaño de la muestra es muy grande, el teorema
central del límite es aplicable y la distribución muestral de
la media será aproximadamente normal.-
x
Z
x
SOLUCION
a) P(145 ≤ x ≤ 150).-
145 150 X
b) P( x 145)
x 145 150
Z 1.97
Calculamos
x 15 / 35
145 150 X
Así, con el mismo criterio se
seguirán calculando el resto de los
incisos, quedando ellos para
ejercitación del alumno.-
X
51300 51800 52300
4000
x n
30
730,30 μ X = 51800 dól.-
El director de personal pregunta sobre la probabilidad de
que la media de la muestra sea entre 51300 y 52300
dólares.- Si el valor de la media de la muestra de X esta
en ese intervalo, se aproximará a 500 dólares de la media
poblacional.- La probabilidad correspondiente es el área
de la distribución muestral que vimos en la figura
anterior.-
Como la distribución muestral es normal, con promedio
de 51800 y desviación estándar 730,30, podemos usar la
tabla de la distribución de probabilidad normal
estandarizada, para calcular el área.-
Tendremos;
x 51300 51800
Z 0,68
x
730,30
E ( p) = P
p(1 p)
p
n
para poblaciones infinitas. -
nP 5 y n (1- P) 5
Esto es, si la población es
infinita y n/N ≤ 0,05 usamos el
error estándar de la proporción
sin el factor de corrección, sin
embargo, si la población es finita
y la relación es n/N 0,05, se
debe usar el factor de
corrección.-
Sabemos que la aproximación
normal puede mejorar con la
corrección por continuidad, un
mecanismo que hace un ajuste en el
caso de que una distribución
continua se aproxime a una
distribución discreta.- En el caso de
estudio de proporción de una
población, estas son muy grandes y
la corrección no aporta diferencia y
por lo tanto la podemos obviar.-
Veamos un ejemplo, con valores irreales solo para
entender los conceptos elementales vistos.- Recuerde que
esto en la práctica profesional no se puede hacer.-
S1N2 1 0.50
S1N3 1 0.50
S1S4 2 1.00
N2N3 0 0.00
N2 S3 1 0.50
N2 S4 1 0.50
p 3
μ p = E( p) = ------------- = ------ = 0.50 = P
K 6
P ( 1- P)
p
n
Observo si n / N 0.05 es este caso no necesito el
factor de corrección para poblaciones finitas, en
cambio si n / N 0.05 si lo debo usar al calcular el error
estándar de la proporción muestral.-
p - P
Z = -----------------
p
VALOR
VALOR PRÁCTICO
PRÁCTICO DE
DE
LA
LA DISTRIBUCION
DISTRIBUCION
MUESTRAL
MUESTRAL DE
DE LA
LA
PROPORCIÓN
PROPORCIÓN
MUESTRAL.-
MUESTRAL.-
Siempre que se selecciona una muestra aleatoria
simple y que el valor de la proporción de la
muestra p se usa para estimar el valor de la
proporción poblacional P, podemos predecir que
hay cierto error de muestreo.- En este caso, el
error de muestreo es el valor absoluto de la
diferencia entre el valor de la proporción
muestral p y la proporción poblacional P.-
0.55 0.60
Zi 0.56
0.0894
P( 0.55 p 0.65) = 0.7123 - 0.2877
= 0,4246
p P 0. 08 0. 05
Z 1,54
p
0. 0195
P( p 0.08) = 1 - F(1,54) =
= 1 - 0.9382 = 0.0618
σ p = 0,1 0,9
= 0,021
200
No Probabilísticas Probabilísticas
Sistemática
Muestra por cuota
Estratificada
Por grupo naturales
Por
conglomerados
MUESTRA ALEATORIA SIMPLE.-
Una muestra aleatoria simple, es aquella en la cual cada
individuo o elemento de una población tiene la misma
oportunidad de ser elegido.- Además, cada muestra de
un tamaño fijo tiene la misma probabilidad de ser
elegida, que cualquier otra muestra del mismo tamaño.-
El muestreo aleatorio simple, es la técnica de muestreo
aleatorio más elemental y constituye la base para otras
técnicas.-
En el muestreo aleatorio simple, se usa n para
representar el tamaño de la muestra y N para representar
el tamaño de la población.- Cada persona o elemento en
el marco se enumera de 1 a N.-
La probabilidad de seleccionar a cualquier miembro en
particular de la población la primera vez es igual a 1/N.-
Existen dos métodos básicos para seleccionar muestras:
Con
C on
empl
reem
re azoo
plaz
Sin
Sin
reemplazo
reemplazo
El muestreo con reemplazo, implica que una vez
seleccionada una persona o elemento, se regresa al
marco donde tiene la misma probabilidad de ser elegida
de nuevo.- Imagine que tiene una urna con 500 tarjetas de
presentación.- Suponga que en el primer sorteo sale la
ficha de Juan Llanos.- La información pertinente se
registra y se regresa la tarjeta a la urna.- Después se
mezclan bien las tarjetas y se saca una segunda tarjeta,.
En esta segunda extracción Juan Llanos, tiene la misma
probabilidad de salir 1/N, de ser elegida de nuevo.- Se
repite el procedimiento hasta alcanzar el tamaño muestra
n deseado.- Sin embargo, suele considerarse más
adecuado tener una muestra de personas o elementos
diferentes en lugar de permitir la repetición de
mediciones de la misma persona o elemento.-
En el muestreo sin reemplazo, no se regresa la
persona o elemento al marco una vez seleccionado y por
lo tanto, no puede elegirse otra vez.- Como antes, en el
muestreo sin reemplazo la probabilidad de que algún
miembro específico de la población, por ejemplo Juan
Llanos, sea elegido en el primer intento es 1/N.- La
probabilidad de que, cualquier individuo no
seleccionado, salga elegido en el segundo intento será 1 /
N-1.- Este proceso continua hasta alcanzar el tamaño de
muestra n deseado.-
ERRORES
ERRORES EN
EN LAS
LAS ENCUESTAS
ENCUESTAS
Aún
Aúncuando
cuandoen enlas
lasencuestas
encuestasse seutilicen
utilicen
métodos
métodosde demuestreo
muestreoprobabilístico
probabilísticoestán
están
sujetos
sujetosaaerrores
errorespotenciales.-
potenciales.-
Hay
Haycuatro
cuatrotipos
tiposdedeerrores
erroresde
deencuestas.-
encuestas.-
Con
Conlaslasencuestas
encuestascorrecta
correctase
sediseñan
diseñan
modelos
modelosparaparareducir
reduciroodisminuir
disminuirlos
los
diferentes
diferenteserrores
erroresdedelas
lasencuestas,
encuestas,loslos
cuales
cualessuelen
suelentener
tenerun
uncosto
costoconsiderable
considerable
Los errores de las encuestan son:
ERRORES DE COBERTURA.-
La clave para una selección apropiada en la muestra es un marco de
población adecuado o una lista actualizada, de todos los sujetos
que participarán en el muestreo.- El error de cobertura ocurre si se
excluyen ciertos grupos de sujetos de las lista de población, de
manera que no tienen oportunidad de ser seleccionado en la
muestra.- El error de cobertura conduce a un sesgo de selección.-
Si el listado es inadecuado porque no se incluyeron algunos
grupos o sujetos de la población, cualquier muestra probabilística
aleatoria proporcionará una estimación de las características del
marco, no de la población real.-
ERRORES DE NO RESPUESTA.-
No todas las personas están dispuestas a contestar una encuesta.-
De hecho, la investigación indica que los individuos de las clases
económicas alta y bajas tienden a responder con menos frecuencia
que los individuos de clase media.- El error de no respuesta surge
del fracaso al recopilar datos de todos los sujetos de la muestra y
el resultado es un error de no respuesta.- Como el general, no se
puede suponer que las personas que no responden son semejantes
a aquellas que si responden, es en extremo importante dar
seguimiento a las no respuestas después de un período específico.-
Deberán varios intentos, ya sea por correo, teléfono o con
encuestador, para convencerlos y que cambien de opinión.- Con
base a estos resultados, las estimaciones obtenidas con las
respuestas iniciales se combinan con las estimaciones obtenidas
con el seguimiento, de manera que la inferencias hechas a partir de
la encuesta sean válidas.- El modo de respuesta afecta la tasa de
respuesta.- La entrevista personal y por teléfono casi siempre
producen una respuesta más alta que la encuesta por correo, pero a
un costo más elevado.-
ERRORES DE MUESTREO.-
Existen tres razones principales para extraer una
muestra en lugar de hacer un censo completo: es más
rápido, menos costo y más eficientes.- Sin embargo, en
el marco de la población el azar determina quién estará
o quién no estará incluido.- El error de muestreo refleja
la heterogeneidad o las diferencias aleatorias, de una
muestra a otra según la probabilidad de que individuos
o elementos específicos sean seleccionados en una
muestra determinadas.- Como se observa los resultados
de sondeo que se publican en revistas y diarios, se
hacen referencia a un margen de error por ejemplo de ±
4 porciento del valor real.- Este margen de error es el
error de muestreo.- Este error se puede reducir con
tamaños de muestras más grande, aunque esto
incrementa el costo de la encuesta.-
EL ERROR DE MEDICIÓN.-
Cuando se quiere realizar una buena investigación por
medio de encuestas, se diseña un cuestionario que
permita reunir información importante.- Los datos
obtenidos deben ser válidos; es decir, las respuestas
correctas deben ser evaluadas y plantearse de manera
que arrojen medidas significativas.-
Pero existe un dilema, es más fácil decir que se obtienen
mediciones significativas que el simple hecho de
obtenerlas.- Por desgracia, las realizaciones de
mediciones está gobernada por lo que es conveniente,
no por lo que se necesita.- Con bastante frecuencia, las
mediciones que se obtienen son solamente más
aproximadas de las mediciones que se desean en
realidad.-
El error de medición se refiere a la falta de precisión
en las respuestas registradas, debido a fallas en la
redacción del enunciado de las preguntas, la influencia
del entrevistador en la persona que responde o por el
esfuerzo que realiza la persona que responde.- Se le
ha dado mucha atención al error de medición que
ocurre por fallas de redacción en el enunciado de las
preguntas.-
Una pregunta debe ser clara, no ambigua.- Debe
presentarse en forma objetiva y neutral, se debe evitar
la pregunta guiada.-
Existe tres fuentes de errores en la medición:
redacción ambigua de la pregunta, efecto halo, y
errores de la persona que contesta.-
El efecto halo se presenta cuando la
persona que responde se siente obligada
a complacer al entrevistador.- Este tipo de
error puede minimizarse con la
capacitación adecuada en la realización
de entrevistas.-
El error que proviene de la persona que
responde se produce cuando ésta realiza
un esfuerzo demasiado grande o
demasiado pequeño.- Existen dos formas
para minimizar esta clase de error: 1)
mediante una revisión cuidadosa de los
datos y un nuevo o visita a aquellos
individuos cuyas respuesta parecen raras
y 2) al establecer un programa de
llamadas aleatorias para verificar la
confiabilidad de las respuestas.-
EJERCICIOS
PARA HACER EN
CLASE
Ejercicio 1.- Para estimar la edad media de una
población de 4000 empleados, se selecciona
una muestra aleatoria simple de 40 empleados.-
a) ¿Usaría usted el factor de corrección por
población finita para calcular el error estándar
de la media? Explique por qué.-
b)Si la desviación estándar de la población es σ =
8,2 años, calcule el error estándar, aplicando y
sin aplicar el factor de corrección por población
finita.- ¿Cuál es el criterio para no tomar en
cuenta ese factor siempre que n/N ≤ 0,05?.-
Ejercicio 2.- Se informa en la revista Mercado que entre
sus suscriptores, los que planean comprar un
automóvil nuevo durante los próximos 12 meses
pretenden gastar un promedio de 27100$.- Suponga
que el precio del nuevo vehículo, para la población de
suscriptores de Mercado tiene una media de μ =
27100$ y que su desviación estándar es de σ = 5200$.-
a) ¿Cuál es la probabilidad de que el precio de la media
de la muestra del nuevo vehículo quede a 1000$ o
menos de la media de la población, si la muestra es de
30 suscriptores?.-
b) ¿Cuál es la probabilidad de que el precio de la media
de la muestra del nuevo vehículo quede a 1000$ o
menos de la media de la población, si la muestra es de
50 suscriptores?.-
c) ¿Cuál es la probabilidad de que el precio de la media
de la muestra del nuevo vehículo quede a 1000$ o
menos de la media de la población, si la muestra es
de 100 suscriptores?.-
Solución
Ejercicio 3.- La compañía de baterías B afirma que sus baterías tienen
una vida media de 60 meses y una desviación estándar de 9
meses.- Un grupo de consumidores que está poniendo a prueba
esta afirmación compra 36 baterías y determina la vida media.-
a) Calcule el error estándar de la media.-
b) Suponiendo que lo que afirma B es cierto.- ¿Cuál es la
probabilidad de que la vida media de la muestra sea menor que
58?.-
c) Determine la probabilidad de que la vida media de la muestra esté
entre 57 y 63.-
d) Suponga que la vida media de la población real de las baterías de
B es de 55 meses.- Averigüe la probabilidad de que la vida media
de la muestra sea por lo menos 60.-
e) Si la media muestral del grupo de consumidores es de 55.- ¿A que
conclusiones llegaría usted si fuera el analista?.-
Solución
Ejercicio 4.- Una población se compone de las siguientes unidades
producidas hoy por cuatro trabajadores:
Trabajadores A B C D
Unidades producidas 5 3 7 8
a) Calcule la media y la desviación estándar de la población.-
b) Elabore una tabla que presente todas las muestras posibles de
dos elementos (muestreo con reemplazo).-
c) Calcule la media de cada una de las muestras de tamaño dos.-
d) Calcule la media de esta distribución muestral.- ¿Es igual esta
media a la media de la población?.-
e) Calcule el error estándar de esta distribución muestral .-
f) Calcule la desviación estándar de la distribución muestral de las
medias.- ¿Es esta desviación estándar igual al error estándar de la
media?.-
g) ¿Qué distribución tiene menor variabilidad, la distribución
poblacional o la distribución muestral de las medias de la
muestras?.-
Ejercicio 5.- La AFIP está considerando una campaña
publicitaria en el programa de televisión Noche de Goles,
que se transmite los días martes.- El martes pasado este
programa tuvo un porcentaje de participación en el rating
global de 25.- Lucia Gómez, la directora de relaciones
públicas de la AFIP sospecha que el porcentaje real es
menor que el 25%.- Contrata a una agencia de
investigación independiente para tomar una muestra
aleatoria de 750 televidentes que estén viendo la
televisión el martes pasado.- La agencia encuentra que
175 estaban viendo Noche de Goles.- ¿Presenta estos
datos suficiente evidencia para contradecir los rating
dados por la empresa que los mide?.-
Solución
Ejercicio 6.- Los registros de inversiones muestran que
la tasa promedio de rendimiento para las firmas que
están en la industria de consumo es del 30 %, con una
desviación estándar del 12%.- Si se selecciona una
muestra de 250 de tales firmas.- ¿Cuál es la probabilidad
de que la media de estas firmas exceda el 31%?.-
Solución
Ejercicio 7.- Solo el 22% de todos las firmas en la
industria de bienes de consumo comercializa sus
productos directamente con el consumidor final.- Si una
muestra de 250 firmas revela una proporción de más del
20% que se compromete en el mercadeo directo, usted
planea hacer su siguiente compra a las firmas de esta
industria.- ¿Qué tan probable es que usted gaste su
dinero bien ganado en otras parte?.-
Solución
8.- La Asociación de consumidores de productos
manufacturados, informa que el 76 % de los
consumidores leen los ingredientes que aparecen en la
etiqueta de los productos que ofrecen.-
Suponga que la proporción de población es P = 0,76 y que
de la población se selecciona una muestra de 400
consumidores.-
a) Describa la distribución de la proporción muestral p.,
que es la proporción en la muestra de consumidores
que leen la lista de ingredientes.-
a) Más de 9,00$.-
b) Entre 8,15 y 8,40$.-
12.- Un investigador informa que los resultados de una
encuesta diciendo que el error estándar de la media es
igual a 20.- La desviación estándar de la población es
de 500.-
Solución
Solución
Resp: 0.0029
14.- Cuando un proceso de producción funciona
correctamente, el número de unidades producidas por
hora sigue una distribución normal que tiene una
media de 92,0 y una desviación estándar de 3,6.- Se ha
tomado una muestra aleatoria de cuatro horas
distintas.-
Solución
15.- La duración de las lámparas de un fabricante tiene
una media de 1200 horas y una desviación estándar de
400 horas.- La población sigue una distribución
normal.- Suponga que compra nueve lámparas que
puede considerarse que son una muestra aleatoria de
la producción del fabricante.-
a) ¿Cuál es la media de la media muestral de la
duración?.-
b) ¿Cuál es la variancia de la media muestral?.-
c) ¿Cuál es el error estándar de la media muestral?.-
d) ¿Cuál es la probabilidad de que esas nueve lámparas
tengan en promedio una duración de menos de 1050
horas?.-
Solución
16.- El precio medio de ventas de las viviendas nuevas
fue en una ciudad de 115000 $ durante un año.- La
desviación estándar poblacional fue de 25000$.- Se
extrajo una muestra aleatoria de 100 viviendas nuevas
de esta ciudad.-
a) ¿Cuál es la probabilidad de que la media muestral de
los precios de venta fuera de más de 110000$?.-
b) ¿Cuál es la probabilidad de que la media muestral de
los precios de venta estuvieran comprendida entre
113000 y 117000$?.-
c) ¿Cuál es la probabilidad de que la media muestral de
los precios de venta estuvieran comprendida entre
114000 y 116000$?.-
d) Suponga que una vez realizados estos cálculos un
amigo le dijera que es casi seguro que la distribución
de los precios de venta de las viviendas nuevas de
esta ciudad no sea normal.- ¿Qué respondería?.-
17.- Se ha tomado una muestra aleatoria de 16 directores
de empresas de una gran ciudad para estimar el
tiempo medio que tardan diariamente en desplazarse
al trabajo.- Suponga que el tiempo poblacional sigue
una distribución normal que tiene una media de 87
minutos y una desviación estándar de 22 minutos.-
a) ¿Cuál es el error estándar de la media muestral de los
tiempos de desplazamiento?.-
b) ¿Cuál es la probabilidad de que la media muestral sea
de menos de 100 minutos?.-
c) ¿Cuál es la probabilidad de que la media muestral sea
de más de 80 minutos?.-
d) ¿Cuál es la probabilidad de que media muestral esté
fuera del intervalo 85; 95 minutos?.-
Solución
18.- En un curso de Economía hay 250 estudiantes.- Se
pide a cada miembro de una muestra aleatoria de 50
de estos estudiantes que estime la cantidad de tiempo
que ha dedicado a hacer los ejercicios que puso el
profesor la semana pasada.-
Suponga que la desviación estándar poblacional es de
30 minutos.-
a) ¿Cuál es la probabilidad de que la media muestral sea
más de 2,5 minutos superior a la media poblacional?.-
b) ¿Cuál es la probabilidad de que la media muestral sea
más de 5 minutos inferior a la media poblacional?.-
c) ¿Cuál es la probabilidad de que la media muestral
difiera en más de 10 minutos de la media
poblacional?.-
Solución
Resp: 0.9146
20.- Se ha estimado que el 43 por ciento de los
Licenciados en Administración de Empresas cree que la
asignatura de ética empresarial es muy importante para
impartir valores éticos a los estudiantes.- Halle la
probabilidad de que más de la mitad de una muestra
aleatoria de 80 licenciados crea eso.-
Resp: 0.1020
Solución