Estadistica Experimental Parte 1 - Maestria UNP

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 94

MSc.

Gerson La Rosa Lama

ESTADÍSTICA DESCRIPTIVA E INFERENCIA ESTADÍSTICA


• Conceptos básicos
1

• Descripción de datos mediante tablas y gráficos


2

• Medidas características de un conjunto de datos


3

• Inferencia sobre la media y varianza.


4

• Tamaño de muestra y técnicas de muestreo


5

MSc. Ing. Gerson La Rosa Lama


1
Conceptos básicos

M odelos
E s t a d í s ti cos

Obtención y análisis
Observaciones de datos

Herramientas
I nform áticas

LA ESTADÍSTICA es una herramienta de aprendizaje a partir de


la observación, pues nos ayuda a extraer conclusiones
generalizables a partir de un conjunto de datos observados.
MSc. Ing. Gerson La Rosa Lama
Conceptos básicos
1

Ejemplo: fabricante de un componente electrónico desea saber si el procedimiento de


fabricación A es más recomendable que el procedimiento B.
FABRICA PRESUPUESTO
TIEMPO Apartir de los datos INDUCIMOS oINFERIMOS
A
Aprendizaje
Datos Análisis
sobre el
observados estadístico
fenómeno

N°A=50 A=10% defectuosos


B N°B=50 B=9.2% defectuosos
¿Qué método deberíamos implantar para producir a gran escala?.
¿qué garantías ofrecen esos datos de que la ventaja se mantendrá en el
futuro?

¡Todo el mundo en una empresa debe aprender estadística!


W. Hunter (1986)
MSc. Ing. Gerson La Rosa Lama
1
Conceptos básicos

DE UN MUESTREO INDUCIMOS QUE EL


PROCEDIMIENTO "A" ES MEJOR QUE EL "B"
INDUCCION
PARTICULAR GENERAL
DEDUCCION
DE LA LEY DE GRAVEDAD, DEDUCIMOS QUE UNA
FRUTA CAERA SI SE DESPRENDE DE UN ARBOL

LOS FENOMENOS REALES SON COMPLEJOS, SIENDO NORMAL ENCONTRAR DIFERENCIAS


ENTRE LO QUE SE OBSERVA Y LO QUE PREDICE UN MODELO TEORICO.

NOS PODEMOS ENCONTRAR CON DOS SITUACIONES:


MODELO
1) MODELO TEORICO 2) NO EXISTE MODELO EMPIRICO
(Deducción) TEORICO (Inducción)

INCERTIDUMBRE EN EL RESULTADO

MSc. Ing. Gerson La Rosa Lama


1
Conceptos básicos

METODO CIENTIFICO: consiste en la aplicación de forma iterativa de un


proceso de inducción-deducción.

A) PLANTEAMIENTO INICIAL (HIPOTESIS O TEORIA) / DEDUCCIÓN


B) OBSERVACIÓN
C) REFORMULACIÓN DEL MODELO / INDUCCION

ERROR EXPERIMENTAL O RESIDUO: es la discrepancia entre el valor


observado y el valor predicho a partir de un modelo.

MSc. Ing. Gerson La Rosa Lama


1
Conceptos básicos

EJERCICIO: Indica cuáles de los siguientes razonamientos son


inductivos y cuáles deductivos
a) Después de lanzar varias veces un dado, la conclusión de un
jugador es que el dado está trucado INDUCCION

b) Si han confirmado un nuevo fenómeno del Niño, la conclusión es


que debemos esperar lluvias en nuestra ciudad. DEDUCCION

c) Este procesador es i7 de última generación, la conclusión será que


la mayoría de softwares correrán bien. DEDUCCION

e) Tras un experimento para decidir el material a utilizar para un


sistema de sujección se anota la tensión de rotura de 20
componentes del material A y otros 20 del material B. Tras ver los
datos se concluye que se usará el material A pues parece que
será más resistente que el B. INDUCCION

. MSc. Ing. Gerson La Rosa Lama


1
Conceptos básicos

DATO: es el valor observado de una variable en una medición.

VARIABLE: Característica observada en el individuo.

a) Cuantitativos

a.1) Continuos: pueden tomar cualquier valor dentro de un


intervalo. Ejemplo: toneladas de uvas procesadas.

a.2) Discretos: sólo pueden tomar valores enteros dentro de un


intervalo. Ejemplo: número de cajas de uvas procesadas.

MSc. Ing. Gerson La Rosa Lama


1
Conceptos básicos

DATO: es el valor observado de una variable en una medición.

VARIABLE: Característica observada en el individuo.

b) Cualitativos: se refieren a cualidades o modalidades que no pueden


expresarse numéricamente.

1) Ordinal: estas cualidades siguen un orden o secuencia. Ejemplo:


Tamaños de uvas: M, L, XL, Jumbo.

2) Nominal: estas cualidades no siguen ningún orden. Ejemplo:


Variedades de uva: red globe, superior, flame, …

MSc. Ing. Gerson La Rosa Lama


1
Conceptos básicos

EJERCICIO: Indica el tipo de variable

- Estatura de alumnos (metros) Cuantitativa continua

- Estados fenológicos de un cultivo Cualitativa ordinal


(floración, crecimiento, envero, …)

Cuantitativa continua
- Pesos de las jabas de mango

- Número de embarcaciones pesqueras. Cuantitativa discreta

- Tipos de presentación de un producto Cualitativa nominal

MSc. Ing. Gerson La Rosa Lama


• Conceptos básicos
1

• Descripción de datos mediante tablas y gráficos


2

• Medidas características de un conjunto de datos


3

• Inferencia sobre la media y varianza.


4

• Tamaño de muestra y técnicas de muestreo


5

MSc. Ing. Gerson La Rosa Lama


• Descripción de datos mediante tablas y gráficos
2

Frecuencias: número de observaciones por cada categoría o clase.

Ejemplo: número de cilindros de 155 vehículos (fichero autos)

TABLA UNIVARIANTE

Frecuencia (absoluta): número de


datos en cada clase (valor)

Frecuencia relativa: proporción 138 autos tiene 6 cilindros o menos,


(0-1) de los datos que hay en lo que supone el 89% de los datos
cada clase (valor)
MSc. Ing. Gerson La Rosa Lama
• Descripción de datos mediante tablas y gráficos
2

Frecuencias: número de observaciones por cada categoría o clase.

Ejemplo: número de cilindros de 155 vehículos (fichero autos)

DIAGRAMA DE BARRAS

MSc. Ing. Gerson La Rosa Lama


• Descripción de datos mediante tablas y gráficos
2

Frecuencias: número de observaciones por cada categoría o clase.

Ejemplo: número de cilindros de 155 vehículos (fichero autos)

DIAGRAMA DE SECTORES

MSc. Ing. Gerson La Rosa Lama


• Descripción de datos mediante tablas y gráficos
2

Frecuencias: número de observaciones por cada categoría o clase.

Ejemplo: número de cilindros y de año de fabricación de 155 vehículos (fichero


autos)
Frecuencia de vehículos de 4
TABLA CRUZADA cilindros del año 80

MSc. Ing. Gerson La Rosa Lama


• Descripción de datos mediante tablas y gráficos
2

Frecuencias: número de observaciones por cada categoría o clase.

Ejemplo: número de cilindros y de año de fabricación de 155 vehículos (fichero


autos)

GRAFICO MOSAICO

Frecuencia de vehículos de 4
cilindros del año 80

MSc. Ing. Gerson La Rosa Lama


• Descripción de datos mediante tablas y gráficos
2

Frecuencias: número de observaciones por cada categoría o clase.

Ejemplo: datos de pasajeros, variables: edad y sexo, tipo de pasajeros,


condiciòn

GRAFICO MOSAICO

MSc. Ing. Gerson La Rosa Lama


• Descripción de datos mediante tablas y gráficos
2

Frecuencias: número de observaciones por cada categoría o clase.

Para datos cuantitativos se utiliza histogramas

Se construyen clases y se representan en tablas o barras.

¿Número de clases? Lo decide el analista. Hay varios criterios. El más


habitual es usar un número en torno a 𝑛

HISTOGRAMAS

MSc. Ing. Gerson La Rosa Lama


• Descripción de datos mediante tablas y gráficos
2

HISTOGRAMA.

MSc. Ing. Gerson La Rosa Lama


• Descripción de datos mediante tablas y gráficos
2

Frecuencias: número de observaciones por cada categoría o clase.

Para datos cuantitativos se utiliza histogramas

Se construyen clases y se representan en tablas o barras.

¿Número de clases? Lo decide el analista. Hay varios criterios. El más


habitual es usar un número en torno a 𝑛
HISTOGRAMAS
MSc. Ing. Gerson La Rosa Lama
• Descripción de datos mediante tablas y gráficos
2

Datos continuos:

GRÁFICO DE SERIE DE TIEMPO


Se utiliza para buscar patrones de los datos en el tiempo, tales como tendencias o patrones
de estación.
La línea continua para la
Compañía A muestra un lento
incremento en el período de dos
años. La línea discontinua para
la Compañía B también muestra
un incremento general durante
los dos años, pero fluctúa más
que el de la Compañía A. La
Compañía B comienza más
abajo que la Compañía A, pero la
Compañía B supera a la
Compañía A para el mes de abril
• Descripción de datos mediante tablas y gráficos
2

Datos continuos:

GRÁFICO DE DISPERSIÓN
Es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para
mostrar los valores de dos variables para un conjunto de datos. Se utiliza para
investigar la relación entre un par de variables continuas.

De la investigación médica
se observa que existe una
relación positiva entre el
Índice de masa corporal
(IMC) y el porcentaje de
grasa corporal en las
adolescentes.
• Descripción de datos mediante tablas y gráficos
2

Datos continuos:

GRÁFICO DE DISPERSIÓN
Se puede utilizar una tercera variable a través del ares de los puntos
representados. A este gráfico se llama gráfico de burbujas.

De la investigación
bancaria se examina las
relaciones entre los
ingresos, los ahorros y las
deudas de un grupo de
solicitantes de préstamos
• Conceptos básicos
1

• Descripción de datos mediante tablas y gráficos


2

• Medidas características de un conjunto de datos


3

• Inferencia sobre la media y varianza.


4

• Tamaño de muestra y técnicas de muestreo


5
• Medidas características de un conjunto de datos
3

Buscan resumir las características más importantes de los


datos en un conjunto reducido de números.

Cada característica un número

Medidas de centralización

¿Cuál es el centro de los datos?

Hay muchas medidas alternativas.


Las más importantes son

Media aritmética
Mediana
centro de la
distribución de datos
• Medidas características de un conjunto de datos
3
Medidas de centralización

MEDIA ARITMETICA, o promedio aritmético es el centro de gravedad de los datos.

Media

Ejemplo: 𝑥 = {1,2,3,3,5,5,5,6,6}

σ𝑛𝑖 = 1 𝑥
𝑥 = 1+2+3+3+5+5+5+6+6 =4 𝑥=
9MSc. Ing. Gerson La Rosa Lama 𝑛
Medidas características de un conjunto de datos
3
Medidas de centralización

MEDIA ARITMETICA
Cuanto más asimétrica sea más se desplaza la media hacia la cola.

Media Media

Es sensible a valores atípicos


Un solo dato puede desplazar la
media hasta hacerla poco
representativa del centro de los
datos

MSc. Ing. Gerson La Rosa Lama


Media
• Medidas características de un conjunto de datos
3
Medidas de centralización

MEDIANA
Es el valor que deja a cada lado el 50% de los datos.

1 2 5 8 11 13 24 28 31 9 datos

Mediana=11

Con un número impar de datos: el dato en posición central

1 2 3 5 8 11 13 24 28 31 10 datos

Mediana=(8+11)/2=9,5
Con un número par de datos: la media de los dos centrales

MSc. Ing. Gerson La Rosa Lama


• Medidas características de un conjunto de datos
3
Medidas de centralización

MEDIANA
Es el valor que deja a cada lado el 50% de los datos.

Es poco sensible a asimetrías

50% 50% 50% 50%

Media= Mediana Media


mediana

La mediana no varía, pero la media se desplaza

MSc. Ing. Gerson La Rosa Lama


• Medidas características de un conjunto de datos
3
Medidas de centralización

MEDIANA
Es el valor que deja a cada lado el 50% de los datos.

Es insensible a valores atípicos

50% 50%

Mediana Media

La mediana no varía, pero la media se desplaza


MSc. Ing. Gerson La Rosa Lama
• Medidas características de un conjunto de datos
3
Medidas de dispersiòn

• Varianza (desviación típica) • Percentiles


• Rango • Cuartiles. Rango intercuartílico
• Diagrama de caja (box-plot)

• Rango o recorrido

Valor máximo menos valor mínimo

X: 1 2 5 8 11 13 24 28 31

Rango: 31-1=30

A mayor rango mayor dispersión

MSc. Ing. Gerson La Rosa Lama


Rango Rango
• Medidas características de un conjunto de datos
3
Medidas de dispersiòn

• Varianza
Promedio de desviaciones a la media, al cuadrado

Ejemplo: 𝑥 = {1,2,3,3,5,5,5,6,6}
𝑥 =4

Varianza

𝜎2 = 1−4 + 2−4 + 3−4 + 3−4 + 5−4 +⋯


2 2 2 2 2
=2,89
9

MSc. Ing. Gerson La Rosa Lama


• Medidas características de un conjunto de datos
3
Medidas de dispersiòn

• Varianza
Promedio de desviaciones a la media, al cuadrado

MSc. Ing. Gerson La Rosa Lama


• Medidas características de un conjunto de datos
3
Medidas de dispersiòn

• Varianza

Poca dispersión
Baja varianza
Baja desviación típica
Bajo CV

media
Mucha dispersión
Alta varianza
Alta desviación típica
Alto CV

media
• Medidas características de un conjunto de datos
3
Medidas de dispersiòn
• Cuartiles Q1, Q2, Q3

Son los valores que dividen la muestra en 4 grupos, cada uno con el 25% de los
datos (aproximadamente)
Entre el mínimo y Q1
25% de los datos
Entre Q1 y Q2 50%
25% de los datos
Entre Q2 y Q3 25% de los datos
50%
Entre Q3 y el máximo 25% de los datos

Q1=percentil 25;Q2 = mediana;Q3=percentil 75

25% 25% 25% 25%

min Q1 Q2 Q3 max
• Medidas características de un conjunto de datos
3
Medidas de dispersiòn

• Diagrama de caja (box-plot)

Es la representación gráfica de los cuartiles

25% 25% 25% 25%

Q1 Q2 Q3

MSc. Ing. Gerson La Rosa Lama


• Medidas características de un conjunto de datos
3
Medidas de dispersiòn

• Diagrama de caja (box-plot)

Comparar grupos

d 1,5d

¿Datos atípicos?
• Medidas características de un conjunto de datos
3
Medidas de dispersiòn

Ojo!! Cuando hay asimetrías,


Dato atípico: dato que se sale del
un dato extremo no debe
necesariamente catalogarse patrón general de los datos
como atípico

La asimetría indica que al


final de la cola habrá cada
vez menos datos.

No es atípico. Es compatible con


el patrón de los datos

Sí es atípico MSc. Ing. Gerson La Rosa Lama


• Medidas características de un conjunto de datos
3
Medidas de dispersiòn

Es compatible con la asimetría


positiva
MSc. Ing. Gerson La Rosa Lama
• Medidas características de un conjunto de datos
3
Otras medidas

EJEMPLO

Peso de llenado de detergente

MSc. Ing. Gerson La Rosa Lama


• Conceptos básicos
1

• Descripción de datos mediante tablas y gráficos


2

• Medidas características de un conjunto de datos


3

• Inferencia sobre la media y varianza.


4

• Tamaño de muestra y técnicas de muestreo


5

MSc. Ing. Gerson La Rosa Lama


4
• Inferencia sobre la media y varianza.

EJERCICIO

Un nuevo prototipo de máquina envasadora de bolsas de malla


de naranjas, de las que se usan en los almacenes de
confección de esta fruta ha sido diseñada para enmallar
naranjas cada 5 segundos.

Se quiere estimar la media. Para ello si esto es así se ha


tomado al azar una muestra de 15 bolsas, cuyos pesos
(gramos) son:

1989 2015 1962 2013 1983 1989 1992 2011


1958 2023 1980 1977 1994 2017 2001

MSc. Ing. Gerson La Rosa Lama


4
• Inferencia sobre la media y varianza.

EJERCICIO

MSc. Ing. Gerson La Rosa Lama


4
• Inferencia sobre la media y varianza.

EJERCICIO

La media muestral ha resultado igual a 1993.6 gramos, y


se regulo manualmente para 2000 gramos

¿quiere ello decir que la máquina envasadora se ha


desajustado y que, por tanto, hay que detener la
producción y proceder a reajustar la máquina?

¡ NO NECESARIAMENETE !
MSc. Ing. Gerson La Rosa Lama
4
• Inferencia sobre la media y varianza.

EJERCICIO
La diferencia entre medias puede deberse al azar del
muestreo, de hecho nunca saldrá exactamente igual a
2000 gramos

Necesitamos algún procedimiento que nos permita


obtener conclusiones sobre el valor de m en la
población a partir de la información que hemos obtenido
en la muestra

Objeto de la Inferencia Estadística


MSc. Ing. Gerson La Rosa Lama
4
• Inferencia sobre la media y varianza.

Inferencia de una media

Hipótesis de salida a contrastar € m=2000

“Hipótesis Nula” H0 € H0: m=2000

frente
“Hipótesis Alternativa” H1 € H1: m ≠2000

Enunciado del Test


¿Cómo resuelvo el
H0 : m = m0 Test?

H1 : m ≠ m0 ¿Cómo decido si es
cierta H0 o H1?
MSc. Ing. Gerson La Rosa Lama
4
• Inferencia sobre la media y varianza.

Inferencia de una media


INTERVALOS DE CONFIANZA
Intervalo calculado a partir de los datos y que tiene una
probabilidad de (1- α) % de contener el valor
desconocido del parámetro (media)

En general se opera con α =0,05, con lo que el intervalo


tendrá una probabilidad del 95% de contener a la media, o
con α =0,01, con lo que el intervalo tendrá una
probabilidad del 99% de contenerlo

MSc. Ing. Gerson La Rosa Lama


4
• Inferencia sobre la media y varianza.

Inferencia de una media


Error muestral: 𝜀
INTERVALOS DE CONFIANZA
s t ( α / 2 ) 1 9 ,8
IC m ⇒ X ± t ( α / 2)
1 9 9 3 ,6 ± N −1
N −1
N 15

t ( α / 2 ) € E l valor de t se busca en la tabla t


N −1
(valor crítico)
INTERVALO DE CONFIANZA PARA m (95%)
(1982,64 , 2004,56) gramos
1993,6 ± 10,96 gramos
Riesgo de 1ª especie = α = 0,05
Nivel de Confianza (1-α)%=(1- 0,05)*100 = 95%

MSc. Ing. Gerson La Rosa Lama


4
• Inferencia sobre la media y varianza.

Distribución de T student
t15

t100
t10

MSc. Ing. Gerson La Rosa Lama


4
• Inferencia sobre la media y varianza.

Distribución de T student

95%

MSc. Ing. Gerson La Rosa Lama


4
• Inferencia sobre la media y varianza.

Inferencia de una media


CONTRASTE DE HIPÓTESIS MEDIANTE IC

H0 : m = m0 s
α /2 s α /2
IC para m X- t , X+ t
H1 : m ≠ m0 N-1
N
N-1
N

Con un Nivel de
Si m0 ∈ IC Aceptar H0 Confianza (1-α)%

Si m0 ∉ IC Rechazar H0 Aceptar H1

Nivel de Confianza (1-α)%


(1–Riesgo de 1ª especie (α))x100
MSc. Ing. Gerson La Rosa Lama
4
• Inferencia sobre la media y varianza.

Inferencia de una media


CONTRASTE DE HIPÓTESIS MEDIANTE IC
H0 : m = m0=2000
H1 : m ≠ 2000

IC para m (95%) (1982,7 , 2004,5) gramos

m0 = 2000 ∈ IC95% (1982,7 , 2004,5) Aceptar H0

¡ Conclusión: la Hipótesis m=2000 es aceptable !

Es admisible que la muestra proceda de una población de


media 2000 gramos.

MSc. Ing. Gerson La Rosa Lama


4
• Inferencia sobre la media y varianza.

Inferencia de una media


CONTRASTE DE HIPÓTESIS MEDIANTE IC

m0 =2000 IC95% (1982,7 , 2004,5) Aceptar H0

¡ la Hipótesis m=2000 es aceptable !

m0 =1990 IC95% (1982,7 , 2004,5) Aceptar H0

¡ la Hipótesis m=1990 también es aceptable !

m0 =2005 IC95% (1982,7 , 2004,5) Rechazar H0

¡ la Hipótesis m=2005 NO es aceptable !


MSc. Ing. Gerson La Rosa Lama
4
• Inferencia sobre la media y varianza.

Inferencia de una varianza

Hipótesis de salida a contrastar σ2 = 361 gramos2

“Hipótesis Nula” H0: σ2 = 361

frente
“Hipótesis Alternativa” H1: σ2 ≠ 361

Enunciado del Test


¿Cómo resuelvo el
H0 : σ2 = σ20 Test?

H1 : σ2 ≠σ20 ¿Cómo decido si es


cierta H0 o H1?
MSc. Ing. Gerson La Rosa Lama
4
• Inferencia sobre la media y varianza.

Inferencia de una varianza

INTERVALO DE CONFIANZA PARA LA σ2 Y σ

(N − 1)S 2
(N − 1)S 2
, Intervalo de Confianza para σ2
g2 g1

(N − 1)S 2 (N − 1)S 2 Intervalo de Confianza para σ


,
g2 g1

Valores de χ2 que se buscan en la


tabla con N-1 grados de libertad
MSc. Ing. Gerson La Rosa Lama
4
• Inferencia sobre la media y varianza.

Distribución Chi-cuadrada (χ2)

95%

MSc. Ing. Gerson La Rosa Lama


4
• Inferencia sobre la media y varianza.

Inferencia de una varianza

INTERVALO DE CONFIANZA PARA LA σ2 Y σ


Ejemplo N-1
(N − 1)S 2 (N − 1)S 2 1 4 x 3 9 2 = 3 1 .2 S2
,
g2 g1 5 .6 3 g2

14x392
= 1 4 .5
2 6 .1 g1
INTERVALO DE CONFIANZA PARA σ (95%)
(14,5 , 31,2) gramos
Riesgo de 1ª especie = α = 0,05
Nivel de Confianza (1-α)%=(1- 0,05)*100 = 95%
MSc. Ing. Gerson La Rosa Lama
4
• Inferencia sobre la media y varianza.

Inferencia de una varianza


CONTRASTE DE HIPÓTESIS MEDIANTE IC
H0 : σ = σ0 H1 : σ ≠ σ0

(N − 1)S 2 (N − 1)S 2
IC PARA σ ,
g2 g1

Si σ0 ∈ IC Con un Nivel de
Aceptar H0
Confianza (1-α)%

Si σ0 ∉ IC Rechazar H0 Aceptar H1

Nivel de Confianza (1-α)%


(1 – Riesgo de 1ª especie (α))x100
MSc. Ing. Gerson La Rosa Lama
4
• Inferencia sobre la media y varianza.

Inferencia de una varianza


CONTRASTE DE HIPÓTESIS MEDIANTE IC
En nuestro ejemplo:

H0 : σ = σ0=19 H1 : σ ≠ 19

IC para σ (95%) (14,5 , 31,2) gramos

σ0 =19 ∈ IC95% (14,5 , 31,2) Aceptar H0

¡ Conclusión: la Hipótesis σ = 19 gramos


(o σ2 = 361) es aceptable !

MSc. Ing. Gerson La Rosa Lama


4
• Inferencia sobre la media y varianza.

EJERCICIO

Un comerciante recibe una partida de mandarinas de la variedad Nulesina. Con objeto de


analizar el calibre de las mismas. Toma una muestra aleatoria simple de 11 naranjas
midiendo sus calibres en cm que resultan ser los siguientes:

5 7.7 7.3 7.8 6.5 9 8.8 6 8.3 8.8 8.1

Obtenga intervalo de confianza para la media, la desviación estándar con una confiabilidad
de 99%, 95% y 90%

Si al comerciante compró mandarinas de un calibre promedio de 8,8 cm. ¿Debería reclamar?

MSc. Ing. Gerson La Rosa Lama


• Conceptos básicos
1

• Descripción de datos mediante tablas y gráficos


2

• Medidas características de un conjunto de datos


3

• Inferencia sobre la media y varianza.


4

• Tamaño de muestra y técnicas de muestreo


5

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

POBLACIÓN:
¿Es posible estudiar la totalidad de los individuos de una población para obtener
información sobre esta? Si la respuesta es no, entonces hacemos muestreo.

¿Por que no podemos estudiar a TODA la población?


• Ensayos destructivos
• Ensayos caros
• Ensayos lentos
• Ensayos difíciles/complejos
• Población no accesible
• Población muy grande

MUESTRA: es un subconjunto de la población.

Para poder extraer conclusiones de la muestra que puedan extrapolarse


válidamente a la población es importante definir el tipo de muestreo.
PROBABILÍSTICO y NO PROBABILÍSTICO.

“No olvidarse la población es el objetivo final del estudio y la muestra es un


medio para obtener información de esta.”
MSc. Ing. Gerson La Rosa Lama
• Tamaño de muestra y técnicas de muestreo
5

UNIDAD DE ANALISIS: es el ente o individuo que reúne las características que


se quieren medir y/o evaluar en la investigación

POBLACIÓN: conjunto de unidades de análisis que constituyen el objeto de un


determinado estudio y sobre los que se desea obtener conclusiones. El
seleccionar la población implica describir sus criterios para incluir o excluir sus
integrante (lugar, tiempo, …) y definir el tamaño.
Pregunta clave:
¿Quiénes van a ser ESTUDIADOS?
¿Procesos?
¿Líneas de
producción? Criterios de inclusión y
¿Personas? exclusión: POBLACIÓN
¿Productos? •Lugar
¿Insumos? •Tiempo
¿Empresas? •Características
UNIDAD DE ANALISIS
¿Parcelas?
….
….
“Población puede ser real (antes
del estudio) o irse generando
(experimentos)”

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

PROBABILÍSTICOS NO PROBABILISTICOS

•Todas las unidades tienen igual •Cada unidad NO tiene igual


probabilidad de participar en probabilidad de participar en
la muestra. la muestra.
•La elección de cada unidad •No se puede calcular el error
muestral es independiente de las muestral
demás •Alto riesgo de invalidez
•Se puede calcular el error muestral producido por la introducción de
sesgos

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

EJEMPLO.

Un investigador evalúa un nuevo producto para el mercado piurano


realizando catas del producto con los alumnos de una universidad
NO PROBABILISTICO.
Un investigador toma muestras del carbón extraído de una mina,
tomando al azar trozos de carbón de la parte superior de cada carro que
transporta el producto.
NO PROBABILISTICO.

Un investigador toma muestras de racimos de uva de plantas


previamente seleccionadas al azar en un mapa de la parcela.
PROBABILISTICO.

Un investigador evalúa la calidad de un lote cacao fermentado


extrayendo muestras al azar de la parte superior, en medio e inferior de
la caja.
PROBABILISTICO.
MSc. Ing. Gerson La Rosa Lama
• Tamaño de muestra y técnicas de muestreo
5

• Muestreo probabilístico
• Muestreo aleatorio simple
• Muestreo aleatorio estratificado
• Muestro por clusters
• Muestreo sistemático

• Muestreo no probabilístico
• Muestreo de conveniencia
• Muestreo de juicios
• Muestreo por cuotas
• Muestreo de “bola de nieve”
https://www.questionpro.com/blog/es/muestreo-no-probabilistico/

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

MUESTREO PROBABILÍSTICO
• MUESTREO ALEATORIO SIMPLE
• Consiste en tomar la muestra de tal modo que todos los
elementos de la población tengan la misma
oportunidad/probabilidad de ser elegidos.
• Necesitamos conocer el censo de la población y hacer una selección
totalmente al azar.

• MUESTREO SISTEMÁTICO
• De la serie ordenada de individuos de una población se selecciona
uno de cada k individuos, ordenadamente (el 8º, el 18º, el 28º,...), a
partir de un elemento elegido al azar
• Se establece la secuencia de muestreo en base a la relación entre
muestra y población.
• Si k es el intervalo entre unidades elegidas:

k=N/n
MSc. Ing. Gerson La Rosa Lama
• Tamaño de muestra y técnicas de muestreo
5

EJERCICIO

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

MUESTREO PROBABILÍSTICO

• MUESTREO ESTRATIFICADO
• Se divide la población en subgrupos o estratos
• De cada estrato se selecciona al azar una muestra como si fuera un
M.A.S o se puede usar un muestreo sistémico de cada estrato.

Según Afijación TAMAÑO ESTRATO VARIANZA COSTO


Igual tamaño No considera Se asume igual igual
Proporcional Si considera Se asume igual igual
Mínima varianza Si considera Se conoce o estima igual
Óptima Si considera Se conoce o estima diferente

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

MUESTREO PROBABILÍSTICO

• MUESTREO ESTRATIFICADO
𝑛 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑛ℎ = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜 ℎ

𝐻 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑒𝑠𝑡𝑟𝑎𝑡𝑜𝑠
𝑁ℎ = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜 ℎ
𝐻

෍ 𝑁ℎ = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
ℎ=1

• Se asigna el mismo tamaño a cada estrato. Como consecuencia


se favorece a los estratos más pequeños y se perjudica a los
grandes en cuanto a precisión.
𝑛
𝑛ℎ =
𝐻

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

MUESTREO PROBABILÍSTICO
• MUESTREO ESTRATIFICADO
𝑛 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑛ℎ = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜 ℎ

𝐻 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑒𝑠𝑡𝑟𝑎𝑡𝑜𝑠
𝑁ℎ = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜 ℎ
𝐻

෍ 𝑁ℎ = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
ℎ=1

• Afijación proporcional: tiene en cuenta el tamaño de cada


estrato.
• Se fija el tamaño de muestra n , se reparte el número de
individuos a encuestar en cada estrato, ni,
proporcionalmente al tamaño N.
𝑁ℎ
𝑛ℎ = 𝑛
σ𝐻
ℎ=1 𝑁ℎ

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

MUESTREO PROBABILÍSTICO
• MUESTREO ESTRATIFICADO
𝑛 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑆ℎ = 𝑒𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
𝑛ℎ = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜 ℎ 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒𝑙 𝑒𝑠𝑡𝑟𝑎𝑡𝑜 ℎ

𝐻 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑒𝑠𝑡𝑟𝑎𝑡𝑜𝑠
𝑁ℎ = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜 ℎ
𝐻

෍ 𝑁ℎ = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
ℎ=1

• Afijación mínima varianza tiene en cuenta el tamaño de cada


estrato. Este criterio se usa cuando se tiene información sobre la
magnitud de las varianzas de los estratos o se ha estimado en un
muestreo piloto. Se usa además cuando los costos de muestrear
las unidades en los diferentes estratos son semejantes.
𝑁ℎ 𝑆ℎ
𝑛ℎ = 𝑛 𝐻
σℎ=1 𝑁ℎ 𝑆ℎ
MSc. Ing. Gerson La Rosa Lama
• Tamaño de muestra y técnicas de muestreo
5

MUESTREO PROBABILÍSTICO
• MUESTREO ESTRATIFICADO
𝑛 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑆ℎ = 𝑒𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
𝑛ℎ = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜 ℎ 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒𝑙 𝑒𝑠𝑡𝑟𝑎𝑡𝑜 ℎ

𝐻 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑒𝑠𝑡𝑟𝑎𝑡𝑜𝑠 𝐶ℎ = 𝑐𝑜𝑠𝑡𝑜 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜 𝑝𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑟


𝑁ℎ = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜 ℎ 𝑢𝑛𝑎 𝑢𝑛𝑖𝑑𝑎𝑑 𝑑𝑒𝑙 𝑒𝑠𝑡𝑟𝑎𝑡𝑜 ℎ
𝐻

෍ 𝑁ℎ = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
ℎ=1

• Afijación óptima tiene en cuenta el tamaño de cada estrato.


Este criterio se usa cuando se tiene información sobre la
magnitud de las varianzas de los estratos o se ha estimado en un
muestreo piloto. Se usa además cuando los costos de muestrear
las unidades en los diferentes estratos son diferentes.
𝑁ℎ 𝑆ℎ / 𝑐ℎ
𝑛ℎ = 𝑛 𝐻
σℎ=1 𝑁ℎ 𝑆ℎ / 𝑐ℎ
MSc. Ing. Gerson La Rosa Lama
• Tamaño de muestra y técnicas de muestreo
5

EJERCICIO

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

MUESTREO PROBABILÍSTICO

• MUESTREO POR CLUSTERS O POR CONGLOMERADOS


• La población se encuentra dividida en subpoblaciones, clusters o
conglomerados
• Se elige al azar (m.a.s.) una muestra de esos subgrupos
• Se estudia a todos los individuos de los clusters seleccionados.
• El tamaño de muestra se calcula en unidades básicas, no en
número de conglomerados a seleccionar.
• Si k es el número de unidades básicas por cada cluster
(asumiendo que todos son iguales), y n la muestra, el
número de clusters a muestrear es:
n
c=
k

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

EJERCICIO

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

Encuestas a hogares ALEATORIO

San José

Av 28 de Julio San Luis Av. circunvalación

San Pablo

San Carlos

San Ricardo

San Roberto

San Benito

Santo domingo

San Pedro
MSc. Ing. Gerson La Rosa Lama
• Tamaño de muestra y técnicas de muestreo
5

Encuestas a hogares SISTEMATICO

San José

Av 28 de Julio San Luis Av. circunvalación

San Pablo

San Carlos

San Ricardo

San Roberto

San Benito

Santo domingo

San Pedro
MSc. Ing. Gerson La Rosa Lama
• Tamaño de muestra y técnicas de muestreo
5

Encuestas a hogares ESTRATIFICADO

San José

Av. 28 de Julio San Luis Av Circunvalación

San Pablo

San Carlos

San Ricardo

San Roberto

San Benito

Santo Domingo

San Pedro

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

Encuestas a hogares CONGLOMERADOS

San José

Av. 28 de Julio San Luis Av Circunvalación

San Pablo

San Carlos

San Ricardo

San Roberto

San Benito

Santo Domingo

San Pedro

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

TAMAÑO DE LA MUESTRA E INFERENCIA.


La muestra debe reproducir las características del universo o población. Hay dos
cuestiones básicas: la primera, sobre la cantidad de elementos que debe incluir la
muestra y, la segunda, hasta qué punto puede generalizarse a la población el
resultado obtenido en ella. Ambas cuestiones conducen al problema de la exactitud o
precisión de la estimación del parámetro desconocido. El objetivo es no incurrir en
errores a la hora de obtener los resultados. Pero como los errores son inevitables, lo
importante entonces es minimizarlos.

Una vez especificadas las características que ha de tener la muestra, hay que
determinar su tamaño (n), de forma que sea suficientemente representativa de la
población y que asegure, para un nivel de confianza (1-α) dado, un error muestral (ε)
máximo permitido. La población puede ser infinita (a veces, suele considerarse infinita
cuando tiene más de 100.000 elementos) o de tamaño finito N, que es lo más general.

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

TAMAÑO DE LA MUESTRA E INFERENCIA.


CASO MEDIA:

VARIABLES CUANTITATIVAS
- Talla media de pescado
- Cantidad de fruta por planta
- Nivel de histamina
- Cantidad de cadmio
- Grados brix de la fruta
- Peso por clamshell producido
- Nivel de satisfacción de un cliente
- Temperatura en túnel
- Solidos en suspensión - mg/L
- Cloro residual libre - ppm

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

TAMAÑO DE LA MUESTRA E INFERENCIA.


CASO MEDIA:

El tamaño de la muestra viene dado por expresión de error muestral


para población infinita y varianza desconocida:

𝑡𝛼 𝑠𝑝
𝜀= 2
, 𝑛𝑝 −1
n

Tamaño de muestra naranjas (error 5 gr)


2
𝑡𝛼,𝑛 −1 𝑠𝑝 2 2.142 19.82
2 𝑝 = = 72
𝑛= 5 2
𝜀2
Faltan muestrar 57 bolsas

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

TAMAÑO DE LA MUESTRA E INFERENCIA.


CASO MEDIA:
El tamaño de la muestra viene dado por la siguiente expresión:
POBLACIÓN INFINITA POBLACIÓN FINITA
2
2
𝑧𝛼/2 𝜎2 𝑁 𝑧𝛼/2 𝜎 2
VARIANZA
𝑛= 𝑛= 2
CONOCIDA
𝜀2 𝑁− 1 𝜀 2 + 𝑧1−𝛼/2 𝜎2

𝑡𝛼2,𝑛 −1 𝑠𝑝 2 𝑁𝑡𝛼2,𝑛 𝑠 2
−1 𝑝
VARIANZA 2 𝑝 2 𝑝
𝑛= 𝑛=
𝜀 2 + 𝑡𝛼2
DESCONOCIDA
𝜀2 𝑁−1 𝑠𝑝 2
,𝑛 −1
2 𝑝
En la mayoría de los casos se desconoce el valor de σ, por lo que es necesario establecer un
proceso de muestreo previo con información más reducida (muestra piloto p) y a partir de ahí
2
estimar la σ a la que llamaremos 𝑆𝑝 . En ese caso en vez de utilizar 𝑧𝛼/2 utilizamos 𝑡𝛼2,𝑛 −1 donde
2 𝑝
𝑛𝑝 es el tamaño de la muestra piloto
MSc. Ing. Gerson La Rosa Lama
• Tamaño de muestra y técnicas de muestreo
5

TAMAÑO DE LA MUESTRA E INFERENCIA.


CASO MEDIA:

Para llevar a cabo el análisis de un producto nuevo se desea realizar una


encuesta para determinar el precio a pagar por consumidor en toda la región
Piura (1,8 millones). Se ha decidido aceptar un error máximo en el precio de
5 soles . Se asume una desviación estándar de 50 soles. Se busca un
nivel de confianza del 95%, obtenga el tamaño adecuado de la muestra.

2
𝑧1−𝛼/2 𝜎2 1,962 𝑥 502
𝑛= = = 385
𝜀2 52

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

TAMAÑO DE LA MUESTRA E INFERENCIA.


CASO MEDIA:

Para llevar a cabo el análisis de un producto nuevo se desea realizar una


encuesta para determinar el precio a pagar por consumidor en el distrito de
Castilla (50 mil personas). Se ha decidido aceptar un error máximo en el
precio de 5 soles . Se asume una desviación estándar de 50 soles. Se
busca un nivel de confianza del 95%, obtenga el tamaño adecuado de la
muestra.

2
𝑁 𝑧𝛼/2 𝜎2 50000 𝑥 1,962 𝑥 502
𝑛= 2 = = 381
𝑁−1 𝜀 2 +𝑧1−𝛼/2 𝜎2 50000−1 52 +1,962 𝑥 502

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

TAMAÑO DE LA MUESTRA E INFERENCIA.


CASO MEDIA:

Para llevar a cabo el análisis de un producto nuevo se desea realizar una


encuesta para determinar el precio a pagar por consumidor en toda la región
Piura (1,8 millones). Se ha decidido aceptar un error máximo en el precio de
5 soles . Para estimar la desviación estándar se hizo una muestra de 25
personas y se obtuvo un valor de 50 soles. Se busca un nivel de
confianza del 95%, obtenga el tamaño adecuado de la muestra.

𝑡𝛼2,𝑛 𝑠 2
2
2 𝑝
−1 𝑝 𝑡2,5, 24 502 2,06 𝑥 502
𝑛= = = = 426
𝜀2 52 5 2

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

TAMAÑO DE LA MUESTRA E INFERENCIA.


CASO MEDIA:

Para llevar a cabo el análisis de un producto nuevo se desea realizar una


encuesta para determinar el precio a pagar por consumidor en el distrito de
Castilla (50 mil personas). Se ha decidido aceptar un error máximo en el
precio de 5 soles . Para estimar la desviación estándar se hizo una
muestra de 25 personas y se obtuvo un valor de 50 soles. Se busca un
nivel de confianza del 95%, obtenga el tamaño adecuado de la muestra.

2
𝑁𝑡𝛼 𝑠𝑝 2
2 ,𝑛𝑝 −1 50000 𝑥 2,062 𝑥 502
𝑛= = = 423
𝑁−1 𝜀 2 +𝑧𝛼2 𝑠𝑝 2 50000−1 52 +2,062 𝑥 502
,𝑛 −1
2 𝑝

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

TAMAÑO DE LA MUESTRA E INFERENCIA.


CASO PROPORCION:

VARIABLES DICOTOMICAS
- Lotes de productos con presencia o ausencia de
coliformes
- Porcentaje de productos con nivel de aceptación Extra
- Porcentaje de productos en mal estado
- Proporción de empresas que tienen implementada BRC
- Porcentaje de empresas con tratamiento biológico de
residuos
- Porcentaje de fruta de calibre jumbo
- Porcentaje de plantas con arañita roja
- Lotes con ausencia o no de mosca de fruta

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

TAMAÑO DE LA MUESTRA E INFERENCIA.


CASO PROPORCION:

El tamaño de la muestra viene dado por la siguiente expresión:


POBLACIÓN INFINITA POBLACIÓN FINITA
2
2
𝑧𝛼/2 𝑝𝑞 𝑁 𝑧𝛼/2 𝑝𝑞
PROPORCION
𝑛= 𝑛= 2
CONOCIDA
𝜀2 𝑁− 1 𝜀 2 + 𝑧1−𝛼/2 𝑝𝑞
2
PROPORCION
2
𝑡𝛼,𝑛 −1 𝑝𝑞 𝑁𝑡𝛼,𝑛 −1 𝑝𝑞
DESCONOCIDA 2 𝑝 2 𝑝
𝑛= 𝑛=
𝜀2 𝑁− 1 𝜀 2 + 𝑧𝛼2 𝑝𝑞
,𝑛 −1
2 𝑝

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

TAMAÑO DE LA MUESTRA E INFERENCIA.


CASO PROPORCION:

Para una población infinita el tamaño de la muestra y proporción


conocida: 2
𝑧𝛼/2 𝑝𝑞 𝑞 =1−𝑝
𝑛=
𝜀2
Generalmente, los valores poblacionales de la proporción buscada
(p) y de su complementario (q=1-p) se desconocen.

Pero en este caso, en vez de obtenerlos mediante una muestra


piloto, pueden sustituirse por p=q=0,5, lo que conduce al máximo
valor exigible de n, ya que cualquier otra combinación de valores
de p y q, al multiplicarlos, daría una valor inferior a 0,25.

MSc. Ing. Gerson La Rosa Lama


• Tamaño de muestra y técnicas de muestreo
5

TAMAÑO DE LA MUESTRA E INFERENCIA.


CASO PROPORCION:

Obsérvese además que si se considera una confianza del 95,5%


(Z=2), el valor de muestra máxima queda sólo en función del error:

2
𝑧𝛼/2 𝑝𝑞 4 𝑥 0,5 𝑥 0,5 1
𝑛= = = 2
𝜀2 𝜀 2 𝜀

Para una población finita el tamaño de la muestra queda en


función del error y el tamaño total:
2
𝑁 𝑧𝛼/2 𝑝𝑞 𝑁
𝑛= 2 =
2
𝑁 − 1 𝜀 + 𝑧1−𝛼/2 𝑝 𝑞 𝑁 − 1 𝜀2 + 1
MSc. Ing. Gerson La Rosa Lama
• Tamaño de muestra y técnicas de muestreo
5

TAMAÑO DE LA MUESTRA E INFERENCIA.


EJERCICIO:

Ejemplo: En una empresa con BRC desean saber el nivel de satisfacción


de sus clientes y quieren realizar un estudio para ver si su nuevo
producto lanzado ha sido de su agrado. ¿Cuál sería el tamaño necesario
para la muestra, si el total de clientes es de 500? Suponga un nivel de
confianza para los resultados del estudio del 95,5% y un error máximo
permitido del 5%. :

2
𝑁 𝑧𝛼/2 𝑝𝑞
𝑛= 2 = 223
𝑁−1 𝜀2 + 𝑧1−𝛼/2 𝑝 𝑞

MSc. Ing. Gerson La Rosa Lama


GRACIAS

ESTADÍSTICA DESCRIPTIVA E INFERENCIA ESTADÍSTICA

También podría gustarte