Estadística Aplicada

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 49

ESTADÍSTICA Y MODELOS

CUANTITATIVOS APLICADOS
REFLEXIONES

• “La alta dirección presiona a los profesionales del


Marketing para que proporcione cifras acerca de
cómo las diversas compañías y las actividades del
Marketing han afectado la rentabilidad de la
inversión, y los profesionales del Marketing, a su
vez, tienen que aprender el idioma financiero
para poder rendir cuentas de sus actividades”
• Philip kotler
REFLEXIONES

• “La regla general es que las personas nos


manejamos con información “asimétrica”. Esto
significa que tomamos decisiones con distinta
información. Pero, de todas maneras, aunque
cada uno de nosotros tenga la misma
información, la tendemos a ver e interpretar
de distintas maneras”

• J Cachanosky
CONCEPTUALIZACIÓN

ESTADÍSTIC Es la ciencia de los datos. Implica la


A colección, clasificación, síntesis,
organización, análisis e interpretación de
los datos.

ESTADÍSTICA Implica la recolección, presentación y


DESCRIPTIVA
caracterización de un conjunto de datos
con el fin de describir apropiadamente las
características de ese conjunto de datos.

ESTADÍSTICA Permite la estimación de una característica


INFERENCIAL
de una población o la toma de una decisión
referente a una población, basándose sólo
en los resultados de una muestra.
INFERENCIA
ESTADÍSTICA

PRUEBAS DE
LA ESTIMACIÓN
HIPÓTESIS

Estimador de la Media Pobla.


Estimador de la Proporción P. P. H. para una población
Estimadores comparativos P. H. para dos poblaciones
Intervalos de Confianza

Nivel de Confianza y de
Significancia
INFERENCIA ESTADÍSTICA

•  Probabilidad Clásica o elemental

Ejemplo:

Una empresa de automóviles ofrece tres tipos de marcas, Mazda, Chevrolet y Ford, si
tiene nueve automóviles y tiene de 2 de Mazda, 3 de Chevrolet y 4 de Ford, Cuál es la
probabilidad que: se venda un automóvil de marca Mazda?
INFERENCIA ESTADÍSTICA
•Distribución
  de probabilidad Discreta
• Distribución Binomial

Ejemplo:

La compañía de Investigación de Mercados Nielsen afirma que, por su experiencia, la


participación de mercado de la marca Fruco con el producto salsa de Tomate es del
60% en Colombia. Se seleccionan 50 hogares al azar, hallar la probabilidad que:
a. exactamente 30 consuman la salsa de tomate Fruco.
b. Como máximo 35 prefieran la salsa de tomate Fruco.
c. Como mínimo 25 no prefieran la salsa de tomate Fruco.
INFERENCIA ESTADÍSTICA
•Distribución
  de probabilidad Discreta
• Distribución Hipergeométrica

Ejemplo:

La empresa Crem Helado desea hacer una investigación de producto para


determinar la viabilidad de lanzamiento de un nuevo sabor de helado. Para tal
fin, selecciona 20 jóvenes en un colegio donde se venden helados de esta marca,
15 encontraron agradable el nuevo sabor. Si se quiere repetir la prueba con 10 de
esos 20 jóvenes, cuál es la probabilidad que:
a. A 5 les guste el nuevo sabor
b. A 4 no les guste el nuevo sabor
c. Menos de 8 les guste el nuevo sabor
INFERENCIA ESTADÍSTICA
•Distribución
  de probabilidad Discreta
• Distribución Poisson

Ejemplo:

Debido al creciente incremento de tutelas, denuncias y derechos de petición de los


usuarios de la salud en Colombia, el Ministerio de la Salud y Protección Social realizó
una investigación del nivel de satisfacción de los usuarios, arrojando un resultado que
en promedio 4 de cada 10 usuarios están satisfechos con el sistema de salud en
Colombia. Si se escoge una población con 400.000 usuarios, hallar la probabilidad que:
a. Menos de 170.000 estén satisfechos.
b. Más de 240.000 no estén satisfechos.
DISTRIBUCIÓN CONTINUA
• Distribución Normal
σ

µ x X

𝑋−µ
𝑍  = 1
σ

Z
0 z
DISTRIBUCIÓN CONTINUA

 Ejemplo 1:

El propietario de un restaurante a determinado que la demanda diara de carne


molida en su negocio tiene una media de 240 Kg y una varianza de 529. Si se
escoge un día cualquiera hallar la probabilidad que:
a. La demanda sea menor de 250 Kg.
b. La demanda sea como mínimo 270 kg.

Ejemplo 2:

El gerente de crédito de un almacén de artículos de electrodomésticos estima las


perdidas por malos clientes durante el año con un media de $ 600.000. Además que
la probabilidad de ser mayor a $700.000 es del 30% y menor de $550.000 es del
40%. Cuál es la desviación estándar.
DISTRIBUCIONES MUESTRALES
•  Proporción de una población

Ejemplo:

ACOPI afirma que el 60 % de los empresarios en Colombia están en contra de la


firma del tratado de libre comercio con China. Cuál es la probabilidad que en una
muestra de 200 empresas den como resultado que máximo el 70 % de los
empresarios no estén de acuerdo con el tratado.
DISTRIBUCIONES MUESTRALES
•Proporción
  de dos poblaciones

Ejemplo:

Ciertas encuestas a televidentes revelan que el 25% de los hombres y 33% de las
mujeres ven televisión en la noche. Cuál es la probabilidad que en 2 muestras
aleatorias de 150 hombres y 100 mujeres respectivamente, sea igual la proporción
entre ellos.
DISTRIBUCIONES MUESTRALES
•  Medidas para muestras grandes
Una población

Ejemplo.

Un fabricante de cierto champú para el cabello, distribuye el tamaño profesional de


su producto en salones de belleza de Pereira. Se ha determinado que el consumo
promedio de su producto es de 2.800 cojines mensuales con una desviación estándar
de 280 cojines. Si se toma una muestra probabilista de 36 salones, cuál es la
probabilidad que el consumo promedio en un mes sea inferior a 2700 cojines.
DISTRIBUCIONES MUESTRALES
•  Medidas para muestras grandes
Dos poblaciones

Ejemplo:

Una empresa estima en dos sucursales que las ventas mensuales son en
promedio $60 millones y $50 millones respectivamente, con una desviación
estándar de $10 millones y $ 5 millones respectivamente. Si se escoge 80 y 60
facturas de un mes al azar respectivamente, cuál es la probabilidad que la
diferencia entre las ventas medias de ambas muestras sea mayor a $15
millones?.
DISTRIBUCIONES MUESTRALES
•  Medidas para muestras pequeñas
Una población

Ejemplo:

El salario mensual de los directores comerciales en Colombia es de $5 millones en


promedio de acuerdo a una estimación presentada por el Director del DANE. Se
toma una muestra aleatoria de 9 directores comerciales que genera como
resultado una desviación estándar de $1 millón, cuál es la probabilidad que el
salario exceda a $6 millones.
DISTRIBUCIONES MUESTRALES
•  Medidas para muestras pequeñas
Dos poblaciones

 
2 ( 𝑛 𝑥 − 1 ) 𝑆 2𝑥 +(𝑛 𝑦 −1) 𝑆 2𝑦
𝑆 𝑝=
𝑛 𝑥+ 𝑛 𝑦 − 2
INTERVALOS DE CONFIANZA

Nivel de Confianza
(1-)

/2 /2
INTERVALOS DE CONFIANZA

Intervalo de confianza para la media en poblaciones normales con varianza conocida

Es un intervalo construido de tal forma que podemos fijar de antemano el grado de


certeza (confianza) de que el verdadero valor de la media quede incluido en él
Este intervalo se calcula mediante la fórmula simplificada

valor de la variable normal estándar que determina una cola superior


=
de medida a
INTERVALOS DE CONFIANZA

Una muestra aleatoria de 36 los cigarrillos de una marca determinada dio un contenido
promedio de nicotina de 3.0 miligramos. Suponga que el contenido de nicotina de estos
cigarrillos sigue una distribución normal con una desviación estándar σ = 1.0 miligramo. a)
Obtenga e interprete un intervalo de confianza del 95% para el verdades; contenido promedio
de nicotina en estos cigarrillos. b) El fabricante garantiza que et contenido promedio de nicotina
es de 2.9 miligramos, ¿qué puede decirse de acuerde con el intervalo hallado?
Sea µx= contenido promedio de nicotina.
Una vez que hemos precisado la fórmula a emplear, pasamos a determinar los valore de los
elementos que la componen. En este caso, (según la tabla II), σx = 1, n =36.
Al reemplazar en (8-7) se tiene,

— El intervalo pedido es [2.67, 3.33].


En cuanto a la interpretación se da en estos términos: "tenemos una certeza del 95% de que el
verdadero contenido promedio de nicotina se halla entre 2.67 y 3.33 miligramos”.
INTERVALOS DE CONFIANZA

Intervalo de confianza para la media en poblaciones normales ton varianza desconocida

Cuando este es el caso el intervalo está dado


por la formula,

en donde, = valor de la variable con distribución t con (n-1) grados de


libertad que deja una cola superior de medida

es la desviación estándar muestral


INTERVALOS DE CONFIANZA

Ejemplo:

Los siguientes son los registros de las mediciones del tiempo (en minutos) que
tardaron 15 operarios para familiarizarse con el manejo de una máquina
moderna recientemente adquirida por la empresa: 3.4, 2.8, 4.4, 2.5, 3.3, 4.0, 4.8,
2.9, 5.6, 5.2, 3.7, 3.0, 3.6, 2.8, 4.8. Suponga que los tiempos se distribuyen
normalmente. A) Determine e interprete un intervalo del 95% de confianza para
el verdadero tiempo promedio, b) el instructor considera que el tiempo
promedio requerido por la población de los trabajadores que reciben instrucción
sobre el manejo de esta máquina está por encima de los cinco minutos, ¿qué se
puede decir de acuerdo con el intervalo hallado?
INTERVALOS DE CONFIANZA
Solución :

Como en la información no se da la varianza poblacional, utilizamos la torunda (8-8). Calculamos la media


y la desviación estándar muestral:
El valor t(14; 0.975) lo buscamos en la tabla IV y allí encontramos que es
2.145. Para la búsqueda de este número en la citada tabla debemos
tomar en cuenta que el valor t buscado debe ser tal que deje una cola
derecha de 2.5%.
Al reemplazar en la fórmula IV tenemos:

•El intervalo pedido es [3.26, 4.34]


•Estamos 95% seguros de que el verdadero tiempo promedio que requieren los operarios para
familiarizarse con la máquina está entre 3.26 y 4.34 minutos;
•De acuerdo con el intervalo hallado, no parece ser correcta la apreciación del instructor, puesto que
el promedio 5 minutos está por fuera del intervalo hallado.
INTERVALOS DE CONFIANZA
Intervalo de confianza para la diferencia de
medias en poblaciones normales
independientes

En esta situación hay que distinguir dos casos: Cuando las varianzas de las
poblaciones involucradas son conocidas y cuando las varianzas de las dos
poblaciones son desconocidas, pero se suponen iguales. Cuando se trata de
poblaciones con varianzas conocidas emplearemos la fórmula,

(8-9)
para determinar un intervalo de confianza para la diferencia µx — µy (en este
orden)
Nota. Usualmente la diferencia de los
parámetros se toma en el orden tal que la
diferencia muestral quede positiva.
INTERVALOS DE CONFIANZA

Ejemplo:

Suponga que se desea medir la diferencia entre dos categorías de empleados en la actividad
de seguros. Una está formada por personas con título superior y la otra por personas que
sólo tienen estudios secundarios. Se toma una muestra de 45 empleados entre los primeros
y la media de ventas resulta ser 32, en tanto que la media de una muestra de 60 empleados
con estudios secundarios solamente, es 25. Suponga también que las ventas de los dos
grupos se distribuyen normalmente con varianzas respectivas de 48 para los titulados y 56
para los que sólo tienen estudios secundarios. a) Calcule e interprete un intervalo del 90% de
confianza para la verdadera diferencia de las medias, b) de acuerdo con el intervalo hallado,
¿hay evidencia de que las ventas medias de los grupos son iguales?
Definamos las variables, X = venta de un titulado, Y = venta de uno con sólo estudios
secundarios. Los parámetros a considerar son:
µx = venta promedio de los titulados, µy = venta promedio de los que tienen sólo estudios
secundarios.
INTERVALOS DE CONFIANZA

Solución:

Los valores muéstrales promedios son respectivamente:

; así que construimos el intervalo por medio de la fórmula (8-9).


Los datos para la aplicación de esta fórmula son:
,

Al reemplazaren (8-9) se tiene

•El intervalo pedido es [4.67, 9.33]


Tenemos una certeza del 90% de que la verdadera diferencia promedio de ventas
se halla entre 4.67 y 9.33.
INTERVALOS DE CONFIANZA

La condición de que las ventas medias son iguales se traduce por la


condición o lo que es lo mismo

, así que para que la igualdad entre las medias no pueda descartarse, el cero
tiene que estar incluido en el intervalo. Como en el presente caso esto no
sucede, entonces no hay evidencia de una igualdad entre las dos medías.
Se registraron los siguientes datos, en minutos, que tardan algunos hombres y
mujeres en realizar cierta actividad en una empresa, los cuales fueron
seleccionados aleatoriamente.
INTERVALOS DE CONFIANZA

Suponga que los tiempos para los dos grupos se distribuyen normalmente y que las
varianzas son iguales, aunque desconocidas. a) Calcule e interprete un intervalo de
confianza del 99% para la verdadera diferencia de medias. b) De acuerdo con el intervalo
hallado. ¿Hay evidencia de que los dos tiempos promedios son iguales? Como puede
observarse en este caso, no hay conocimiento de las varianzas poblacionales. Cuando
esto ocurre, el intervalo para, se calcula mediante la fórmula,

(8-10)
INTERVALOS DE CONFIANZA

= valor de la variable con distribución t con k = nx - ny — 2 grados de libertad que


determina un área superior de medida

Es la varianza ponderada.
Como se indicó para el caso anterior, la diferencia de los parámetros se toma de tal
forma que la diferencia muestral sea positiva.
INTERVALOS DE CONFIANZA

En el presente problema tomamos, = tiempo que tarda una mujer en


realizar la actividad, Y = tiempo que tarda un hombre en realizar la
actividad.
Los datos para la fórmula (8-10) son:

(De acuerdo con la tabla IV al aproximar a 40 grados de libertad).


La varianza ponderada está dada por
INTERVALOS DE CONFIANZA

Al reemplazar en (8-10) se tiene,

•El intervalo pedido es [1.61, 2.39]


•Estamos 99% seguros de que la verdadera diferencia promedio de tiempo
que gastan dichos hombres y mujeres en realizar la actividad se encuentra
entre 1.61 y 2.39 minutos.
•Como el 0 no está contenido en el intervalo, estos datos no evidencian una
igualdad entre las dos medias. La utilización de la fórmula (8-10) requiere que
las varianzas de las dos poblaciones aunque desconocidas, sean iguales.
Cuando las varianzas son distintas la fórmula (8-10) sufre una modificación en
cuanto a los grados de libertad, pero este tema no se discutirá en el presente
texto.
INTERVALOS DE CONFIANZA

Intervalo de confianza para la proporción y


diferencia de proporciones
En algunos casos lo que interesa es determinar una proporción o diferencia de proporciones. Como por
ejemplo, la proporción de personas que están a favor de determinado nuevo producto o si la proporción de
artículos defectuosos que produce la máquina I es diferente a la proporción de defectuosos que produce la
máquina II.
Cuando se trata de determinar un intervalo de confianza para una proporción se aplica la fórmula,

(8-11)
INTERVALOS DE CONFIANZA

Como la fórmula (8-11) es una consecuencia del teorema del límite central, se recomienda para su aplicación tomar
muestras de tamaño grande.
Una fábrica desea saber la proporción de amas de casa que preferirían una aspiradora "Central", dados la calidad y el
precio. Se toma al azar una muestra de 100 amas de casa; 20 dicen que les gustaría la máquina. Calcule e interprete un
intervalo del 95% de confianza para la verdadera proporción de amas de casa que preferirían la citada aspiradora.
Los datos para la aplicación de la fórmula (8-11) son

Al reemplazar se tiene:

•El intervalo pedido es

•La verdadera proporción de amas de casa que preferirían la aspiradora está entre 12.2% y 27.8%
INTERVALOS DE CONFIANZA

Se está considerando cambiar el procedimiento de manufactura de partes. Se tornan muestras del


procedimiento actual así como del nuevo para determinar si este último resulta mejor. Si 75 de 1,000
artículos del procedimiento actual presentaron defectos y lo mismo sucedió con 80 de 2,500 partes
del nuevo, determine un intervalo de confianza del 90% para la verdadera diferencia de proporciones
de partes defectuosas. Cuando se de intervalos de confianza para la diferencia de proporciones
empleamos la fórmula
(8-12)
en donde
son las proporciones muéstrales de cada una de las características
consideradas.
Proporción de artículos defectuosos producidos por el procedimiento
actual
Proporción de artículos defectuosos producidos por el procedimiento
nuevo
INTERVALOS DE CONFIANZA

Al reemplazar en (8-12) se tiene

•El intervalo pedido es [0.0281, 0.0579]


•Estamos 90% seguros de que la diferencia de proporciones está entre 0.0281 y 0.0579
8.5.5 intervalo de confianza para varianza de poblaciones normales
Si S2 es la varianza muestral de una muestra aleatoria de tamaño n de una población normal, un intervalo de confianza de

para σ2 está dado por

(8-13)
INTERVALOS DE CONFIANZA

Este intervalo es diferente a los estudiados anteriormente y puede expresarse así:

En donde

valor de la variable con distribución ji cuadrado con (n – 1) grados de libertad que determina un área inferior
de medida

-Valor de la variable con distribución ji cuadrado con (n - 1) grados de libertad que determina un área superior
de medida
Un fabricante de baterías para automóvil asegura que las baterías que produce duran en promedio 2 años, con una desviación
estándar de 0,5 años. Si 5 de estas baterías tienen duración 1.5, 2.5, 2.9, 3.2, 4.0 años, determine un intervalo de confianza del
95% para σ2 e indique si es válida la afirmación del fabricante.
Como se trata de un intervalo de confianza para la varianza aplicamos la fórmula (8-13)
INTERVALOS DE CONFIANZA

(De acuerdo con la tabla III)


Al reemplazar se tiene:

Como el intervalo pedido.


Como el valor de varianza 0.25 está por fuera del intervalo, lo
afirmado por el fabricante no está garantizado por los datos
muéstrales.
INTERVALOS DE CONFIANZA

Intervalo de confianza para el cociente de


varianzas
Si
son las varianzas muéstrales de muestras independientes de tamaños

respectivamente de poblaciones normales, entonces un intervalo de confianza de

es,
para

(8-14)
Donde

Donde valor de la distribución F con

grados de libertad que determina un área superior de medida


INTERVALOS DE CONFIANZA

Valor de la distribución F con

grados de libertad que determina un área superior de medida

.
Determine un intervalo del 90% de confianza al tomar las variables definidas en el segundo ejercicio
para el coeficiente de la sección 8.5.3.
En ese ejercicio se tuvieron valores de varianzas
muéstrales

Al reemplazar en (8-14)

Es el intervalo pedido.
PRUEBAS DE HIPÓTESIS
¿Qué es una hipótesis?
 Una creencia sobre la población,
principalmente sus parámetros: Creo que el porcentaje
de devoluciones será
 Media
inferior al 5%
 Varianza
 Proporción/Tasa

 OJO: Si queremos contrastarla,


debe establecerse antes del
análisis.
Identificación de hipótesis
 Hipótesis nula Ho  Hipótesis Alternativa H1
 La que contrastamos  Niega a H0
 Los datos pueden refutarla  Los datos pueden mostrar
evidencia a favor
 No debería ser rechazada sin
una buena razón.  No debería ser aceptada sin
una gran evidencia a favor.

p , , 
H0 5%
p , , 
: 5%
Contrastes: unilateral y
bilateral
La posición de la región crítica depende de la hipótesis alternativa

Bilateral H1: P  0.05

Unilateral Unilateral
H1: P < H1: P >
0.05 0.05
Significancia de la prueba:
Valor P
El contraste es estadísticamente significativo cuando:
Valor P < 
Es decir, si el resultado experimental discrepa más de “lo
tolerado” a priori.

 Valor P

Se rechaza H0: P = 0.05

Se acepta H1: P > 0.05


 Valor P

Frontera Estadístico
de Rechazo de
Significancia de la prueba: Valor P
El contraste es No significativo cuando: Valor P > 
Por lo tanto no hay evidencia significativa para rechazar la
Hipótesis Nula

No se rechaza
H0: P = 0.05
P

Estadístico Frontera
de de Rechazo
Resumen: , Valor P y
criterio de rechazo
 Sobre   Sobre
Valor P
 Es número pequeño,  Es conocido
preelegido al diseñar el tras realizar el
experimento experimento

 Conocido  sabemos  Conocido Valor


todo sobre la región sabemos
P, todo sobre el
crítica resultado
del experimento

 Sobre el criterio de rechazo


 Contraste significativo Valor P < 
Tipos de error al contrastar
hipótesis
Realidad
H0 cierta H0 Falsa

Correcto Error de tipo II


No Rechazo H0 El tratamiento no tiene El tratamiento si tiene
efecto y así se decide. efecto pero no lo
percibimos.

Probabilidad β

Error de tipo I Correcto


Rechazo H0 El tratamiento no tiene El tratamiento tiene efecto
efecto pero se decide y el experimento lo
que sí. confirma.
Probabilidad 
Acepto H1
RESUMEN
1. Plantee la Hipótesis Nula y la Hipótesis
Alternativa.
2. Seleccione el Nivel de Significancia.
3. Calcule el Estadístico de Prueba.
4. Utilice el Método Gráfico o el Valor P para
Decidir si hay evidencia suficiente para
rechazar la H. Nula.
5. Evalué el Error Tipo I y Tipo II tome una
decisión.
APLICACIONES P. H.
Una Media Poblacional con n  30

Diferencia de dos Medias Poblacionales


con n  30

TENDENCIA CENTRAL Una Proporción Poblacional con n  30

Diferencia de dos
Proporciones Poblacionales con n  30

Una Media Poblacional con n < 30 ó 


PRUEBAS DE desconocida
HIPOTESIS
Diferencia de dos Medias Poblacionales
con n < 30 ó  desconocida

Una Población

VARIABILIDA
D Comparación de dos Poblaciones
APLICACIONES PRUEBA DE
HIPÓTESIS

COMPARACIÓ
ANOVA – PRUEBA F
N VARIAS
POBLACIONES

PRUEBAS DE
HIPOTESIS

CHI CUADRADO
PRUEBA DE
VARIABLES CUALITATIVAS
INDEPENDENCIA

También podría gustarte