Métodos Cuantitativos Aplicados A Los Negocios: Man-Iv
Métodos Cuantitativos Aplicados A Los Negocios: Man-Iv
Métodos Cuantitativos Aplicados A Los Negocios: Man-Iv
MÉTODOS CUANTITATIVOS
APLICADOS A LOS NEGOCIOS
MAN-IV - c u a r t o c u at r i m e s t r e
Índice
Presentación 4
Macrobjetivos 5
Programa 6
Mapa Conceptual 7
Agenda 8
Material 8
Glosario 9
Módulos *
Módulo 1 12
Módulo 2 27
Módulo 3 57
Módulo 4 82
Referencias
Semanas
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Módulo 1 Módulo 2 Módulo 3 Módulo 4
Evaluación Evaluación
Parcial 1 Parcial 2
Material
Material Básico
Material Complementario
1 El texto seleccionado posee un excelente diseño lo cual contribuirá a que el aprendizaje sea
ameno. Bajo ningún punto de vista se deberá fotocopiar el material, no sólo por ser un delito sino porque
estará perdiendo los aportes que un texto en colores le brinda. El libro además posee un CD que le permitirá
ampliar las funciones del Excel, lo cual será fundamental para trabajar con los datos.
Cabe aclarar que este texto es que se le presentó como material básico, en la primera parte de Estadística
que Ud. ya cursó.
Anova: Técnica para probar de manera simultánea si son iguales las medias
de tres o más poblaciones.
Error Tipo II: Ocurre cuando se acepta una hipótesis nula falsa.
Hipótesis Nula: Declaración acerca del valor del parámetro poblacional, que
se compara para probar ante la evidencia muestral. Se simboliza con H0
Modelo funcional: Un modelo que supone una relación exacta entre las
variables.
Módulos MÓDULO 1
M1 Microobjetivos
M1 Contenidos
Introducción
a) La estimación puntual.
Estimación puntual
Con los datos provenientes de una muestra se obtiene un único valor que
lo utilizaremos como estimación del parámetro. Sólo a manera de ejemplo,
a continuación se hace mención a algunos de los Parámetros con sus
Estadísticos más utilizados para realizar la estimación:
Parámetro Estadístico
µ
x
P
p
σ S
∑ [X − X ]
2
2 i
s =
n −1
Recordar que la varianza muestral es igual a:
Con los datos que surgen de una muestra se obtienen dos valores, que
generan un intervalo en el que, en forma probable, se encuentra el valor del
parámetro.
a) Insesgabilidad
b) Consistencia
d) Suficiencia
∧
• Insesgabilidad: El estimador θ del parámetro θ es insesgado si la
esperanza del estimador es igual al parámetro:
()
E θˆ = θ
∧
Cuando no se cumple con esa igualdad, se dirá que θ será un estimador
sesgado del parámetro θ pudiendo ser el sesgo positivo o negativo.
∧
• Consistencia: El estimador θ del parámetro θ es consistente, si
el estimador se aproxima al parámetro a medida que el tamaño de
la muestra se aproxima al tamaño de la población. En el caso del
estadístico media muestral ( x ) y del parámetro media poblacional
(µ) podemos ver que a medida que n→N, ambas medias tienden
a ser iguales y por consiguiente la media muestral es un estimador
consistente de µ.
( ) ()
V θˆ j < V θˆi
(Recuerde que la varianza también se simboliza con V mayúscula).
Cabe aclarar que de todos los estimadores posibles que se pueden usar
para estimar la media poblacional, la media muestral es la que reúne todas
las propiedades de un buen estimador, es decir es insesgado, eficiente,
consistente y suficiente. De allí que, en los procedimientos de estimación,
se utilice la x como estimador de la µ.
{
(
P − k1 〈 k θ ; θ 〈 k2 = 1 − α) }
Donde:
k θ ; θ
: Es un estadístico que es función de θ que es una variable
aleatoria y depende matemáticamente del parámetro θ. Este estadístico
se elige de manera tal que tenga una función de probabilidad conocida y
tabulada.
θˆ − θ
k (θˆ;θ ) = = Z ∼ N (0,1)
σ θˆ
{
P − Z ≤ k (θˆ;θ ) ≤ Z } = 1 − α
{
P − Zσ θˆ ≤ θˆ − θ ≤ Zσ θˆ } = 1 − α
{ }
P − Zσθˆ − θˆ ≤ −θ ≤ Zσθˆ − θˆ = 1 − α
P{Zσ θˆ + θˆ ≥ θ ≥ −Zσ θˆ + θˆ } = 1 − α
{ }
P θˆ − Zσ θˆ ≤ θ ≤ θˆ + Zσ θˆ = 1 − α
x−µ
P − Z ≤ ≤ Z = 1−α
σ/ n
σ σ
P − Z − x ≤ −µ ≤ Z − x = 1−α
n n
σ σ
Px − Z ≤µ ≤ x+Z = 1−α
n n
- el nivel de confianza: 1 - α
- la varianza poblacional: σ x
- el tamaño muestral: n
x−µ
k ( x, µ) =
s/ n
tiene una distribución t de Student con n-1 grados de libertad.
Para definir estos tres conceptos se partirá en todos los casos del estadístico
Z. Se deberá recordar que:
x−µ
Z=
σ/ n
σ
e=Z
n
Z 2σ 2
n=
e2
Si se trabaja con poblaciones finitas sin reemplazo, la fórmula anterior se
convierte en el primer paso y la cantidad definitiva se determina considerando
el tamaño de la población de la siguiente manera:
p− p
Z= ∼ N (0,1)
p.q
n
p.q
Li : p − Z
n
p.q
Ls : p + Z
n
Z 2 p.q
n=
e2
Al igual que en el caso anterior (media poblacional), si se conoce el tamaño
de la población, la fórmula anterior se convierte en el primer paso y la cantidad
definitiva se llega con la fórmula que sigue:
n0 N
n=
[( N − 1) + n0 ]
Hemos llegado al final del desarrollo teórico de este primer módulo. Le
aconsejo que para facilitar el estudio de los conceptos presentados realice
los ejercicios y las actividades de autoevaluación que proporciona el libro
de texto.
Actividad 1
Se va consolidando más en su trabajo
Hoy su superior le encarga que, con la información sobre las ventas promedios
de la sucursal de la empresa, prepare un informe breve por escrito para los
directivos de la misma, donde puedan estimar las ventas de la sucursal con una
confianza del 95%.
Li = $68.875
Ls = $81.125
Entonces, con una confianza del 95% se puede estimar que el verdadero
promedio de ventas de la sucursal está comprendido entre los $68.875 y los
$81.125
AA Actividad 1
asistente académico
Bien, a esta altura, ¡le resulta muy sencillo el pedido! Sin más, se pone a
trabajar en el asunto para elaborar el informe por escrito.
CC AA
Li = 0,145
Ls = 0,155
Entonces, con una confianza del 99% se puede estimar que la verdadera
proporción de ventas de contado de la sucursal está comprendida entre el 14,5%
y el 15,5%
AA Actividad 2
asistente académico
CC AA
CC Actividad 3
clave de corrección
n ≥ 323
AA Actividad 3
asistente académico
- El nivel de confianza (1 − α )
- El error tolerable máximo (e)
- La variabilidad de la población (σ ) ó ( p ∗ q )
2
Actividad 4
Ejercitando un poco más…
a) Determine el peso neto promedio del café que se empaca en cada sobre.
b) El monto total en pesos para las compras realizadas por los 400 clientes.
9. En una ciudad grande donde existen 800 estaciones de servicio, para una
muestra aleatoria de 36 estaciones de servicio, 20 de ellas venden una marca
determinada de aceite. Utilizando un intervalo de confianza del 95% estime:
a) La proporción de todas las estaciones de servicio del área que venden esa
marca de aceite.
10. Para una muestra aleatoria de 100 hogares de una gran ciudad, el número
de hogares en los que cuando menos un adulto está en esos momentos
desempleado es 12. Estime el porcentaje de hogares de esa ciudad en
los que al menos un adulto esté desempleado, utilizando un intervalo de
confianza del 95%.
MÓDULO 2
M2 Microobjetivos
M2 Contenidos
Prueba de hipótesis
Introducción
Pueden presentarse en la
práctica, situaciones en las
que exista una sospecha
relativa a la característica de la
población sometida a estudio.
La Prueba de Hipótesis
implica, en cualquier
investigación, la existencia de
dos teorías o hipótesis
implícitas, que denominaremos
hipótesis nula e hipótesis
alternativa, que de alguna
manera reflejarán esa idea a
priori que tenemos y que pretendemos contrastar con la “realidad”. De la
misma manera aparecen, implícitamente, diferentes tipos de errores que
podemos cometer durante el procedimiento. No podemos olvidar que,
habitualmente el estudio y las conclusiones que obtengamos para una
población cualquiera, se habrán apoyado exclusivamente en el análisis de
sólo una parte de ésta. De la probabilidad con la que estemos dispuestos a
asumir estos errores, dependerá, por ejemplo, el tamaño de la muestra
Estadística Inferencial
Paso 5: Decidir
a)
b)
Error de Tipo I:
Es el error que consiste en rechazar H0 cuando es cierta. La probabilidad
de cometer este error es lo que anteriormente hemos denominado nivel de
significación. Es una costumbre establecida el denotarlo siempre con la letra α
a) Lateral Izquierda:
b) Lateral Derecha:
X −µ
t=
s/ n
X
p=
n
X pq
p= ≈ N ( p, )
n n
X p q p − p0
p= ≈ N ( p0 ; 0 0 ) ⇔ = Z ≈ N (0,1)
n n p0 q0
n
X
p=
n
EDUBP | CONTADOR | Métodos Cuantitativos Aplicados a los negocios - pág. 35
Entonces se define:
p − p0
Z=
p0 q0
n
Resumiendo:
a) Si:
b) Si:
En el ejemplo:
1.- Se puede observar que se trabaja con muestras pequeñas.
2.- Las observaciones de las dos muestras son independientes
3.- ¿Las dos poblaciones son aproximadamente normales?
Variable 1 Variable 2
Media 227,58 247,92
Varianza 191,54 466,08
Observaciones 12 12
Grados de libertad 11 11
F 0,410952
P(F<=f) una cola 0,07789187
Valor crítico para F 0,35486991
(una cola)
Variable 1 Variable 2
Media 227,58 247,92
Varianza 191,54 466,08
Observaciones 12 12
Varianza agrupada 328,81
Diferencia hipotética de las medias 0
Grados de libertad 22
Estadístico t -2,747
P(T<=t) una cola 0,0059
Valor crítico de t (una cola) 1,71714419
P(T<=t) dos colas 0,01177384
Valor crítico de t (dos colas) 2,07387529
c) Si:
Variable 1 Variable 2
Media 62,85 59,19
Varianza 401,029 379,856
Observaciones 13 13
Coeficiente de correlación de 0,987
Pearson
Diferencia hipotética de las 0
medias
Grados de libertad 12
Estadístico t 4,136
P(T<=t) una cola 0,00069082
Valor crítico de t (una cola) 1,78228674
P(T<=t) dos colas 0,00138163
Valor crítico de t (dos colas) 2,17881279
Planteo de hipótesis
Veamos un ejemplo:
Supongamos que tenemos las calificaciones (puntajes) de tres grupos de
personas según el método de instrucción utilizado:
¿Por qué existe variación entre los valores? ...es decir ¿Por qué las
observaciones no son todas las mismas?
2.- Por otro lado las personas son naturalmente diferentes y variables, tanto
si se las trata o no en forma igual, por lo tanto, aún dentro de un grupo
donde todos reciben el mismo tratamiento, existe variabilidad esto se llama
variación dentro del grupo.
Entonces, resumiendo:
Analizar/Comparar medias/
ANOVA de un factor/Dependiente: calificación; Factor: Método de
Instrucción.
Opciones: descriptivos y Prueba de homogeneidad de varianzas
Descriptivos
Calificación
Intervalo de confianza para
la media al 95%
Desviación Límite
N Media típica Error típico Límite inferior superior Mínimo Máximo
1 5 80,00 6,205 2,775 72,30 87,70 70 86
2 5 85,00 5,916 2,646 77,65 92,35 76 90
3 5 75,00 6,205 2,775 67,30 82,70 68 82
Total 15 80,00 7,061 1,823 76,09 83,91 68 90
Calificación
Estadístico
de Levene gl1 gl2 Sig.
,095 2 12 ,910
M2 Actividades
Actividad 1
¿Hay evidencias muestrales suficientes?
Su jefe le reenvía el mail a Ud. y le pide que evalúe el pedido del cliente. El
correo en su parte pertinente dice:
Después de leer el correo Ud. tiene claro que el procedimiento que deberá
utilizar. Busca la información de la sucursal en lo que respecta a las ventas
promedio y a la proporción de ventas de contado, con la que ya trabajó
anteriormente y le resulta familiar a esta altura.
¡Nuevamente le deseo suerte en esta tarea!!!
CC AA
CC Actividad 1
clave de corrección
Paso 1:
Paso 2:
Paso 3:
Paso 5:
Por lo tanto existen evidencias muestrales para concluir que las ventas
promedios de la sucursal son significativamente inferiores a las del resto de
las sucursales de la empresa.
Paso 4:
Paso 5:
AA Actividad 1
asistente académico
Recuerde:
Además tenga en cuenta que los datos que necesita para la realización de
las pruebas y que se refieren a la empresa son los siguientes:
Actividad 2
Comparando promedios
Suc. 3,1 3,7 3,6 4,0 3,8 3,8 5,9 4,9 3,6 3,6 2,3 4,0 3,1 2,4 3,7
cuestionada 3,8 2,8 2,9 3,4 4,0 4,0 5,0 3,5 2,3 2,5 2,7 3,4 3,6 2,4 2,6
Otra Suc. 5,0 4,5 3,4 3,4 6,0 3,3 4,5 4,6 3,5 5,2 4,8 4,4 4,6 3,6 5,0
5,4 5,5 4,6 4,5 4,6 6,7 4,5 5,0 5,7 4,8 5,0 5,2 4,9 4,6 4,8
CC AA
CC Actividad 2
clave de corrección
Prueba para la diferencia de medias:
H 0 : µ1 = µ 2
H1 : µ1 ≠ µ 2
α = 0,0505
Estadísticos de grupo
Prueba de
Levene para la
igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
Error típ. confianza para la
Sig. Diferencia de la diferencia
F Sig. t gl (bilateral) de medias diferencia Inferior Superior
Ventas Se han asumido
,301 ,586 -5,987 58 ,000 -1,2400 ,20710 -1,65456 -,82544
en miles varianzas iguales
de $ No se han asumido
-5,987 57,56 ,000 -1,2400 ,20710 -1,65463 -,82537
varianzas iguales
Nota: Cabe aclarar que Ud. en un parcial o examen tendrá parte de los
cálculos necesarios para aplicar la prueba ya realizados o bien, se le
proporcionará las salidas de computación pertinente para que analice los
resultados y pueda concluir y tomar la decisión.
AA Actividad 2
asistente académico
En este caso, Ud. cuenta con los datos de las ventas diarias de cada sucursal
para hacer la comparación. Ud. ya sabe cómo calcular todos los estadísticos
descriptivos de cada muestra. Le sugiero repasar todo lo visto en el módulo
3 de la primera parte de Estadística ya cursada. Se le indica en este caso que
las ventas de las dos sucursales tienen un comportamiento normal.
Actividad 3
CC AA
CC Actividad 3
clave de corrección
Ventas en miles de $
Intervalo de confianza
para la media al 95%
Desviaci Error Límite Límite
n Media ón típica típico inferior superior Mínimo Máximo
al frente 7 5,771 1,69481 ,64058 4,2040 7,3389 4,00 8,60
al medio 7 1,986 ,63358 ,23947 1,3997 2,5717 1,40 3,20
atrás 7 3,514 1,41825 ,53605 2,2026 4,8259 2,20 6,00
Total 21 3,757 2,03090 ,44318 2,8327 4,6816 1,40 8,60
Ventas en miles de $
Estadístico
de Levene gl1 gl2 Sig.
3,230 2 18 ,063
ANOVA
Ventas en miles de $
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-grupos 50,780 2 25,390 14,412 ,000
Intra-grupos 31,711 18 1,762
Total 82,491 20
Comparaciones múltiples
Variable dependiente: Ventas en miles de $
HSD de Tukey
Intervalo de confianza al
95%
Diferencia de Límite
(I) ubicación (J) ubicación medias (I-J) Error típico Sig. Límite inferior superior
al frente al medio 3,7857* ,70948 ,000 1,9750 5,5964
atrás 2,2571* ,70948 ,014 ,4464 4,0678
al medio al frente -3,7857* ,70948 ,000 -5,5964 -1,9750
atrás -1,5286 ,70948 ,107 -3,3393 ,2821
atrás al frente -2,2571* ,70948 ,014 -4,0678 -,4464
al medio 1,5286 ,70948 ,107 -,2821 3,3393
*. La diferencia entre las medias es significativa al nivel .05.
Lo invito a que con lo que Ud. aprendió en este módulo sobre ANOVA,
complete y profundice la interpretación de estos resultados.
AA Actividad 3
asistente académico
4.- Hay una fuerte sospecha que en cierta región de la Argentina hay
desnutrición infantil y es clave para la salud de los niños su detección
temprana.
Según los especialistas en nutrición, los niños de 12 meses de edad
deberían medir en promedio al menos 60 cm.; si midieran menos habría
indicios de desnutrición y las autoridades sanitarias deberían tomar medidas
inmediatamente. Para evaluar si este problema está o no presente en la
región, se tomó una muestra aleatoria de 100 niños de 12 meses de edad y
se determinó una altura promedio de 58 cm. y una desviación de 2 cm.
Usando un nivel de significación del 5% ¿qué le informaría Ud. a las
autoridades sanitarias?
A1 A2 A3
4 5 3
7 6 5
9 3 1
6 8 4
9 3 4
6 2 5
5 5 7
7 6 3
7 7 5
10 5 3
MÓDULO 3
M3 Microobjetivos
.75
Expected Cum Prob
.50
.25
0.00
0.00 .25 .50 .75 1.00
Scatterplot
Regression Standardized Residual Dependent Variable: Ventas (millones)
2.0
1.5
1.0
.5
0.0
-.5
-1.0
-1.5
-2.0 -1.5 -1.0 -.5 0.0 .5 1.0 1.5 2.0
Ingreso
Ventas Nro.de Nro.de autos personal
Región (millones) distribuidoras registrados (miles de
y X1 X2 millones)
X3
1 52,30 2011 24,60 98,50
2 26,00 2850 22,10 31,10
3 20,20 650 7,90 34,80
4 16,00 480 12,50 32,70
5 30,00 1694 9,00 68,80
6 46,20 2302 11,50 94,70
7 35,00 2214 20,50 67,60
8 3,50 125 4,10 19,70
9 33,10 1840 8,90 67,90
10 25,20 1233 6,10 61,40
11 38,20 1699 9,50 85,60
Los supuestos en el modelo de regresión múltiple, son los mismos que los
planteados en el modelo de regresión simple. Para el caso del ejemplo en
cuestión sería:
2.- Una variable predictora no debe tener una correlación demasiado alta
con ninguna otra variable predictora, es decir se debe revisar si existe
Multicolinealidad.
Para nuestro ejemplo la variable “número de autos registrados” y “número de
distribuidoras” están altamente correlacionadas r = 0.670, de manera que la
multicolinealidad puede llegar a ser un problema, ya que los coeficientes de
regresión muestrales, estimadores de los parámetros poblacionales
β0, β1, ..., βk no son confiables.
Entonces en el procesamiento siguiente, se elimina la “número de
distribuidoras” y se dejan las dos restantes variables independientes.
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 1827,033 2 913,516 110,401 ,000a
Residual 66,196 8 8,275
Total 1893,229 10
a. Variables predictoras: (Constante), Ingreso personal (miles de millones), Nro.de
autos registrados (millones)
b. Variable dependiente: Ventas (millones)
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) -4,027 2,468 -1,632 ,141
Nro.de autos
,621 ,138 ,310 4,493 ,002
registrados (millones)
Ingreso personal
,430 ,035 ,849 12,328 ,000
(miles de millones)
a. Variable dependiente: Ventas (millones)
• Prueba F de regresión
Serie de tiempo
Una serie de tiempo es un grupo de datos que se recogen, registran u
observan en incrementos sucesivos de tiempo (semanal, trimestral, anual).
Ejemplos de serie de tiempo pueden ser, las ventas trimestrales de una
empresa durante el año pasado; el número promedio anual de inscriptos
en una determinada universidad; el registro mensual de automóviles en una
ciudad; etc.
El análisis de una serie de tiempo resulta útil para la toma de decisiones
actuales y la planeación con base en una predicción de largo plazo. Las
proyecciones a largo plazo en general se hacen a más de un año, dos,
cinco y diez años.
Cuando se registra una serie de tiempo es difícil visualizar sus
componentes. Hay cuatro componentes, el objetivo de descomponer una
serie es observar cada uno de sus elementos aislados.
Donde:
Y: valor real de la variable de interés
T: tendencia secular
C: componente cíclica
E: componente estacional
I: componente irregular
Donde:
M3 Actividades
Actividad 1
Aceptando el desafío
Basan esta asociación en un artículo reciente del periódico que hacía hincapié
en la inusitada alta correlación entre esta variable y otros indicadores de la
actividad económica social. Para la muestra se seleccionan al azar 10 meses.
90
70
40 50 60 70 80 90
Correlaciones
Tasa de Vtas.
ocupación mensuales
hotel (miles $)
Tasa de ocupación hotel Correlación de Pearson 1 ,974**
Sig. (bilateral) . ,000
Covarianza 228,489 77,536
N 10 10
Vtas. mensuales (miles $) Correlación de Pearson ,974** 1
Sig. (bilateral) ,000 .
697,820 249,841
Covarianza 77,536 27,760
N 10 10
**. La correlación es significativa al nivel 0,01 (bilateral).
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 236,799 1 236,799 145,249 ,000a
Residual 13,042 8 1,630
Total 249,841 9
a. Variables predictoras: (Constante), Tasa de ocupación hotel
b. Variable dependiente: Vtas. mensuales (miles $)
Coeficientes
Coeficientes no estandarizad Intervalo de confianza para
estandarizados os B al 95%
Límite
Modelo B Error típ. Beta t Sig. Límite inferior superior
1 (Constante) 61,230 1,918 31,920 ,000 56,807 65,653
Tasa de ocupación hotel ,339 ,028 ,974 12,052 ,000 ,274 ,404
a. Variable dependiente: Vtas. mensuales (miles $)
Ahora le toca a Ud. continuar con el análisis de las salidas. Le paso la posta,
realice su análisis por escrito y plantee las conclusiones pertinentes.
CC AA
CC Actividad 1
clave de corrección
Por lo tanto es posible concluir que existe una relación lineal positiva y fuerte
entre las variables.
SCR 13042
r2 =1− =1− = 0,948
SCT 249841
(Ver cuadro Anova)
H 0 : β1 = 0
H1 : β1 ≠ 0
AA Actividad 1
asistente académico
Por otro lado deberá observar si existe o no una relación lineal entre las
variables, recuerde que para ello deberá analizar el comportamiento de las
variables a través del diagrama de dispersión.
Luego, visualizada la posible relación lineal entre las variables, habrá que
calcular y analizar el coeficiente de correlación lineal.
Actividad 2
Correlaciones
incremento incremento
rentabilidad % anual de % anual de
global costos gcias.
rentabilidad global Correlación de Pearson 1 ,627** ,014
Sig. (bilateral) . ,009 ,959
Suma de cuadrados y
660,030 415,230 10,560
productos cruzados
Covarianza 44,002 27,682 ,704
N 16 16 16
incremento % Correlación de Pearson ,627** 1 -,118
anual de costos Sig. (bilateral) ,009 . ,663
Suma de cuadrados y
415,230 664,330 -89,400
productos cruzados
Covarianza 27,682 44,289 -5,960
N 16 16 16
incremento % Correlación de Pearson ,014 -,118 1
anual de gcias. Sig. (bilateral) ,959 ,663 .
Suma de cuadrados y
10,560 -89,400 862,380
productos cruzados
Covarianza ,704 -5,960 57,492
N 16 16 16
**. La correlación es significativa al nivel 0,01 (bilateral).
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 264,724 2 132,362 4,353 ,036a
Residual 395,306 13 30,408
Total 660,030 15
a. Variables predictoras: (Constante), incremento % anual de gcias., incremento %
anual de costos
b. Variable dependiente: rentabilidad global
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) 8,730 4,639 1,882 ,082
incremento %
,636 ,215 ,638 2,950 ,011
anual de costos
incremento %
,078 ,189 ,089 ,413 ,686
anual de gcias.
a. Variable dependiente: rentabilidad global
Usted prepara un informe para su amigo por escrito, en donde plasma las
conclusiones del caso.
CC AA
CC Actividad 2
clave de corrección
AA Actividad 2
asistente académico
Actividad 3
De tendencia y efecto cíclico…
Con estos datos, usted está interesado en analizar las crestas y valles
de la componente cíclica en los comerciales televisivos.
y… enseguida se pone a trabajar en este tema…
CC AA
CC Actividad 3
clave de corrección
AA Actividad 3
asistente académico
Actividad 4
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 12.304 2 6.152 149.953 .000a
Residual 3.323 81 4.103E-02
Total 15.627 83
a. Predictors: (Constant), Cantidad de azucar en gramos, Calorías por ración
b. Dependent Variable: Peso por ración en gramos
Coefficientsa
Standardi
zed
Unstandardized Coefficien
Coefficients ts
Model B Std. Error Beta t Sig.
1 (Constant) .157 .076 2.053 .043
Calorías por ración .0092 .001 .934 15.201 .000
Cantidad de azucar
-.0066 .004 -.091 -1.479 .143
en gramos
a. Dependent Variable: Peso por ración en gramos
2.- Una cierta empresa que vende leche desea realizar pronósticos de sus
Ventas (expresadas en miles de pesos) a partir del precio por litro y del dinero
invertido en publicidad (en cientos de pesos). Para ello plantea un modelo de
Regresión Lineal y obtiene la siguiente información:
Coefficients t Sig.
B Std. Error
(Constant) 1,566 1,810 ,865 ,416
Precio por litro -,199 ,105 -1,890 ,101
Publicidad en cientos ,983 ,147 6,667 ,000
de pesos
ANOVA
Sum of Squares df Mean Square F Sig.
Regression 201,855 2 100,927 22,255 ,001
Residual 31,745 7 4,535
Total 233,600 9
Scatterplot
Dependent Variable: Ventas en miles de pesos
2,0
Regression Standardized Residual
1,5
1,0
,5
0,0
-,5
-1,0
-1,5
-1,5 -1,0 -,5 0,0 ,5 1,0 1,5 2,0
(Nota: este es el ejercicio 8, del capítulo 14, pág.530, tomado del libro Hanke
y Reitsch “Estadística para negocios”).
LIMITES AL 95%
Invest. y Ganancias Li para valores Ls para Li para
Desarrollo medios de y valores valores Ls para
(Int. de confianza) superiores del valores del
de y Intervalo intervalo de
de predicción
predicción
5 25 15.75819 42.33098 0.03275 58.05642
7 30 26.21523 45.37713 8.2834 63.30896
4 20 9.76947 41.56811 -4.62884 55.96642
10 50 34.34076 57.50637 17.65132 74.19581
8 40 30.04392 48.30003 11.81362 66.53033
12 60 36.08046 69.26986 22.0069 83.34342
6 50 21.336 43.50477 4.34865 60.49211
11 35 35.38984 63.20889 19.99692 78.60181
63 310
x y xy X2 Y2
5 25 125 25 625
7 30 210 49 900
4 20 80 16 400
10 50 500 100 2500
8 40 320 64 1600
12 60 720 144 3600
6 50 300 36 2500
11 35 385 121 1225
63 310 2640 555 13350
.75
.50
Expected Cum Prob
.25
0.00
0.00 .25 .50 .75 1.00
.04
.02
0.00
Deviation from Normal
-.02
-.04
-.06
0.0 .2 .4 .6 .8 1.0
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 670.939 1 670.939 6.039 .049a
Residual 666.561 6 111.093
Total 1337.500 7
a. Predictors: (Constant), Investigación y desarrollo
b. Dependent Variable: Ganancia anual
Coefficientsa
Standardi
zed
Unstandardized Coefficien
Coefficients ts
Model B Std. Error Beta t Sig.
1 (Constant) 12.166 11.441 1.063 .329
Investigación y desarrollo 3.376 1.374 .708 2.458 .049
a. Dependent Variable: Ganancia anual
70
60
50
40
30
Ganancia anual
20
10
0
0 2 4 6 8 10 12 14
Investigación y desarrollo
y X1 X2 X3
Y 1 -.85 .76 .23
X1 -.85 1 -.42 -.07
X2 .76 -.42 1 .07
X3 .23 -.07 .07 1
MÓDULO 4
M4 Microobjetivos
Luego se supone que la hipótesis nula es cierta. Si se supone que las dos
variables (sexo y preferencia por un modelo de celular) son independientes,
¿cuántas observaciones se esperaría que cayeran en cada celda?
La probabilidad que un cliente elija el modelo básico (independientemente
del sexo) es:
48
48 x
= p = = 0,2626
185 n
Donde 17 + 31 = 48
La tabla con las frecuencias esperadas sería:
Sexo
Masculino Femenino Totales
Modelo Frec. Frec. Frec. Frec.
Observada Esperada Observada Esperada
Básico 19 17 29 31 48
Intermedio 23 25 47 45 70
Inteligente 24 24 43 43 67
Totales 66 119 185
( f o − f e )2 ≈ χ 2
∑ fe
( r −1)(c −1)
Donde:
fo fe ( fo − f e ) ( f o − f e )2
( f o − f e )2
fe
19 17 2 4 0,2353
23 25 -2 4 0,16
24 24 0 0 0
29 31 -2 4 0,1290
47 45 2 4 0,08888
43 43 0 0 0
Total 0,6131
( f o − f e )2 ≈ χ 2
∑ fe
k −1 − c
La diferencia en este caso son los grados de libertad, que en este caso son:
gl
gl = k −1− c
Donde:
k = número de categorías
c = número de parámetros poblacionales desconocidos estimados por
estadísticos maestrales.
nro.de
errores Frecuencia
0 102
1 140
2 75
3 52
4 31
Total 400
λ =µ=
∑x i fi
=
570
= 1.425
n 400
Los grados de libertad (gl) en este caso son 3 con una probabilidad acumulada
de 0.95., el valor de tabla de la ji-cuadrado es 7.81. Por lo tanto la zona de
rechazo de la H 0 será a la derecha de 7.81.
El estadístico de prueba será:
χ2 = ∑
( f o − f1 )2
fe
Actividad 1
Relacionando variables
“… ¡¡¡Por favor!! Necesito que me des una mano con este tema, mi
jefe me mandó esto… sobre una investigación que encontró sobre
el uso de Internet y la carrera que cursa una muestra de estudiantes;
me pidió que tratara de ver si existe relación entre las variables…
en realidad yo estoy atrasado con otro informe que todavía no
terminé… y como vos estás estudiando estadística en tu carrera,
¿quién mejor para ayudarme con esto?, ¿tenés un tiempito?”
Por supuesto que Ud. puede ayudarlo en este tema. Además, ¡hoy se levantó
con muchas ganas de trabajar! Sin más, revisa lo que su superior necesita
con urgencia, lo hace y se pone a ver de qué se tratan estos datos a relacionar
para ayudar a su compañero.
La información con la que cuenta es una tabla de doble entrada con los
siguientes datos.
CARRERA
Lic. Contador
Psicología Público Total
¿que motivo laborales Count 0 4 4
principal te Expected Count 2.0 2.0 4.0
llevó a academicos Count 32 16 48
conectarte a
Expected Count 24.5 23.5 48.0
internet?
entretenimiento Count 4 9 13
Expected Count 6.6 6.4 13.0
familiares Count 0 3 3
Expected Count 1.5 1.5 3.0
curiosidad Count 3 7 10
Expected Count 5.1 4.9 10.0
relaciones sociales Count 7 5 12
Expected Count 6.1 5.9 12.0
Total Count 46 44 90
Expected Count 46.0 44.0 90.0
CC AA
CC Actividad 1
clave de corrección
CARRERA
Lic. Contador
Psicología Público Total
¿que motivo laborales Count 0 4 4
principal te Expected Count 2.0 2.0 4.0
llevó a academicos Count 32 16 48
conectarte a
Expected Count 24.5 23.5 48.0
internet?
entretenimiento Count 4 9 13
Expected Count 6.6 6.4 13.0
familiares Count 0 3 3
Expected Count 1.5 1.5 3.0
curiosidad Count 3 7 10
Expected Count 5.1 4.9 10.0
relaciones sociales Count 7 5 12
Expected Count 6.1 5.9 12.0
Total Count 46 44 90
Expected Count 46.0 44.0 90.0
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 16.153a 5 .006
Likelihood Ratio 19.050 5 .002
Linear-by-Linear
.786 1 .375
Association
N of Valid Cases 90
a. 5 cells (41.7%) have expected count less than 5. The
minimum expected count is 1.47.
Del procesamiento de los datos a través del paquete SPSS, se señala que
un 42% de las celdas tienen frecuencias esperadas menores a 5. En estos
casos se hace necesario reagrupar categorías. La tabla cruzada siguiente
presenta las categorías de la variable “motivo por el que se conecta a Internet”
reagrupadas, de esta manera se logra que las frecuencias esperadas sean
mayores a 5.
CARRERA
Lic. Contador
Psicología Público Total
motivo Académicos Count 32 16 48
Expected Count 24.5 23.5 48.0
Entretenimiento/Curiosi Count 7 16 23
dad Expected Count
11.8 11.2 23.0
Familiares/Relaciones Count 7 12 19
Sociales/Laborales Expected Count 9.7 9.3 19.0
Total Count 46 44 90
Expected Count 46.0 44.0 90.0
Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 10.131a 2 .006
Likelihood Ratio 10.341 2 .006
Linear-by-Linear
7.110 1 .008
Association
N of Valid Cases 90
a. 0 cells (.0%) have expected count less than 5. The
minimum expected count is 9.29.
Entonces, se puede concluir que existe relación entre la carrera que cursa el
estudiante y el motivo principal por el que se conecta a Internet.
El paso siguiente es averiguar qué tan fuerte es esta relación. Esto se hace a
través de los coeficientes de asociación.
Symmetric Measures
Donde:
r: cantidad de filas
c: cantidad de columnas
69.60%
70%
60%
50%
40% 36.40% 36.40%
30% 27.30%
Este caso se resolvió con la ayuda del paquete estadístico SPSS, lo desafío
ahora que lo resuelva utilizando el paso a paso que se le planteó en los
contenidos, Ud. está en condiciones de hacerlo.
Actividad 2
Si de preferencias se trata…
Parece que esta semana el tema de trabajo está vinculado con datos sobre
las carreras universitarias. Su jefe se enteró de la ayuda que Ud. le brindó a
su compañero, leyó el informe y le pareció que, ahora estando en el tema,
Usted podría analizar datos que llegaron a la consultora sobre la preferencia
de los alumnos. Estos datos se refieren a siete carreras, bajo la modalidad
a distancia, que ofrece una determinada universidad. Las carreras están
identificadas con las letras de la A a la G y los datos con los que se cuenta
es la cantidad de alumnos que muestran preferencia por cada una de las
carreras.
carrera Frecuencia
A 18
B 12
C 25
D 23
E 8
F 19
G 14
Total 119
CC1 Actividad 2
clave de corrección
Prueba de chi-cuadrado
Frecuencias
carrera
N observado N esperado Residual
A 18 17,0 1,0
B 12 17,0 -5,0
C 25 17,0 8,0
D 23 17,0 6,0
E 8 17,0 -9,0
F 19 17,0 2,0
G 14 17,0 -3,0
Total 119
Estadísticos de contraste
carrera
Chi-cuadrado a 12,941
gl 6
Sig. asintót. ,044
a. 0 casillas (,0%) tienen frecuencias
esperadas menores que 5. La frecuencia
de casilla esperada mínima es 17,0.
AA1 Actividad 2
asistente académico
Para resolver esta actividad, se le recomienda que revise todo lo relativo a las
pruebas de bondad de ajuste que se vieron es este módulo.
Además, le sugiero que lea atentamente el tema del texto sugerido como
bibliografía básica, allí encontrará desarrollado en extenso este tema.
Asimismo cuenta con más ejemplos y ejercicios que le permitirán poner en
práctica todo lo aprendido.
Fíjese que en este caso no se trata de una tabla de doble entrada, sino que
la variable en análisis es una sola, identifíquela y luego plantee las hipótesis
adecuadas.
Nuevamente en este caso, como no se solicita trabajar con un nivel de
significación específico, trabaje a un nivel del 5%.
Recuerde que el paso final en toda prueba de hipótesis es la conclusión y
consiguiente toma de decisión.