Métodos Cuantitativos Aplicados A Los Negocios: Man-Iv

CDR
MÉTODOS CUANTITATIVOS
APLICADOS A LOS NEGOCIOS
MAN-IV - c u a r t o c u at r i m e s t r e
Índice
Presentación 4
Macrobjetivos 5
Programa 6
Mapa Conceptual 7
Agenda 8
Material 8
Glosario 9
Módulos *
Módulo 1 12
Módulo 2 27
Módulo 3 57
Módulo 4 82
* Cada módulo contiene:

microobjetivos
contenidos
actividades
Referencias
Ícono para indicación de Lectura Básica (disponible en ANEXO): ∙
Ícono para indicación de Lectura Complementaria (disponible en plataforma):
Impresión total del documento 259 páginas
EDUBP | CONTADOR | Métodos Cuantitativos Aplicados a los negocios - pág. 3

¡Bienvenido a esta asignatura!
Presentación
Hoy comienza el cursado a distancia de

esta materia. Ud. ya está familiarizado con la
asignatura, ¡¡ahora continuará descubriendo
y aprendiendo el fascinante mundo que le
abre esta disciplina!!.
A esta altura Ud. ya seguramente ha
comprendido que la Estadística es una
ciencia aplicada y ha entendido sobre la
utilidad que adquiere para los Licenciados
en Administración el entender los conceptos
y los procesos que se usan en el análisis de
datos.
Proponemos entonces seguir en este
aprendizaje, abordando desde hoy esta
segunda parte en la que se desarrollarán los
temas de Inferencia, que le serán de gran
relevancia para la toma de decisión en el
ámbito laboral y profesional.
Es conocido por todos que estamos viviendo tiempos de grandes cambios,

en los que el común denominador es la globalización. Las transformaciones
a las que debemos enfrentarnos son continuas, generales y muy rápidas.
Ante esto, nuestra capacidad en la toma de decisiones inteligentes a través
de un eficaz manejo de los datos que a diario nos rodean y en especial en
el campo en el que nos compete a cada uno, y, la posibilidad de realizar
predicciones basadas en dicha información, juegan un rol fundamental.
En toda área en la que Ud. o cualquiera de nosotros se desenvuelva, los
fenómenos son multicausales y existen una diversidad de aspectos en los
que sólo se tiene un control relativo, frente a esto, resulta útil conocer y
comprender un método que permita el manejo de esos datos con un grado
de incertidumbre. La Estadística Inferencial, cuyos contenidos aborda esta
materia, le brinda una serie de herramientas para organizar la información y
para tomar decisiones acerca de ella.
Si se conocen los métodos y las técnicas pertinentes, prácticamente
cualquier conjunto de datos puede transformarse en información útil. Tal
como se expresó al comienzo de la asignatura Estadística Aplicada I, nuestro
principal objetivo es que usted se convierta en consumidor inteligente de la
información y que sea también capaz de generarla y producirla de manera
eficiente.
Las actividades que le iremos proponiendo en el transcurso de la asignatura,

tal como ocurrió con la primera parte que Ud. ya cursó, han surgido de
las distintas áreas que conforman la currícula del plan de estudio. En este
sentido, encontrará actividades vinculadas con el área contable, con el área
del management, finanzas, marketing, producción y economía, entre otras.
EDUBP | CONTADOR | Métodos Cuantitativos Aplicados a los negocios- pág. 4

Cabe señalar que, si bien esta materia se presenta por separado de Métodos
Cuantitativos Aplicados a los negocios, sus contenidos se encuentran
estrechamente relacionados ya que son ejes conceptuales vinculados entre sí
que, por las características propias del plan, se organizan en dos cuatrimestres.
Por lo tanto es importante que Ud. tome el estudio de la Estadística, como
una única disciplina cuyos temas, conceptos, procedimientos y herramientas
se usan de manera integrada a la hora de un análisis estadístico específico.
En Métodos Cuantitativos Aplicados a los negocios, se desarrollaron los

conceptos fundamentales de la materia y que están presentes en toda la
disciplina, Ud. hasta aquí tiene los conocimientos de todo lo relativo a la
rama de la Estadística Descriptiva, en esta oportunidad se abordarán todos
los temas vinculados con la otra rama, la Estadística Inferencial, que le
permitirá la toma de decisiones en base a conjuntos de datos, convirtiéndose
el conocimiento y correcto manejo de las herramientas de la Inferencia, en
algo fundamental para controlar el desarrollo económico y científico que nos
rige en la actualidad.
Para concluir esta presentación y para

iniciar esta nueva etapa de enseñanza-
aprendizaje les dejamos uno de los
pensamientos de Albert Einstein:
“Nunca consideres el estudio como

una obligación, sino como una
oportunidad para penetrar en el bello y
maravilloso mundo del saber”.
Prof. Carla E. Carrizo Stauffer
Macroobjetivos • Comprender los fundamentos teóricos y prácticos del análisis estadístico

inferencial, con la finalidad de poder seleccionar el procedimiento de
inferencia más adecuado para la toma de decisiones, en el campo laboral y
profesional, en base a conjuntos de datos.
• Aprender y entender los dos procesos básicos de la Inferencia Estadística,
la Estimación y la Prueba de Hipótesis, conocer el alcance de cada uno,
desarrollando las habilidades en la aplicación de uno u otro proceso en
base a las conclusiones para la toma de decisiones en el ámbito en que se
desenvuelve el licenciado en Administración.
• Utilizar la computadora en la aplicación de técnicas estadísticas con el
objeto de adquirir rapidez en el análisis de datos, avanzar hacia técnicas
que requieren un análisis más avanzado, y posibilitar el análisis de grandes
volúmenes de datos.
• Comprender los conceptos teóricos básicos que se utilizan en los modelos
estadísticos para serie de tiempo, a fin de aplicar los mismos en el análisis
y pronosticación de serie de tiempo reales del mundo de los negocios.
• Transferir los conocimientos teóricos y prácticos a situaciones y casos
reales que impliquen la toma de decisión, a partir de la evidencia muestral,
en el campo del Administrador, a los fines de elaborar juicios propios e
independientes.

Programa Módulo I: Teoría de estimación
Estimación puntual. Concepto. Propiedad de los buenos estimadores.

Estimación por intervalos. Concepto. Definición de intervalos de confianza.
Intervalos de confianza para la media, proporción y varianza. Tratamiento
para una muestra y para dos muestras. Determinación del tamaño de la
muestra. Aplicaciones. Estudio de casos.
Módulo II: Prueba de hipótesis
Procedimiento de prueba de hipótesis estadística. Tests de hipótesis para

media, varianza y proporción. Error Tipo I y Tipo II. Tratamiento inferencial
de dos muestras. Muestras independientes y muestras apareadas. Test
de hipótesis para la diferencia de medias, diferencia de proporciones y
cociente de varianzas. Vinculación entre pruebas de hipótesis e intervalos
de confianza. Análisis de varianza con un factor. Prueba F de análisis de
varianza (ANOVA), tabla de análisis de varianza. Supuestos del modelo.
Comparaciones múltiples. Análisis de salidas de computación. Aplicaciones.
Estudio de casos.
Módulo III: Regresión y correlación
Análisis de correlación. Coeficiente. Análisis de regresión. Conceptos. El

modelo de regresión lineal simple. Supuestos del modelo de regresión.
Coeficiente de determinación. Intervalos de confianza y pruebas de hipótesis
para los coeficientes de regresión. Análisis de los residuos. Aplicaciones del
análisis de regresión: predicción y pronosticación. Regresión lineal múltiple.
Interpretación de salidas de computación. Aplicaciones. Estudio de casos.
Serie de tiempo: ¿Qué es una serie temporal? Aplicaciones. Descripción
general del modelo. Componentes de una serie temporal: Tendencia
(T), Fluctuaciones cíclicas (C), Variaciones estacionales (E), Variaciones
irregulares (I). Casos prácticos de aplicación.
Módulo IV: Prueba Ji-Cuadrado
La prueba Ji-cuadrada como un procedimiento de prueba de hipótesis.

Coeficientes que permiten medir el grado de asociación entre las variables.
Pruebas de bondad de ajuste. Pruebas de independencia en tablas de
contingencia. Pruebas de homogeneidad. Análisis de salidas de computación.
Aplicaciones. Estudio de casos.

Mapa conceptual

Agenda
20% 30% 30% 20%

Módulos 1 2 3 4
Semanas
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Módulo 1 Módulo 2 Módulo 3 Módulo 4
Evaluación Evaluación
Parcial 1 Parcial 2
Material
Material Básico
LIND, D., MARCHAL, W. y WATHEN, S.: Estadística Aplicada a los Negocios y

a la Economía. México, Ed. McGraw Hill, 2008.1
Material Complementario
ANDERSON, DAVID R.; SWEENEY, DENNIS J.; WILLIAMS, THOMAS

A.: Estadística para administración y economía. México, Ed. Thomson
Internacional, 2008.
LEVINE, DAVID M.; BERENSON, MARK L.; KREHBIEL, TIMOTHY C.:
Estadística para administración. México, Ed. Pearson, 2006
HANKE – REITSCH. Estadística para negocios. Segunda edición. México,
Ed. Irwin, 1995.
MENDENHALL, WILLIAM; BEAUER, BARBARA M.; BEAUER, ROBERT
J.: Introducción a la probabilidad y estadística. México, Ed. Thomson
Internacional, 2007.
VISAUTA VINACUA, BIENVENIDO. Análisis estadístico con SPSS 14.
Estadística Básica. México, Ed. McGraw Hill, 2007.
1 El texto seleccionado posee un excelente diseño lo cual contribuirá a que el aprendizaje sea
ameno. Bajo ningún punto de vista se deberá fotocopiar el material, no sólo por ser un delito sino porque
estará perdiendo los aportes que un texto en colores le brinda. El libro además posee un CD que le permitirá
ampliar las funciones del Excel, lo cual será fundamental para trabajar con los datos.
Cabe aclarar que este texto es que se le presentó como material básico, en la primera parte de Estadística
que Ud. ya cursó.

Glosario Análisis de correlación: Conjunto de técnicas estadísticas para medir la
fuerza de la relación entre dos variables.
Análisis de regresión: Técnicas que permiten describir la naturaleza de la

relación entre dos variables.
Anova: Técnica para probar de manera simultánea si son iguales las medias
de tres o más poblaciones.
Coeficiente de confianza: Valor de tabla asociado a un nivel de confianza.
Coeficiente de correlación: Medida de la fuerza de asociación entre dos

variables cuantitativas. Su valor queda comprendido entre -1 y +1.
Coeficiente de determinación múltiple: medida del porcentaje de la

variabilidad en y que se puede explicar mediante las variables de predicción.
Coeficiente de determinación simple: Medida del porcentaje de la

variabilidad en y que puede ser explicado con la variable predictora x.
Coeficiente de regresión estimado: Medida del cambio promedio en

la variable dependiente debido a un incremento de una unidad en la
variable predictora relevante, manteniendo constante las otras variables de
predicción.
Consistencia: Propiedad de un buen estimador, se da cuando el estimador

se aproxima al parámetro a medida que el tamaño de la muestra se aproxima
al tamaño de la población.
Diagrama de dispersión: Gráfica de pares de datos en un espacio

bidimensional. Representa de manera visual la relación entre dos variables.
Distribución χ (ji cuadrado): Distribución de probabilidad con las

2
siguientes características: a) Su valor solo puede ser positivo; b) Hay una

familia de distribuciones ji cuadrado, una diferente por cada grado de libertad
distinto; c) Las distribuciones tienen sesgo positivo, pero, a medida que
aumenta el número de grados de libertad, la distribución se aproxima a la
normal.
Eficiencia: Propiedad de un buen estimador, se da cuando un estimador

tiene la varianza mínima en comparación a otro estimador del parámetro.
Error de estimación: Diferencia absoluta entre el estimador y el parámetro.
Error Tipo I: Ocurre cuando se rechaza una hipótesis nula verdadera.
Error Tipo II: Ocurre cuando se acepta una hipótesis nula falsa.
Estadístico de prueba χ : Estadístico con distribución ji-cuadrado que se

2
utiliza para investigar si dos variables cualitativas están relacionadas.

Estadístico: Es función del estimador y depende matemáticamente del
parámetro a estimar, se elige de manera tal que tenga una función de
probabilidad conocida y
tabulada.
Estimación por intervalos: Intervalo donde con cierta probabilidad se

localiza un parámetro en base a la información de la muestra.
Estimación puntual: Valor único calculado a partir de una muestra para

estimar un parámetro poblacional.
Estimador: Estadístico que se usa para estimar un determinado parámetro
Hipótesis Alternativa: Hipótesis de trabajo o de investigación, alternativa a la

hipótesis nula. Se simboliza H1
Hipótesis Nula: Declaración acerca del valor del parámetro poblacional, que
se compara para probar ante la evidencia muestral. Se simboliza con H0
Insesgabilidad: Propiedad de un buen estimador, se da cuando la esperanza

del estimador es igual al parámetro a estimar.
Límites de confianza: Límites de dos valores, máximo y mínimo, dentro de

los cuales se considera que un parámetro de la población está incluído con
cierta confianza
o probabilidad.
Matriz de correlación: Presentación de los coeficientes de correlación para

cada posible par de variables en el análisis.
Método de mínimos cuadrados: Método que determina la ecuación para la

línea recta que minimiza la suma de los cuadrados de las distancias verticales
entre los puntos y la recta.
Modelo estadístico: Un modelo que supone una relación funcional y algún

error aleatorio.
Modelo funcional: Un modelo que supone una relación exacta entre las
variables.
Muestras dependientes: Se caracterizan por una medición, después algún

tipo de intervención, seguida por otra medición. También son dependientes
debido a que el mismo individuo o elemento es un miembro de las dos
muestras.
Muestras independientes: Las muestras elegidas al azar no están relacionadas

entre sí.
Multicolinealidad: Condición que resulta cuando las variables predictoras

tienen una correlación muy alta entre ellas.

Nivel de confianza: Probabilidad estimada de que un parámetro de la
población esté dentro de un intervalo de confianza dado.
Nivel de significación: Probabilidad de rechazar la hipótesis nula cuando es

verdadera. Se simboliza con α
Prueba de bondad de ajuste: Prueba que determina la probabilidad de que

las frecuencias observadas para una variable categórica pudieran haberse
obtenido de una población hipotética.
Prueba de dos colas: Se emplea cuando la hipótesis alternativa no indica una

dirección.
Prueba de hipótesis: Procedimiento de inferencia estadística con base en

evidencia muestral y teoría de probabilidad, para determinar si es razonable la
declaración acerca del parámetro poblacional.
Prueba Ji-cuadrado: Prueba estadística que determina si dos variables

categóricas se relacionan entre sí.
Prueba unilateral: Se emplea cuando la hipótesis alternativa indica una

dirección.
Recta de regresión muestral: Línea recta que mejor se ajusta a un conjunto

de puntos x;y.
Regresión por pasos: Proceso paso a paso para determinar la ecuación de

regresión. Introduce variables en la ecuación de regresión de a una en una,
hasta analizarlas a todas.
Riesgo: Probabilidad de cometer un error mayor que el máximo error

permitido en la estimación
Suficiencia: Propiedad de un buen estimador, se da cuando el estimador usa

toda la información de la muestra con respecto al parámetro a estimar.
Tabla de contingencia: Tabla de doble entrada en la que se relacionan dos

variables categóricas o cualitativas.
Tamaño muestral: Cantidad de elementos a seleccionar en la muestra,

determinado en función del error de muestreo, del nivel de confianza y de la
variabilidad de la población.
Valor crítico: Un valor que es el punto de división entre la región de rechazo y

de no rechazo de la hipótesis nula.
Valor p: La probabilidad de de calcular un valor del estadístico de prueba

por lo menos tan extremo como el que se encuentra en los datos muestrales
cuando la hipótesis nula es verdadera.
Variable dependiente: Variable para predecir o estimar.

Variable ficticia: Variable cualitativa que se usa como predictor.
Variable independiente: Variable que proporciona la base para la

estimación.
Módulos MÓDULO 1
M1 Microobjetivos
• Aprender uno de los procedimientos básicos de la inferencia

estadística, la Estimación, tanto puntual como por intervalos; a fin de poder
usar la información de la muestra de datos recolectados en el campo de la
administración para estimar parámetros poblacionales como la media y la
proporción.
• Conocer y comprender cómo afectan los factores determinantes para

la determinación del tamaño muestral a fin de determinar la cantidad mínima
de casos a ser seleccionados al hacerse el trabajo de campo en el área de
la administración.
M1 Contenidos
Introducción
En esta unidad nos detendremos a estudiar el concepto de estimación de

parámetros. Existen dos maneras de estimar un parámetro:
a) La estimación puntual.
b) La estimación por intervalos.
Ahora bien, antes de continuar, le

aconsejo que retome el concepto
de parámetro y de estadístico ya
visto en la primera parte, en el
cuatrimestre anterior.
Los parámetros poblacionales se estiman utilizando estadísticos muestrales.

Estos estadísticos son funciones de las observaciones muestrales, por lo
tanto son variables aleatorias y tienen sus respectivas distribuciones de
probabilidad. Por ejemplo, el parámetro media poblacional puede estimarse
a través de la media muestral o a partir de otro estadístico que consideremos
adecuado. El estadístico que se utiliza se llama estimador del parámetro.

Profundicemos entonces, en cada una de estas estimaciones:
Estimación puntual
Con los datos provenientes de una muestra se obtiene un único valor que
lo utilizaremos como estimación del parámetro. Sólo a manera de ejemplo,
a continuación se hace mención a algunos de los Parámetros con sus
Estadísticos más utilizados para realizar la estimación:
Parámetro Estadístico
µ
x
P
p
σ S
∑ [X − X ]
2
2 i
s =
n −1
Recordar que la varianza muestral es igual a:
Es importante que de aquí en más usted sepa que, cuando utilicemos

el siguiente
∧ símbolo θ referimos genéricamente un Parámetro; y con el
signo: θ referiremos a un estimador, también genéricamente.
Estimación por intervalos
Con los datos que surgen de una muestra se obtienen dos valores, que
generan un intervalo en el que, en forma probable, se encuentra el valor del
parámetro.
Estimación puntual: Propiedades de los buenos estimadores
Es posible determinar muchos estadísticos para estimar un parámetro

desconocido θ. Por ejemplo se podría utilizar la mediana muestral, o la media
muestral para estimar el valor de la media. Entonces la pregunta que surge
es, ¿Cómo seleccionar un buen estimador?, ¿qué propiedades deberá tener
un buen estimador? A continuación procuraremos ofrecer respuesta a estas
preguntas.
Características de un buen estimador
Un estadístico, para que sea un buen estimador de un parámetro, debe reunir

las siguientes cuatro características o bien la mayoría de ellas.
a) Insesgabilidad
b) Consistencia

c) Eficiencia
d) Suficiencia
A continuación, veremos qué significa cada una de estas características:
∧
• Insesgabilidad: El estimador θ del parámetro θ es insesgado si la
esperanza del estimador es igual al parámetro:
()
E θˆ = θ
∧
Cuando no se cumple con esa igualdad, se dirá que θ será un estimador
sesgado del parámetro θ pudiendo ser el sesgo positivo o negativo.
∧
• Consistencia: El estimador θ del parámetro θ es consistente, si
el estimador se aproxima al parámetro a medida que el tamaño de
la muestra se aproxima al tamaño de la población. En el caso del
estadístico media muestral ( x ) y del parámetro media poblacional
(µ) podemos ver que a medida que n→N, ambas medias tienden
a ser iguales y por consiguiente la media muestral es un estimador
consistente de µ.
• Eficiencia: varianza mínima. Si consideramos al estimador que tenga

varianza mínima, éste puede emplearse para medir la eficiencia y el
estimador de varianza mínima es un estimador eficiente. Cuando existen
varios estimadores de un mismo parámetro ∧ , ∧ ..., ∧ se denomina
θ1 θ 2 θ j
estimador de varianza mínima si:
( ) ()
V θˆ j < V θˆi
(Recuerde que la varianza también se simboliza con V mayúscula).
Suficiencia: Un estimador es suficiente, para un parámetro θ, cuando

utiliza toda la información contenida en la muestra aleatoria con
respecto a θ. Cabe aclarar que de todos los estimadores posibles que
se pueden usar para estimar la media poblacional, la media muestral
es la que reúne todas las propiedades de un buen estimador, es decir
es insesgado, eficiente, consistente y suficiente. De allí que, en los
procedimientos de estimación, se utilice la x como estimador de la µ.
Cabe aclarar que de todos los estimadores posibles que se pueden usar
para estimar la media poblacional, la media muestral es la que reúne todas
las propiedades de un buen estimador, es decir es insesgado, eficiente,
consistente y suficiente. De allí que, en los procedimientos de estimación,
se utilice la x como estimador de la µ.

Estimación por intervalos
Recordemos que la estimación por intervalos consiste en encontrar dos

puntos procedentes de los datos de una muestra, los cuales generan un
intervalo aleatorio; que confiaremos (con una determinada probabilidad)
contenga al parámetro que queremos estimar. Se puede expresar lo anterior
de la siguiente manera:
{ 
(
P − k1 〈 k θ ; θ 〈 k2 = 1 − α) }
Donde:
 
k θ ; θ  
  : Es un estadístico que es función de θ que es una variable
aleatoria y depende matemáticamente del parámetro θ. Este estadístico
se elige de manera tal que tenga una función de probabilidad conocida y
tabulada.
1 − α : Es la probabilidad de que un intervalo contenga al parámetro

estimado. Si lo expresamos en porcentaje lo denominamos nivel de
confianza.
k: se denomina coeficiente de confianza, es un valor de tabla asociado con

el nivel de confianza.
Intervalo de confianza cuando el estimador tiene distribución normal o

asintóticamente normal

Sea θ un estimador insesgado de θ, que se distribuye Normal, con media
igual al parámetro θ y con desviación estándar igual a σ θ .
 
k θ ; θ 
El estadístico con   distribución conocida y tabulada que se
utilizaría es una Z, normal (0;1); entonces:
θˆ − θ
k (θˆ;θ ) = = Z ∼ N (0,1)
σ θˆ
La expresión anterior se multiplica por -1
{
P − Z ≤ k (θˆ;θ ) ≤ Z } = 1 − α
{
P − Zσ θˆ ≤ θˆ − θ ≤ Zσ θˆ } = 1 − α
{ }
P − Zσθˆ − θˆ ≤ −θ ≤ Zσθˆ − θˆ = 1 − α
P{Zσ θˆ + θˆ ≥ θ ≥ −Zσ θˆ + θˆ } = 1 − α

Finalmente la expresión del intervalo queda:
{ }
P θˆ − Zσ θˆ ≤ θ ≤ θˆ + Zσ θˆ = 1 − α
-Z y Z surgen de la tabla de la distribución normal en función de la probabilidad

conocida 1 - α.
Intervalo de confianza para estimar µ

Para estimar un parámetro es frecuente utilizar el estadístico análogo;
así para estimar la media poblacional se utiliza generalmente la media
muestral.
Cuando la población es normal (µ;σ) la x ~N (µ; σ/ √n); lo mismo sucede
con poblaciones no normales con n grande ( n ≥ 30 ). Esto Ud. lo vió en el
cuatrimestre anterior en el módulo 7.
De manera similar a como se trabajó cuando se presentó el intervalo de

confianza para el parámetro θ, ahora planteamos el intervalo para cuando
la media poblacional es el parámetro a estimar. La fórmula queda planteada
de la siguiente manera:
 x−µ 
P − Z ≤ ≤ Z = 1−α
 σ/ n 
 σ σ 
P − Z − x ≤ −µ ≤ Z − x = 1−α
 n n 
 σ σ 
Px − Z ≤µ ≤ x+Z  = 1−α
 n n
La amplitud del intervalo dependerá de:
- el nivel de confianza: 1 - α
- la varianza poblacional: σ x
- el tamaño muestral: n
Cuando las varianzas poblacionales se desconocen y las muestras son

grandes; el estadístico que se utiliza será:
x−µ
k (x, µ ) =
σ/ n
Y los límites del intervalo de confianza serán:

σ
Li = x − Z
n
σ
Ls = x + Z
n

Varianza poblacional desconocida, población normal, muestra pequeña
Cuando se hace la estimación de la media poblacional partiendo de una

población con distribución Normal -pero de la varianza poblacional es
desconocida- si la muestra es pequeña, el estadístico:
x−µ
k ( x, µ) =
s/ n
tiene una distribución t de Student con n-1 grados de libertad.
Por lo tanto en la estimación por intervalos se utilizarán los valores de los

coeficientes de confianza (k) de la tabla de la distribución t de Student.
Error, riesgo y tamaño de la muestra
Para definir estos tres conceptos se partirá en todos los casos del estadístico
Z. Se deberá recordar que:
x−µ
Z=
σ/ n
Veamos de qué se trata cada concepto.
 Error de la estimación: Es la diferencia absoluta entre el estimador y el

parámetro simbolizándolo habitualmente con e.
e= x−µ
σ
e=Z
n
 Riesgo: Es la probabilidad de cometer un error mayor que el máximo

error permitido en la estimación y lo simbolizaremos con la letra griega α
 Tamaño de la muestra: Es la cantidad mínima de unidades a seleccionar.
Si el parámetro a estimar es la media poblacional, la fórmula para determinar

la cantidad de unidades es la siguiente:
Z 2σ 2
n=
e2
Si se trabaja con poblaciones finitas sin reemplazo, la fórmula anterior se
convierte en el primer paso y la cantidad definitiva se determina considerando
el tamaño de la población de la siguiente manera:

n0 N
n=
[( N − 1) + n0 ]
Intervalo de confianza para estimar P
Muchas veces las decisiones dependen de parámetros binarios, recordemos

que son aquellos que sólo aceptan dos categorías, en este caso el parámetro
que interesa es la Proporción Poblacional. Ejemplo: una empresa quiere
saber qué proporción de clientes pagan al contado y que proporción con
tarjetas de crédito. El estadístico a utilizar será:
p− p
Z= ∼ N (0,1)
p.q
n
Un procedimiento similar al aplicado para la media se emplea para la

proporción y el intervalo obtenido será el siguiente:
p.q
Li : p − Z
n
p.q
Ls : p + Z
n
Tamaño de muestra para la proporción
Cuando el parámetro a estimar es la proporción poblacional, la determinación

del tamaño muestral se realiza mediante la siguiente fórmula:
Z 2 p.q
n=
e2
Al igual que en el caso anterior (media poblacional), si se conoce el tamaño
de la población, la fórmula anterior se convierte en el primer paso y la cantidad
definitiva se llega con la fórmula que sigue:
n0 N
n=
[( N − 1) + n0 ]
Hemos llegado al final del desarrollo teórico de este primer módulo. Le
aconsejo que para facilitar el estudio de los conceptos presentados realice
los ejercicios y las actividades de autoevaluación que proporciona el libro
de texto.

M1 Actividades
Actividad 1
Se va consolidando más en su trabajo
Ha comenzado un nuevo semestre, Ud.

continúa trabajando en la consultora
y está muy conforme por ello. A
medida que los meses pasaron, Ud.
se consolidó en el puesto de trabajo:
sus superiores le confían tareas más
complejas, que para Ud. son un desafío
permanente en el que pone en juego su
capacidad y los conocimientos que día
a día le proporciona la carrera que está
cursando. A lo largo de este tiempo ha
podido apreciar lo valioso que es contar
con los conocimientos y herramientas
que la disciplina Estadística le ofrece.
Hoy Ud. está regresando de un breve viaje al interior de la provincia, más

precisamente viene de visitar una de las sucursales que una de las empresas
clientes de la consultora, posee allí. Ud. ya ha estado al tanto de los problemas
de esta sucursal; es más, le recuerdo que en la actividad 6 del módulo 6 de la
materia anterior (la primera parte de Estadística) tuvo que resolver una situación
conflictiva aportando la explicación adecuada con el soporte estadístico para la
inquietud de uno de los socios de la firma Technology.com SRL.
A continuación le transcribo lo que decía en el encabezado la actividad que le

menciono:
“La empresa Technology.com SRL sigue con algunos

problemas. El gerente financiero le ha comentado su
preocupación ante el retroceso que han sufrido los ingresos
de la empresa en los últimos meses. Uno de los socios ha
encontrado que los ingresos mensuales medios de las
distintas sucursales en los últimos seis meses son de 90 mil
pesos, con una variabilidad de 25 mil pesos”.
Bien, en esta oportunidad, los directivos de la empresa tomaron una muestra

en los 64 días seleccionados aleatoriamente en los 10 meses pasados, en la
sucursal del interior de la provincia que es la que está con problemas a ojos vista
de los directivos. La muestra arrojó un promedio de ventas de la sucursal de 75
mil pesos. Justamente Ud. viajó a dicha sucursal para traer dicha información.
Hoy su superior le encarga que, con la información sobre las ventas promedios
de la sucursal de la empresa, prepare un informe breve por escrito para los
directivos de la misma, donde puedan estimar las ventas de la sucursal con una
confianza del 95%.
Por supuesto que Ud. se encuentra en condiciones de resolver el tema. Prende

su computadora, busca el material de estudio y se pone de inmediato con lo
solicitado. Presentará un informe escrito.
CC AA
CC Actividad 1
clave de corrección
El intervalo de confianza para la media (µ) será:
Reemplazando en la fórmula por los valores correspondientes:
Los límites del IC serán:
Li = $68.875
Ls = $81.125
Entonces, con una confianza del 95% se puede estimar que el verdadero
promedio de ventas de la sucursal está comprendido entre los $68.875 y los
$81.125
El error de estimación asciende a $6.125
AA Actividad 1
asistente académico
Para resolver esta tarea se le recomienda revise todo lo relativo a estimación

por intervalos para la media, tanto de los contenidos del módulo como de la
bibliografía del material básico, capítulo 9.
Recuerde que la estructura de todo intervalo de confianza es:
Entonces el estimador a usar en la fórmula será x ó p , según el parámetro

a estimar.
El error de estimación se conforma del producto del valor del estadístico,

que queda determinado por el nivel de confianza, por el error estándar
del estimador. Cabe señalar que si se tiene información del tamaño de la
población deberá corregir el error estándar de la media, usando el factor de
corrección de población finita, ¿lo recuerda?, es:
N −n
N −1
Le recomiendo que revise lo visto en el último módulo de la materia anterior,
cuando se trabajó con distribución en el muestreo de la media y de la
proporción.
Actividad 2
Continúa dando respuestas para la sucursal
Los directivos de la empresa Technology.com SRL quedaron muy conformes

con la estimación de las ventas promedio de la sucursal del interior de
provincia.
Ahora, como ellos entienden que dicha

sucursal se aleja bastante de las expectativas
que tienen, el gerente financiero de la firma
recibió hace poco el informe de los medios
de pago utilizados por los clientes, entre otros
datos de la sucursal, y le llama la atención la
baja proporción de clientes de la misma que
utilizan el pago de contado para los productos,
siendo que la empresa está incentivando
las compras de contado con interesantes
campañas de promoción, y más aún revisando
el comportamiento que presentan el resto de
las sucursales y la casa central, en las que las
ventas de contado se vieron incrementadas a
raíz de las cautivantes promociones.
Nuevamente lo convocan a Ud. para que le proporcione una respuesta con

fundamento estadístico.
El dato que le suministran desde la sucursal es una proporción del 15% de

clientes que compran de contado. Como al gerente financiero le interesó
mucho el cálculo del intervalo de confianza que Ud. hizo para las ventas
promedios de la sucursal observada, ahora le solicitan si es posible hacer
el mismo tipo de análisis para una estimación de la proporción de clientes
que compran de contado en dicha sucursal, aunque le gustaría elevar el
nivel de confianza de dicha estimación. Además, le solicita que le indique el
error de estimación con el que se trabajaría. Considera que con esta nueva
estimación se encontrará en condiciones fundamentadas para llevar a cabo
una auditoría a dicha sucursal.
Bien, a esta altura, ¡le resulta muy sencillo el pedido! Sin más, se pone a
trabajar en el asunto para elaborar el informe por escrito.
Desde aquí le deseo mucha suerte.
CC AA

CC Actividad 2
El intervalo de confianza para la Proporción Poblacional será:
Reemplazando en la fórmula por los valores correspondientes:
Los límites del IC serán:
Li = 0,145
Ls = 0,155
Entonces, con una confianza del 99% se puede estimar que la verdadera
proporción de ventas de contado de la sucursal está comprendida entre el 14,5%
y el 15,5%
El error de estimación asciende al 0,5%
Le sugiero que con la estimación por intervalos de la media y de la proporción

elabore un informe completo para la sucursal ya que de seguro le será de gran
utilidad al gerente financiero para la toma de decisiones.
AA Actividad 2
Todo lo recomendado en el Asistente Académico de la actividad 1 de este

módulo es válido para esta actividad también, ya que se trata de hacer
una estimación por intervalos, en esta oportunidad es para otro parámetro
diferente al de la actividad 1. Preste atención.
En este caso si bien no se explicita el tamaño de la muestra, para resolver

se sugiere que tome como tamaño muestral a los 64 días que fueron
seleccionados en el estudio, puesto que es la información que Ud. trajo de
su viaje a la sucursal, la misma se corresponde a ese período.
Como el gerente le pidió trabajar con una mayor confianza, entonces le

sugiero trabajar con un nivel del 99%, recuerde que esta probabilidad es la
que determina el valor del estadístico.
Le recomiendo, también, que resuelva los ejercicios y las autoevaluaciones

del capítulo 9 de la bibliografía básica, le será de mucha ayuda.

Actividad 3
¿Cuántos casos corresponde muestrear?
A la consultora en la que Ud. trabaja le

ha llegado una consulta de una ONG
que pretende publicar un artículo en
relación a una ley que proteja el medio
ambiente. Para ello, la organización
está investigando y llega a la consultora
trayendo como información previa una
encuesta de opinión pública efectuada a
400 personas de la ciudad, de las cuales
280 se pronunciaron a favor de una ley
protectora del medio ambiente.
Hoy lo desafectan a Ud. del cliente Techonology.com SRL y le solicitan una

ayuda para dar respuesta a la consulta de la ONG. ¿Cuál será su tarea en
este caso? Las necesidades de la organización son las siguientes, según
manifestación del consultante:
“Necesitamos tener un valor que nos sirva como

estimador de la proporción de gente que en la ciudad
está de acuerdo con una ley de este tipo, ¿nos sirve
esta encuesta de opinión realizada hace dos años
sobre el tema? Por otro lado desde la organización
hay intención de realizar nuevamente una encuesta
de este tipo, en dicho caso ¿cuál debería ser el
tamaño de muestra necesario para cumplir el
objetivo? ¿Cambia en algo el hecho que se conozca
el tamaño de la población de la ciudad en la que se
realizará el trabajo?
El jefe del departamento de estadísticas de la consultora lo convoca a Ud.

para que responda por escrito la consulta de la ONG. Ud. siente que es
una buena oportunidad para demostrar a sus superiores lo que conoce de
determinación de muestra y de estimación, así se enfrenta a este nuevo
desafío.
CC AA
CC Actividad 3
El parámetro a estimar en este caso es (p) la proporción poblacional de

personas que apoyan una ley de protección del medio ambiente.
El estimador de dicho parámetro será la proporción muestral ( p )
Determinación del tamaño muestral.

Dado que en una investigación similar, mediante una encuesta de opinión
se preguntó sobre el tema que ahora ocupa, y habiendo consultado a la
organización sobre este punto, se toma como referente el valor de la
proporción como antecedente, es decir 280
p= = 0,7070
400
Se le recuerda que si no se conoce el valor del parámetro o bien no se posee
un valor que se pueda tomar como referencia, el valor que se considera en
050
la fórmula es de p = 0,5
Entonces el cálculo queda de la siguiente manera:
n ≥ 323
Por lo tanto como mínimo se deberá encuestar a 323 personas de la ciudad.
Si se conoce el tamaño de la población (N) se lo deberá tener en cuenta

haciéndolo jugar en la fórmula, ya que redundará en un tamaño de muestra
menor.
Ya está en condiciones con estos resultados de preparar el informe que

elevará al jefe del departamento de Estadísticas de la consultora y que servirá
de punto de partida para dar comienzo a la tarea con el nuevo cliente que
llegó a la consultora.
AA Actividad 3
Como primer punto para comenzar a resolver, deberá identificar cuál es el

parámetro a estimar y cuál es el estimador apropiado.
Teniendo en cuenta el parámetro que se desea estimar con la investigación,
será la fórmula de cálculo a aplicar para la determinación del tamaño de
muestra. Le recomiendo que revise los contenidos de este módulo.
Recuerde que los factores que influyen en el tamaño de la muestra son:
- El nivel de confianza (1 − α )
- El error tolerable máximo (e)
- La variabilidad de la población (σ ) ó ( p ∗ q )
2
Tener presente que la organización pretende un error máximo del 5%.

Como no se precisó el nivel de confianza, es costumbre trabajar por convención
con un nivel del 95%. Aunque cabe aclarar que es Ud. que propondrá el
nivel de confianza con el que se trabajará al cliente de la consultora. Tenga
presente que el nivel de confianza es el que determina el valor de Z (valor que
surge de la tabla de la Normal estandarizada).

Por otro lado recuerde que si se conoce o se puede estimar el tamaño de
la población, siempre será de utilidad ya que reducirá el tamaño de muestra
mínima necesaria.
Si bien en este caso no se indica el tamaño poblacional, usted pruebe

aplicando la fórmula vista en este módulo para determinar el tamaño de la
muestra para cuando se conoce N (para ello haga una estimación de un
tamaño poblacional para este caso).
Actividad 4
Ejercitando un poco más…
1. En una semana determinada se elige al azar una muestra de 300

empleados de un número muy grande de ellos que trabajan en una empresa
manufacturera. Los trabajadores realizan una labor a destajo y se encuentra
que el promedio de pago por pieza trabajada es de $18, con un error
estándar muestral de $1,4. Estime el pago promedio a destajo para todos los
empleados de la empresa que permita tener una confianza del 95% de que
ese intervalo incluya el valor de la media poblacional. AA
2. Suponga que se desea estimar el promedio de ventas por tienda para un

producto determinado de consumo popular durante el año anterior. Determine
el intervalo de confianza del 95%, considerando que las ventas se distribuyen
en forma normal siendo la media muestral de u$s 3.425, conociéndose la
desviación estándar poblacional de u$s 200 y n = 25.
3. Para el problema anterior determine el intervalo de confianza del 95%

suponiendo que la población no tiene una distribución normal, siendo los
datos muestrales: x = u$s 3.425 y s = u$s 200; el tamaño muestral es de 50.
4. Como supervisor del proceso de empacado de café en sobres, usted

toma una muestra aleatoria de 12 de los sobres en la planta empacadora
a los fines de corroborar la cantidad de café que se almacena por sobre. El
peso neto de los sobres de café se presenta en la siguiente tabla.
Gramos por sobre Cantidad de sobres

15.7 1
15.8 2
15.9 2
16.0 3
16.1 3
16.2 1
a) Determine el peso neto promedio del café que se empaca en cada sobre.
b) Determine el error estándar muestral.
c) Suponiendo que el peso del café empacado tiene distribución normal,

estime el peso promedio por sobre de café utilizando un intervalo de
confianza del 95%

5. Un analista de investigación de mercados recopila datos de una muestra
aleatoria de100 clientes, de un conjunto de 400 clientes que adquirieron un
“cupón especial”. Las 100 personas gastaron un promedio de $24,57 en la
tienda, con un error estándar de $ 6,6.
Utilizando un intervalo de confianza del 95%, estime:
a) El monto promedio de las compras para los 400 clientes.
b) El monto total en pesos para las compras realizadas por los 400 clientes.
6. Un analista de un departamento de personal elige al azar los expedientes

de 16 trabajadores a destajo y encuentra que el salario promedio por pieza es
de $95. Se supone que los salarios de esa empresa tienen una distribución
normal. Si se sabe que la desviación estándar de los salarios es de $10,
estime la tasa promedio de salarios en la empresa utilizando un intervalo de
confianza de 90%.
7. Se sabe por registros históricos que la desviación estándar del nivel

de ventas por tienda de un producto de consumo popular es de $200 y se
supone que la población de la totalidad de las ventas por tienda tiene una
distribución normal. ¿Cuál es el tamaño mínimo de muestra que se requiere
para estimar el promedio de ventas por tienda con un margen de error de
$100 y con una confianza del 95%?
8. Un analista desea estimar el salario diario promedio de los trabajadores de

una compañía determinada, con un margen de error de $25 y una confianza
del 90%. Se estima que la desviación estándar de los salarios no es mayor
de $100. ¿Cuál es el número de expedientes que deben muestrearse, como
mínimo, para satisfacer este objetivo de investigación?
9. En una ciudad grande donde existen 800 estaciones de servicio, para una
muestra aleatoria de 36 estaciones de servicio, 20 de ellas venden una marca
determinada de aceite. Utilizando un intervalo de confianza del 95% estime:
a) La proporción de todas las estaciones de servicio del área que venden esa
marca de aceite.
b) El número total de estaciones de servicio del área donde se vende el aceite.
10. Para una muestra aleatoria de 100 hogares de una gran ciudad, el número
de hogares en los que cuando menos un adulto está en esos momentos
desempleado es 12. Estime el porcentaje de hogares de esa ciudad en
los que al menos un adulto esté desempleado, utilizando un intervalo de
confianza del 95%.
11. Un pequeño fabricante adquiere un lote de 200 partes electrónicas del

“exceso de inventario” de una empresa. Se encuentra que para una muestra
aleatoria de 50 de las refacciones, 5 de ellas tienen defectos. Estime la
proporción de todas las partes del embarque que tienen defectos utilizando
un intervalo de confianza del 95%.
AA Actividad 4
En este caso tiene que realizar una estimación por intervalos.
MÓDULO 2
M2 Microobjetivos
• Comprender el otro gran procedimiento de la inferencia estadística, las

pruebas de hipótesis, para realizar los test sobre parámetros poblacionales
de interés (media y proporción) en la ciencia de la administración,
trabajando con una y con dos poblaciones.
• Distinguir las situaciones de muestras independientes y de muestras
apareadas para hacer hipótesis sobre la diferencia de medias en
situaciones de toma de decisión en el campo de la administración.
• Comprender la mecánica del Análisis de Varianza para contrastar la
hipótesis de igualdad de medias de más de dos poblaciones y poder
aplicar el método en situaciones de la administración en donde se trabaje
con más de dos muestras.
M2 Contenidos
Prueba de hipótesis
Introducción
Pueden presentarse en la
práctica, situaciones en las
que exista una sospecha
relativa a la característica de la
población sometida a estudio.
La Prueba de Hipótesis
implica, en cualquier
investigación, la existencia de
dos teorías o hipótesis
implícitas, que denominaremos
hipótesis nula e hipótesis
alternativa, que de alguna
manera reflejarán esa idea a
priori que tenemos y que pretendemos contrastar con la “realidad”. De la
misma manera aparecen, implícitamente, diferentes tipos de errores que
podemos cometer durante el procedimiento. No podemos olvidar que,
habitualmente el estudio y las conclusiones que obtengamos para una
población cualquiera, se habrán apoyado exclusivamente en el análisis de
sólo una parte de ésta. De la probabilidad con la que estemos dispuestos a
asumir estos errores, dependerá, por ejemplo, el tamaño de la muestra

requerida. Desarrollamos en este capítulo los contrastes de hipótesis para
los parámetros más usuales que venimos estudiando en el capítulo anterior:
medias, varianzas y proporciones, para una o dos poblaciones.
Las pruebas de hipótesis se realizan:
a) Suponiendo a priori que la ley de distribución de la población es conocida.

b) Se extrae una muestra aleatoria de dicha población.
c) Si la distribución de la muestra es “diferente” de la distribución de
probabilidad que hemos asignado a priori a la población, concluimos que
probablemente sea errónea la suposición inicial.
Veamos un ejemplo. Supongamos que debemos realizar un estudio sobre

la altura media de los habitantes de cierta ciudad de Argentina. Antes de
tomar una muestra, lo lógico es hacer la siguiente suposición a priori, (que
en realidad es la hipótesis que se desea poner a prueba, o la Hipótesis Nula
y que denotamos H0):
H0: La altura media no difiere de la del resto del país.
Al seleccionar una muestra de habitantes de la ciudad en cuestión - de

tamaño n=8 - podríamos encontrarnos ante uno de los siguientes casos (a
ó b) de datos sobre la estatura expresada en metros de los sujetos incluidos
en la muestra:
a) Muestra = {1,50; 1,52; 1,48; 1,55; 1,60; 1,49; 1,55; 1,63}

b) Muestra = {1,65; 1,80; 1,73; 1,52; 1,75; 1,65; 1,75; 1,78}
Intuitivamente, en el caso a) sería lógico suponer que, salvo que la muestra

obtenida sobre los habitantes sea muy poco representativa, la hipótesis H0
debe ser rechazada.
En el caso b) tal vez no podamos afirmar con rotundidad que la hipótesis H0
sea cierta, sin embargo, no podríamos descartarla y la admitimos por una
cuestión de simplicidad.
Este ejemplo sirve como introducción de los siguientes conceptos:
En una prueba de hipótesis (también denominada test de hipótesis) se

decide si cierta hipótesis H0 que denominamos Hipótesis Nula puede ser
rechazada o no a la vista de los datos suministrados por una muestra de la
población.
Para realizar el contraste es necesario establecer previamente una Hipótesis
Alternativa (H1) que será admitida cuando H0 sea rechazada.
Estimación versus prueba de hipótesis
En el módulo 1 habíamos planteado que los dos grandes procedimientos
de la estadística inferencial eran la estimación y la prueba de hipótesis, el
siguiente esquema presenta de manera resumen comparativo estos dos
procesos.
Estadística Inferencial
ESTIMACIÓN PRUEBA DE HIPÓTESIS
Utiliza la evidencia muestral Utiliza la evidencia muestral para evaluar

para ESTIMAR un PARÁMETRO la probabilidad de que una SOSPECHA
DESCONOCIDO de la población. sobre un parámetro de una población
sea cierta.
Pasos para probar una hipótesis

A los efectos de probar una hipótesis se siguen los siguientes cinco pasos:
Paso 1: Planteamos la Hipótesis Nula y Alternativa
• Hipótesis Nula (H0): Es una afirmación o enunciado tentativo sobre el

valor de un parámetro.
• Hipótesis Alternativa (H1): Se establece como opuesta a la H0 y

representa la conclusión que se apoya si la H0 se rechaza.

Paso 2: Seleccionar un nivel de significación
El riesgo que se asume acerca de rechazar la H0, cuando en realidad debe

aceptarse por ser verdadera. Se identifica como α
Paso 3: Identificar el valor estadístico de prueba
Valor que se obtiene a partir de la información muestral, utilizado para

rechazar o no rechazar la H0.
En resumen este valor estadístico se trata de:
• Una Variable Aleatoria.

• Que es función de los datos de la muestra.
• Tiene distribución conocida.
• Incluye en su fórmula el parámetro.
Paso 4: Establecer regla de decisión
La regla de decisión establece las condiciones bajo las que se acepta o

rechaza la H0. El valor que separa la región de rechazo y no rechazo se llama
Valor Crítico.
Paso 5: Decidir
Por último, se decide

• Rechazar la H0
• No Rechazar la H0
¿Por qué decimos RECHAZAR o NO RECHAZAR la H0 y no decimos

RECHAZAR o ACEPTAR?
Decimos rechazar o no rechazar la H0 ya que ésta es la hipótesis que se

pone a prueba.
Veamos esto gráficamente.
H0 : el aula está vacía.

H1 : el aula no está vacía.
a)
b)

Puntos claves en la prueba de hipótesis
Al momento de realizar la prueba de hipótesis,

• La H0 establece que la diferencia entre el estadístico muestral y el
parámetro poblacional hipotético se debe a la variación aleatoria del
muestreo.
• La H0 siempre se refiere a un valor específico del parámetro
poblacional, nunca al estadístico muestral.
• La H0 siempre contiene el signo igual respecto al valor especificado
del parámetro.
• La H1 nunca contiene el signo igual respecto al valor especificado de
parámetro de la población.
Tipos de error: Error Tipo I y Error Tipo II

Al probar una hipótesis se debe tener presente que la decisión que se tome
puede conducir a la conclusión incorrecta, pudiendo cometer dos tipos de
errores; aquél que surge de rechazar la hipótesis nula cuando es cierta y no
se debería rechazar o bien, en no rechazar la hipótesis nula cuando es falsa
y se debería rechazar. Estos errores se denominan error tipo I y error tipo II
respectivamente.
Error de Tipo I:
Es el error que consiste en rechazar H0 cuando es cierta. La probabilidad
de cometer este error es lo que anteriormente hemos denominado nivel de
significación. Es una costumbre establecida el denotarlo siempre con la letra α
Error de Tipo II:

Es el error que consiste en no rechazar H0 cuando es falsa. La probabilidad
de cometer este error la denotamos con la letra β

Prueba de hipótesis para la media
En este apartado nos detendremos en las dos situaciones que se pueden

dar en la prueba de hipótesis, las que presentamos seguidamente.
Prueba de dos colas con varianza conocida

Suponemos que:
donde σ es conocido y queremos contrastar si es posible que µ

2
(desconocida) sea en realidad cierto valor (µ 0 ). Esto es un supuesto teórico

que nunca se dará en la realidad pero servirá para introducir la teoría sobre
contrastes. La prueba se escribe entonces como:
1.- Planteo de las hipótesis:
Como hemos mencionado anteriormente, la técnica para hacer el contraste

consiste en suponer que H0 es cierta.
2.- Establecer el nivel de significancia α
3.- Identificar el estadístico de prueba
Para poder acceder a las probabilidades de la Normal, hemos tipificado (ya

que los valores para hacer la tipificación son conocidos). Si H0 es cierta,
entonces esperamos que el valor z obtenido sobre la muestra esté cercano
a cero con una gran probabilidad. Esto se expresa fijando un nivel de
significación α y tomando como región crítica C a los valores que son muy
extremados y con probabilidad α en total,

4.- Regla de Decisión y toma de Decisión
La región de rechazo de la hipótesis nula es la sombreada.

Se rechaza H0 cuando el estadístico z cae en la zona de rechazo.
Prueba de una cola con varianza conocida
a) Lateral Izquierda:
b) Lateral Derecha:
Las regiones de aceptación y rechazo para la prueba unilateral serán:

Prueba de hipótesis para media con varianza desconocida
El procedimiento es similar al desarrollado en el punto 2.1 y 2.2 con las
salvedades que el tema merece.
1. El planteo se realiza tal lo desarrollado más arriba.

2. Se debe decidir el nivel de significancia
3. Establecer el estadístico de prueba:
X −µ
t=
s/ n
En donde t se distribuirá con una distribución t de Student con n-1 grados

de libertad.
4. Establecer los valores críticos, (que surgirán de la tabla de la t de Student)

fijando la región de rechazo y de no rechazo de la H0
5. Tomar la decisión.
Prueba de hipótesis para la Proporción
Supongamos que poseemos una sucesión de observaciones independientes,

de modo que cada una de ellas se comporta como una distribución de
Bipuntual de parámetro p:
La variable aleatoria X definida como el número de éxitos obtenidos en una

muestra de tamaño n es, por definición una variable aleatoria de distribución
binomial:
La proporción muestral (estimador del verdadero parámetro p a partir de la
muestra) es:
X
p=
n
Nos interesamos por la prueba de hipótesis:
frente a otras hipótesis alternativas.
Para ello nos basamos en un estadístico de prueba que ya fue considerado

anteriormente en la construcción de intervalos de confianza para proporciones
y que sigue una distribución aproximadamente normal para tamaños
muestrales suficientemente grandes:
X pq
p= ≈ N ( p, )
n n
Si la hipótesis H0 es cierta se tiene:
X p q p − p0
p= ≈ N ( p0 ; 0 0 ) ⇔ = Z ≈ N (0,1)
n n p0 q0
n
Prueba de hipótesis para la proporción bilateral o de dos colas
Las hipótesis son:
Extraemos una muestra y observamos el valor que asume la proporción

muestral.
X
p=
n
Entonces se define:
p − p0
Z=
p0 q0
n
Siendo el criterio de aceptación o rechazo de la hipótesis nula el que refleja

la siguiente figura.
Prueba bilateral de una proporción
Pruebas de hipótesis unilaterales

Consideremos un contraste del tipo lateral izquierda:

El gráfico expresa el criterio de aceptación o rechazo a seguir:
Para la prueba unilateral contraria, el planteo de las hipótesis siguen la

expresión:
Método del Valor P
El valor P asociado a un resultado observado es la probabilidad de

obtener un valor como el observado o más extremo si la hipótesis nula es
cierta. Las calculadoras modernas con funciones estadísticas avanzadas
y los programas estadísticos proporcionan el valor P para facilitar la
interpretación de los resultados a la hora de realizar inferencia.

Interpretación del valor P
Se rechaza la hipótesis nula si el valor P asociado al resultado observado es
igual o menor que el nivel de significación establecido, convencionalmente
los valores de α utilizados en las pruebas de hipótesis son: 0,05 ó 0,01.
Resumiendo:
· Si el valor p < α se Rechaza la H0

· Si el valor p ≥ α no se Rechaza la H0
Prueba de hipótesis sobre la diferencia entre medias de dos

poblaciones
Respecto a la prueba de hipótesis a continuación brindaremos los pasos

que se deben seguir.
a) Si:
 Se trabaja con muestras grandes y

 Las observaciones de las dos muestras son independientes
Se utiliza la distribución Normal
b) Si:
 Las muestras son pequeñas.

 Las observaciones de las dos muestras son independientes.
 Las dos poblaciones son aproximadamente Normales.
 Las dos poblaciones tienen varianzas iguales.
Se utiliza la distribución t de Student

Veamos un ejemplo. Un psicólogo industrial desea estudiar los efectos de
la motivación en las ventas de cierta empresa. De 24 vendedores nuevos,
12 reciben un salario por hora y 12 reciben comisión (se seleccionan al azar
vendedores de cada uno de estos grupo). Se desea analizar si hay evidencia
para decir que las ventas por comisiones producen un volumen de ventas
mayor.
En el ejemplo:
1.- Se puede observar que se trabaja con muestras pequeñas.
2.- Las observaciones de las dos muestras son independientes
3.- ¿Las dos poblaciones son aproximadamente normales?
Los datos de los montos de ventas en las dos muestras se procesaron

estadísticamente y los resultados se presentan a continuación.
Columna 1 (grupo que recibe Columna 1 (grupo que recibe

salario) comisión)
Media 227,58 Media 247,92

Error típico 3,995 Error típico 6,232
Mediana 226,5 Mediana 241
Desviación estándar 13,84 Desviación estándar 21,59
Varianza de la muestra 191,54 Varianza de la muestra 466,08
Curtosis 0,131 Curtosis -1,198
Coeficiente de 0,518 Coeficiente de asimetría 0,566
asimetría
Rango 49 Rango 61
Mínimo 207 Mínimo 224
Máximo 256 Máximo 285
Suma 2731 Suma 2975
n 12 n 12
4.- ¿Las dos poblaciones tienen varianzas iguales?
Prueba F para varianzas de dos muestras
Variable 1 Variable 2
Media 227,58 247,92
Varianza 191,54 466,08
Observaciones 12 12
Grados de libertad 11 11
F 0,410952
P(F<=f) una cola 0,07789187
Valor crítico para F 0,35486991
(una cola)

Como el valor p es mayor al nivel de significación (α =0,05), entonces no se
rechaza la H0 de igualdad de las varianzas.
5.- Prueba para la diferencia de medias
Prueba t para dos muestras suponiendo varianzas iguales
Media 227,58 247,92
Varianza 191,54 466,08
Observaciones 12 12
Varianza agrupada 328,81
Diferencia hipotética de las medias 0
Grados de libertad 22
Estadístico t -2,747
P(T<=t) una cola 0,0059
Valor crítico de t (una cola) 1,71714419
P(T<=t) dos colas 0,01177384
Valor crítico de t (dos colas) 2,07387529
Dado que el valor p es menor a α, se rechaza la H0 de igualdad de las medias;

por lo tanto hay evidencia muestral suficiente para concluir que el promedio
de ventas es diferente entre los dos grupos de vendedores.
c) Si:
 Las muestras están relacionadas (apareadas),

 se supone que la población se distribuye normal,
 o bien, la población no es muy pequeña y no tiene un sesgo grande:
Se utiliza la distribución t de Student
Veamos un ejemplo. Al fin de medir el efecto de una campaña de ventas,

el director de investigación de una cadena de supermercados tomó una
muestra aleatoria de 13 parejas de tiendas. Se midió la variable ventas (en
miles de dólares por semana) antes y después de realizar la campaña.
Observándose los resultados para un período de una semana antes de la
campaña y después de la campaña en esas tiendas, ¿Se puede concluir que
existe evidencia de que la campaña de ventas aumentó las ventas promedio
por semana?

Analicemos los datos…
1.- Las muestras están apareadas.
2.- ¿La población tiene un sesgo grande?
Columna1(después de la Columna 2(antes de la campaña)

campaña)
Media 62,85 Media 59,19

Error típico 5,55 Error típico 5,41
Mediana 59,4 Mediana 54,7
Desviación estándar 20,026 Desviación estándar 19,490
Varianza de la muestra 401,029 Varianza de la muestra 379,856
Curtosis -0,474 Curtosis -0,881
Coeficiente de 0,373 Coeficiente de asimetría 0,464
asimetría
Rango 66,1 Rango 59,5
Mínimo 31,7 Mínimo 33
Máximo 97,8 Máximo 92,5
Suma 817 Suma 769,5
n 13 n 13
Prueba t para medias de dos muestras emparejadas
Media 62,85 59,19
Varianza 401,029 379,856
Observaciones 13 13
Coeficiente de correlación de 0,987
Pearson
Diferencia hipotética de las 0
medias
Grados de libertad 12
Estadístico t 4,136
P(T<=t) una cola 0,00069082
Valor crítico de t (una cola) 1,78228674
P(T<=t) dos colas 0,00138163
Valor crítico de t (dos colas) 2,17881279
Dado que el valor p es menor a α, se rechaza la H0 de igualdad de las medias;

por lo tanto hay evidencia muestral suficiente para concluir que el promedio
de ventas es diferente aplicando o no la campaña de ventas.

Prueba de hipótesis sobre la diferencia de medias de tres o más
poblaciones
Cuando trabajamos con más de dos poblaciones y nos interesa comparar

los promedios poblacionales el procedimiento estadístico que se adecua a
tal situación es el análisis de varianza.
Análisis de la varianza (ANOVA). Concepto.

Es un procedimiento estadístico para determinar si las medias de tres o más
poblaciones son iguales.
Si bien se comparan las medias poblacionales, la prueba se realiza centrando
la atención en las varianzas de las poblaciones por esta razón se llama
análisis de la varianza.
Supuestos del análisis de la varianza
Al realizar un análisis de varianza se debe verificar lo siguiente:

• Normalidad de las poblaciones.
• Homogeneidad de la varianza.
• Independencia de errores.
Planteo de hipótesis
En general para observar si varios grupos tienen el mismo promedio

poblacional, la hipótesis nula y la alternativa se expresarían de la siguiente
manera:
Veamos un ejemplo:
Supongamos que tenemos las calificaciones (puntajes) de tres grupos de
personas según el método de instrucción utilizado:

Método de instrucción
I II III
86 90 82
79 76 68
81 88 73
70 82 71
84 89 81
Puntaje total por grupo: 400 425 375
Puntaje promedio por 80 85 75
grupo:
Puntaje promedio global: 80
Puesto que hay tres métodos de instrucción, la hipótesis nula y la alternativa

serán:
Si observamos las medias muestrales en los tres grupos según el método de

instrucción, vemos que no todas son iguales; la pregunta a contestar es si
estos resultados de la muestra son los suficientemente diferentes para llegar
a la conclusión de que las medias poblacionales no son todas iguales.
De acuerdo al supuesto de la H0 de que todas las medias son iguales

podemos calcular una medida de variabilidad total.
¿Por qué existe variación entre los valores? ...es decir ¿Por qué las
observaciones no son todas las mismas?
1.- Una razón es que el recibir distintos métodos de instrucción afecta a la

calificación y se obtienen medias diferentes, la variabilidad que surja se llama
variación entre grupos.
2.- Por otro lado las personas son naturalmente diferentes y variables, tanto
si se las trata o no en forma igual, por lo tanto, aún dentro de un grupo
donde todos reciben el mismo tratamiento, existe variabilidad esto se llama
variación dentro del grupo.
Entonces, resumiendo:

Aspectos relevantes
a) Si la Ho es cierta, entonces la variación entre grupos estimará la

variabilidad total de la población al igual que la variación dentro del grupo.
b) Si la Ho es falsa, la variación entre grupos será mayor.
Es decir que si no hay diferencia de un grupo a otro, cualquier diferencia en

la media muestral se explicará por la variación aleatoria y la varianza entre
grupos deberá estar cerca de la varianza dentro de los grupos; si en cambio,
en la realidad hay una diferencia entre los grupos, la varianza entre grupos
será significativamente mayor que la varianza dentro de los grupos.
En la siguiente presentación titulada “Anova” (disponible en plataforma)

encontrará un resumen de los aspectos más relevantes de este tema. Lo
invito a revisarlo.
Plateamos ahora los resultados de la aplicación del ANOVA mediante la

utilización de un paquete estadístico.
Si usted desea emplear el software SPSS los pasos a seguir son:
Analizar/Comparar medias/
ANOVA de un factor/Dependiente: calificación; Factor: Método de
Instrucción.
Opciones: descriptivos y Prueba de homogeneidad de varianzas

ANOVA de un factor.
Las salidas que proporciona dicho software son:
Descriptivos
Calificación
Intervalo de confianza para
la media al 95%
Desviación Límite
N Media típica Error típico Límite inferior superior Mínimo Máximo
1 5 80,00 6,205 2,775 72,30 87,70 70 86
2 5 85,00 5,916 2,646 77,65 92,35 76 90
3 5 75,00 6,205 2,775 67,30 82,70 68 82
Total 15 80,00 7,061 1,823 76,09 83,91 68 90
Prueba de homogeneidad de varianzas
Calificación
Estadístico
de Levene gl1 gl2 Sig.
,095 2 12 ,910
Ahora Ud. ya está en condiciones de hacer el análisis e interpretación de la

salida de computación; le doy algunas pautas para ello:
En el primer cuadro se presentan los estadísticos descriptivos de cada grupo.
El segundo cuadro permite comprobar la igualdad de las varianzas.
El último cuadro permite decidir en base al valor p (sig.= 0,070)
¿A qué conclusión llega?
¿Se rechaza o no la hipótesis nula de igualdad de medias entre los tres
grupos?
Lo invito a continuar y tomar la decisión en la prueba.

Le recomiendo que al leer este módulo complemente su estudio con el
material básico de la bibliografía sugerida para la asignatura. Asimismo, sepa
que usted puede canalizar sus preguntas a través del espacio de las tutorías.
Le recomiendo que al leer este módulo complemente su estudio con el

material básico de la bibliografía sugerida para la asignatura. Asimismo,
sepa que usted puede canalizar sus preguntas a través del espacio de las
tutorías.
Le recomiendo realizar las actividades propuestas para este módulo, donde

podrá encontrar ejemplos en situaciones de negocios en los que se aplican
los temas vistos aquí.
Se encuentra en condiciones de realizar la primera etapa de la evaluación

integradora.
M2 Actividades
Actividad 1
¿Hay evidencias muestrales suficientes?
El gerente financiero de la firma Technology.

com SRL quedó muy conforme con los
informes anteriores que desde la consultora
enviaron acerca del comportamiento de las
ventas de la sucursal de dicha firma. Ud.
tuvo un rol clave en la elaboración de los
mismos ya que aportó, desde la estadística
las herramientas adecuadas para el análisis
solicitado. Hoy el gerente de la empresa,
envía un correo electrónico a su superior,
solicitando a la consultora un nuevo análisis
en base a datos de la sucursal de la empresa.
Su jefe le reenvía el mail a Ud. y le pide que evalúe el pedido del cliente. El
correo en su parte pertinente dice:
“… tenemos en la empresa otra inquietud y es

por ello que los consultamos nuevamente y
solicitamos que nos aporten otras herramientas
que nos permitan interpretar mejor la información
de nuestra sucursal. El informe anterior en donde
nos proporcionaron una estimación de las
ventas promedios y de la proporción de ventas a
contado de la sucursal nos fue de gran utilidad,
ahora estamos interesados en saber si con los
datos muestrales con los que contamos podemos
verificar una hipótesis sobre las ventas promedio
y sobre la proporción de ventas de contado en
la sucursal. ¿Es posible afirmar que las ventas
promedios de la sucursal son significativamente
inferiores a las de las demás sucursales, que
tienen un promedio de ventas muy cercano a los
$90.000?, y; ¿Qué sucede con el porcentaje de
ventas de contado? - que, a nuestro entender
se aleja mucho del 32% que manejan las otras
sucursales-. Dejamos a los expertos en la materia
que nos indiquen con qué probabilidad de error
se trabajará en este caso.
Espero vuestra respuesta.
Saludos cordiales.
….”
Después de leer el correo Ud. tiene claro que el procedimiento que deberá
utilizar. Busca la información de la sucursal en lo que respecta a las ventas
promedio y a la proporción de ventas de contado, con la que ya trabajó
anteriormente y le resulta familiar a esta altura.
¡Nuevamente le deseo suerte en esta tarea!!!
CC AA
CC Actividad 1
Prueba para la media:
Paso 1:
Paso 2:
Paso 3:

Paso 4:
z * = − 1,645 la zona de rechazo de la Hipótesis Nula se encuentra a la

izquierda del z*
Paso 5:
Como el valor de Z observado es menor al valor del Z crítico Z obs < Z ( *

), es
decir cae en la zona de rechazo de la H 0
El cálculo del valor p es:
Por lo tanto existen evidencias muestrales para concluir que las ventas
promedios de la sucursal son significativamente inferiores a las del resto de
las sucursales de la empresa.
Prueba para la proporción:
Paso 4:
z * = − 1,645 la zona de rechazo de la Hipótesis Nula se encuentra a la

izquierda del z*
Paso 5:
Como el valor de Z observado es menor al valor del Z crítico Z obs < Z ( *

), es
decir cae en la zona de rechazo de la H 0
El cálculo del valor p es:
Por lo tanto existen evidencias muestrales para concluir que la proporción

de ventas de contado en la sucursal es significativamente menor al
porcentaje de de las restantes sucursales.
Lo invito a redactar el informe que la consultora le pasará al cliente, posee
la información para hacerlo.
AA Actividad 1
Para resolver esta tarea se le recomienda revise todo lo relativo a prueba

de hipótesis para la media y para la proporción, tanto de los contenidos del
módulo como de la bibliografía del material básico. Capítulo 10.
Recuerde:
a) Identificar los parámetros para los cuales realizará las pruebas.

b) Determinar el nivel de significación con el que trabajará. En este caso
le dejaron a Ud. establecerlo. En general el valor por convención es
el 5%, salvo que le soliciten u otro nivel.
c) Plantear las hipótesis. Decidir si se trata de pruebas bilaterales o
unilaterales.
d) Identificar los valores de los estimadores maestrales.
e) Plantear los pasos para la prueba de hipótesis.
f) Concluir.
g) Generar un informe al respecto. Se le recomienda que le explique
brevemente al cliente, de qué se trata el procedimiento aplicado, cuál
es el alcance y cuál es la decisión a la que se arriba.
Además tenga en cuenta que los datos que necesita para la realización de
las pruebas y que se refieren a la empresa son los siguientes:
- Promedio de venta de las sucursales: $90.000 (este será el valor de

la media en la Ho)
- Desviación poblacional: $25.000
- Promedio de venta de la sucursal observada: $75.000
- Muestra: 64 días.
- Proporción de ventas de contado que maneja la empresa es de 32%
(este será el valor de la proporción en la Ho)
- Proporción muestral en la sucursal es de 15%
Actividad 2
Comparando promedios
Pareciera ser que en esta segunda

parte del año, estará vinculado a los
requerimientos estadísticos que surgen
de las consultas que la firma Technology.
com SRL le hace llegar a la consultora en
la que Ud. trabaja. Esto le resulta grato
porque los directivos de la firma están
muy conformes con los informes que
la consultora le brindó y en los que Ud.
tuvo participación activa aplicando las
herramientas estadísticas.
¿Qué tendrá que realizar en esta oportunidad?
Como ya sabe, la empresa, que posee un nuevo gerente de Marketing, este

año trata de penetrar en el mercado de manera agresiva con una campaña
muy ambiciosa en lo que hace a promociones para las compras de contado de
sus clientes. En base a esto, le sigue inquietando que una de sus sucursales
registre un promedio de ventas de contado tan inferior al resto de las ventas
de las demás sucursales. En esta oportunidad, el gerente financiero de la
empresa acerca a la consultora la información correspondiente a una muestra
de 30 días de ventas de la sucursal cuestionada y una muestra de ventas de
otra de las sucursales con características similares en varios aspectos, por lo
que resultan comparables las sucursales y, en la que también se aplicaron las
campañas de promoción para incrementar las ventas de contado. La idea,
ahora es comparar los promedios diarios de ventas entre las dos sucursales
para ver qué tan diferentes son las ventas promedios diarias. Por supuesto
el gerente financiero busca juntar evidencias para encarar la auditoria en la
sucursal.
Los datos son los siguientes:

(Se trata de los montos diarios de ventas en miles de $, cada sucursal).
Suc. 3,1 3,7 3,6 4,0 3,8 3,8 5,9 4,9 3,6 3,6 2,3 4,0 3,1 2,4 3,7
cuestionada 3,8 2,8 2,9 3,4 4,0 4,0 5,0 3,5 2,3 2,5 2,7 3,4 3,6 2,4 2,6
Otra Suc. 5,0 4,5 3,4 3,4 6,0 3,3 4,5 4,6 3,5 5,2 4,8 4,4 4,6 3,6 5,0
5,4 5,5 4,6 4,5 4,6 6,7 4,5 5,0 5,7 4,8 5,0 5,2 4,9 4,6 4,8
Ahora le toca a Ud. analizar los datos. Evalúe la herramienta estadística a

aplicar, tenga en cuenta que tiene que comparar las ventas diarias promedios
entre las dos sucursales. El gerente financiero de la empresa espera sus
comentarios por escrito.
CC AA
CC Actividad 2
Prueba para la diferencia de medias:
En este caso se trata de muestras independientes, con muestras grandes

(n > 30).
Las hipótesis a plantear son:
(Identificaremos con 1 a la sucursal observada y 2 a la otra sucursal).
H 0 : µ1 = µ 2
H1 : µ1 ≠ µ 2
α = 0,0505

A continuación, se presentan los resultados del procesamiento a través del
software SPSS, para la prueba diferencia de medias.
Estadísticos de grupo
Desviación Error típ. de

sucursal n Media típ. la media
Ventas en miles de $ Suc.observada 30 3,4800 ,83641 ,15271
Otra Suc. 30 4,7200 ,76627 ,13990
Prueba de muestras independientes
Prueba de
Levene para la
igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
Error típ. confianza para la
Sig. Diferencia de la diferencia
F Sig. t gl (bilateral) de medias diferencia Inferior Superior
Ventas Se han asumido
,301 ,586 -5,987 58 ,000 -1,2400 ,20710 -1,65456 -,82544
en miles varianzas iguales
de $ No se han asumido
-5,987 57,56 ,000 -1,2400 ,20710 -1,65463 -,82537
varianzas iguales
La prueba de Levene permite concluir que no se rechaza la hipótesis de

igualdad de varianzas, ya que el valor p es mayor al nivel de significación.
El valor p = 0,000 (Sig. bilateral) al ser menor que α, lleva a rechazar la

igualdad de las medias, por lo que se concluye que existe evidencia muestral
suficiente para decir que las ventas promedio por día son diferentes entre las
sucursales. Si observamos los estadísticos descriptivos (primer cuadro) la
media muestral de la sucursal cuestionada es menor que la media muestral
de la otra sucursal.
Nota: Cabe aclarar que Ud. en un parcial o examen tendrá parte de los
cálculos necesarios para aplicar la prueba ya realizados o bien, se le
proporcionará las salidas de computación pertinente para que analice los
resultados y pueda concluir y tomar la decisión.
Nuevamente se le recomienda revisar todo el paso a paso en la aplicación

de las pruebas de hipótesis en el libro de texto de la bibliografía básica, lo
encontrará en el capítulo 11.
AA Actividad 2
Para resolver esta tarea, se le recomienda revise todo lo relativo a prueba de

hipótesis para dos muestras, tanto de los contenidos del módulo como de la
bibliografía del material básico, en su capítulo 11.

Recuerde:
a) Identificar si se trata de muestras independientes o dependientes.

b) Verificar la normalidad de los datos en la población, esto generalmente
en los ejercicios se lo proporciona como dato.
c) Revisar los tamaños muestrales para determinar con qué estadístico
de prueba trabajar (Z ó t)
d) Determine el nivel de significación con el que trabajará. En este caso
le dejaron a Ud. establecerlo. En general el valor por convención es
el 5%, salvo que le soliciten u otro nivel.
e) Plantear las hipótesis. Decidir si se trata de pruebas bilaterales o
unilaterales.
f) Identifique los valores de los estimadores muestrales.
g) Plantee los pasos para la prueba de hipótesis.
h) Concluya.
i) Genere un informe al respecto. Se le recomienda que le explique
brevemente al cliente, de qué se trata el procedimiento aplicado, cuál
es el alcance y cuál es la decisión a la que se arriba.
En este caso, Ud. cuenta con los datos de las ventas diarias de cada sucursal
para hacer la comparación. Ud. ya sabe cómo calcular todos los estadísticos
descriptivos de cada muestra. Le sugiero repasar todo lo visto en el módulo
3 de la primera parte de Estadística ya cursada. Se le indica en este caso que
las ventas de las dos sucursales tienen un comportamiento normal.
Actividad 3
Comparando más promedios
Hoy es viernes a la tarde y Ud. ya ha terminado con toda su tarea y nada

ha quedado pendiente en su escritorio. Está a punto de partir, pero antes
decide tomar un café y leer una revista especializada en marketing que dejó
hace unos días en el cajón. Un artículo llama su atención, el mismo trata
acerca de la ubicación estratégica que se hace de determinados productos
en los supermercados. El artículo sigue comentando cómo un gerente de un
supermercado ubicó en diferentes localizaciones de un pasillo del local, un
artículo de limpieza de una nueva marca que el supermercado presenta en
exclusividad. La idea era evaluar cómo la ubicación del producto afectaba
a las ventas del mismo. Lo que hizo el gerente fue lo siguiente, ubicó el
producto en cuestión en tres localizaciones distintas (adelante, al medio y
atrás) del pasillo, manteniendo la misma localización por siete días en cada
ubicación y relevó el monto de ventas del producto durante una semana en
cada posición.

Ud. se entusiasmó con el tema y
avanzando en la lectura se encuentra
que se había publicado una tabla con
los datos de las ventas por día para las
tres ubicaciones. A esta altura Ud. ni
lo duda y se pone a trabajar con los
datos, tiene muy en claro lo que desde
el análisis estadístico debe aplicar.
¡Quiere Ud. sacar las conclusiones!
A decir verdad, ya está más que
entrenado en el tema.
El cuadro con los datos que necesita es el siguiente:

Volumen de ventas en miles de pesos.
Localización del producto en el pasillo

Al frente Al medio Atrás
8,6 3,2 4,6
7,2 2,4 6,0
5,4 2,0 4,0
6,2 1,4 2,8
5,0 1,8 2,2
4,0 1,6 2,8
4,0 1,5 2,2
Se acomoda en su escritorio, enciende nuevamente la computadora y se

dispone a resolver este ejercicio, de paso le sirve de ejercitación para la
materia. ¡Éxitos!
CC AA
CC Actividad 3
Análisis de Varianza a un factor:
A continuación se presentan los resultados del procesamiento a través del

software SPSS, para el ANOVA

Descriptivos
Ventas en miles de $
Intervalo de confianza
para la media al 95%
Desviaci Error Límite Límite
n Media ón típica típico inferior superior Mínimo Máximo
al frente 7 5,771 1,69481 ,64058 4,2040 7,3389 4,00 8,60
al medio 7 1,986 ,63358 ,23947 1,3997 2,5717 1,40 3,20
atrás 7 3,514 1,41825 ,53605 2,2026 4,8259 2,20 6,00
Total 21 3,757 2,03090 ,44318 2,8327 4,6816 1,40 8,60
Prueba de homogeneidad de varianzas
Estadístico
de Levene gl1 gl2 Sig.
3,230 2 18 ,063
ANOVA
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-grupos 50,780 2 25,390 14,412 ,000
Intra-grupos 31,711 18 1,762
Total 82,491 20
Comparaciones múltiples
Variable dependiente: Ventas en miles de $
HSD de Tukey
Intervalo de confianza al
95%
Diferencia de Límite
(I) ubicación (J) ubicación medias (I-J) Error típico Sig. Límite inferior superior
al frente al medio 3,7857* ,70948 ,000 1,9750 5,5964
atrás 2,2571* ,70948 ,014 ,4464 4,0678
al medio al frente -3,7857* ,70948 ,000 -5,5964 -1,9750
atrás -1,5286 ,70948 ,107 -3,3393 ,2821
atrás al frente -2,2571* ,70948 ,014 -4,0678 -,4464
al medio 1,5286 ,70948 ,107 -,2821 3,3393
*. La diferencia entre las medias es significativa al nivel .05.
La prueba de Levene permite concluir que no se rechaza la hipótesis de

igualdad de varianzas, ya que el valor p es mayor al nivel de significación.

El valor p = 0,000 (Sig.) en el cuadro del ANOVA, al ser menor que α, lleva
a rechazar la igualdad de las medias, por lo que se concluye que existe
evidencia muestral suficiente para decir que las ventas promedio diarias son
diferentes dependiendo de la ubicación del producto en el pasillo.
Si observamos los estadísticos descriptivos (primer cuadro) la media muestral
de la ubicación al frente es mayor que las ventas promedio del producto en
las restantes ubicaciones.
Lo invito a que con lo que Ud. aprendió en este módulo sobre ANOVA,
complete y profundice la interpretación de estos resultados.
Nota: Cabe aclarar que en un parcial o examen usted dispondrá parte de

los cálculos necesarios para aplicar la prueba ya realizados o bien, se le
proporcionará las salidas de computación pertinente para que analice los
resultados y pueda concluir y tomar la decisión.
Nuevamente se le recomienda revisar todo el paso a paso en la aplicación

de las pruebas de hipótesis en el libro de texto de la bibliografía básica, lo
encontrará en el capítulo 12.
AA Actividad 3
Para resolver esta tarea se le recomienda revise todo lo relativo a prueba de

hipótesis para dos muestras, tanto de los contenidos del módulo como de la
bibliografía del material básico, en su capítulo 12.
Esta situación es un caso típico de comparación de medias en el que deberá

aplicar el procedimiento de ANOVA a un factor.
En este caso el factor por el que se hace la comparación es la ubicación del
producto. Las muestras son de igual tamaño.
Le sugiero que se haga las siguientes preguntas:
- ¿Con un nivel de significación del 10%, existe evidencia de una

diferencia significativa de las ventas diarias del producto según la
ubicación en el pasillo?
- Si es adecuado, ¿qué localización parece diferir más en el promedio
de ventas?
- ¿A qué conclusión arriba? Realice una descripción completa de las
opciones del gerente del supermercado respecto a la localización del
producto en el pasillo.

Actividad 4
Ejercitando un poco más
1.- Un profesor ha registrado las calificaciones de sus alumnos durante varios

cuatrimestres, siendo la media µ = 72 ptos. con una desviación estándar de
12 ptos. Su curso actual de 36 alumnos parece tener un mejor rendimiento,
por lo que el profesor desea mostrar que de acuerdo con el promedio del
grupo actual, el rendimiento ha mejorado. ¿Constituye el promedio del
grupo, de 75.2 ptos., evidencia suficiente a un nivel del 5%, para respaldar la
afirmación del profesor?
2.- Las casas cercanas a un campus universitario tienen un valor medio de

u$s 58.950. Se supone que aquellas situadas cercas de la universidad tienen
un valor superior. Para ello se tomó una muestra de 12 casas en el área
cercana a la universidad para contrastar la teoría. La valuación promedio
en la muestra fue de u$s 62.460 con una desviación estándar de u$s 5.200.
Realizar una prueba de hipótesis con un α = 0.05. Suponga que la variable
en la población tiene distribución Normal.
3.- Un funcionario municipal conviene en renunciar a su puesto para

postularse a una posición de nivel superior a menos que exista evidencia
suficiente de que más del 25% de sus compañeros de partido estén en contra
de su decisión. Una muestra aleatoria de 800 integrantes del partido reveló
que 217 se oponen a la decisión del funcionario. ¿Sugiere esta muestra que
él optará por postularse al mayor cargo?
4.- Hay una fuerte sospecha que en cierta región de la Argentina hay
desnutrición infantil y es clave para la salud de los niños su detección
temprana.
Según los especialistas en nutrición, los niños de 12 meses de edad
deberían medir en promedio al menos 60 cm.; si midieran menos habría
indicios de desnutrición y las autoridades sanitarias deberían tomar medidas
inmediatamente. Para evaluar si este problema está o no presente en la
región, se tomó una muestra aleatoria de 100 niños de 12 meses de edad y
se determinó una altura promedio de 58 cm. y una desviación de 2 cm.
Usando un nivel de significación del 5% ¿qué le informaría Ud. a las
autoridades sanitarias?
5.- Un gobernador desea conocer el porcentaje de votos que va a obtener

en las próximas elecciones. En las pasadas, obtuvo el 30% de los votos. El
gobernador sospecha que el porcentaje no ha cambiado. Luego de pedirle
a usted que efectúe el estudio correspondiente, Ud. toma una muestra de
1230 votantes y de ellos 611 afirmaron que votarían por él. ¿Puede afirmarse
a un nivel del 10% que ha habido un aumento en el porcentaje de intención
de voto?

6.- Se lleva a cabo un estudio para comprobar la eficacia de tres métodos de
enseñanza de un tema sobre ecología.
A1: Control de lectura.

A2: Conferencia en el grupo.
A3: Asesoría personalizada.
Se seleccionan al azar 30 estudiantes de la misma institución educativa con

promedio de 7 o más. Posteriormente se aplica un examen y se obtienen las
siguientes puntuaciones:
A1 A2 A3
4 5 3
7 6 5
9 3 1
6 8 4
9 3 4
6 2 5
5 5 7
7 6 3
7 7 5
10 5 3
Realice un análisis de varianza y concluya.
MÓDULO 3
M3 Microobjetivos
• Comprender las nociones básicas de regresión y correlación simple

y múltiple. para poder aplicarlas en el ámbito profesional, cuando se
enfrente al análisis de variables cuantitativas.
• Distinguir los dos procesos fundamentales, análisis de correlación
y análisis de regresión, para su correcta aplicación con las técnicas
estadísticas específicas, en los casos y situaciones de producción
de información útil en la toma de decisión cuando se relacionan
variables en el ámbito de los negocios y de la administración.
• Interpretar adecuadamente las salidas de resultados, por aplicación
de software estadísticos, para cuando se realiza un análisis de
correlación y/o de regresión al predecir el comportamiento de una
variable en base al conocimiento de otra en el campo de la adminis-
tración y negocios.
• Desarrollar los conceptos básicos sobre serie de tiempo a fin de
capacitarse en el análisis de los modelos, la determinación de las
características principales de la serie, el pronóstico con la aplicación
del modelo y el uso del software en la resolución de situaciones
reales en los negocios.

M3 Contenidos
En este módulo se explorará la relación entre dos variables cuantitativas.

Muchas de las variables en el contexto de los negocios se miden en escala
de intervalo o de razón, las técnicas de regresión y correlación se usan
ampliamente para apoyar el proceso de toma de decisiones.
Las nociones básicas de

regresión y correlación se
estudiarán en este módulo, en
una primera parte se presentará
el análisis simple, es decir en el
que se involucran dos variables.
La extensión de estas técnicas a
situaciones que involucran más
de dos variables, llamado Análisis
Multivariado, se presentará luego,
en la segunda parte del módulo.
Dado que el análisis de regresión requiere de una gran cantidad de cálculos,

se hace hincapié en el uso de los programas de computación para aplicar
estas técnicas. Cabe señalar en este aspecto que:
a) Lo presentado aquí, debe ser entendido como un marco de referencia

y debe servirle de guía para el estudio de los temas, pero de ninguna
manera esto reemplaza al libro de texto, sino que lo complementa.
b) Se señala también que en el caso de las evaluaciones parciales y

en los exámenes finales, usted contará con salidas de computación
en las que se deberá interpretar los resultados, por lo tanto, usted
no deberá hacer todos y cada uno de los cálculos de regresión y
correlación, lo importante en estos temas es que usted comprenda la
lógica subyacente del proceso, tratándose de pruebas de hipótesis,
cuya mecánica ya conoce de los módulos anteriores.
Correlación y regresión simple
En primer lugar se desarrollará la correlación y regresión simples, lo invito a

ver la presentación de “correlacion y regresión” (disponible en plataforma).
Es importante detenerse a continuación en el punto de los supuestos del
modelo de regresión lineal simple, es decir la verificación de los mismos, los
que fueron enunciados en una de las placas que Ud. revisó.

A continuación se desarrolla cada uno de ellos, analizando las salidas
de computación del programa estadístico SPSS, en la comprobación del
cumplimiento de los supuestos del modelo.
Cabe señalar que el análisis de los supuestos del modelo de regresión se

estudia a través del comportamiento de los residuales.
a) La distribución de probabilidad de es normal.
Para verificar este supuesto utilizamos el gráfico “Normal P-P Plot”

Sentencias a utilizar del programa:
Statistics/ Regression/Linear
Dependent: Ventas Independent: Número de
automóviles registrados e ingresos personales
Plots: Y: *Zresid X: *Zpred
Standardized Residual Plot:Normal probability plot
Continue/ OK
Normal P-P Plot of Regression Sta

Dependent Variable: Ventas (millo
1.00
.75
Expected Cum Prob
.50
.25
0.00
0.00 .25 .50 .75 1.00
Observed Cum Prob
Análisis de la salida: En el eje vertical se representa la función de distribución

esperada bajo la hipótesis de distribución Normal (0,1) y en el eje horizontal se
representa la función de distribución acumulativa de los valores observados.
Si la distribución de los residuos fuera Normal, dichos valores deberían ser
aproximadamente iguales y, en consecuencia, los puntos del gráfico estarían
situados, sobre la línea de 45°.

b) La varianza de la distribución de es constante para todos los
valores de x.
El gráfico utilizado en esta oportunidad es el de los residuos tipificados
para analizar la homogeneidad de varianzas. En el eje horizontal están
representados los valores estimados de y, en la ordenada se representa en
cambio los residuales.
Scatterplot
Regression Standardized Residual Dependent Variable: Ventas (millones)
2.0
1.5
1.0
.5
0.0
-.5
-1.0
-1.5
-2.0 -1.5 -1.0 -.5 0.0 .5 1.0 1.5 2.0
Regression Standardized Predicted Value
Análisis de la salida: Si la varianza de los residuales es constante se debería

esperar que la variabilidad de los mismos se distribuyera aleatoriamente.
c) La media de la distribución de probabilidad de es cero.
Esto significa: E ( )=0
d) Los valores de son independientes entre sí.
Esta suposición implica que se ha seleccionado una muestra aleatoria de

elementos de una población para medirlos. El hecho de que los residuos
sean independientes es consecuencia directa de que las observaciones
deben ser independientes entre sí.
Análisis de regresión lineal múltiple
Ya que usted ha ahondado en el tema de la regresión simple, estudiaremos

ahora el modelo de regresión lineal múltiple como una extensión de aquél,
para el cual habíamos establecido la siguiente ecuación de regresión, en
donde la variable independiente era una sola.

Si estableciésemos la ecuación de regresión para el modelo lineal múltiple
ésta sería, - en el caso de considerar 3 variables independientes - la siguiente:
El hecho de que el modelo de regresión lineal simple sea adecuado no

significa que no pueda ser mejorado a través de la información proporcionada
por otras variables.
Vamos a desarrollar este tema mediante un ejemplo. El ejemplo que

tomaremos es la situación planteada en la página 640 del libro de Hanke y
Reitsch, Estadística para negocios.
El caso plantea desarrollar un modelo para predecir las ventas totales de

una compañía. Las variables de predicción que se quieren investigar son:
el número de distribuidoras de la región que mantiene en inventario las
refacciones de la compañía, el número de automóviles registrados para
cada región y el ingreso personal en la región.
A continuación, se le transcribe el caso.
Herb Hancock, gerente de ventas de la compañía NAPE (un

distribuidor mayoritario de refacciones para automóviles) quiere
desarrollar un modelo para predecir en el mes de abril, las
ventas anuales totales para una región. Si las ventas regionales
se pueden predecir, entonces se podrán estimar las ventas
totales de la compañía. El número de distribuidoras de la región
que mantiene en inventario las refacciones de la compañía y
el número de automóviles registrados para cada región y el
ingreso personal de la región, son las variables de predicción
que el gerente quiere investigar. Los datos con los que cuenta
son los siguientes:
Ingreso
Ventas Nro.de Nro.de autos personal
Región (millones) distribuidoras registrados (miles de
y X1 X2 millones)
X3
1 52,30 2011 24,60 98,50
2 26,00 2850 22,10 31,10
3 20,20 650 7,90 34,80
4 16,00 480 12,50 32,70
5 30,00 1694 9,00 68,80
6 46,20 2302 11,50 94,70
7 35,00 2214 20,50 67,60
8 3,50 125 4,10 19,70
9 33,10 1840 8,90 67,90
10 25,20 1233 6,10 61,40
11 38,20 1699 9,50 85,60

Supuestos del Modelo
Los supuestos en el modelo de regresión múltiple, son los mismos que los
planteados en el modelo de regresión simple. Para el caso del ejemplo en
cuestión sería:
• Elección de las Variables de Predicción
Esto se hace mediante el análisis de la Matriz de Correlación, la cual

despliega los coeficientes de correlación para cada posible par de variables
en el análisis.
El orden de la matriz dependerá del número de variables que incluyamos en
el estudio, en nuestro ejemplo la matriz es de orden 4x4.
Análisis de la elección de las variables de predicción:
1.- La variable “número de autos registrados” tiene un potencial regular

r = 0,5484, las variables “número de distribuidoras” e “ingresos personales”
con r = 0,739 y r = 0,9364 respectivamente, tienen buen potencial como
variables de predicción.
2.- Una variable predictora no debe tener una correlación demasiado alta
con ninguna otra variable predictora, es decir se debe revisar si existe
Multicolinealidad.
Para nuestro ejemplo la variable “número de autos registrados” y “número de
distribuidoras” están altamente correlacionadas r = 0.670, de manera que la
multicolinealidad puede llegar a ser un problema, ya que los coeficientes de
regresión muestrales, estimadores de los parámetros poblacionales
β0, β1, ..., βk no son confiables.
Entonces en el procesamiento siguiente, se elimina la “número de
distribuidoras” y se dejan las dos restantes variables independientes.
• El resto de los resultados utilizando el programa estadístico

Las salidas del programa SPSS, que proporcionan los datos necesarios para
el análisis multivariado, se muestran a continuación.
Resumen del modelob
R cuadrado Error típ. de la

Modelo R R cuadrado corregida estimación Durbin-Watson
1 ,982a ,965 ,956 2,87655 2,170
a. Variables predictoras: (Constante), Ingreso personal (miles de millones),
Nro.de autos registrados (millones)
b. Variable dependiente: Ventas (millones)

ANOVAb
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 1827,033 2 913,516 110,401 ,000a
Residual 66,196 8 8,275
Total 1893,229 10
a. Variables predictoras: (Constante), Ingreso personal (miles de millones), Nro.de
autos registrados (millones)
b. Variable dependiente: Ventas (millones)
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) -4,027 2,468 -1,632 ,141
Nro.de autos
,621 ,138 ,310 4,493 ,002
registrados (millones)
Ingreso personal
,430 ,035 ,849 12,328 ,000
(miles de millones)
a. Variable dependiente: Ventas (millones)
• Ecuación de regresión múltiple muestral:
• Análisis del coeficiente de determinación:
El modelo explica el 96,5% de la varianza en las ventas. El R cuadrado del

primer cuadro de resultados es 0,965
• Análisis del error estándar de la estimación:
Al observar el primer cuadro de resultados, se encuentra el error típico

de estimación, por lo que cada pronóstico se aleja alrededor de 2,87655
millones.
• Prueba de Hipótesis para determinar si el ingreso personal y

el número de automóviles registrados deben usarse para predecir las
ventas.
Responde a la pregunta: ¿Es conveniente que ambas variables

permanezcan en el modelo?

Como los estadísticos de prueba (t) ambos son mayores al t* = +/- 2,306
(recordar que en la tabla de la t de Student se debe entrar con 8 gl), se
rechaza la hipótesis nula.
Si observa en el último cuadro de resultados se encuentran los valores
de t (4,49 y 12,33 para las variables número de autos e ingreso personal,
respectivamente). Por supuesto que si Ud. observa el valor p (sig.) que figura
en la última columna del cuadro de resultados (0,002 y 0,000, respectivamente)
y compara con el valor de significación (α = 0,05), al ser inferior el valor p, se
rechaza la hipótesis nula.
Por lo que significa que las variables x sí son importantes para describir la
variabilidad de y.
Ambas variables explican una porción significativa de la varianza en las

ventas.
• Prueba F de regresión
Esta prueba responde a la pregunta: ¿El modelo es el adecuado para explicar

el comportamiento de y?
En el cuadro de la ANOVA, se observa que:

F = 110,40
Como el valor p (.0000) es menor que el nivel de significancia (.05)
Rechazamos la H 0 Por lo que diremos que la ecuación de regresión
explica un porcentaje significativo de la varianza de y. Concluimos que el
modelo es adecuado para explicar el comportamiento de y.
• Interpretación de los coeficientes de regresión estimados para la

ecuación de regresión múltiple

Si el número de autos registrados en la región aumenta en 1 millón,
mientras que el ingreso personal se mantiene constante, las ventas
aumentarán en un promedio de 621. Si el ingreso personal aumenta en mil
millones, mientras que el número de autos registrados se deja constante,
las ventas aumentarán un promedio de 430.
A continuación, seguiremos estudiando y analizando la relación de

variables cuantitativas.
Habiendo comprendido el análisis de regresión tanto simple como múltiple,
ahora se presenta el uso de datos para proyectar eventos futuros.
Serie de tiempo
Una serie de tiempo es un grupo de datos que se recogen, registran u
observan en incrementos sucesivos de tiempo (semanal, trimestral, anual).
Ejemplos de serie de tiempo pueden ser, las ventas trimestrales de una
empresa durante el año pasado; el número promedio anual de inscriptos
en una determinada universidad; el registro mensual de automóviles en una
ciudad; etc.
El análisis de una serie de tiempo resulta útil para la toma de decisiones
actuales y la planeación con base en una predicción de largo plazo. Las
proyecciones a largo plazo en general se hacen a más de un año, dos,
cinco y diez años.
Cuando se registra una serie de tiempo es difícil visualizar sus
componentes. Hay cuatro componentes, el objetivo de descomponer una
serie es observar cada uno de sus elementos aislados.
Con la descomposición se persigue dos cosas: a) tener una mejor idea de

las causas de variabilidad de la serie y b) facilitar el proceso para hacer los
pronósticos.
Para entender las componentes de una serie, deben considerarse las

relaciones matemáticas entre las mismas. El modelo más usado para la
descomposición de la serie es el modelo multiplicativo, en el que se analiza
la serie como el producto de sus componentes:
Donde:
Y: valor real de la variable de interés
T: tendencia secular
C: componente cíclica
E: componente estacional
I: componente irregular

A continuación, se define a cada una de las componentes:
- Tendencia secular: es la componente a largo plazo que representa el
crecimiento o disminución de la serie durante un período largo.
- Variación cíclica: es el aumento o reducción de una serie de tiempo
durante períodos mayores a un año. Se puede decir que es la
fluctuación con apariencia de ondas alrededor de la tendencia.
- Variación estacional: es el patrón de cambio en los datos de una serie
dentro del año y se repite año tras año.
- Componente irregular: mide la variabilidad de una serie de tiempo
luego de eliminar las otras componentes. Se la suele dividir en
variaciones episódicas y variaciones residuales.
En el texto básico de la materia encontrará ejemplos que ilustran a cada

componente de una serie de tiempo, lo invito a revisarlos, los encontrará en
el capítulo relativo a serie de tiempo.
A continuación, desarrollaremos un ejemplo para identificar las componentes

de la serie de tiempo y hacer un pronóstico.
Vamos a utilizar el modelo multiplicativo, para analizar los datos de la serie
de tiempo:
La primera componente de interés en una serie anual es la tendencia. La
mayoría de las series de tiempo por períodos entre 10 y 20 años, en general
revelan una tendencia lineal o bien se puede usar una línea recta como una
aproximación cercana.
En este módulo se presentó el procedimiento de regresión lineal para
encontrar la recta que mejor ajusta a los datos observados. Recordemos la
ecuación de la recta:
Cuando estamos trabajando con serie de tiempo, “x” representa el tiempo

seleccionado.
Consideremos el siguiente caso: el registro anual de nuevos automóviles en
varios países del Mercosur durante un período de varios años, se presenta
en la siguiente tabla:

año y x 𝑦� Cíclica
1984 6.577 1 7.978 82,44
1985 5.855 2 8.054 72,70
1986 6.939 3 8.130 85,35
1987 7.557 4 8.206 92,09
1988 8.065 5 8.283 97,37
1989 9.314 6 8.359 111,42
1990 9.009 7 8.435 106,80
1991 8.357 8 8.511 98,19
1992 9.404 9 8.587 109,51
1993 9.447 10 8.663 109,05
1994 8.388 11 8.739 95,98
1995 9.831 12 8.815 111,53
1996 10.409 13 8.892 117,06
1997 11.351 14 8.968 126,57
1998 8.701 15 9.044 96,21
1999 8.168 16 9.119 89,57
2000 9.752 17 9.196 106,05
2001 10.826 18 9.272 116,76
2002 10.946 19 9.348 117,09
2003 10.357 20 9.424 109,90
2004 8.761 21 9.501 92,21
2005 8.444 22 9.577 88,17
2006 7.754 23 9.653 80,33
2007 8.924 24 9.729 91,73
2008 10.118 25 9.805 103,19
2009 10.889 26 9.881 110,20
2010 11.140 27 9.957 111,88
2011 10.183 28 10.033 101,50
2012 10.398 29 10.109 102,86
2013 9.853 30 10.186 96,73
2014 9.103 31 10.262 88,71
2015 8.234 32 10.338 79,65
En la columna “y” se presenta los valores de la cantidad de nuevos registros

anuales (en millones); los años codificados como la variable independiente,
x, con 1984 como 1, 1985 como 2 y así sucesivamente. El procedimiento
visto anteriormente de análisis de regresión, nos permite obtener la recta de
ajuste que es la ecuación de tendencia para este caso:
Según la salida de resultados del SPSS, el R2 =0,273, la ecuación de
tendencia explica el 27,3% de la varianza de la variable “registro de nuevos
automóviles”. La estimación para 1984, según la ecuación de tendencia es
7.978 millones, se espera que cada año esta estimación de tendencia aumente
un promedio de 0,076 millones (76.000 registros nuevos). Este patrón de
crecimiento constante puede atribuirse al incremento en la población que va
teniendo edad para conducir en ese período. La columna de presenta los
valores ajustados según la ecuación de tendencia.
Aunque el modelo de tendencia lineal se usa con mucha frecuencia para

describir el crecimiento o disminución de una serie de tiempo, a veces es
necesario utilizar modelos de tendencia curvilínea. Cuando un analista
decide qué modelo de tendencia usar, debe identificar con mucho cuidado
el propósito que tiene para calcular la tendencia.

Los datos anuales de una serie pueden revelar ciertos efectos cíclicos. Los
valores por encima (crestas) y por debajo (valles) de la recta de tendencia
representan fluctuaciones cíclicas que pueden estar influidas por las
condiciones cambiantes de la economía, como por ejemplo tasas de interés,
demanda de consumidores, condiciones de mercado, entre otras. El índice
cíclico para los datos anuales se calcula de la siguiente manera:
Donde:
En la tabla anterior, en la columna “cíclica” se encuentran los valores de

cada índice cíclico. Los índices cíclicos indican la posición de cada valor “y
relativo” a la recta de tendencia. Esta posición se indica por un porcentaje,
por ejemplo, en 1984 el valor “y” era el 82,44% de la recta de tendencia, en
tanto que en 2010 “y” era el 111,88% de la recta de tendencia.
Como los valores cíclicos se muestran como porcentaje de la recta de
tendencia, la tendencia se elimina de la serie dejando solo la componente
cíclica para su evaluación.
Entonces, en 1984, los registros de nuevos vehículos fueron un 18% aprox.,
más bajos que los que se esperaba según la estimación de la tendencia, en
tanto que en 2010 fueron aproximadamente un 12% superiores a lo que se
esperaba según la estimación de la tendencia.
La gráfica siguiente ayuda a analizar la componente cíclica. Este gráfico
muestra la ecuación de tendencia como la línea base representada como el
100%. Este tipo de gráfica permite visualizar los patrones cíclicos que ayudan
al analista a comparar la variable de interés con el patrón cíclico de otras
variables y/o indicadores de negocios.

Se le recomienda profundizar el estudio de estos temas en el texto básico
de la materia, en él encontrará ejemplos y ejercicios de autoevaluación que
lo pondrán en contacto con casos del campo de los negocios, pudiendo
realizar también el análisis de la componente estacional.
A fin de profundizar los conceptos de regresión lineal simple y múltiple,

puede realizar las actividades propuestas, transfiriendo estos conceptos al
análisis de datos de la realidad. También se encuentra en condiciones de
realizar la actividad correspondiente a serie de tiempo, pudiendo transferir
los conceptos vistos aquí.
Aquí damos por finalizado el módulo tres, lo invitamos a comunicarse a través
del espacio que ofrece la tutoría, para comunicar sus preguntas y las dudas
que puedan surgir.
M3 Actividades
Actividad 1
Aceptando el desafío
¿Aceptó el desafío propuesto al final del desarrollo del tema de regresión

simple? , ¿Recuerda caso propuesto al final de las placas de PowerPoint? La
planteo nuevamente aquí.
Los propietarios de una compañía

que distribuye varios tipos de equipos
electrónicos, como TV, videocasetes,
cámaras de vídeo etc. están preocupados
por las ventas mensuales brutas, sobre esta
variable tienen registros de los últimos cinco
años.
Piensan que una de las variables que puede
estar relacionada con las ventas es la tasa de
ocupación del hotel más grande del lugar.
Basan esta asociación en un artículo reciente del periódico que hacía hincapié
en la inusitada alta correlación entre esta variable y otros indicadores de la
actividad económica social. Para la muestra se seleccionan al azar 10 meses.
Ahora me adelanto, le doy una ayuda y le agrego las salidas de computación

luego de haber procesado los datos con el paquete estadístico SPSS.

100
90
Vtas. mensuales (miles $)

80
70
40 50 60 70 80 90
Tasa de ocupación hotel
Correlaciones
Tasa de Vtas.
ocupación mensuales
hotel (miles $)
Tasa de ocupación hotel Correlación de Pearson 1 ,974**
Sig. (bilateral) . ,000
Covarianza 228,489 77,536
N 10 10
Vtas. mensuales (miles $) Correlación de Pearson ,974** 1
Sig. (bilateral) ,000 .
697,820 249,841
Covarianza 77,536 27,760
N 10 10
**. La correlación es significativa al nivel 0,01 (bilateral).
Resumen del modelob
R cuadrado Error típ. de la Durbin-W

Modelo R R cuadrado corregida estimación atson
1 ,974a ,948 ,941 1,27683 1,447
a. Variables predictoras: (Constante), Tasa de ocupación hotel
b. Variable dependiente: Vtas. mensuales (miles $)
ANOVAb
Suma de Media
1 Regresión 236,799 1 236,799 145,249 ,000a
Residual 13,042 8 1,630
Total 249,841 9
a. Variables predictoras: (Constante), Tasa de ocupación hotel
b. Variable dependiente: Vtas. mensuales (miles $)

Coeficientesa
Coeficientes
Coeficientes no estandarizad Intervalo de confianza para
estandarizados os B al 95%
Límite
Modelo B Error típ. Beta t Sig. Límite inferior superior
1 (Constante) 61,230 1,918 31,920 ,000 56,807 65,653
Tasa de ocupación hotel ,339 ,028 ,974 12,052 ,000 ,274 ,404
a. Variable dependiente: Vtas. mensuales (miles $)
Ahora le toca a Ud. continuar con el análisis de las salidas. Le paso la posta,
realice su análisis por escrito y plantee las conclusiones pertinentes.
CC AA
CC Actividad 1
a) En el gráfico de dispersión o nube de puntos se puede observar que

existe una relación directa o positiva entre las variables, además es posible
decir que dicha relación se puede ajustar mediante una recta.
b) El coeficiente de correlación entre la tasa de ocupación hotel y las

ventas mensuales es: r= 0,974 (un coeficiente positivo y cercano a 1).
Por lo tanto es posible concluir que existe una relación lineal positiva y fuerte
entre las variables.
c) El error estándar de regresión es 1,28 (ver salida de computación,

2do.cuadro)
d) La estimación por intervalos para la pendiente, para un nivel del 95%

de confianza es: 0,274 – 0,404 (ver salida de computación 4to.cuadro).
e) El valor de t observado es 12,05 (ver salida de computación 4to.

cuadro).
f) La recta de regresión muestral es:
g) El coeficiente de determinación lineal simple es:
SCR 13042
r2 =1− =1− = 0,948
SCT 249841
(Ver cuadro Anova)
Por lo tanto el 94,8% de la variabilidad de la variable y se explica cuando se

usa “x” para predecirla.
h) Observando de los cuadros de resultados, en el cuadro de Anova,

el valor p igual a 0, es menor al nivel de significación del 5%, por lo tanto se
rechaza la hipótesis nula de pendiente cero; por lo tanto se concluye que
existe una relación lineal entre las variables, la pendiente es distinta de 0.
Recuerde que las hipótesis para la prueba son.
H 0 : β1 = 0
H1 : β1 ≠ 0
i) La estimación puntual para las ventas a partir de una tasa de

ocupación hotel del 61%, será:
Es decir que la estimación de las ventas semanales serían de $81909 para

una tasa de ocupación hotel del 61%.
AA Actividad 1
Para realizar el análisis de correlación y regresión recuerde que primero

tiene que identificar a las variables, una como independiente y la otra como
dependiente o explicada; en este caso la variable independiente (x) es la tasa
de ocupación hotel, en tanto que la variable que se intenta explicar a través
de ella es las ventas mensuales (y).
Por otro lado deberá observar si existe o no una relación lineal entre las
variables, recuerde que para ello deberá analizar el comportamiento de las
variables a través del diagrama de dispersión.
Luego, visualizada la posible relación lineal entre las variables, habrá que
calcular y analizar el coeficiente de correlación lineal.
Verificado lo anterior se procederá al análisis de regresión planteando la

recta de ajuste, para lo cual deberá identificar de las salidas de computación
la ordenada al origen y la pendiente de la recta.
Luego quedará realizar las pruebas de hipótesis para la pendiente y hacer

una estimación de la variable dependiente dado un valor de la variable
predictora.
Actividad 2
Agregando más variables al análisis de regresión
La semana pasada Ud. leyó un artículo

periodístico en el sector economía de su diario
local, en el que se presentaba un cuadro con
variables económicas. El estudio realizado
sobre la rentabilidad total de un grupo de
empresas vinculaba a otras variables tales
como el porcentaje de incremento en los
costos de un año a otro y el porcentaje de
ganancias brutas entre otras.
El artículo le pareció muy interesante y busco más información del sector, un
amigo que actualmente está estudiando economía le aportó más información
y a su vez le ayudó con el procesamiento estadístico de dichos datos y ayer
le mandó a Ud. un correo con las salidas de computación, lo que le envió fue
lo siguiente:
Estimado, aquí te mando información procesada de las

siguientes variables sobre una muestra de 16 empresas del
sector agropecuario, las variables son las siguientes:
Y: rentabilidad global
X1: incremento porcentual anual de costos
X2: incremento porcentual anual de ganancias
Bueno amigo, con esta información podrás hacer el estudio

de regresión multivariado que te interesó.
¡Mucha suerte! Y… después me comentás cómo te fue,
por supuesto si necesitás ayuda no dudes en llamarme. Un
abrazo. Juan.
Correlaciones
incremento incremento
rentabilidad % anual de % anual de
global costos gcias.
rentabilidad global Correlación de Pearson 1 ,627** ,014
Sig. (bilateral) . ,009 ,959
Suma de cuadrados y
660,030 415,230 10,560
productos cruzados
Covarianza 44,002 27,682 ,704
N 16 16 16
incremento % Correlación de Pearson ,627** 1 -,118
anual de costos Sig. (bilateral) ,009 . ,663
Suma de cuadrados y
415,230 664,330 -89,400
productos cruzados
Covarianza 27,682 44,289 -5,960
N 16 16 16
incremento % Correlación de Pearson ,014 -,118 1
anual de gcias. Sig. (bilateral) ,959 ,663 .
Suma de cuadrados y
10,560 -89,400 862,380
productos cruzados
Covarianza ,704 -5,960 57,492
N 16 16 16
**. La correlación es significativa al nivel 0,01 (bilateral).
Resumen del modelo
R cuadrado Error típ. de la

Modelo R R cuadrado corregida estimación
1 ,633a ,401 ,309 5,51436
a. Variables predictoras: (Constante), incremento % anual de
gcias., incremento % anual de costos

ANOVAb
Suma de Media
1 Regresión 264,724 2 132,362 4,353 ,036a
Residual 395,306 13 30,408
Total 660,030 15
a. Variables predictoras: (Constante), incremento % anual de gcias., incremento %
anual de costos
b. Variable dependiente: rentabilidad global
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) 8,730 4,639 1,882 ,082
incremento %
,636 ,215 ,638 2,950 ,011
anual de costos
incremento %
,078 ,189 ,089 ,413 ,686
anual de gcias.
a. Variable dependiente: rentabilidad global
Usted prepara un informe para su amigo por escrito, en donde plasma las
conclusiones del caso.
CC AA
CC Actividad 2
En el primer cuadro (correlaciones parciales) se encuentran los coeficientes

de correlación de a pares de variables, esto permite analizar si existe o no
multicolinealidad entre las variables independientes que puedan afectar el
análisis.
En este caso no se detecta este problema, por lo tanto las dos variables
independientes se dejan en el modelo.
En el cuadro siguiente (resumen del modelo) se encuentra el R cuadrado o

Coeficiente de Determinación (0,401) por lo tanto en este estudio el modelo
explica el 40,1% de la varianza de la rentabilidad global.
La ecuación de regresión múltiple muestral es:


y = 8,7373+ 0,636 x1 + 0,078 x2
A la pregunta si es conveniente que ambas variables permanezcan en el

modelo, analizando los valores p asociados a cada coeficiente b, en el
cuadro “coeficientes” se observa que para la variable “incremento % anual
de gcias.” El valor p es mayor a α (5%) por lo que la variable x2 no resulta
importante para describir la variabilidad de y.

Recuerde que la prueba de hipótesis para este punto se corresponde al
siguiente planteo:
H 0 : β1 = 0; β2= 0
H1 : β1 ≠ 0; β2 ≠ 0
A la pregunta acerca si el modelo es el adecuado para explicar el

comportamiento de y, la prueba a aplicar sería:
En el cuadro de resultados “ANOVA”, el valor del estadístico F= 4,353,

tiene asociado un valor p de 0,036 por lo tanto al ser menor que el nivel de
significancia, se rechaza la hipótesis nula. Por lo que la ecuación de regresión
explica un porcentaje significativo de la varianza de y.
AA Actividad 2
Para hacer el análisis de regresión múltiple por supuesto le recomiendo que

revise el tema en los contenidos de este módulo.
Recuerde a su vez que el bordaje del tema se hará siempre con salidas de
computación, en las que Ud. tendrá que identificar los indicadores necesarios
para poder interpretar dichas salidas y plantear las pruebas de hipótesis que
se le solicite.
Actividad 3
De tendencia y efecto cíclico…
Terminando la jornada de trabajo, se dispone a tomar algo fresco y

al abrir el cajón de su escritorio, observa la revista especializada en
negocios que a usted tanto le interesa y … al hojearla, se encuentra con
un artículo que despierta su interés. El mismo trata acerca de usar los
videos que se suben a las redes sociales como una poderosa herra-
mienta de ventas. El artículo plantea el caso de una empresa extranjera
que está usando estos videos que muestran los productos y servicios
de la misma y que debido a esto, la empresa está considerando seri-
amente disminuir los comerciales que se realizan a través de otros
canales de comunicación más tradicionales, como la televisión y radio.
Antes de tomar una decisión el presidente de la empresa desea inves-
tigar la historia de los comerciales televisivos y radiales en el país, en
especial el efecto cíclico.
Este artículo le pareció más que interesante y además lo vinculó con lo
que usted ha visto en este módulo acerca de serie de tiempo.

Inquieto como es, buscó información de la empresa en la que usted tra-
baja respecto a este tema y recopiló los siguientes gastos en los comer-
ciales televisivos de los últimos 10 años, los mismos son los siguientes:
Con estos datos, usted está interesado en analizar las crestas y valles
de la componente cíclica en los comerciales televisivos.
y… enseguida se pone a trabajar en este tema…
Para resolver este caso es aconsejable que revise el análisis de

regresión lineal para obtener la ecuación de tendencia y el cálculo del
índice cíclico.
CC AA
CC Actividad 3
En la tabla que se presenta abajo, muestra los valores estimados por la

ecuación de tendencia, en la tercera columna.
Los valores estimados se obtienen reemplazando en la ecuación de

tendencia
A “x” por 1, por 2 y así sucesivamente hasta 10, que corresponde a la

codificación de los años (2010 a 2019) de la serie de tiempo.
Con los valores de la tercera y cuarta columnas usted podrá calcular el

índice cíclico que se encuentre en la quinta columna de la tabla.
Con los datos precedentes usted puede redactar un informe sobre el

comportamiento cíclico de la serie. ¡Queda en sus manos!!!
AA Actividad 3
Esta actividad lo enfrenta a la aplicación de los temas vinculados a serie

de tiempo.
Luego de realizar el análisis de regresión correspondiente a la serie de

10 años, usted obtiene la ecuación de tendencia que, le agrego aquí
como información adicional para calcular a partir de ella, los valores
estimados de la variable gastos en comerciales televisivos.
Se le recomienda también, repasar todo lo relativo al cálculo del índice

cíclico, para poder realizar el análisis de la serie en cuanto a esta com-
ponente.

Por supuesto que queda abierta la posibilidad de su parte de completar
los cálculos con un análisis de los posibles factores que afectan al com-
portamiento de la serie y poder así generar un informe más acabado
que seguramente le será de interés a sus superiores en la empresa,
para la toma de decisiones.
Actividad 4
Practicando algo más
1.- Los accionistas de una explotación agropecuaria desean analizar si el

peso por ración de granos se puede llegar a predecir a partir de las calorías
por ración (X1) y de cantidad de azúcar en gramos por ración (X2). Para ello
se toma información a una muestra de tamaño 83 y se obtiene la siguiente
información, luego de procesarlos con un software adecuado para el análisis
de datos. Los resultados se presentan a continuación
Nota: Recuerde que los puntos son comas.
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 12.304 2 6.152 149.953 .000a
Residual 3.323 81 4.103E-02
Total 15.627 83
a. Predictors: (Constant), Cantidad de azucar en gramos, Calorías por ración
b. Dependent Variable: Peso por ración en gramos
Coefficientsa
Standardi
zed
Unstandardized Coefficien
Coefficients ts
Model B Std. Error Beta t Sig.
1 (Constant) .157 .076 2.053 .043
Calorías por ración .0092 .001 .934 15.201 .000
Cantidad de azucar
-.0066 .004 -.091 -1.479 .143
en gramos
a. Dependent Variable: Peso por ración en gramos
A partir de la información que proporcionan los cuadros se solicita que realice

lo siguiente:

a) Obtenga e interprete el coeficiente de determinación.
b) Escriba la ecuación de regresión muestral.
c) Realice la prueba sobre el coeficiente de X2, e indique si es conveniente
que esta variable permanezca en el modelo.
d) Realice la prueba sobre el modelo e indique si el mismo es adecuado
para explicar el comportamiento de Y.
e) Estime el número de calorías por gramo si el peso fue de 1,57 gramos y
la cantidad de azúcar de 7 gramos.
f) ¿Cuáles son los supuestos sobre los residuos que debemos tener en
cuenta para el análisis anterior?
2.- Una cierta empresa que vende leche desea realizar pronósticos de sus
Ventas (expresadas en miles de pesos) a partir del precio por litro y del dinero
invertido en publicidad (en cientos de pesos). Para ello plantea un modelo de
Regresión Lineal y obtiene la siguiente información:
Coefficients t Sig.
B Std. Error
(Constant) 1,566 1,810 ,865 ,416
Precio por litro -,199 ,105 -1,890 ,101
Publicidad en cientos ,983 ,147 6,667 ,000
de pesos
ANOVA
Sum of Squares df Mean Square F Sig.
Regression 201,855 2 100,927 22,255 ,001
Residual 31,745 7 4,535
Total 233,600 9
Scatterplot
Dependent Variable: Ventas en miles de pesos
2,0
Regression Standardized Residual
1,5
1,0
,5
0,0
-,5
-1,0
-1,5
-1,5 -1,0 -,5 0,0 ,5 1,0 1,5 2,0
Regression Standardized Pr edicted Value

a) Plantee el modelo de regresión encontrado.
b) Calcule e interprete el Coeficiente de Determinación.
c) ¿El precio por litro de la leche aporta información para la predicción en
las ventas? Concluya con un nivel de significación del 5%.
d) ¿El modelo propuesto se considera adecuado para predecir las ventas?
Utilice un nivel de significación del 5%.
e) ¿Qué puede decir respecto a la independencia de los residuos?
Justifique. ¿Qué otro control se debería haber realizado?
3.- La directora de Investigación y Desarrollo de una importante firma,

Donna Pico, debe defender la petición sobre un presupuesto necesario para
aumentar los fondos. Obtuvo una muestra de ocho compañías farmacéuticas
y recogió los siguientes datos:
Compañía Ganancia anual Investigación y desarrollo

(millones de $) (millones de $)
Y x
1 25 5
2 30 7
3 20 4
4 50 10
5 40 8
6 60 12
7 50 6
8 35 11
(Nota: este es el ejercicio 8, del capítulo 14, pág.530, tomado del libro Hanke
y Reitsch “Estadística para negocios”).
El procesamiento estadístico brinda los siguientes datos.
LIMITES AL 95%
Invest. y Ganancias Li para valores Ls para Li para
Desarrollo medios de y valores valores Ls para
(Int. de confianza) superiores del valores del
de y Intervalo intervalo de
de predicción
predicción
5 25 15.75819 42.33098 0.03275 58.05642
7 30 26.21523 45.37713 8.2834 63.30896
4 20 9.76947 41.56811 -4.62884 55.96642
10 50 34.34076 57.50637 17.65132 74.19581
8 40 30.04392 48.30003 11.81362 66.53033
12 60 36.08046 69.26986 22.0069 83.34342
6 50 21.336 43.50477 4.34865 60.49211
11 35 35.38984 63.20889 19.99692 78.60181
63 310

Invest. y Ganancias
Desarrollo
x y xy X2 Y2
5 25 125 25 625
7 30 210 49 900
4 20 80 16 400
10 50 500 100 2500
8 40 320 64 1600
12 60 720 144 3600
6 50 300 36 2500
11 35 385 121 1225
63 310 2640 555 13350
Normal P-P Plot of Ganancia anual

1.00
.75
.50
Expected Cum Prob
.25
0.00
0.00 .25 .50 .75 1.00
Observed Cum Prob
Detrended Normal P-P Plot of Ganancia anual

.06
.04
.02
0.00
Deviation from Normal
-.02
-.04
-.06
0.0 .2 .4 .6 .8 1.0
Observed Cum Prob

Model Summary
Adjusted Std. Error of

Model R R Square R Square the Estimate
1 .708a .502 .419 10.54
a. Predictors: (Constant), Investigación y desarrollo
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 670.939 1 670.939 6.039 .049a
Residual 666.561 6 111.093
Total 1337.500 7
a. Predictors: (Constant), Investigación y desarrollo
b. Dependent Variable: Ganancia anual
Coefficientsa
Standardi
zed
Unstandardized Coefficien
Coefficients ts
Model B Std. Error Beta t Sig.
1 (Constant) 12.166 11.441 1.063 .329
Investigación y desarrollo 3.376 1.374 .708 2.458 .049
a. Dependent Variable: Ganancia anual
70
60
50
40
30
Ganancia anual
20
10
0
0 2 4 6 8 10 12 14
Investigación y desarrollo
En función de dichos datos:
a) Bosqueje el diagrama de dispersión.

b) Estime el coeficiente de correlación e interprete el resultado.
c) Pruebe el coeficiente de correlación a un nivel de significancia del 5%.
d) Mencione los supuestos del modelo y opine al respecto.
e) Determine la ecuación de regresión muestral.
f) Calcule una estimación puntual para las ganancias si lo que se invierte en
Investigación y Desarrollo es de $6 millones.
g) ¿Qué porcentaje de la variabilidad de las ganancias se puede explicar por
un porcentaje significativo de la varianza de la inversión en Investigación
y Desarrollo?
h) Pruebe el coeficiente de regresión con un nivel de significancia del 5%
i) Calcule un intervalo de predicción del 95% para una inversión en
investigación y desarrollo de $6.
j) Calcule un intervalo de confianza del 95% para una inversión en
Investigación y Desarrollo de $6.
4.- A continuación, se presenta la matriz de correlación, se intenta predecir

una variable considerando tres variables independientes.
Se le solicita que analice los coeficientes.
¿Qué variables deja para continuar en el análisis de regresión? Justifique su
respuesta.
y X1 X2 X3
Y 1 -.85 .76 .23
X1 -.85 1 -.42 -.07
X2 .76 -.42 1 .07
X3 .23 -.07 .07 1
Sugerencia: resolver las actividades de autoevaluación y demás

ejercicios que propone la bibliografía básica de la materia será de gran
utilidad.
MÓDULO 4
M4 Microobjetivos
• Conocer y aprender sobre la aplicación de pruebas de hipótesis para la

toma de decisiones ante ciertas situaciones del mundo de los negocios
y de la administración, utilizando para ello datos cualitativos (en escala
nominal u ordinal).
• Distinguir las situaciones de la vida cotidiana y profesional, en las que
corresponda, por la naturaleza de los datos, la aplicación de tablas
de contingencia o las pruebas de bondad de ajuste para la toma de
decisiones.
• Aprender a medir el grado de asociación entre variables cualitativas que
puedan surgir de estudios de mercado o investigaciones y donde se
requiera de la toma de decisiones a partir de tablas cruzadas con los
datos de dichas variables.

M4 Contenidos
1. Introducción: pruebas ji Cuadrado

En los módulos 1 y 2 se planteó
la estimación y las pruebas de
hipótesis. Se trabajó con
muestras que provenían de
poblaciones normales o se hizo
el supuesto de población normal
y las pruebas manejaron datos
en escala de intervalo o de
razón. Existen muchas
situaciones de la vida cotidiana
y profesional en la que los datos
se miden en escala nominal u
ordinal, es decir se trabaja con datos de naturaleza cualitativa. En estos
casos no se puede hacer suposiciones sobre la normalidad de la población,
es por ello que en este último módulo se verá el tratamiento estadístico para
estas situaciones, principalmente mediante el uso de la prueba ji-cuadrada.
2. Pruebas con tablas de contingencia

La prueba con tablas de contingencia está diseñada para ver si dos variables
categóricas están relacionadas, también se la conoce como Pruebas de
Independencia, ya que la hipótesis nula establece que las dos variables son
independientes.
Los datos se presentan en tablas que se suelen llamar tabla de clasificación
cruzada o tabla cruzada.
Las celdas en la tabla señalan la frecuencia para cada combinación posible
de resultados (frecuencias de celdas).
Una característica de la mayoría de las tablas de contingencia es que no es
de inmediato evidente que la hipótesis nula sea cierta o falsa. Se necesita
una prueba estadística para saber si existe una relación entre las variables de
las filas y de las columnas.
Las hipótesis nula y alternativa serán del tipo:
Vamos a desarrollar el tema a través del siguiente ejemplo.

Una compañía dedicada a la venta de celulares está interesada en conocer
si el sexo del cliente está relacionado con el tipo de celular que prefieren,
la empresa en la actualidad comercializa principalmente tres modelos, uno
básico, intermedio y otro inteligente. Para ello realizó un muestreo sobre
185 potenciales clientes y los resultados se presentan en la siguiente tabla
cruzada.

Sexo
Modelo Masculino Femenino Totales
Básico 19 29 48
Intermedio 23 47 70
Inteligente 24 43 67
Totales 66 119 185
Lo primero que debemos plantear son las hipótesis.
Luego se supone que la hipótesis nula es cierta. Si se supone que las dos
variables (sexo y preferencia por un modelo de celular) son independientes,
¿cuántas observaciones se esperaría que cayeran en cada celda?
La probabilidad que un cliente elija el modelo básico (independientemente
del sexo) es:
48
48 x
= p = = 0,2626
185 n
Esto se determina al observar que de 185 clientes, 48 elegirían el modelo

básico.
Si la preferencia por el modelo del celular y el sexo del cliente son
independientes según la H 0 la compañía esperaría que el 26% de los clientes
varones prefieren el modelo básico, o sea:
Asimismo se esperaría que el 26% de los clientes de sexo femenino, prefieran

el modelo básico:
Donde 17 + 31 = 48
La tabla con las frecuencias esperadas sería:
Sexo
Masculino Femenino Totales
Modelo Frec. Frec. Frec. Frec.
Observada Esperada Observada Esperada
Básico 19 17 29 31 48
Intermedio 23 25 47 45 70
Inteligente 24 24 43 43 67
Totales 66 119 185

La fórmula para el cálculo de las frecuencias esperadas es la siguiente:
Veamos cuál es el estadístico de prueba que se usa.
( f o − f e )2 ≈ χ 2
∑ fe
( r −1)(c −1)
Donde:
La cantidad de filas y columnas determinan los grados de libertad de la

gl = (r − 1)(c − 1)
ji-cuadrado lo que se simboliza: gl
Con este estadístico se comparan las frecuencias esperadas con las
observadas para cada celda. Si las diferencias no son grandes, el estadístico
llevará a no rechazar la H 0 (recordar que las frecuencias esperadas se
calculan bajo el supuesto de que las dos variables son independientes).
Si las frecuencias esperadas y las observadas son distintas, el estadístico
conducirá al rechazo de la H 0 .
Las pruebas de hipótesis con tablas de contingencia son siempre laterales

derechas (ya que interesan las diferencias grandes en el numerador de la
fórmula, para el rechazo de la H 0 ).
Calcularemos ahora el valor el estadístico.
fo fe ( fo − f e ) ( f o − f e )2
( f o − f e )2
fe
19 17 2 4 0,2353
23 25 -2 4 0,16
24 24 0 0 0
29 31 -2 4 0,1290
47 45 2 4 0,08888
43 43 0 0 0
Total 0,6131
El nivel de significación será del 5% (α = 0.05)

El valor crítico de tabla de la ji-cuadrado con 2 gl. Y una probabilidad
acumulada del 0.95 es:
χ (23*−1)(2 −1) = χ 22* = 5.9
0.9559
Por lo tanto la zona de rechazo de la H 0 estará a la derecha de 5.99

Al comparar el valor del estadístico de prueba con el valor crítico de tabla
de la χ , el valor del estadístico cae en la zona de no rechazo de la H 0
2
. Por lo tanto no se rechaza la H 0 . Al no rechazarla significa que no hay

relación entre la el sexo del cliente y la preferencia por un modelo de celular
en particular.
3. Prueba de bondad de ajuste

La prueba de bondad de ajuste determina la probabilidad de que las
frecuencias observadas para una variable categórica pudieran haberse
obtenido de una población hipotética.
Esta prueba es una aplicación más general de la prueba de independencia
vista en el apartado anterior, sólo que en la bondad de ajuste se trabaja con
una sola variable categórica.
Las hipótesis entre las que se debe decidir después de analizar los datos
muestrales son las siguientes:
La población especificada generalmente es una distribución de probabilidad

de los que Ud. ya conoce (Poisson, Binomial, Normal, etc. o bien cualquier
comportamiento que se le pueda ocurrir).
El estadístico de prueba a utilizar aquí es el mismo que para las tablas de
contingencia.
( f o − f e )2 ≈ χ 2
∑ fe
k −1 − c
La diferencia en este caso son los grados de libertad, que en este caso son:
gl
gl = k −1− c
Donde:
k = número de categorías
c = número de parámetros poblacionales desconocidos estimados por
estadísticos maestrales.
Plantearemos a continuación otro ejemplo para desarrollar el tema:

En un estudio contable el responsable del área de impuestos decide encarar
una auditoría de las declaraciones juradas mensuales confeccionadas por los
auxiliares del estudio, para ello selecciona una muestra de 400 declaraciones
y analiza la cantidad de errores cometidos; la información se presenta a
continuación.
nro.de
errores Frecuencia
0 102
1 140
2 75
3 52
4 31
Total 400
¿Sugiere esta distribución que la cantidad de errores sigue una distribución

de Poisson, a un nivel de significancia del 5%?
Ud. sabe que en la distribución de Poisson la media y la varianza son iguales,
representándose mediante µ ó λ, por lo tanto el estadístico muestral que
estima el parámetro en este caso será (media de la muestra):

λ =µ=
 ∑x i fi
=
570
= 1.425
n 400
Las hipótesis a plantear serán:
El valor de ji cuadrado crítico, será:
Los grados de libertad (gl) en este caso son 3 con una probabilidad acumulada
de 0.95., el valor de tabla de la ji-cuadrado es 7.81. Por lo tanto la zona de
rechazo de la H 0 será a la derecha de 7.81.
El estadístico de prueba será:
χ2 = ∑
( f o − f1 )2
fe
A continuación se presentan los cálculos necesarios para llegar al valor del

estadístico.

Nro.de
errores fo xi f i P ( x = xi ; µ = 1.4 ) fe
( f o − f e )2
fe
0 102 0 0,2466 98,64 0,1145
1 140 140 0,3452 138,08 0,0267
2 75 150 0,2417 96,68 4,8616
3 52 156 0,1128 45,12 1,0490
4 31 124 0,0538 21,52 4,1761
400 570 10,2279
Nota: La cuarta columna de la tabla contiene las probabilidades que surgen

de la distribución de probabilidad de Poisson para una media de 1,4 (recuerde
el manejo de la distribución de Poisson que Ud. estudió y trabajó en el primer
cuatrimestre). La quinta columna presenta las frecuencias esperadas si la
variable siguiera una distribución de Poisson con una media de 1,4. Los
valores esperados allí consignados se calculan multiplicando cada una de
las probabilidades de la columna 4 por el total de la muestra en este caso,
n = 400
Luego al comparar el valor del estadístico de prueba con el valor crítico:

10,2279 > 7,81
El valor calculado cae en la zona de rechazo de la H 0 , por lo tanto se rechaza
la H 0 , por lo que se concluye que el Nro. de errores cometidos en las DDJJ
no sigue una distribución de Poisson.
4. Consideraciones finales sobre las pruebas ji cuadrado

a) Todas las frecuencias esperadas deben ser mayores que 5, de
ser menores, la prueba puede no ser válida ya que la ji cuadrado
puede no representar a la distribución muestral verdadera. Esto es
particularmente importante para tablas 2 x 2 que tienen 1 gl.
b) Los análisis que se realicen con el paquete estadístico SPSS incluyen
la disposición de los datos junto al valor ji cuadrado calculado y el
valor p.
c) En el caso de rechazar la H 0 en una prueba con tablas de
contingencia, la conclusión será que existe dependencia entre las
variables, seguidamente corresponde determinar la naturaleza de
esa dependencia (se inspecciona la tabla de contingencia tratando
de encontrar qué filas tienden a influir en qué columnas).
d) Un paso más en el análisis de asociación de las variables, luego de
haber rechazado la H 0 de independencia es calcular un coeficiente
que mida el grado de asociación entre las variables, como por
ejemplo el Coeficiente de Phi o el Coeficiente de Contingencia.
Le recomiendo que preste atención a la actividad 1 de este módulo
ya que allí se presentarán estos coeficientes a través de la salida de

resultados del paquete estadístico SPSS. Cabe aclarar que el cálculo
de los mismos excede los contenidos del mismo, aunque sí estará
Ud. en condiciones de interpretar los resultados de esos coeficientes
de asociación.
Le recomiendo que preste atención a la actividad 1 de este módulo ya que

allí se presentarán estos coeficientes a través de la salida de resultados del
paquete estadístico SPSS. Cabe aclarar que el cálculo de los mismos excede
los contenidos del mismo, aunque sí estará Ud. en condiciones de interpretar
los resultados de esos coeficientes de asociación.
e) Muchas situaciones de datos cuantitativos relevantes en un análisis

estadístico, se deberán transformar en datos cualitativos (a escala
nominal u ordinal) para poder aplicar estas técnicas en la toma de
decisiones.
Como conclusión del presente desarrollo teórico le sugiero que realice

las actividades propuestas para el módulo y las de autoevaluación que se
presentan en el texto de la bibliografía básica; éstas le servirán para poder
evaluar su evolución en estudio de los temas de este módulo.
Le recomiendo revisar el manual de uso (disponible en plataforma)Getting

Started with MegaStat ® J. B. Orris. Butler University. Copyright 2005 by J.
B. Orris
Se encuentra en condiciones de realizar las consignas de la segunda parte

de la evaluación integradora.
Como bien se planteó en los objetivos generales de la asignatura el fin principal

de la misma apunta a que usted conozca y maneje los procedimientos
esenciales de la inferencia estadística, tanto para datos cuantitativos
como para los cualitativos. Quisiera remarcar el tema de la importancia de
estos procedimientos en la toma de decisión ante situaciones de su futuro
desempeño profesional. Esperando que tanto los contenidos como las
actividades propuestas le hayan servido a tal fin, lo saludo y lo espero en el
espacio de la tutoría por cualquier duda que pueda surgir.

M4 Actividades
Actividad 1
Relacionando variables
Hoy lunes regresa de un agradable fin de semana compartido con amigos,

llega con energías renovadas a su trabajo.
En el pasillo, camino a la oficina del gerente de Marketing, uno de sus
compañeros lo cruza y casi en un tono de desesperación le pide ayuda:
“… ¡¡¡Por favor!! Necesito que me des una mano con este tema, mi
jefe me mandó esto… sobre una investigación que encontró sobre
el uso de Internet y la carrera que cursa una muestra de estudiantes;
me pidió que tratara de ver si existe relación entre las variables…
en realidad yo estoy atrasado con otro informe que todavía no
terminé… y como vos estás estudiando estadística en tu carrera,
¿quién mejor para ayudarme con esto?, ¿tenés un tiempito?”
Por supuesto que Ud. puede ayudarlo en este tema. Además, ¡hoy se levantó
con muchas ganas de trabajar! Sin más, revisa lo que su superior necesita
con urgencia, lo hace y se pone a ver de qué se tratan estos datos a relacionar
para ayudar a su compañero.
La información con la que cuenta es una tabla de doble entrada con los
siguientes datos.
Motivo principal que llevó a conectarte a internet y Carrera
CARRERA
Lic. Contador
Psicología Público Total
¿que motivo laborales Count 0 4 4
principal te Expected Count 2.0 2.0 4.0
llevó a academicos Count 32 16 48
conectarte a
Expected Count 24.5 23.5 48.0
internet?
entretenimiento Count 4 9 13
familiares Count 0 3 3
curiosidad Count 3 7 10
relaciones sociales Count 7 5 12
Total Count 46 44 90
A su vez, su compañero se comunica por el interno de la oficina y le comenta

que esta información surge de una investigación llevada a cabo por un grupo
de estudiantes de la carrera de Psicología, para indagar sobre si la carrera
que cursan los estudiantes está relacionada con los motivos por los que se
conectan a Internet. Le informa que los datos corresponden a una muestra
de 90 estudiantes de las carreras de Psicología y de Contador Público a los

que se les preguntó mediante una encuesta sobre el motivo principal por el
que se conectan a Internet.
¡Ah! - dijo Ud.- Se trata de analizar la relación entre variables!!, inmediatamente

lo vinculó a este tema con las pruebas estadísticas… y debo decirle que está
bien orientado. Realice un informe por escrito para pasarle a su compañero.
CC AA
CC Actividad 1
En este caso se trata de relacionar las siguientes variables:

• Carrera seguida por el estudiante (con dos categorías)
• Motivo principal que lo lleva a conectarse a Internet (con seis
categorías)
El nivel de significación con que se trabaja es del 5%. (Recuerde que es el

nivel que habitualmente se usa si no especifica otro).
Al observar la tabla de contingencia, hay varias frecuencias observadas

que son menores a 5. Recuerde que la prueba ji cuadrado requiere que las
frecuencias esperadas sean de por lo menos 5.
Motivo principal que llevó a conectarte a internet y Carrera
CARRERA
Lic. Contador
¿que motivo laborales Count 0 4 4
principal te Expected Count 2.0 2.0 4.0
llevó a academicos Count 32 16 48
conectarte a
internet?
entretenimiento Count 4 9 13
familiares Count 0 3 3
curiosidad Count 3 7 10
relaciones sociales Count 7 5 12

Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 16.153a 5 .006
Likelihood Ratio 19.050 5 .002
Linear-by-Linear
.786 1 .375
Association
N of Valid Cases 90
a. 5 cells (41.7%) have expected count less than 5. The
minimum expected count is 1.47.
Del procesamiento de los datos a través del paquete SPSS, se señala que
un 42% de las celdas tienen frecuencias esperadas menores a 5. En estos
casos se hace necesario reagrupar categorías. La tabla cruzada siguiente
presenta las categorías de la variable “motivo por el que se conecta a Internet”
reagrupadas, de esta manera se logra que las frecuencias esperadas sean
mayores a 5.
Motivo principal que llevó a contactarte Internet y Carrera
CARRERA
Lic. Contador
motivo Académicos Count 32 16 48
Entretenimiento/Curiosi Count 7 16 23
dad Expected Count
11.8 11.2 23.0
Familiares/Relaciones Count 7 12 19
Sociales/Laborales Expected Count 9.7 9.3 19.0
De las 6 categorías iniciales se reagrupó en tres categorías los motivos de

conexión, de esta manera se logra que las frecuencias esperadas sean
mayores a 5.
El cuadro siguiente muestra:

- El valor del estadístico de prueba (Pearson chi-cuadrado), cuya fórmula es:
( f o − f e )2 ≈ χ 2
∑ fe
( r −1)(c −1)
- y, el valor p asociado (Asymp.Sig.)
Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 10.131a 2 .006
Likelihood Ratio 10.341 2 .006
Linear-by-Linear
7.110 1 .008
Association
N of Valid Cases 90
a. 0 cells (.0%) have expected count less than 5. The
minimum expected count is 9.29.

Dado que el valor p es menor al nivel de significación (.006 < .05) se rechaza
la hipótesis nula, entonces se rechaza la H 0 de independencia entre las
variables.
Entonces, se puede concluir que existe relación entre la carrera que cursa el
estudiante y el motivo principal por el que se conecta a Internet.
El paso siguiente es averiguar qué tan fuerte es esta relación. Esto se hace a
través de los coeficientes de asociación.
Symmetric Measures
Value Approx. Sig.

Nominal by Phi .336 .006
Nominal Cramer's V .336 .006
Contingency Coefficient .318 .006
N of Valid Cases 90
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null
hypothesis.
En esta salida del programa se observan los coeficientes:
• Phi este coeficiente es una medida de asociación entre dos variables

dicotómicas, basado en el estadístico ji cuadrado que toma valores
entre 0 y 1. Valores próximos a 0 indicarán no asociación entre las
variables y valores próximos a 1, fuerte asociación. Dado que solo
una de las variables tiene dos categorías de respuesta y la otra tienen
tres después del reagrupamiento, este coeficiente no es el indicado
para hacer el análisis de asociación.
• El coeficiente de contingencia (Contingency Coefficient) es una

extensión del coeficiente Phi al caso de que al menos una de las
variables presente más de dos categorías. Toma valores entre 0 y
C max donde, valores próximos a 0 indicarán no asociación entre las
variables y valores próximos a C max , fuerte asociación.
La fórmula del coeficiente es la siguiente:

min(r − 1, c − 1)
C max =
1 + min(r − 1, c − 1)
Donde:
r: cantidad de filas
c: cantidad de columnas
En este caso el valor del C max será: 0.7071

Por lo tanto el valor del Coeficiente de Contingencia 0.336 está a
la mitad aproximadamente del recorrido 0 − 0.7071 . Por lo tanto
podemos concluir que si bien existe relación entre la carrera y el
motivo principal de conexión a Internet, dicha asociación es regular.
Tal como se indicó en los contenidos de este módulo, es importante luego

de detectada la relación estadística significativa entre las variables, analizar
nuevamente la tabla de contingencia con las frecuencias observadas a fin de
detectar tendencia en la influencia de las variables.
A continuación se sugiere que realizar un gráfico que le ayude a presentar

la información y a sacar conclusiones. Por supuesto, Ud. ya sabe graficar
variables que se presentan en tablas de doble entrada, porque ya lo aprendió
en la primera parte de la materia, en el anterior cuatrimestre.
69.60%
70%
60%
50%
40% 36.40% 36.40%
30% 27.30%
20% 15.20% 15.20%

10%
0% Psicología
Académicos Entretenimiento Flia/Sociales Contador
De los 48 alumnos que se conectan a Internet por motivos Académicos, el

32 corresponden a la carrera de Psicología y sólo 16 son estudiantes de la
carrera de Contador Público.
En las categorías restantes, la situación se invierte: de los 23 estudiantes que
acceden por entretenimiento o curiosidad, 7 son de Psicología y 16 son de
Contador Público.
De los 19 que se acercaron a Internet por motivos familiares, sociales o
laborales, 7 son de Psicología y 12 son estudiantes de la carrera de Contador.
De los 46 alumnos de Psicología la categoría de la variable con mayor
frecuencia es el acercamiento a Internet por motivos académicos- 69,6%-,
en la carrera de Contador Público, en cambio, hay dos categorías con
máxima frecuencia “motivos académicos” y “motivos de entretenimiento y
curiosidad” cada una con una frecuencia del 36,4%.
Este caso se resolvió con la ayuda del paquete estadístico SPSS, lo desafío
ahora que lo resuelva utilizando el paso a paso que se le planteó en los
contenidos, Ud. está en condiciones de hacerlo.

AA Actividad 1
La información con la que cuenta la tiene en una tabla de doble entrada,

tenga en cuenta que, como se busca indagar acerca de si existe o no relación
entre dos variables, le recomiendo entonces que:
• Identifique primero las variables a relacionar.

• Identifique luego las categorías de las variables. Esto le servirá
para establecer la cantidad de filas y columnas (que le permitirán
establecer los grados de libertad), para luego trabajar con el
estadístico de prueba y con el valor crítico.
• Observe que la tabla de contingencia que se le proporciona
contiene no sólo las frecuencias observadas, sino también las
frecuencias esperadas.
Le recomiendo a su vez que repase todo lo relativo a las pruebas de hipótesis

con tablas de contingencia visto en este módulo, como así también repase el
tema en el material básico de la asignatura.
Actividad 2
Si de preferencias se trata…
Parece que esta semana el tema de trabajo está vinculado con datos sobre
las carreras universitarias. Su jefe se enteró de la ayuda que Ud. le brindó a
su compañero, leyó el informe y le pareció que, ahora estando en el tema,
Usted podría analizar datos que llegaron a la consultora sobre la preferencia
de los alumnos. Estos datos se refieren a siete carreras, bajo la modalidad
a distancia, que ofrece una determinada universidad. Las carreras están
identificadas con las letras de la A a la G y los datos con los que se cuenta
es la cantidad de alumnos que muestran preferencia por cada una de las
carreras.
carrera Frecuencia
A 18
B 12
C 25
D 23
E 8
F 19
G 14
Total 119
El jefe le deja la siguiente inquietud: “… con estos datos, ¿hay evidencia

de que no se manifiesta diferencia en la preferencia en la elección de las
distintas carreras ofrecidas?
Ud. recoge la información y se queda pensando en la pregunta de su jefe.
Cuando llega a su escritorio se pone a revisar el material de estudio, para
ver qué tipo de análisis estadístico es el adecuado y realiza su informe para
entregar a su superior.
CC AA
CC1 Actividad 2
Dado que este caso lo que se busca es ver si se presenta o no preferencia

en la elección de las distintas carreras a distancia ofrecidas, el planteo de las
hipótesis es el siguiente:
El estadístico de prueba es una ji cuadrado con 6 gl, ya que las categorías de

la variable son 7 y en este caso es necesario utilizar ningún estimador para
calcular las frecuencias esperadas.
Luego del procesamiento con el paquete estadístico SPSS, las salidas de

resultados son las siguientes:
Prueba de chi-cuadrado
Frecuencias
carrera
N observado N esperado Residual
A 18 17,0 1,0
B 12 17,0 -5,0
C 25 17,0 8,0
D 23 17,0 6,0
E 8 17,0 -9,0
F 19 17,0 2,0
G 14 17,0 -3,0
Total 119
Estadísticos de contraste
carrera
Chi-cuadrado a 12,941
gl 6
Sig. asintót. ,044
a. 0 casillas (,0%) tienen frecuencias
esperadas menores que 5. La frecuencia
de casilla esperada mínima es 17,0.

Del análisis de las mismas, podemos concluir:
- en el primer cuadro se muestran las frecuencias observadas y

las esperadas, bajo hipótesis nula cierta, es decir si no existiera
preferencia en la elección de las carreras, las frecuencias deberían
ser iguales.
- En el segundo cuadro se presenta, el valor del estadístico de prueba,
los grados de libertad y el valor p.
- Dado que el valor p es menor al nivel de significación propuesto
(0.044 < 0.05) se rechaza la H 0 , por lo tanto se concluye que existe
evidencia muestral suficiente para decir que existe diferencias en las
preferencias al elegir una carrera en la modalidad a distancia.
Nuevamente le propongo el desafío de resolver este caso, apoyándose

en lo aprendido en este módulo, aplicando los pasos de toda prueba de
hipótesis.
AA1 Actividad 2
Para resolver esta actividad, se le recomienda que revise todo lo relativo a las
pruebas de bondad de ajuste que se vieron es este módulo.
Además, le sugiero que lea atentamente el tema del texto sugerido como
bibliografía básica, allí encontrará desarrollado en extenso este tema.
Asimismo cuenta con más ejemplos y ejercicios que le permitirán poner en
práctica todo lo aprendido.
Fíjese que en este caso no se trata de una tabla de doble entrada, sino que
la variable en análisis es una sola, identifíquela y luego plantee las hipótesis
adecuadas.
Nuevamente en este caso, como no se solicita trabajar con un nivel de
significación específico, trabaje a un nivel del 5%.
Recuerde que el paso final en toda prueba de hipótesis es la conclusión y
consiguiente toma de decisión.

Métodos Cuantitativos Aplicados A Los Negocios: Man-Iv

Cargado por

Copyright:

Formatos disponibles

Métodos Cuantitativos Aplicados A Los Negocios: Man-Iv

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Métodos Cuantitativos Aplicados A Los Negocios: Man-Iv

Cargado por

Copyright:

Formatos disponibles

CDR

* Cada módulo contiene:

Ícono para indicación de Lectura Básica (disponible en ANEXO): ∙

Ícono para indicación de Lectura Complementaria (disponible en plataforma):

Impresión total del documento 259 páginas

EDUBP | CONTADOR | Métodos Cuantitativos Aplicados a los negocios - pág. 3

Hoy comienza el cursado a distancia de

Es conocido por todos que estamos viviendo tiempos de grandes cambios,

Las actividades que le iremos proponiendo en el transcurso de la asignatura,

EDUBP | CONTADOR | Métodos Cuantitativos Aplicados a los negocios- pág. 4

En Métodos Cuantitativos Aplicados a los negocios, se desarrollaron los

Para concluir esta presentación y para

“Nunca consideres el estudio como

Prof. Carla E. Carrizo Stauffer

Macroobjetivos • Comprender los fundamentos teóricos y prácticos del análisis estadístico

EDUBP | CONTADOR | Métodos Cuantitativos Aplicados a los negocios - pág. 5

Estimación puntual. Concepto. Propiedad de los buenos estimadores.

Módulo II: Prueba de hipótesis

Procedimiento de prueba de hipótesis estadística. Tests de hipótesis para

Módulo III: Regresión y correlación

Análisis de correlación. Coeficiente. Análisis de regresión. Conceptos. El

Módulo IV: Prueba Ji-Cuadrado

La prueba Ji-cuadrada como un procedimiento de prueba de hipótesis.

EDUBP | CONTADOR | Métodos Cuantitativos Aplicados a los negocios- pág. 6

EDUBP | CONTADOR | Métodos Cuantitativos Aplicados a los negocios - pág. 7

20% 30% 30% 20%

LIND, D., MARCHAL, W. y WATHEN, S.: Estadística Aplicada a los Negocios y

ANDERSON, DAVID R.; SWEENEY, DENNIS J.; WILLIAMS, THOMAS

EDUBP | CONTADOR | Métodos Cuantitativos Aplicados a los negocios- pág. 8

Análisis de regresión: Técnicas que permiten describir la naturaleza de la

Coeficiente de confianza: Valor de tabla asociado a un nivel de confianza.

Coeficiente de correlación: Medida de la fuerza de asociación entre dos

Coeficiente de determinación múltiple: medida del porcentaje de la

Coeficiente de determinación simple: Medida del porcentaje de la

Coeficiente de regresión estimado: Medida del cambio promedio en

Consistencia: Propiedad de un buen estimador, se da cuando el estimador

Diagrama de dispersión: Gráfica de pares de datos en un espacio

Distribución χ (ji cuadrado): Distribución de probabilidad con las

siguientes características: a) Su valor solo puede ser positivo; b) Hay una

Eficiencia: Propiedad de un buen estimador, se da cuando un estimador

Error de estimación: Diferencia absoluta entre el estimador y el parámetro.

Error Tipo I: Ocurre cuando se rechaza una hipótesis nula verdadera.

Estadístico de prueba χ : Estadístico con distribución ji-cuadrado que se

utiliza para investigar si dos variables cualitativas están relacionadas.

EDUBP | CONTADOR | Métodos Cuantitativos Aplicados a los negocios - pág. 9

Estimación por intervalos: Intervalo donde con cierta probabilidad se

Estimación puntual: Valor único calculado a partir de una muestra para

Estimador: Estadístico que se usa para estimar un determinado parámetro

Hipótesis Alternativa: Hipótesis de trabajo o de investigación, alternativa a la

Insesgabilidad: Propiedad de un buen estimador, se da cuando la esperanza

Límites de confianza: Límites de dos valores, máximo y mínimo, dentro de

Matriz de correlación: Presentación de los coeficientes de correlación para

Método de mínimos cuadrados: Método que determina la ecuación para la

Modelo estadístico: Un modelo que supone una relación funcional y algún

Muestras dependientes: Se caracterizan por una medición, después algún

Muestras independientes: Las muestras elegidas al azar no están relacionadas

Multicolinealidad: Condición que resulta cuando las variables predictoras

EDUBP | CONTADOR | Métodos Cuantitativos Aplicados a los negocios- pág. 10

Nivel de significación: Probabilidad de rechazar la hipótesis nula cuando es