Matematicas para Ing
Matematicas para Ing
Matematicas para Ing
1
Revisión no. 0. Fecha de revisión: septiembre, 2003. Página 2 de 1917 F-CADI-SA-MA-11-GP-A
I. DIRECTORIO
RECONOCIMIENTOS
ING. JAVIER TOCHIHUITL VÁZQUEZ UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ
ING. DIEGO A. GARCÍA RODRÍGUEZ UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ
ING. VICTOR MORALES GUZMÁN UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ
ING. MA. DEL ROSARIO ROSAS C. UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ
ING. ANGELINA ALONSO CAMPOS UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ
T.S.U. JANET BLANCAS UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ
2
ÍNDICE
# CONTENIDO PÁGINA
I. DIRECTORIO Y RECONOCIMIENTOS 2
II. ÍNDICE 3
III. INTRODUCCIÓN DE LA ASIGNATURA 4
IV. UNIDADES TEMÁTICAS
UNIDAD I. INTRODUCCIÓN 5
UNIDAD II. ORGANIZACIÓN Y PRESENTACIÓN DE DATOS 51
UNIDAD III. MEDIDAS DESCRIPTIVAS 72
UNIDAD IV. MODELOS PROBABILÍSTICOS 95
UNIDAD V. PRUEBAS DE HIPÓTESIS 111
UNIDAD VI. ANÁLISIS DE LA VARIANZA 130
UNIDAD VII. REGRESIÓN LINEAL 148
V. REFERENCIAS 177
VI. GLOSARIO 177
VII. ANEXOS 178
Ejercicios
3
III. INTRODUCCIÓN DE LA ASIGNATURA
Dentro de las asignaturas que corresponden al Área de Ciencias Básicas Aplicadas para la formación de
Técnico Superior Universitario en Procesos Agroindustriales encontramos la de Matemáticas para
ingenieros. Dicha asignatura tiene el objetivo de: aplicar herramientas estadísticas en el análisis de
información que se genera de mediciones de procesos alimentarios, para proponer soluciones en
problemas de control de calidad e interpretar resultados de experimentos realizados, para formular
conclusiones con nivel de escala probable.
El programa que comprende está asignatura esta formada por siete unidades. La primera corresponde a
una introducción a la Probabilidad, la segunda a la Organización y presentación de datos, la tercera a
Medidas descriptivas, la cuarta a Modelos probabilísticos, la quinta a Pruebas de hipótesis, la sexta a
Análisis de la varianza y la séptima a Regresión lineal.
4
CAPITULO 1
INTRODUCCIÓN A LA PROBABILIDAD
INTRODUCCIÓN
El alumno abordará en esta unidad temática los conceptos de probabilidad, aplicándolo al
experimento aleatorio y espacio muestral. Conocerá y distinguirá una población de datos,
determinando su muestra, ordenando los datos, tabulándolos y graficando estos datos para su
interpretación; estas herramientas estadísticas apoyaran a su formación, ya que podrá ordenar e
interpretar un conjunto de datos.
5
5.1 Utilizar el teorema de Bayes en problemas del ámbito profesional que involucren 45
probabilidades subjetivas.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
5.1.1. Emplear en problemas del ámbito profesional que involucren probabilidades
subjetivas y aplicar el teorema de Bayes en su solución.
6
TEMA 1
Objetivo de aprendizaje.
1. Ilustrar y relacionar el concepto de experimento aleatorio con el del espacio muestral.
Criterio de Aprendizaje.
1.1 Diferenciar el concepto de experimento aleatorio con el del espacio muestral.
Didáctica de enseñanza.
Ta. 1 Realizar ejercicios de experimentos aleatorios y obtener el espacio muestral posible.
La historia de la probabilidad comienza en el siglo XVII cuando Fermat y Pascal tratan de resolver
algunos problemas relacionados con los juegos de azar.
Christian Huygens conoció la correspondencia entre Blaise Pascal y Pierre Fermat suscitada por el
caballero De Méré y publicó (en 1657) el primer libro sobre probabilidad: De Ratiociniis in Ludo
Aleae, (Calculating in Games of Chance), un tratado sobre juegos de azar.
Durante el siglo XVIII, debido muy particularmente a la popularidad de los juegos de azar, se
publicaron varios documentos de este tipo. Jakob Bernouilli (1654-1705) Ars Conjectandi (publicado
en 1713 aunque escrito sobre 1690) y Auguste De Moivre (1667-1754) contribuyeron de forma
importante a este desarrollo.
En 1812 Pierre Laplace publicó Théorie analytique des probabilités en el que expone un análisis
matemático sobre los juegos de azar.
Desde los orígenes la principal dificultad para poder considerar la probabilidad como una rama de la
matemática fue la elaboración de una teoría suficientemente precisa como para que fuese aceptada
como una forma de matemática. A principios del siglo XX el matemático ruso A. Kolmogorov la
definió de forma axiomática y estableció las bases para la moderna teoría de la probabilidad que en la
actualidad es parte de una teoría más amplia como es la teoría de la medida.
En estas notas, entenderemos por experimento aleatorio cualquier situación que, realizada en las
mismas condiciones, sea imposible de predecir el resultado que obtengamos.
Experimento Aleatorio: Es aquel que se realiza sin tener el conocimiento previo de los resultados que
se obtendrán del mismo.
Si sale cara se extrae de una urna U 1, con una determinada composición de bolas de colores, una bola y
si sale cruz de extrae de una urna U 2, con otra determinada composición de bolas de colores, una bola.
A continuación se considera el color de la bola extraído.
7
Los tres primeros son ejemplos de experimentos aleatorios simples y el último un ejemplo de
experimento aleatorio compuesto
Puedes comprobar las operaciones unión, intersección y diferencias de dichos sucesos pasando el ratón
sobre los correspondientes diagramas
Unión:
{“números pares o múltiplos de 3”} = {2, 3, 4, 6}
Intersección:
{“números pares y múltiplos de 3”} = {6}
8
Diferencia B - A
{“múltiplos de 3 y no números pares”} = {3}
Diferencia A - B
{“números pares y no múltiplos de 3”} = {2, 4}
Unión
(A o B) = {“salen al menos dos cruces o sale alguna cara”} = {+++, c++, +c+, ++c, ccc, cc+, c+c, +cc}
Intersección
(A y B) = {“salen al menos dos cruces y sale alguna cara”} = {c++, +c+, ++c}
Diferencias
A - B = (A y Bc) = {“salen al menos dos cruces y no sale alguna cara”}
B - A = (B y Ac) = {“sale alguna cara y no salen al menos dos cruces”}
Algunas consideraciones básicas con sucesos que serán útiles para la resolución de problemas
Sucesos incompatibles y complementarios
9
Si A es un suceso de un determinado experimento aleatorio cuyo espacio muestral es E, entonces A y su
complementario son incompatibles, es decir
(A y Ac) = Ø
Además (A o Ac) = E
Dos sucesos complementarios son incompatibles, pero el recíproco no es cierto, es decir dos
sucesos incompatibles no tienen por qué ser complementarios.
Dados dos sucesos A y B de un determinado experimento aleatorio que no sean incompatibles los
sucesos (A - B), (B - A) y (A y B) son incompatibles
Además podemos expresar tanto A como B como unión de dos sucesos incompatibles
A = (A - B) o (A y B)
B = (B - A) o (A y B)
10
Consideremos el experimento aleatorio consistente en lanzar tres monedas y los sucesos
A = {“salen al menos dos cruces”} = {c++, +c+, ++c, +++}
B = {“salen dos cruces”} = {c++, +c+, ++c}
Leyes de De Morgan
Dos propiedades importantes que, a veces, resultan útiles en la resolución de problemas son las
siguientes:
Consideremos el experimento aleatorio consistente en lanzar dos dados (o un dado dos veces) y sumar
la puntuación obtenida.
El conjunto formado por todas las posibles sumas que pueden obtenerse se denomina Espacio Muestral
de dicho experimento aleatorio y suele designarse por E. Cada uno de los elementos de E es un suceso
elemental.
Entre los sucesos apuntados, existen sucesos simples (o elementales) (por ejemplo el M) y otros
sucesos compuestos constituidos por varios sucesos elementales. El conjunto de todos estos sucesos,
incluidos los sucesos seguro e imposible, se denomina Espacio de Sucesos (constituido por todos los
subconjuntos que pueden formarse a partir del espacio muestral E) que suele designarse por P (E).
El diagrama de árbol de la figura corresponde al experimento aleatorio de lanzar una moneda tres veces
(o tres monedas) y considerar el resultado obtenido.
El espacio muestral se obtiene fácilmente sin más que ir recorriendo todas las ramas y es
Se considera el experimento aleatorio consistente en lanzar una moneda. Si sale cara se extrae de una
urna que contiene bolas azules y rojas una bola y si sale cruz se extrae una bola de otra urna que
contiene bolas rojas y verdes.
Espacio muestral del experimento aleatorio consistente en el lanzamiento de dos dados (o un dado dos
veces) y observar el resultado
En el experimento aleatorio del lanzamiento de dos dados, el suceso “la suma obtenida sea 7” es
S = {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}
13
En el experimento aleatorio del lanzamiento de dos dados, el suceso “la suma obtenida es número
primo” es
S = {(1,1), (1,2), (2,1), (1,4), (2,3), (3,2), (4,1), (1,6), (2,5), (3,4), (4,3), (5,2), (6,1), (5,6), (6,5)}
En el experimento aleatorio del lanzamiento de dos dados, el suceso “en los dos lanzamientos se
obtiene número primo” es
En el experimento aleatorio consistente en lanzar dos dados y considerar la suma de ambos, los sucesos
{“obtener suma par”} y {“obtener suma impar”} son complementarios. También son complementarios
los sucesos {“obtener suma mayor o igual que 5”} y {“obtener suma menor que 5”}.
En el experimento aleatorio consistente en lanzar dos monedas los sucesos {“obtener al menos una
cara”} y {“no obtener ninguna cara”} son complementarios.
El complementario del suceso A = {“en los dos lanzamientos se obtiene número primo”} (en amarillo)
es el suceso B = {“en alguno de los dos lanzamientos (o en ambos) no se obtiene número primo”} (en
verde)
14
Evidencia parcial
Ta. 1 Realizar ejercicios de experimentos aleatorios y obtener el espacio muestral posible.
Evaluación parcial
Entrega de Ta.1
15
TEMA 2
Objetivo de aprendizaje.
2. Definir el concepto de población y muestra.
Criterio de Aprendizaje.
2.1 Distinguir el concepto de población y muestra.
Didáctica de enseñanza.
Población: es el conjunto de datos que caracteriza el fenómeno que se desea estudiar. Una
población está determinada por sus características definitorias. Por lo tanto, el conjunto de elementos
que posea esta característica se denomina población o universo. Población es la totalidad del fenómeno
a estudiar, donde las unidades de población poseen una característica común, la que se estudia y da
origen a los datos de la investigación.
Entonces, una población es el conjunto de todas las cosas que concuerdan con una serie determinada de
especificaciones. Un censo, por ejemplo, es el recuento de todos los elementos de una población.
Cuando seleccionamos algunos elementos con la intención de averiguar algo sobre una población
determinada, nos referimos a este grupo de elementos como muestra. Por supuesto, esperamos que lo
que averiguamos en la muestra sea cierto para la población en su conjunto. La exactitud de la
información recolectada depende en gran manera de la forma en que fue seleccionada la muestra.
Cuando no es posible medir cada uno de los individuos de una población, se toma una muestra
representativa de la misma.
La muestra descansa en el principio de que las partes representan al todo y, por tal, refleja las
características que definen la población de la que fue extraída, lo cual nos indica que es representativa.
El método de muestreo se basa en ciertas leyes que le otorgan su fundamento científico, las cuales son:
Ley de los grandes números: si en una prueba, la probabilidad de un acontecimiento o suceso es P, y
si éste se repite una gran cantidad de veces, la relación entre las veces que se produce el suceso y la
cantidad total de pruebas (es decir, la frecuencia F del suceso) tiende a acercarse cada vez más a la
probabilidad P.
De estas dos leyes fundamentales de la estadística, se infieren aquellas que sirven de base más
directamente al método de muestreo:
16
Ley de la regularidad estadística: un conjunto de n unidades tomadas al azar de un conjunto N, es
casi seguro que tenga las características del grupo más grande.
Ley de la inercia de los grandes números: esta ley es contraria a la anterior. Se refiere al hecho de
que en la mayoría de los fenómenos, cuando una parte varía en una dirección, es probable que una parte
igual del mismo grupo, varíe en dirección opuesta.
Tipos de muestras.
Muestreo aleatorio simple: la forma más común de obtener una muestra es la selección al azar. Es
decir, cada uno de los individuos de una población tiene la misma posibilidad de ser elegido. Si no se
cumple este requisito, se dice que la muestra es viciada. Para tener la seguridad de que la muestra
aleatoria no es viciada, debe emplearse para su constitución una tabla de números aleatorios.
Muestreo estratificado: una muestra es estratificada cuando los elementos de la muestra son
proporcionales a su presencia en la población. La presencia de un elemento en un estrato excluye su
presencia en otro. Para este tipo de muestreo, se divide a la población en varios grupos o estratos con el
fin de dar representatividad a los distintos factores que integran el universo de estudio. Para la
selección de los elementos o unidades representantes, se utiliza el método de muestreo aleatorio.
Muestreo por cuotas: se divide a la población en estratos o categorías, y se asigna una cuota para las
diferentes categorías y, a juicio del investigador, se selecciona las unidades de muestreo. La muestra
debe ser proporcional a la población, y en ella deberán tenerse en cuenta las diferentes categorías. El
muestreo por cuotas se presta a distorsiones, al quedar a criterio del investigador la selección de las
categorías.
Muestreo intencionado: también recibe el nombre de sesgado. El investigador selecciona los elementos
que a su juicio son representativos, lo que exige un conocimiento previo de la población que se
investiga.
Muestreo mixto: se combinan diversos tipos de muestreo. Por ejemplo: se puede seleccionar las
unidades de la muestra en forma aleatoria y después aplicar el muestreo por cuotas.
Muestreo tipo: la muestra tipo (master simple) es una aplicación combinada y especial de los tipos de
muestra existentes. Consiste en seleccionar una muestra "para ser usada" al disponer de tiempo, la
muestra se establece empleando procedimientos sofisticados; y una vez establecida, constituirá el
módulo general del cual se extraerá la muestra definitiva conforme a la necesidad específica de cada
investigación.
Para ilustrar, tomemos el siguiente ejemplo: Supóngase que se tienen que estudiar las edades una
población de radioescuchas, por ser tan grande la cantidad de ellos, solamente se encuestan a 350 de
ellos, los cuales en este caso serán la muestra de dicha población.
17
Las muestras representativas de su población son aquellas que poseen las mismas características de la
población que se desea estudiar.
Poblaciones infinitas: Todos los juegos o fenómenos cuyos resultados están indeterminados
cuantitativamente ó aquellas poblaciones que por su gran número de elementos, resulta prácticamente
imposible trabajar con todos ellos.
Poblaciones finitas: Todos los juegos o fenómenos cuyos resultados están determinados
cuantitativamente, ya que se pueden conocer cantidades específicas.
Función: Es establecer una relación entre dos elementos distintos, como son población y tiempo, con
base en esto podemos decir que la población esta en función del tiempo: p= f (t), también recibe el
nombre de función explícita, y consta de una variable independiente (t), y una variable
dependiente(p).Así podemos decir que B= a una función implícita ya que consta de dos variables
independientes (p,t), esto quiere decir: que B esta en función del paso del tiempo, es decir : B=f(p.t).
Gráfica: Una gráfica es una representación de la relación entre variables, muchos tipos de gráficos
aparecen en estadística, según la naturaleza de los datos involucrados y el propósito de la gráfica, es la
de representar los valores tabulados obtenidos de los muestreos o los datos del total de la población.
Constante: Un elemento constante es aquel que durante un intervalo definido siempre va a valer lo
mismo, conservando sus características.
Variable: Es un elemento que durante un intervalo definido se va a comportar de distintas formas. Las
variables que se manejan en estadística moderna son aleatorias.
Variable Aleatoria: Es aquella que al tener una función se asigna un número real a cada resultado en el
espacio muestral de un experimento aleatorio.
Variables discretas: Son aquellas que toman determinado valor exacto como: El No. De hijos de una
familia.
Ecuación: Las ecuaciones son enunciados del tipo A = B donde A = miembro ó lado izquierdo, y B =
miembro derecho al cual se le pueden hacer una serie de operaciones.
Filas de datos: Consiste en datos que no han sido ordenados y que simplemente han sido tomados
como tal. Un ejemplo sería: Estatura de los estudiantes, que posteriormente se agrupan
numéricamente.
Ordenación: Consiste en ordenar datos en forma creciente y decreciente y la diferencia entre el mayor
y el menor de los datos recibe el nombre de rango.
Distribución de frecuencia:
18
Al resumir grandes colecciones de datos, es útil distribuirlos en clases o categorías, y determinar el
número de individuos que pertenecen a cada clase llamado frecuencia de clase.
Una disposición tabular de los datos por clases junto con las frecuencias correspondientes de clase se
llama distribuidores de frecuencia o tablas de frecuencia.
Tipos de intervalos: Un intervalo de clase que, al menos en teoría carece de Limite Superior o Limite
Inferior indicado. Se llama intervalo de Clase Abierto, ejemplo: refiriéndonos a edades de 65 años o
más.
Supóngase que f(x) es una población, donde X1, X2, X3... Xn son las muestras. Se dice que es una
muestra X1 sin remplazamiento, si X1 se analiza sin regresarla a la población, si por el contrario se
analiza la muestra y se regresa a la población antes de realizar cualquier otro experimento, será una
muestra con remplazamiento.
Ejemplo 1)
Supóngase que se tienen 12 canicas
4 ROJAS 4 VERDES 4 NEGRAS
¿Qué probabilidad existe de extraer una canica roja, con remplazamiento y sin remplazamiento?
a) Con remplazamiento: 4 / 12
b) Sin remplazamiento: 4 / 11
X1 X2
X3 X4
Xn
Se llama muestreo sin reemplazo cuando de una población tomamos X muestras sin devolverlas.
Se llama muestreo con reemplazo cuando una población f ( x ) toma una o varias muestras ingresándola
a la población.
Suponga una población f( x ) donde f( x ) son 1000 resistencias de diferentes valores, si tomamos de
muestras 10 resistencias las analizamos y posteriormente las regresamos estamos hablando de muestras
con remplazamiento, esto sería un ejemplo de población infinita que resulta de una población finita.
Muestras Aleatorias:
19
suficientemente bien, uno de los problemas importantes de la diferencia estadística es como recoger
una muestra.
Una forma de hacer esto para poblaciones finitas es asegurarse de que cada miembro de la población
tenga igual oportunidad de encontrarse en la muestra lo cual se conoce como muestra Aleatoria.
Ejemplo 1:
d) Población de todos los focos de 40 watts que serán producidos por la compañía Sylvania.
Ejemplo 2:
VA ===> Personalidad, carácter, paciencia, I.D. de cada alumno (aunque es un número entero es
atributo de una persona), número de empleado, RFC.
VCC ===> Edad, peso, altura, estatura, temperatura, calificaciones, promedio, medida de inteligencia.
VCD ===> Hijos, propiedades, 1 año, número de parientes, número de producción de autos, número de
alumnos, número de calculadoras vendidas, carreras, universidades, unidades de las materias
b) Una muestra que consta de 4 personas en un gimnasio fue cuestionada sobre "el color de short que
gustaba vestir para hacer ejercicio", la "marca" y la "talla" que usa. Los datos recolectados fueron:
Short de color rojo, verde, negro y azul. Estos datos fueron reescritos con clave:
Verde = 2, lila = 3 y azul = 3, rojo = 4
20
Detectar las variables, el promedio de cada variable y el tipo de variable.
Solución:
A pesar de que los datos fueron reescritos como 1, 2, 3, 4, no tendría sentido encontrar el promedio de
la muestra sumando y dividiendo entre 4: (verde + lila + azul + rojo)/4 o como (1 + 2 + 3 + 4)/4. Esto
último a pesar de ser un número sigue siendo variable cualitativa y el resultado del promedio no tiene
sentido.
Ejemplo 3:
1) ¿Cuál es la población?
2) ¿Cuál es la muestra?
3) Identifique el parámetro de interés
4) Identifique la estadística y proporcione su valor
5) ¿Se conoce el valor del parámetro?
Solución:
1) ¿Cuál es la población? Todas las personas que padecen hipertensión (presión arterial elevada), cuya
presión pueda ser controlada por un nuevo producto desarrollado por la empresa.
21
3) Identifique el parámetro de interés. La proporción de la población que padecen hipertensión y que
puede ser controlada por un nuevo producto desarrollado por la empresa. Dicho de otra manera, es la
proporción de la población para la que es eficaz el medicamento.
b) Un comunicólogo desea calcular el "rating" del noticiario de "Joaquín López Doriga". Se condujo un
estudio en el que participaron 1000 televidentes, y se encontró que el 60% de las personas ven el
noticiario. Suponiendo que las 1000 personas son representativas del grupo de televidentes, conteste las
siguientes preguntas:
1) ¿Cuál es la población?
2) ¿Cuál es la muestra?
3) Identifique el parámetro de interés
4) Identifique la estadística y proporcione su valor
Solución:
1) ¿Cuál es la población? Todos los televidentes.
3) Identifique el parámetro de interés. El "rating" del noticiario de” Joaquín López Doriga". O la
proporción de la población que ve el noticiario de” Joaquín López Doriga".
c) Un técnico de control de calidad selecciona piezas ensambladas de una línea de montaje y registra la
siguiente información de cada pieza:
A: Defectuosa o no defectuosa
C: El peso de la pieza
1) ¿Cuál es la población?
3) ¿Cuál es la muestra?
4) Clasifique las respuestas para cada una de las tres variables como de variables cualitativas o
atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD):
Solución:
1) ¿Cuál es la población? Todas las piezas ensambladas de una línea de montaje.
22
2) La población ¿es finita o infinita? Infinita.
4) Clasifique las respuestas para cada una de las tres variables como variables cualitativas o atributivas
(VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD):
B: El número de identificación del trabajador que ensambló la pieza. VA. Variable atributiva
Multinomial.
d) Se hizo un estudio con 500 estudiantes de la UDLA y se registro la siguiente información de cada
uno:
Suponiendo que los 500 estudiantes son representativos de este estudio, se encontró que el 70 % asiste
a discotecas los jueves en la noche. Conteste las siguientes preguntas
1) ¿Cuál es la población?
2) ¿Cuál es la muestra?
3) Identifique el parámetro de interés.
4) Identifique la estadística y proporcione su valor.
5) Clasifique las respuestas para cada una de las tres variables como de variables cualitativas o
atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD).
Solución:
1) ¿Cuál es la población?
Todos los estudiantes de la UT.
2) ¿Cuál es la muestra?
500 Número de estudiantes de la UT.
5) Clasifique las respuestas para cada una de las tres variables como de variables cualitativas o
atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD).
Al contabilizar las respuestas "Si" o "No" asiste a discotecas los jueves en la noche, se convierte en el
número de estudiantes que va las discotecas. VCD
e) Un estudio está interesado en determinar algo sobre el promedio del valor en $ de las computadoras
que pertenecen al cuerpo docente de la UT. Diga:
1) ¿Cuál es la población?
2) La población es ¿finita o infinita?
3) Dar una muestra
4) ¿Cuál es la variable?
5) ¿Que tipo de variable es la variable?
6) Dar un dato
7) Dar todos los datos de la muestra
8) ¿Cuál es el experimento?
9) ¿Cuál es el parámetro?
10) ¿Cuál es la estadística que se encuentra?
Solución:
1) ¿Cuál es la población?
Colección de todas las computadoras que pertenecen a todos los miembros del cuerpo docente de la
universidad.
4) ¿Cuál es la variable?
"El valor en $ de cada computadora en particular"
6) Dar un dato
Por ejemplo la computadora de la "Doctora Pilar Gómez" que está valuada en $15,000.
8) ¿Cuál es el experimento?
24
Los métodos aplicados para seleccionar las computadoras que integran la muestra y determinar el valor
de cada computadora de la muestra. El método aplicado fue preguntando a cada miembro del
departamento. Otra forma de realizarlo sería preguntando por medio de un memorándum o por medio
de un e-mail.
9) ¿Cuál es el parámetro?
Es sobre el que se está buscando información, es decir, el promedio del valor de todas las computadoras
de la población:
prom = (15000 + 20000 + 18000 + 35000 + 22000 + 16000 + 30000 + 25000 + 8000)/9 =
prom = $21,000
f) La siguiente tabla representa las características de todos los empleados de tiempo completo de la
fábrica de Shampoo "Patito" al 1o. de enero del año en curso.
Diga:
1) ¿Cuál es la población?
2) La población es ¿finita o infinita?
3) Dar una muestra
4) ¿Cuál es la(s) variable(s)?
5) ¿Que tipo de variable(s) es (son)?
6) Dar un dato
7) Dar todos los datos de una muestra
Solución:
1) ¿Cuál es la población?
Es posible obtener en este ejemplo varias poblaciones, dado que hay 6 variables (los encabezados de
las columnas), esta tabla contiene 6 poblaciones. Las poblaciones son:
Población de empleados por Número de empleado , la población de empleados por Color ojos, la
población de empleados por Sexo, la población de empleados por Puesto, la población de empleados
por Años de Servicio y la población de empleados por Salario Anual.
25
2) La población es ¿finita o infinita?
Todas las poblaciones constan de 8 empleados por lo que es finita.
6) Dar un dato
Sueldo anual = $65000
26
TEMA 3
Objetivo de aprendizaje.
3. Definir el concepto de probabilidad y relacionarlo con el de frecuencia relativa.
Criterio de Aprendizaje.
3.1 Analizar el concepto de probabilidad y relacionarlo con el de frecuencia relativa
Didáctica de enseñanza.
Ta. 2 Realizar ejercicios donde se estime frecuencias relativas a partir de experimentos aleatorios y/o
datos de muestras
Esto es rigurosamente cierto cuando n es muy grande. Más formalmente, se deberá escribir así:
Donde:
P(E): Probabilidad que el resultado E ocurra.
E: Resultado que interesa analizar.
M: Número de veces que ocurre E.
n: Número de veces que se ejecuta el experimento.
Por ejemplo, si se desea saber cuál es la probabilidad de ocurrencia de que aparezca el número 2 en la
cara superior cuando se lanza un dado, se podrían hacer lanzamientos seguidos y anotar cuántas veces
aparece cada número, en particular el 2. Si esto se repite varias veces, entonces la relación entre el
número de veces que apareció el 2 y el número de lanzamientos será un estimativo de la probabilidad.
Esta frecuencia relativa tiende a un número; en el caso de un dado que no esté cargado, esta frecuencia
tiende a 1/6.
Una variable aleatoria está definida por una función que asigna un valor de dicha variable aleatoria a
cada punto del universo. Por ejemplo, la variable aleatoria puede ser el valor que aparezca en la cara
superior del dado, o el cuadrado de este valor, etc. En este ejemplo, E=2, m es el número de veces que
aparece el número 2 y n es el número de lanzamientos.
27
A continuación se presentan algunas propiedades básicas de la probabilidad.
1) La probabilidad de un resultado del universo es una cantidad menor o igual que uno y mayor o igual
que cero. Esto se explica porque la probabilidad está definida por la proporción entre un número de
casos “exitosos” y el número total de casos. El número de casos “exitosos” es menor que el número
total de casos.
Ejercicio
Lanzar una moneda 50 veces. Construir y completar en la hoja de cálculo la siguiente tabla de ejemplo:
Construir una gráfica de los resultados con n en las abcisas y m/n en las ordenadas, como se ilustra a
continuación.
2) La probabilidad de un resultado que no puede ocurrir, o sea que no pertenece al universo, es cero.
3) La probabilidad del universo es uno. Es decir, la probabilidad de que ocurra alguno de los resultados
de todo el conjunto posible de ellos es P(E1+E2+...+Em) y es igual a 1, donde (E1,E2,...,Em), son
todos los resultados posibles, mutuamente excluyentes y exhaustivos del universo.
Nota: Se dice que unos resultados son mutuamente excluyentes cuando la ocurrencia de cualquiera de
ellos elimina la ocurrencia de cualquier otro.
28
m1+m2+m3+...mk = n (3)
Si esta ecuación se divide por n, entonces la suma de las frecuencias relativas es igual a 1.
P(E1)+P(E2)+P(E3)+...P(Ek) = 1 (5)
4) Si E y F son resultados mutuamente excluyentes, o sea que sólo uno de ellos puede ocurrir, entonces
la probabilidad de que ocurra E o F es P (E+F) = P (E) + P(F). Nuevamente, en el lanzamiento de un
dado de seis caras numeradas de 1 a 6, sólo un número aparecerá en la cara superior, por lo tanto, los
resultados (E2) y (E6), o sea que aparezca 2 en un caso o que aparezca 6 en el otro, son resultados
mutuamente excluyentes. La probabilidad de que ocurra E2 o E6 es de 1/6+1/6 o sea, 1/3.
5) Si E y F son resultados independientes, esto es, que la ocurrencia de uno no afecta la ocurrencia del
otro, la probabilidad de que ocurran simultáneamente P(EF), es P(E) x P(F). Tomando como ejemplo
el dado de seis caras, el hecho que en el primer lanzamiento del dado aparezca un 2, no influye para
que en el segundo lanzamiento aparezca cierto número; los lanzamientos son resultados
independientes. Entonces, la probabilidad de que en el primer lanzamiento aparezca un 2 y en el
segundo aparezca un 6 será 1/6x1/6, o sea, 1/36.
NOTA: Obsérvese que cuando se trata de resultados mutuamente excluyentes y se desea saber la
probabilidad de que uno de los dos ocurra, se expresa con frases ligadas por o; en el caso de resultados
independientes y si se desea calcular la probabilidad de que ambos ocurran, las frases se ligan con y.
Estas propiedades son formales pero coinciden con las nociones intuitivas de probabilidad.
En la realidad los hechos no son tan simples como en el ejemplo del dado. Ocurren combinaciones que
complican un poco la situación. El cálculo de sus probabilidades es más complejo.
Ejemplo
Supóngase que se desea analizar los resultados de una inversión $1.000 a tres años. El resultado de
cada año es la ocurrencia de un ingreso por valor de $600 o $0. Los resultados posibles son:
(NNN) = m1
(NNS) = m2
(NSN) = m3
(NSS) = m4
(SNN) = m5
(SSN) = m6
(SNS) = m7
(SSS) = m8
Y así para los demás casos. Las probabilidades de que el resultado sea cero son:
P(N)1 = ,3
P(N)2 = ,3
P(N)3 = ,3
NOTA: Se supone que los eventos son independientes entre sí. Esto significa que el resultado positivo
de un año no influye en la probabilidad de que, en los años siguientes, el resultado sea también
positivo. Esto en la realidad puede que no ocurra. Sin embargo, para efectos del análisis, se hará caso
omiso de esta consideración.
Estos resultados se denominarán puntos. Los eventos serán una combinación cualquiera de puntos. Así
se puede pensar en el evento, “por lo menos un año con ingreso”, el cual incluiría los puntos m2, m3,
30
m4, m5, m6, m7 y m8, o en el evento “a lo sumo un año con ingreso cero”, el cual incluiría los puntos
m4, m6, m7 y m8.
Si la probabilidad de que ocurra el ingreso es diferente a 70%, hay que introducir los valores adecuados
en los cálculos.
La probabilidad de estos eventos será la suma de la probabilidad de los puntos. En el primer evento, la
probabilidad será de:
0,063+0,063+0,147+0,063+0,147+0,147+0,343 = 0,973
0,147+0,147+0,147+0,343 = 0,784
Evidencia parcial
Ta. 2 Realizar ejercicios donde se estime frecuencias relativas a partir de experimentos aleatorios y/o
datos de muestras
Evaluación parcial
Entrega de Ta.2
31
TEMA 4
Objetivo de aprendizaje.
4. Definir el concepto de probabilidad y relacionarlo con el de la frecuencia relativa.
Criterio de Aprendizaje.
4.1. Diferenciar el concepto de probabilidad y relacionarlo con el de la frecuencia relativa.
Didáctica de enseñanza.
Pa. 1 Elaborar ejercicios donde se emplee la fórmula de probabilidad condicional en problemas del
ámbito profesional donde la ocurrencia de un evento dependa de otro.
Probabilidad condicional
Generalmente hablando, la probabilidad condicional de un evento A dado otro evento B, denotada P(A|
B) es la probabilidad de que el evento A ocurra cuando sabemos que el evento B ocurrió. Esta es razón
por la cual se llama condicional a esta probabilidad. La probabilidad de que el evento A ocurra está
condicionada por la ocurrencia de B. Esta información adicional sobre A se incluye en el cómputo de su
probabilidad condicional cuando analizamos los resultados posibles que se pueden observar cuando
sabemos que B ha ocurrido.
Por simplicidad, supondremos que tenemos muy buena puntería y que el dardo siempre cae en el
tablero S. Esto significa que la probabilidad de que el dardo aterrice en el tablero es 1. Suponemos
además, que S, A, B, C se refieren a los discos completos y no tan sólo a la franja. Así S es un disco
que contiene al disco A, el que a su vez incluye el disco B. Este último incluye el disco C.
Podemos relacionar la probabilidad de que un dardo aterrice en cualquier región directamente al área
de la región. Les asignaremos probabilidades a las varias regiones en la tabla tomando la razón del área
de la región al área del tablero. Esta asignación es razonable, ya que mientras más grande es la región,
más probable debe ser que el dardo aterrice allí. Estamos considerando el área del tablero S como una
unidad contra la cual comparar las otras áreas, además, si comparamos el área de S consigo misma
obtendremos una razón de 1, por esto es razonable decir que el área de S es igual a su probabilidad, 1.
Con esta suposición, el área de cada disco es igual a la probabilidad de que el dardo caiga en el disco.
32
Denotaremos el evento que el dardo aterrice en la región S, A, B o C por el nombre de la región.
Supongamos que la razón del área de región A a S es 1/2, de la región B a S es 1/10 y de la región C a S
es 1/60. Según la asignación de probabilidad que hicimos, tenemos que P(A) = 1/2, P (B) = 1/10, P (C)
= 1/60 y P (S) = 1.
Ahora hacemos el siguiente experimento: igual que con el juego de colocar la cola al burro, nos
vendamos los ojos y lanzamos el dardo. Un juez nos dice que aterrizó en la región A. Entonces
preguntamos ¿cuál es la probabilidad de que haya aterrizado en B? Si no hacemos uso del hecho de que
el dardo aterrizó en A, contestaremos la probabilidad buscada es 1/10. Pero sabemos que el dardo
aterrizó en A, que B está contenido totalmente en A y que el área de B es una quinta parte del área de A,
entonces la respuesta correcta es 1/5, estableciendo que P (B|A) = (1/10)/(1/2) = 1/5.
Esta expresión se justifica con el siguiente argumento. Como sabemos que el dardo ha aterrizado en A,
el área de A ahora llega a ser una nueva unidad contra la cual medir otras áreas, esto explica el
denominador. El numerador corresponde al área en común de las regiones A y B. Dado el hecho que el
dardo aterrizó en A, la única manera en que el dardo puede aterrizar también en la región B es que haya
aterrizado en ambas regiones. Ahora la región B está contenida en la región A, por lo cual A∩B= B y P
(A∩B) = P (B).
Pregunta
¿Cuál es la probabilidad que el dardo haya aterrizado en A si sabemos que aterrizó en B?
Como sabemos que B está contenido totalmente en A, vemos que si el dardo aterriza en B entonces
tiene que haber aterrizado en A. Siguiendo este razonamiento tenemos:
P (A|B)= (área de A también en B)/ (área de B)= (área de B)/ (área de B)= 1.
Pregunta
Si el dardo aterrizó fuera de B, ¿cuál es la probabilidad que haya aterrizado en C?
33
Para calcular P (B|A) debemos darnos cuenta de que B tiene un pedazo pequeño en común con la
región A. Este pedazo tiene área igual a 1/ 30. Si sabemos que el dardo aterrizó en A, para que haya
caído en B, debe haber aterrizado en esta pequeña región en común. La región A es nuestra unidad de
comparación. Comparamos el área en la intersección de A y B con el área de A para obtener nuestra
contestación. Así P (B|A) es igual a la proporción (1/ 30) / ( 1/2)= 1/ 15. Este resultado se puede
interpretar como el número de veces que la región en común entre A y B cabe en la región A.
La respuesta a P (A|B) no es tan fácil de hallar como antes. Sabemos ahora que el dardo aterriza en la
región B. Debemos hallar la proporción del área de la intersección de A y B al área de B. Ahora la
región B es nuestra unidad y así P (A|B) es igual a (1/30) / (1/10)= 1/3.
Un ejercicio fácil de resolver es hallar P (A|C). Como A y C son disjuntos, si el dardo aterrizó en C
sabemos que es imposible que haya aterrizado también en A, por esta razón la probabilidad buscada
debe ser cero.
Se puede traducir estos datos en proporciones o porcentajes y representar en un diagrama de Venn tal
como a la derecha. El conjunto W representa todas las mujeres en la muestra, F el conjunto representa
los estudiantes que reciben ayuda económica y J el conjunto de estudiantes en la muestra que trabajan.
34
Nos proponemos seleccionar al azar una persona de estos 100 estudiantes en la muestra. Entonces
podemos hablar acerca de la probabilidad que la persona seleccionada es una mujer, por ejemplo. Sin
temor a confundirnos, usaremos los nombres F, J y W para denotar el evento que la persona
seleccionada recibe ayuda económica, trabaja o es una mujer, respectivamente.
Entonces P (W)= .30 + .05 + .05 + .15 = .55, por ejemplo. De este diagrama de Venn podemos
contestar rápidamente muchas preguntas que a primera vista parecen ser muy complicados, tal como,
¿qué proporción de estudiantes son mujeres que no trabajan y reciben ayuda económica? Esta pregunta
es equivalente a encontrar P (W y F y no J). La solución, .30 se encuentra en la intersección de los tres
conjuntos W, no J, F.
La probabilidad condicional se ve en situaciones donde queremos saber, por ejemplo‚ qué proporción
de estudiantes que trabajan son mujeres. Esto es equivalente a encontrar P (W | J). La proporción de
estudiantes que trabajan es .40, la proporción de mujeres que trabajan es .20. De esta manera la
proporción de mujeres de entre todos los estudiantes que trabajan‚ es .20/ .40= .50, es decir, la mitad de
los estudiantes que trabajan son mujeres. Igual a las ideas desarrolladas previamente podemos escribir
la solución como P (W | J ) = P (W y J)/ P (J) = .20/ .40 = .50.
El diagrama de Venn que representa los resultados obtenidos en la encuesta parece también un tablero
de dardos. La probabilidad de que el dardo caiga en cualquiera de esas regiones está dada por la
proporción de estudiantes representados en esa región.
Dejemos que R y G denoten el valor observado en la cara del dado rojo y en el dado verde,
respectivamente y X la suma de los valores observados, es decir, X = R + G. Si suponemos que los
dados están balanceados, entonces los 36 resultados distintos del experimento son igualmente
probables. Por la forma como se lleva a cabo el experimento, vemos que el valor observado en un dado
no está relacionado con el valor en el otro dado, es decir. El valor obtenido en un dado es independiente
del obtenido en el otro. De estas suposiciones tenemos que P (R = r) = P (G = g) = 1/ 6 y que P (R= r,
G= g)= 1/ 36 para r, g= 1,2, ..., 6.
En esta situación muchas preguntas acerca de la probabilidad de eventos particulares se pueden reducir
a contar el número de elementos en el conjunto apropiado.
35
Espacio muestral de los resultados al tirar dos dados
Pregunta
Encontremos la probabilidad que el número de puntos en el dado rojo es menor o igual a 3: P(R 3).
Para encontrar esta probabilidad debemos contar el número de pares en la tabla para los cuales R ≤3.
Vemos que hay 18 de estos pares de un total de 36 pares posibles así obtenemos P (R ≤3)= 18/ 36=
1/2.
Pregunta
¿Cuál es la probabilidad que la suma X de los valores observados en los dos dados es menor de 6, es
decir, P (X< 6)?
El número de pares donde observamos esta situación es 10, de un total de 36 pares posibles, por eso
debemos tener P(X < 6) = P (X ≤5)= 10/ 36. Supongamos estás en tu casa y un amigo te invita a jugar
un juego donde se lanzan dos dados, tal como Parchís. A ti te interesa que la suma de los puntos en los
dados sea 9. Tiras los dados, pero no miras el resultado. Tu amigo te dice que la suma de los dados es
mayor de 7. ¿Te dice algo este dato? ¿Cuáles son ahora tus oportunidades de haber obtenido 9? Si
hubiera dicho que la suma era menor de siete sabrías de seguro que perdiste.
Necesitamos calcular P ( X= 9 | X> 7). Antes de tirar los dados, sabías que la probabilidad de ganar,
P(X=9) era igual a 4/ 36. ¿Cambió esto? En la Tabla 2 están señalados todos los pares donde X > 7 y
los pares donde X = 9.
36
Como sabemos que X > 7 el resultado observado debe estar dentro del triángulo azul. Allí hay 15 pares
distintos de los cuales cuatro son consistentes con X= 9, por esto P (X = 9| X> 7)= 4/ 15‚ esto significa
que tus oportunidades de haber ganado han aumentado.
El resultado se puede obtener de la siguiente forma. La proporción de pares donde X > 7 es 15/ 36. La
proporción de pares donde X > 7 y X = 9 es 4/ 36, siguiendo las ideas anteriores tenemos que P ( X = 9|
X > 7) = (4/36) ¸ (15/ 36) = 4/ 15. Igual que antes esta representación se asemeja a un tablero de dardos
y el resultado se obtiene al comparar el "área" de la región que representa X = 9 con el "área" de la
región que representa X > 9. De igual manera, también se asemeja a un diagrama de Venn.
Considera la probabilidad de que en el dado Rojo se observe un tres si sabemos que la suma de los
dados es 5, es decir, P (R = 3 | X= 5). De la Tabla 1 se puede ver que P (X = 5)= 4/ 36, P (R = 3)= 6/ 36
y P( X = 5 y R = 3) = 1/36. La suma X es igual a cinco sólo cuando se observa uno de los cuatro pares:
(1,4), (2,3), (3,2), (4,1). De esos, sólo uno es compatible con que el dado rojo sea igual a 3, por esta
razón, P (R = 3| X= 5)= 1/ 4. Este resultado implica que el evento {R = 3} afecta la probabilidad de que
el evento {X = 5} ocurra. Antes de hacer el experimento, la probabilidad de observar {R=3} es 1/6,
pero ahora sabemos que {X=5} ocurrió y por lo tanto la probabilidad de observar {R=3} es ahora 1/4.
Pregunta
¿Qué hubiera pasado si el evento que condiciona hubiera sido X= 7?
De la tabla se puede ver que P (R = 3 | X = 7) = 1/6 = P (R = 3). Es decir, el saber que {X=7} ocurrió
no nos ofrece información alguna sobre la probabilidad de que {R=3} ocurra.
En cada nodo del árbol representamos el número de canicas rojas y azules que quedan en la caja. Las
ramas que emanan de cada nodo representan los dos resultados posibles que se pueden obtener cuando
se selecciona una canica al azar: rojo o azul. Cada rama es rotulada por el resultado obtenido y por la
probabilidad condicional de observar ese resultado. Los nodos al final representan los estados finales
posibles que podemos obtener como resultado del experimento. Estos nodos finales se llaman hojas.
37
Diagrama de árbol que ilustra el experimento de seleccionar dos canicas de una caja
Pregunta
¿Cuál es la probabilidad que la segunda canica seleccionada sea roja dado que la primera es azul?
Si la primera canica fue azul, ahora quedan en la caja dos canicas rojas y dos azules. De ahí
seleccionamos otra canica. La probabilidad de que una canica seleccionada de esa caja sea roja es 2/4.
Para facilitar el trabajo denotamos el evento de que la primera canica seleccionada es roja por R1 y el
evento de que la segunda sea roja por R2. Hacemos lo propio para las canicas azules. Esta
representación es útil para encontrar probabilidades conjuntas y marginales.
Por ejemplo, la probabilidad que la primera canica sea roja y la segunda azul, denotada P (R1 y B2) es
el producto de las probabilidades que rotulan el camino de la raíz del árbol y que son consistentes con
los resultados R1 y B2. Entonces P (R1 y B2) = 2/5 x 3/4 = 6/20.
Si nos interesamos por la probabilidad marginal de que la segunda canica sea roja, P(R2), tenemos que
darnos cuenta de que hay dos caminos posibles en que la segunda canica es roja. Estos dos caminos
dependen del resultado que se observó cuando seleccionamos la primera canica, que pudo haber sido
rojo o azul. Así observamos una canica roja en la segunda selección cuando cualquiera de los dos
eventos conjuntos (B1 y R2) ó (R1 y R2) ocurren. Estos son eventos son disjuntos por lo cual P ( R2 ) =
P (B1 y R2) + P (R1 y R2) = 6/20+ 2/20 = 8/20.
Los árboles son especialmente útiles para encontrar probabilidades condicionales tal como P( R1 | B2 ).
Esta probabilidad se puede entender si pensamos en un experimento donde escogemos una canica al
azar, sin mirarla, la escondemos y luego seleccionamos al azar otra canica. Si la segunda canica
seleccionada es azul, ¿cuál es la probabilidad que la canica que escogimos primero era roja?
Una forma de contestar esta pregunta es usando la Regla de Bayes, que aún no hemos estudiado. Otra
forma es la siguiente. Imaginemos que antes de comenzar el experimento quitamos una canica azul.
Esa será la canica azul que escogeremos como segunda selección, la hemos reservado de antemano.
Ahora, en esta caja imaginaria hay 2 canicas rojas y 2 azules, por esta razón la probabilidad P (R1 | B2)
debe ser igual a (número de canicas rojas) / (número total de canicas) = 2/4.
Pregunta
Verifica que la medida P( • | B) satisface los axiomas de probabilidad, es decir, si B es un evento fijo en
el espacio muestral S, entonces P( • | B) es una medida de probabilidad.
Con la representación del árbol vimos como obtener la probabilidad conjunta de dos eventos A, B. Por
ejemplo, vimos que para obtener la probabilidad de que la primera canica fuera roja y la segunda fuera
azul, P(R1 y B2) multiplicamos P ( B2 | R1 ) por la cantidad P (R1) a lo largo de las ramas apropiadas
38
del árbol. Esta operación se justifica ahora por nuestra definición de probabilidad condicional. Si A, B
son dos eventos cualquiera en un espacio muestral S, tenemos la regla de multiplicación.
Prueba
Usa la definición de probabilidad condicional.
Ejemplo 1
Tienes los cuatro ases de la baraja en tus manos {A♠, A♣, A♥, A♦}. Sabemos que dos de esas barajas
son rojas y las otras dos son de color negro. Sin mirar, un amigo selecciona una baraja primero luego de
las restantes tres selecciona una segunda baraja. Queremos encontrar la probabilidad del evento que
ambas barajas seleccionadas sean rojas, {A♥, A♦}. La única forma en que ambas barajas serán rojas es
que la primera sea roja y dado que la primera fue roja, la segunda debe ser roja también. La
probabilidad de que la primera sea roja es 2/4. Si la primera fue roja, la probabilidad de que la segunda
sea roja es entonces 1/3. Por lo tanto P(ambas barajas son rojas)=2/4 ´ 1/3 = 2/12.
Pregunta
Enumera el espacio muestral de este experimento. ¿Cuál representación sería más útil? Expresa el
problema del Ejemplo 1 en forma de símbolos, usando la regla de multiplicación.
Ejemplo 2
El almacén de la UT recibe 100 togas para su graduación. El fabricante había llamado a la escuela para
anticiparle que entre esas 100 togas hay 10 que son de un tamaño equivocado, muy pequeñas para
estudiantes de escuela superior. Seleccionamos dos togas al azar. ¿Cuál es la probabilidad de que ambas
sean muy pequeñas?
Seguimos el mismo argumento de arriba para resolver este ejercicio. La probabilidad de que la primera
seleccionada sea muy pequeña es 10/100. Una vez seleccionada la primera toga pequeña,
seleccionamos la siguiente toga de las restantes 99, de las cuales ahora 9 son muy pequeñas. Así, la
probabilidad de que ambas sean muy pequeñas es 10/100 ´ 9/99.
¿Qué tal si seleccionamos 3 togas? ¿Cuál es la probabilidad de que las tres sean muy pequeñas?
Podemos representar este experimento con un árbol que tiene 8 ramas (¿cómo?). Esto nos permite
extender el argumento de antes. En este caso la probabilidad deseada es 10/100 ´ 9/99 ´ 8/98.
Esta situación facilita el generalizar la regla de multiplicación. Para facilitar la discusión representemos
por T1 el evento de que la primera toga sea muy pequeña, por T2 el evento de que la segunda sea muy
pequeña y por T3 el evento de que la tercera toga sea muy pequeña. Vemos que 10/100 es la
probabilidad de que la primera toga sea pequeña, es decir P( T1 ). El valor 9/99 representa la
probabilidad de que la segunda sea pequeña si la primera fue pequeña, P( T2 | T1 ). El valor 8/98 es un
poco más complicado. Para obtener la tercera toga pequeña en sucesión, debimos haber seleccionado la
primera y la segunda togas pequeñas, así, 8/98 es el resultado de calcular P( T3 | T1 y T2 ).
39
Teorema 2
Sean A, B, C eventos cualquiera en un espacio muestral S tal que P(A) > 0 y P(A∩B) > 0. Entonces
P( A∩B∩C ) = P(A) P(A | B) P(C | A∩B).
Prueba.
P( A∩B∩C ) = P( (A∩B)∩C ) = P( C | A∩B) P(A∩B), usando la regla de multiplicación para los
eventos C y A∩B. Usamos nuevamente esa regla para calcular P( A∩B ) = P(A | B) P(B) y sustituimos
arriba para obtener el resultado.
Pregunta
Usa inducción matemática para generalizar esta regla para n eventos.
40
Práctica 1
Elaborar ejercicios donde se emplee la fórmula de probabilidad condicional en problemas del ámbito
profesional donde la ocurrencia de un evento dependa de otro.
1. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras.
Selecciona una canica al azar y anota su color.
a. Representa el experimento usando un árbol.
b. Enumera el espacio muestral.
c. Usa la notación y operaciones de conjuntos para representar el evento de que la canica
seleccionada:
i. sea negra.
ii. sea blanca.
iii. no sea negra
iv. sea blanca o negra
v. sea negra y blanca.
d. Ilustra los eventos de arriba en el árbol que representa el experimento y en un diagrama de
Venn.
e. Encuentra la probabilidad de que la canica seleccionada:
i. sea negra.
ii. sea blanca.
iii. no sea negra
iv. sea blanca o negra
v. sea negra y blanca.
2. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras.
Selecciona una canica al azar, anota su color y devuélvela a la caja. Selecciona otra canica y anota su
color.
a. Representa el experimento usando un árbol.
b. Enumera el espacio muestral.
c. Encuentra la probabilidad de que la primera canica seleccionada:
i. sea negra.
ii. sea blanca.
iii. no sea negra
iv. sea blanca o negra
v. sea negra y blanca.
d. Usa la notación y operaciones de conjuntos para representar el evento de que:
i. ambas canicas seleccionadas sean negras.
ii. una de las canicas seleccionadas sea blanca.
iii. ninguna canica sea blanca.
iv. la segunda canica sea blanca si la primera fue negra.
v. la primera canica sea blanca si la segunda no fue blanca.
vi. la segunda canica es blanca.
e. Encuentra la probabilidad de que:
i. ambas canicas seleccionadas sean negras.
ii. una de las canicas selecionadas sea blanca.
iii. ninguna canica sea blanca.
iv. la primera canica es blanca y la segunda es negra,
41
v. la segunda canica sea blanca si la primera fue negra.
vi. la primera canica sea blanca si la segunda no fue blanca.
f. ¿Es el evento de que la primera canica sea negra independiente del evento de que la segunda
canica sea blanca? Explica.
g. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente
excluyentes? Explica.
3. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras.
Selecciona una canica al azar, anota su color, esta vez no la devuelvas a la caja. Selecciona otra canica
y anota su color.
a. Enumera el espacio muestral.
b. Encuentra la probabilidad de que:
i. ambas canicas seleccionadas sean negras.
ii. una de las canicas seleccionadas sea blanca.
iii. ninguna canica sea blanca.
iv. la primera canica no es ni blanca ni negra.
v. la primera canica es blanca y la segunda es negra.
vi. la segunda canica sea blanca si la primera fue negra.
vii. la primera canica sea blanca si la segunda no fue blanca.
viii. la segunda canica es blanca.
c. ¿En qué se distingue este experimento del efectuado en el problema número 2?
d. ¿Es el evento de que la primera canica sea negra independiente del evento de que la segunda
canica sea blanca? Explica.
e. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente
excluyentes? Explica.
4. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras.
Selecciona una canica al azar, anota su color, devuélvela a la caja y añade a la caja dos canicas del
mismo color de la canica seleccionada. Selecciona otra canica y anota su color.
a. Representa el experimento usando un árbol.
b. Enumera el espacio muestral.
c. Encuentra la probabilidad de que:
i. ambas canicas seleccionadas sean negras.
ii. una de las canicas seleccionadas sea blanca.
iii. ninguna canica sea blanca.
iv. la primera canica no es ni blanca ni negra.
42
v. la primera canica es blanca y la segunda es negra.
vi. la segunda canica sea blanca si la primera fue negra.
vii. la primera canica sea blanca si la segunda no fue blanca.
viii. la segunda canica sea negra.
d. ¿Es el evento de que la primera canica sea negra independiente del evento de que la segunda
canica sea blanca? Explica.
e. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente
excluyentes? Explica.
5. Considera una caja con seis canicas. Dos de las canicas son blancas, una es roja y las restantes son
negras. Selecciona una canica al azar, anota su color, devuélvela a la caja y añade a la caja dos canicas
del mismo color de la canica seleccionada. Selecciona otra canica y anota su color.
a. Representa el experimento usando un árbol.
b. Enumera el espacio muestral.
c. Encuentra la probabilidad de que:
i. ambas canicas seleccionadas sean rojas.
ii. una de las canicas seleccionadas sea blanca.
iii. ninguna canica sea blanca.
iv. la primera canica no es ni blanca ni negra.
v. la primera canica es blanca y la segunda es roja.
vi. la segunda canica sea roja si la primera fue roja.
vii. la primera canica sea negra si la segunda no fue blanca.
viii. las dos canicas sean de colores distintos.
ix. las dos canicas sean del mismo color.
x. la segunda canica sea negra.
d. ¿Es el evento de que la primera canica sea roja independiente del evento de que la segunda
canica sea blanca? ¿Son estos eventos mutuamente excluyentes? Explica.
e. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente
excluyentes? Explica.
6. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras. A la
misma vez, selecciona dos canicas al azar y anota sus colores.
a. Representa el experimento usando un árbol.
b. Enumera el espacio muestral.
c. Usa la notación y operaciones de conjuntos para representar el evento de que las canicas
seleccionadas:
i. ambas sean negras.
ii. ninguna sea negra.
iii. sean de colores distintos.
d. Ilustra los eventos de arriba en el árbol que representa el experimento.
e. Encuentra la probabilidad de que las canicas seleccionadas:
i. ambas sean negras.
ii. ninguna sea blanca.
43
iii. sean de colores distintos.
f. ¿Tiene alguna relación este problema con el número 3 arriba? Explica.
Hacemos un experimento con dos cajas. La caja A tiene siete canicas. En esta caja, dos de las canicas
son blancas, tres son rojas y dos son negras. La caja B tiene seis canicas. Cuatro de las canicas en B son
rojas y dos son negras. Se tira un dado para decidir de cuál caja se selecciona una canica al azar. Si se
observa el evento {1,2,3,4} se selecciona una canica de la caja A. En el caso de observar el evento
{5,6} se selecciona al azar una canica de la caja B.
44
TEMA 5
Objetivo de aprendizaje.
5. Definir el Teorema de Bayes.
Criterio de Aprendizaje.
5.1. Utilizar el teorema de Bayes en problemas del ámbito profesional que involucren probabilidades
subjetivas.
Didáctica de enseñanza.
Pa. 2 Elaborar ejercicios donde se planteen problemas del ámbito profesional que involucren
probabilidades subjetivas y aplicar el Teorema de Bayes en su solución
En el distrito universitario de Jauja los estudiantes se distribuyen entre las tres carreras que pueden
cursarse del siguiente modo: el 20% estudian arquitectura, el 35% medicina y el 45% economía. El
porcentaje de alumnos que finalizan sus estudios en cada caso es del 5%, 12% y del 18%. Elegido un
alumno al azar determinar la probabilidad de que haya acabado los estudios.
Vemos todo esto mediante un diagrama de flujo y calculamos la probabilidad de que un alumno elegido
al azar haya terminado los estudios.
Si A1, A2, y A3 son, respectivamente, los sucesos "estudiar arquitectura", "estudiar medicina" y "estudiar
economía" resulta
p(Ai) = 1
Y los sucesos A1, A2, y A3 son incompatibles (no existen estudiantes que cursen dos carreras).
Además
45
E = A 1 o A2 o A3
A partir del razonamiento anterior podemos enunciar el siguiente teorema que es conocido como
teorema de la probabilidad total
Si los sucesos A1, A2, A3 ... An son una partición ( ) del espacio
46
La fábrica de enlatados PI S.A. produce 5000 envases diarios. La máquina A produce 3000 de estos
envases, de los que el 2% son defectuosos y la máquina B produce los 2000 restantes de los que se sabe
que el 4% son defectuosos. Determinar la probabilidad de que un envase elegido al azar sea defectuoso.
Y ahora la pregunta ¿Si el envase seleccionado es defectuoso, qué probabilidad hay de que proceda de
la máquina A? ¿Y de la B?
Las expresiones
47
Son las de la "fórmula de Bayes" para cada uno de las preguntas formuladas. Estas expresiones pueden
generalizarse fácilmente para un conjunto finito de sucesos con las condiciones indicadas.
Podemos hacernos ahora varias preguntas que son fáciles de contestar. Por ejemplo:
¿Si el envase no es defectuoso, qué probabilidad hay de que provenga de la máquina A?. ¿Y de la
B?.
O bien, teniendo en cuenta el primer ejercicio, ¿si un alumno seleccionado ha finalizado la carrera, qué
probabilidad hay que haya estudiado arquitectura?. ¿Y medicina?
Thomas Bayes nació en Londres, Inglaterra. Su padre fue ministro presbiteriano. Posiblemente De
Moivre fue su maestro particular, pues se sabe que por ese entonces ejercía como profesor en Londres.
Bayes fue ordenado ministro presbiteriano y muere en 1761. Sus restos descansan en el cementerio
londinense de Bunhill Fields. La traducción de la inscripción en su tumba es
Hijo de los conocidos Joshua y Ann Bayes. 7 de abril de 1761. En reconocimiento al importante trabajo
que realizó Thomas Bayes en probabilidad. Su tumba fue restaurada en 1969 con donativos de
estadísticos de todo el mundo.
Miembro de la Royal Society desde 1742, Bayes fue uno de los primeros en utilizar la probabilidad
inductivamente y establecer una base matemática para la inferencia probabilística. Publicó los trabajos:
Divine Providence and Government Is the Happiness of His Creatures (1731) An Introduction to the
Doctrine of Fluxions, and a Defence of The Analyst (1736)
En 1763, dos años después de su muerte, se publica Essay Towards Solving a Problem in the Doctrine
of Chances, en el que trataba el problema de las causas a través de los efectos observados, y donde se
enuncia el teorema que lleva su nombre. El trabajo fue entregado a la Royal Society por Richard Price
y es la base de la técnica bayesiana.
48
En una urna hay 5 bolas, 3 azules y 2 verdes. Se saca una bola de la urna y sin mirarla, se guarda. A
continuación se vuelve a sacar otra bola que es verde. ¿Cuál es la probabilidad de que la primera haya
sido verde?. Y si la segunda hubiera sido azul, ¿cuál es la probabilidad de que la primera sea verde?. ¿Y
azul?.
En donde (A1 y A2), es el suceso "sacar azul la primera bola y azul la segunda" y análogamente los
restantes (A1 y V2), (V1 y A2), (V1 y V2).
Probabilidad de que la primera haya sido verde (en el supuesto que la segunda ha sido verde)
Aplicamos el teorema de Bayes y resulta:
Probabilidad de que la primera haya sido verde (en el supuesto que la segunda ha sido azul)
Aplicamos el teorema de Bayes y resulta:
Probabilidad de que la primera haya sido azul (en el supuesto que la segunda ha sido azul)
Aplicamos el teorema de Bayes y resulta:
49
Práctica 2
Elaborar ejercicios donde se planteen problemas del ámbito profesional que involucren probabilidades
subjetivas y aplicar el Teorema de Bayes en su solución
(b) Si elegimos, al azar, un alumno la Universidad Tecnológica y éste es un alumno de 1º, ¿cuál es
la probabilidad de que proceda de la localidad B?
2) Según la estadística de los resultados en las Prueba de Acceso en una provincia andaluza, en
septiembre de 2001, el número de alumnas presentadas es de 840, de las que han aprobado un 70%,
mientras que el número de alumnos presentados es 668, habiendo aprobado un 75% de estos.
(a) Elegida, al azar, una persona presentada a las Pruebas, ¿cuál es la probabilidad de que haya
aprobado?
(b) Sabiendo que una persona ha aprobado, ¿cuál es la probabilidad de que sea varón?
50
CAPITULO 2
ORGANIZACIÓN Y PRESENTACIÓN DE
DATOS
INTRODUCCIÓN
El propósito de la presente unidad es que el alumno adquiera la habilidad para ordenar y tabular
datos, construyendo con ellos diversas gráficas que le permitirán calcular sus medidas de
tendencia central y dispersión, así como utilizar los fundamentos matemáticos de probabilidad
para resolver algunos problemas de Procesos Agroindustriales que se presentan en las empresas.
51
TEMA 1
Objetivo de aprendizaje.
1. Reconocer los métodos tabulares de presentación de datos.
Criterio de Aprendizaje.
1.1. Ilustrar y describir tablas de frecuencias relativas y absolutas.
1.2. Ilustrar y describir tablas para representar dos conjuntos de datos.
Didáctica de enseñanza.
Ta. 3 Realizar ejercicios, organizando datos en tablas de frecuencia relativas y absolutas de datos, así
como también tablas para representar dos conjuntos de datos.
Consideremos una población estadística de n individuos, descrita según un carácter o variable C cuyas
modalidades han sido agrupadas en un número k de clases, que denotamos mediante .
Para cada una de las clases ci, , introducimos las siguientes magnitudes:
Frecuencia absoluta
De la clase ci es el número ni, de observaciones que presentan una modalidad perteneciente a esa clase.
Frecuencia relativa
De la clase ci es el cociente fi, entre las frecuencias absolutas de dicha clase y el número total de
observaciones, es decir
Obsérvese que fi es el tanto por uno de observaciones que están en la clase ci. Multiplicado por 100%
representa el porcentaje de la población que comprende esa clase.
Frecuencia relativa: .
Modali. Frec. Abs. Frec. Rel. Frec. Abs. Acumu. Frec. Rel. Acumu.
C ni fi Ni Fi
c1 n1 N1 = n1
cj nj
ck nk Nk = n Fk = 1
n 1
Ejemplo
Calcular los datos que faltan en la siguiente tabla:
li-1 -- li ni fi Ni
53
0 -- 10 60 f1 60
10 -- 20 n2 0,4 N2
20 -- 30 30 f3 170
30 -- 100 n4 0,1 N4
100 -- 200 n5 f5 200
n
Solución:
Sabemos que la última frecuencia acumulada es igual al total de observaciones, luego n=200.
Por otro lado podemos calcular n4 teniendo en cuenta que conocemos la frecuencia relativa
correspondiente:
Así:
N4=n4+N3=20+170 =190.
Al haber calculado todas las frecuencias absolutas, es inmediato obtener las relativas:
54
Elección de las clases
En cuanto a la elección de las clases, deben seguirse los siguientes criterios en función del tipo de
variable que estudiemos:
Cuando se trate de variables cualitativas o cuasicuantitativas, las clases ci serán de tipo nominal;
En el caso de variables cuantitativas, existen dos posibilidades:
O bien
Y marca de clase ci, a un punto representativo del intervalo. Si éste es acotado, tomamos como marca
de clase al punto más representativo, es decir al punto medio del intervalo,
La marca de clase no es más que una forma abreviada de representar un intervalo mediante uno de sus
puntos. Por ello hemos tomado como representante, el punto medio del mismo. Esto está plenamente
justificado si recordamos que cuando se mide una variable continua como el peso, la cantidad con
cierto número de decimales que expresa esta medición, no es el valor exacto de la variable, sino una
medida que contiene cierto margen de error, y por tanto representa a todo un intervalo del cual ella es el
centro.
Interv. M. clase Frec. Abs. Frec. Rel. Frec. Abs. Acum. Frec. Rel. Acum.
C ni fi Ni Fi
l0 -- l1 c1 n1 N1 = n1 F1 = f1
lk-1 -- lk ck nk Nk=n Fk =1
n 1
55
Elección de intervalos para variables continuas
A la hora de seleccionar los intervalos para las variables continuas, se plantean varios problemas como
son el número de intervalos a elegir y sus tamaños respectivos. La notación más común que usaremos
para un intervalo sea
El primer intervalo, l0 -- l1, podemos a cerrarlo en el extremo inferior para no excluir la observación
más pequeña, l0
Éste es un convenio que tomaremos en las páginas que siguen. El considerar los intervalos por el lado
izquierdo y abrirlos por el derecho no cambia de modo significativo nada de lo que expondremos.
El número de intervalos, k, a utilizar no está determinado de forma fija y por tanto tomaremos un k que
nos permita trabajar cómodamente y ver bien la estructura de los datos; Como referencia nosotros
tomaremos una de los siguientes valores aproximados:
Por ejemplo si el número de observaciones que tenemos es n=100, un buen criterio es agrupar las
Suele tomarse constante, considerando la observación más pequeña y más grande de la población
A= lk - l0
56
Observación
Podría ocurrir que la cantidad a fuese un número muy desagradable a la hora de escribir los intervalos
(ej. a=10,325467). En este caso, es recomendable variar simétricamente los extremos,
Recorrido:
Marca de clase:
Frecuencias rectificadas: ;
Ejemplo
Sobre un grupo de n=21 personas se realizan las siguientes observaciones de sus pesos, medidos en
kilogramos:
58 42 51 54 40 39 49
56 58 57 59 63 58 66
70 72 71 69 70 68 64
Solución:
En primer lugar hay que observar que si denominamos X a la variable ``peso de cada persona'' esta es
una variable de tipo cuantitativa y continua. Por tanto a la hora de ser ordenados los resultados en una
tabla estadística, esto se ha de hacer agrupándolos en intervalos de longitud conveniente. Esto nos lleva
a perder cierto grado de precisión. Para que la perdida de información no sea muy relevante seguimos
el criterio de utilizar intervalos (no son demasiadas las observaciones). En este punto
podemos tomar bien k=4 o bien k=5. Arbitrariamente se elige una de estas dos posibilidades. Por
ejemplo, vamos a tomar k=5.
57
Entonces tomaremos k=5 intervalos de longitud a=6,6comenzando por l0=xmin=39 y terminando en
l5=33:
Intervalos M. clase f.a. f.r. f.a.a. f.r.a.
li-1 -- li ci ni fi Ni Fi
i=1 39 -- 45,6 42,3 3 0,1428 3 0,1428
i=2 45,6 -- 52,2 48,9 2 0,0952 5 0,2381
i=3 52,2 -- 58,8 55,5 6 0,2857 11 0,5238
i=4 58,8 -- 65,4 62,1 3 0,1428 14 0,6667
i=5 65,4 -- 72 68,7 7 0,3333 21
21
Otra posibilidad a la hora de construir la tabla, y que nos permite que trabajemos con cantidades más
simples a la hora de construir los intervalos, es la siguiente. Como la regla para elegir l0 y l5 no es muy
estricta podemos hacer la siguiente elección:
ya que así la tabla estadística no contiene decimales en la expresión de los intervalos, y el exceso d,
cometido al ampliar el rango de las observaciones desde A hasta A', se reparte del mismo modo a los
lados de las observaciones menores y mayores:
Intervalos M. clase f.a. f.r. f.a.a. f.r.a.
li-1 -- li ci ni fi Ni Fi
i=1 38 -- 45 41,5 3 0,1428 3 0,1428
i=2 45 -- 52 48,5 2 0,0952 5 0,2381
i=3 52 -- 59 55,5 7 0,3333 12 0,5714
i=4 59 -- 66 62,5 3 0,1428 15 0,7143
i=5 66 -- 73 69,5 6 0,2857 21
21
58
Evidencia parcial
Ta. 3 Realizar ejercicios, organizando datos en tablas de frecuencia relativas y absolutas de datos, así
como también tablas para representar dos conjuntos de datos.
Evaluación parcial
Entrega de Ta.3
59
TEMA 2
Objetivo de aprendizaje.
2. Diferenciar los métodos gráficos empleados para organizar datos.
Criterio de Aprendizaje.
2.1. Ilustrar los métodos gráficos empleados para organizar datos.
Didáctica de enseñanza.
Pa. 3 Elaborar, organizar datos y construir diagramas de puntos histogramas y polígonos de
frecuencias.
Los gráficos más usuales para representar variables de tipo nominal son los siguientes:
Diagramas de barras:
En la siguiendo la figura, representamos en el eje de ordenadas las modalidades y en abscisas las
frecuencias absolutas o bien, las frecuencias relativas. Si, mediante el gráfico, se intenta comparar
varias poblaciones entre sí, existen otras modalidades, como las mostradas en la figura posterior.
Cuando los tamaños de las dos poblaciones son diferentes, es conveniente utilizar las frecuencias
relativas, ya que en otro caso podrían resultar engañosas.
Figura: Diagramas de barras para comparar una variable cualitativa en diferentes poblaciones. Se ha
de tener en cuenta que la altura de cada barra es proporcional al número de observaciones (frecuencias
relativas).
60
Diagramas de sectores
Se divide un círculo en tantas porciones como clases existan, de modo que a cada clase le corresponde
un arco de círculo proporcional a su frecuencia absoluta o relativa .
Como en la situación anterior, puede interesar comparar dos poblaciones. En este caso también es
aconsejable el uso de las frecuencias relativas (porcentajes) de ambas sobre gráficos como los
anteriores. Otra posibilidad es comparar las 2 poblaciones usando para cada una de ellas un diagrama
semicircular, al igual que en la figura anterior. Sean los tamaños respectivos de las 2
poblaciones. La población más pequeña se representa con un semicírculo de radio r1y la mayor con otro
de radio r2. La relación existente entre los radios, es la que se obtiene de suponer que la relación entre
las áreas de las circunferencias es igual a la de los tamaños de las poblaciones respectivas, es decir:
61
Figura: Diagrama de sectores para comparar dos poblaciones
Pictogramas
Expresan con dibujos alusivos al tema de estudio las frecuencias de las modalidades de la variable.
Estos gráficos se hacen representado a diferentes escalas un mismo dibujo, como vemos en la siguiente
figura.
El escalamiento de los dibujos debe ser tal que el área de cada uno de ellos sea proporcional a la
frecuencia de la modalidad que representa. Este tipo de gráficos suele usarse en los medios de
comunicación, para que sean comprendidos por el público no especializado, sin que sea necesaria una
explicación compleja.
62
Gráficos para variables cuantitativas
Para las variables cuantitativas, consideraremos dos tipos de gráficos, en función de que para
realizarlos se usen las frecuencias (absolutas o relativas) o las frecuencias acumuladas:
Diagramas diferenciales:
Son aquellos en los que se representan frecuencias absolutas o relativas. En ellos se representa el
número o porcentaje de elementos que presenta una modalidad dada.
Diagramas integrales:
Son aquellos en los que se representan el número de elementos que presentan una modalidad inferior o
igual a una dada. Se realizan a partir de las frecuencias acumuladas, lo que da lugar a gráficos
crecientes, y es obvio que este tipo de gráficos no tiene sentido para variables cualitativas.
Según hemos visto existen dos tipos de variables cuantitativas: discretas y continuas. Vemos a
continuación las diferentes representaciones gráficas que pueden realizarse para cada una de ellas así
como los nombres específicos que reciben.
Ejemplo
Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el número de caras, X, obteniéndose los
siguientes resultados:
Ordenamos a continuación los datos en una tabla estadística, y se representa la misma en la figura
Figura: Diagrama diferencial (barras) e integral para una variable discreta. Obsérvese que el diagrama
integral (creciente) contabiliza el número de observaciones de la variable inferiores o iguales a cada
punto del eje de abcisas.
63
xi ni fi Ni Fi
0 1 1/8 1 1/8
1 3 3/8 4 4/8
2 3 3/8 7 7/8
3 1 1/8 8 8/8
n=8 1
Ejemplo
Clasificadas 12 familias por su número de hijos se obtuvo:
Número de hijos (xi) 1 2 3 4
Frecuencias (ni) 1 3 5 3
Comparar los diagramas de barras para frecuencias absolutas y relativas. Realizar el diagrama
acumulativo creciente.
64
Con las columnas relativas a xi y ni realizamos el diagrama de barras para frecuencias absolutas, lo que
se muestra en la figura siguiente. Como puede verse es idéntico (salvo un cambio de escala en el eje de
ordenadas) al diagrama de barras para frecuencias relativas y que ha sido calculado usando las
columnas de xi y fi. El diagrama escalonado (acumulado) se ha construido con la información
procedente de las columnas xi y Ni.
Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los
polígonos de frecuencias.
65
El diagrama integral para una variable continua se denomina también polígono de frecuencias
acumulado, y se obtiene como la poligonal definida en abcisas a partir de los extremos de los
intervalos en los que hemos organizado la tabla de la variable, y en ordenadas por alturas que son
proporcionales a las frecuencias acumuladas. Dicho de otro modo, el polígono de frecuencias absolutas
es una primitiva del histograma. Véase la parte inferior de la figura siguiente, en la que se representa a
modo de ilustración los diagramas correspondientes a la variable cuantitativa continua expresada en la
tabla siguiente:
Intervalos ci ni Ni
0 -- 2 1 2 2
2 -- 4 3 1 3
4 -- 6 5 4 7
6 -- 8 7 3 10
8 - 10 9 2 12
12
66
Ejemplo
La siguiente distribución se refiere a la duración en horas (completas) de un lote de 500 tubos:
Solución: En primer lugar observamos que la variable en estudio es discreta (horas completas), pero al
tener un rango tan amplio de valores resulta más conveniente agruparla en intervalos, como si de una
variable continua se tratase. La consecuencia es una ligera perdida de precisión.
El último intervalo está abierto por el límite superior. Dado que en él hay 25 observaciones puede ser
conveniente cerrarlo con una amplitud ``razonable''. Todos los intervalos excepto el tercero tienen una
amplitud de 200 horas, luego podríamos cerrar el último intervalo en 1.300 horas.
Antes de realizar el histograma conviene hacer una observación importante. El histograma representa
las frecuencias de los intervalos mediante áreas y no mediante alturas. Sin embargo nos es mucho más
fácil hacer representaciones gráficas teniendo en cuenta estas últimas. Si todos los intervalos tienen la
misma amplitud no es necesario diferenciar entre los conceptos de área y altura, pero en este caso el
tercer intervalo tiene una amplitud doble a los demás, y por tanto hay que repartir su área en un
rectángulo de base doble (lo que reduce su altura a la mitad).
Así será conveniente añadir a la habitual tabla de frecuencias una columna que represente a las
amplitudes ai de cada intervalo, y otra de frecuencias relativas rectificadas, fi', para representar la altura
del histograma. Los gráficos requeridos se representan en las figuras siguientes.
Intervalos ai ni fi fi' Fi
300 -- 500 200 50 0,10 0,10 0,10
500 -- 700 200 150 0,30 0,30 0,40
700 -- 1.100 400 275 0,55 0,275 0,95
1.100 -- 1.300 200 25 0,05 0,05 1,00
n=500
67
Figura: Histograma. Obsérvese que la altura del histograma en cada intervalo es fi' que coincide en
todos con fisalvo en el intervalo 700 -- 1.100 en el que ya que la amplitud de ese intervalo
es doble a la de los demás.
Por otro lado, mirando la figura anterior se ve que sumando frecuencias relativas, hasta las 900 horas
de duración hay 0,10 + 0,30 + 0,275 = 0,675 = 67,5 % de los tubos.
Esta cantidad se obtiene de modo más directo viendo a qué altura corresponde al valor 900 en el
diagrama de frecuencias acumuladas.
Como en total son 500 tubos, el número de tubos con una duración igual o menor que 900 horas es
, redondeando, 338 tubos.
69
Práctica 3
Elaborar, organizar datos y construir diagramas de puntos histogramas y polígonos de frecuencias.
6. ¿Por qué se ha utilizado un histograma para representar estos datos, en lugar de una gráfica de
barras?
B) Una empresa maltera recibe mensualmente 50 lotes de cebada, los cuales se les mide su peso
hectolítrico (lb/bu), y se les clasifica según la siguiente tabla:
55.8, 48, 54, 50, 51, 50, 56, 58, 59, 49, 49.9, 55, 58, 60, 45, 58, 59, 52, 54, 56, 48, 49, 56, 51, 52, 48,
59, 53, 51, 50, 58, 56, 54, 57, 56, 52, 49, 46, 56, 45, 49, 58, 59, 52, 56, 54, 52, 57, 49, 56
70
5. Elige y elabora un gráfico con los datos, que ayuden a interpretar los el conjunto de datos.
71
CAPITULO 3
MEDIDAS DESCRIPTIVAS
INTRODUCCIÓN
En este capítulo se abordarán las medidas de tendencia central, que se conocen como medidas de
posición, se refieren al punto medio de una distribución. Generalmente el objetivo principal de
las medidas de tendencia central es describir las características típicas de conjuntos de datos y,
como hay varias formas de hacerlo, existen y se utilizan varios tipos de promedios. Se les llama
medidas de tendencia central porque la acumulación más alta de datos se encuentra en los
valores intermedios. Las medidas de tendencia central más comunes son: La media aritmética
(comúnmente conocida como media o promedio); la mediana: la cual es el puntaje que es ubica
en el centro de una distribución; la moda (que es el puntaje que se presenta con mayor frecuencia
en una distribución); entre otras.
72
determinar si las dos están relacionadas.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
4.1.1. Calcular y obtener la covarianza y correlación de dos muestras de datos y
determinar si las dos están relacionadas.
DEMOSTRACIÓN DE HABILIDADES FINALES
Ta. 4 En base a un conjunto de datos, calcular la media aritmética, mediana y moda. 78
Ta. 5 En base a una muestra de datos y una tabla de frecuencias calcular amplitud o 83
rango, desviación media, varianza, desviación Estándar y coeficiente de
variación
Pa.4 En base a un conjunto de datos calcular: media aritmética, mediana y moda; 86
elaborar tabla de frecuencias y obtener: rango, desviación media, desviación
estándar, varianza y coeficiente de variación.
Pa. 5 Calcular y obtener covarianza y correlación de un conjunto de datos. 92
73
TEMA 1
Objetivo de aprendizaje.
1. Definir y explicar los conceptos y fórmulas de la media aritmética, mediana y moda.
Criterio de Aprendizaje.
1.1. Practicar y analizar la media aritmética, mediana y moda de un conjunto de datos.
Didáctica de enseñanza.
Ta. 4 En base a un conjunto de datos, calcular la media aritmética, mediana y moda.
Media aritmética
La media aritmética simple esta dada por la formula Σ X/n y que significa: la suma de todos los valores
y el resultado se divide entre el número de observaciones; y que además el valor de la media representa
un valor con respecto a toda la información.
Una muestra de una población consiste en n observaciones, con una media de x. Las medidas que
calculamos para una muestra se conocen como estadística.
La notación es diferente cuando calculamos medidas para la población entera, es decir, para el grupo
que contiene a todos los elementos que estamos describiendo. La media de una población se simboliza
con μ. El número de elementos de una población se denota con la letra mayúscula cursiva N. Por lo
general, en estadística se utilizan letras del alfabeto latino para simbolizar la información sobre las
muestras y letras del griego para referirnos a la información sobre poblaciones.
Por ejemplo:
Media de la población:
μ = ∑x / N
Para calcular esta media, sumamos todas las observaciones. Los estadísticos se refieren a este tipo de
datos como datos no agrupados.
Si los valores que toma x en una serie de datos, no todos tienen la misma importancia, es valido asignar
"pesos" o "ponderaciones" de acuerdo a la importancia de cada dato.
74
Una distribución de frecuencias consta de datos agrupados en clases. Cada valor de una observación
cae dentro de alguna de las clases. No sabemos el valor individual de cada observación. A partir de la
información de la tabla, podemos calcular fácilmente una estimación del valor de la media de estos
datos agrupados.
Para encontrar la media aritmética de datos agrupados, primero calculamos el punto medio de cada
clase. Para lograr que los puntos medios queden en cifras cerradas, redondeamos las cantidades.
Después, multiplicamos cada punto medio por la frecuencia de las observaciones de dicha clase,
sumamos todos los resultados y dividimos esta suma entre el número total de observaciones de la
muestra.
.μ= ∑ (f x) / n
f = frecuencia de observaciones de cada clase
x= punto medio de cada clase de la muestra
n = número de observaciones de la muestra
En la serie del ejemplo anterior aparecen los números; pero cada uno con diferente frecuencia. Si cada
uno de estos datos se multiplica por su respectiva frecuencia o ponderación y se suman estos productos,
se obtendrá la misma suma que si se hubieran sumado uno por uno
Mediana
La mediana es un solo valor calculado a partir del conjunto de datos que mide la observación central de
éstos. Esta sola observación es la más central o la que está más en medio en el conjunto de números.
La mitad de los elementos están por encima de este punto y la otra mitad está por debajo.
Para hallar la mediana de un conjunto de datos, primero hay que organizarlos en orden descendente o
ascendente. Si el conjunto de datos contiene un número impar de elementos, el de en medio en el
arreglo es la mediana. Si hay un número par de observaciones, la mediana es el promedio de los dos
elementos de en medio.
Mediana = (n + 1) / 2
75
Lo primero que se requiere es ordenar los datos en forma ascendente o descendente, cualquiera
de los dos criterios conduce al mismo resultado.
Si el número de valores es impar, la mediana es el valor medio, el cual corresponde al dato.
Cuando el número de valores en el conjunto es par, no existe un solo valor medio, si no que
existen dos valores medios, en tal caso, la mediana es el promedio de los valores.
1.- Es única.
2.- Es simple.
3.- Los valores extremos no tienen efectos importantes sobre la mediana, lo que si ocurre con la media.
Por ejemplo:
Para la obtención de la mediana se deberán de ordenar. Tomemos el criterio de orden ascendente con lo
que, se tiene:
0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4,
Se observa que el número de datos es igual a 15 datos, siendo el número de datos impar se elige el dato
que se encuentra a la mitad, una vez ordenados los datos, en este caso es 1.
Ejemplo 2.
3, 4, 4, 5, 16, 19, 25, 30 Med = (5+16)/2 = 10.5
Se observa que el número de datos es par, por los que se promedian los dos valores centrales es decir
el 5 y el 16 y el valor obtenido será la mediana del conjunto de datos.
76
Med = {[(n + 1) / 2 – (F + 1)] / fm} w + Lm
Donde:
n = número total de elementos de la distribución
F = suma de todas las frecuencias de clase hasta, pero sin incluir, la clase mediana
fm = frecuencia de la clase mediana
w = ancho de intervalo de clase
Lm = límite inferior del intervalo de clase mediano
Moda
La moda es la medida que se relaciona con la frecuencia con que se presenta el dato o los datos con
mayor incidencia, con lo que se considera la posibilidad de que exista más de una moda para un
conjunto de datos. La notación más frecuente es la siguiente: Mo . Esta medida se puede aparecer tanto
para datos cualitativos como cuantitativos. Se dice que cuando un conjunto de datos tiene una moda la
muestra es unimodal, cuando tiene dos modas bimodal, cuando la muestra contiene mas de un dato
repetido se dice que es multimodal y un último caso es cuando ningún dato tiene una frecuencia, en
dicho caso se dice que la muestra es amodal.
La moda es una medida de tendencia central diferente de la media, pero un tanto parecida a la mediana,
pues en realidad no se calcula mediante algún proceso aritmético ordinario. La moda es aquel valor que
más se repite en el conjunto de datos.
En ocasiones, el azar hace que un solo elemento no representativo se repita lo suficiente para ser el
valor más frecuente del conjunto de datos. Es por esta razón que rara vez se utiliza la moda de un
conjunto de datos no agrupados como medida de tendencia central.
Por esta razón, siempre que se utiliza la moda como medida de tendencia central de un conjunto de
datos, debemos calcular la moda de datos agrupados (buscar la clase modal).
Ejemplos:
b).- 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, -3, 4, 6, 3, 3
Las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la más alta frecuencia, por lo que
la muestra es bimodal
c).- 1, 2, 3, 4, 5, 6, 7, 8, 9
La muestra no contiene ningún dato repetido por lo que se considera que la muestra es amodal.
Cuando los datos ya se encuentran agrupados en una distribución de frecuencias, podemos poner que la
moda está localizada en la clase que contiene el mayor número de elementos, es decir, en la clase que
tiene mayor frecuencia. Para determinar un solo valor para la moda a partir de esta clase modal:
77
Mo = Lmo + [d1 / (d1 + d2 )] w
Evidencia parcial
Ta. 4 En base a un conjunto de datos, calcular la media aritmética, mediana y moda.
Evaluación parcial
Entrega de Ta.4
78
TEMA 2
Objetivo de aprendizaje.
2. Definir y explicar las fórmulas y conceptos de amplitud o rango, desviación media, varianza,
desviación Estándar y coeficiente de variación.
Criterio de Aprendizaje.
2.1. Practicar y analizar amplitud o rango, desviación media, varianza, desviación Estándar y
coeficiente de variación de una muestra de datos y de una tabla de frecuencias.
Didáctica de enseñanza.
Ta. 5 En base a una muestra de datos y una tabla de frecuencias calcular amplitud o rango, desviación
media, varianza, desviación Estándar y coeficiente de variación
Las medidas de tendencia central son de un gran valor representativo para una masa de observaciones.
Pero el valor de esas medidas dependerá de cuan variable sea la masa de información. Por eso se
establecen medidas que tratan de explicar la dispersión de los datos y son: la desviación estándar, el
coeficiente de variación, el error estándar y los límites de confianza. Una medida de dispersión
conveniente deberá tomar en consideración todos los datos de la serie sopesando cada dato por su
distancia al centro de la distribución.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan
una parte de la información que necesitamos acerca de las características de los datos. Para aumentar
nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o
variabilidad.
Rango
Una medida razonable de la variabilidad podría ser la amplitud o rango, que se obtiene restando el
valor más bajo de un conjunto de observaciones del valor más alto. Es fácil de calcular y sus unidades
son las mismas que las de la variable, aunque posee varios inconvenientes:
No utiliza todas las observaciones (sólo dos de ellas);
Se puede ver muy afectada por alguna observación extrema;
El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso nunca
disminuye.
79
Desviación media
Se define la desviación media como la media de las diferencias en valor absoluto de los valores de la
variable a la media, es decir, si tenemos un conjunto de n observaciones, x1, ..., xn, entonces
Si los datos están agrupados en una tabla estadística es más sencillo usar la relación
Como se observa, la desviación media guarda las mismas dimensiones que las observaciones. La suma
de valores absolutos es relativamente sencilla de calcular, pero esta simplicidad tiene un inconveniente:
Desde el punto de vista geométrico, la distancia que induce la desviación media en el espacio de
observaciones no es la natural (no permite definir ángulos entre dos conjuntos de observaciones). Esto
hace que sea muy engorroso trabajar con ella a la hora de hacer inferencia a la población.
Varianza
Para calcular la varianza de una población, dividimos la suma de las distancias al cuadrado entre la
media y cada elemento de la población entre el número total de observaciones de dicha población.
= (x - μ)2 / N
= varianza de la población.
x = elemento u observación.
μ = media de la población.
N = número total de elementos de la población.
Para la varianza, las unidades son el cuadrado de las unidades de los datos. Estas unidades no son
intuitivamente claras o fáciles de interpretar. Por esta razón, tenemos que hacer un cambio significativo
en la varianza para calcular una medida útil de la desviación, que sea menos confusa. Esta medida se
conoce como la desviación estándar, y es la raíz cuadrada de la varianza. La desviación estándar,
entonces, está en las mismas unidades que los datos originales.
La suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media
aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de
cualquier otro valor que no sea la media aritmética.
Si observamos, veremos que la varianza no es más que el desvío estándar al cuadrado. Precisamente la
manera de simbolizarla es .
Por lo mismo, el desvío estándar puede definirse como la raíz cuadrada de la varianza
80
La varianza es una medida primaria de variabilidad utilizada en varias pruebas estadísticas. Su cálculo
es simplemente elevar al cuadrado la desviación estándar.
Desviación estándar
Es posible identificar conjuntos de datos que a pesar de ser muy distintos en términos de valores
absolutos, poseen la misma media. Una medida diferencial para identificar esos conjuntos de datos es
la concentración o dispersión alrededor de la media.
Una manera que aparece como muy natural para construir una medida de dispersión sería promediar las
desviaciones de la media.
Una manera de evitar que los distintos signos se compensen es elevarlas al cuadrado, de manera que
todas las desviaciones sean positivas. La raíz cuadrada del promedio de estas cantidades recibe el
nombre de desvío estándar, o desviación típica y es representada por la siguiente fórmula:
La desviación estándar sólo puede utilizarse en el caso de que las observaciones se hayan medido con
escalas de intervalos o razones.
A mayor valor del coeficiente del desvío estándar, mayor dispersión de los datos con respecto a su
media. Es un valor que representa los promedios de todas las diferencias individuales de las
observaciones respecto a un punto de referencia común, que es la media aritmética. Se entiende
entonces que cuando este valor es más pequeño, las diferencias de los valores respecto a la media, es
decir, los desvíos, son menores y, por lo tanto, el grupo de observaciones es más “homogéneo” que si el
valor de la desviación estándar fuera más grande. O sea que a menor dispersión mayor homogeneidad y
a mayor dispersión, menor homogeneidad.
La raíz cuadrada de un número positivo puede ser tanto positiva como negativa. Cuando tomamos la
raíz cuadrada de la varianza para calcular la desviación estándar, los estadísticos solamente consideran
la raíz cuadrada positiva.
La desviación estándar nos permite determinar, con un buen grado de precisión, dónde están
localizados los valores de una distribución de frecuencias con relación a la media. El teorema de
Chebyshev dice que no importa qué forma tenga la distribución, al menos 75% de los valores caen
81
dentro de + 2 desviaciones estándar a partir de la media de la distribución, y al menos 89% de los
valores caen dentro de + 3 desviaciones estándar a partir de la media.
Resultado estándar:
La desviación estándar es también útil para describir qué tan lejos las observaciones individuales de
una distribución de frecuencias se apartan de la media de la distribución. Una medida que se conoce
como resultado estándar nos da el número de desviaciones estándar que una observación en particular
ocupa por debajo o por encima de la media:
Resultado estándar = (x - μ ) /s
= f(x - )2 / N
= varianza de la población.
x = punto medio de cada una de las clases.
= media de la población.
N = número total de elementos de la población.
f = frecuencia de cada una de las clases.
Para calcular la varianza y la desviación estándar de una muestra, utilizamos las mismas fórmulas,
sustituyendo por y N con n – 1.
s2 = (x - )2 / (n – 1)
¿Por qué utilizamos n – 1 como denominador en lugar de N? Los especialistas en estadística pueden
demostrar que si tomamos muchas muestras de una población dada, si encontramos la varianza de la
muestra para cada muestra y promediamos los resultados, entonces este promedio no tiende a tomar el
valor de la varianza de la población, a menos que tomemos n – 1 como denominador de los cálculos.
Coeficiente de variación
Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que
corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de
82
variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente
sirve para comparar las dispersiones de variables correspondientes a escalas de razón.
Una manera de construir una medida de variabilidad que cumpla los requisitos anteriores es el llamado
coeficiente de variación.
El coeficiente de variación es una medida relativa de dispersión que nos permite hacer comparaciones
de diferentes grupos con diferentes unidades de medida o diferentes magnitudes y obtener mejores
conclusiones.
Evidencia parcial
Ta. 5 En base a una muestra de datos y una tabla de frecuencias calcular amplitud o rango, desviación
media, varianza, desviación Estándar y coeficiente de variación
Evaluación parcial
Entrega de Ta.5
83
TEMA 3
Objetivo de aprendizaje.
3. Enunciar las ventajas y desventajas de las medidas de tendencia central y de dispersión
Criterio de Aprendizaje.
3.1 Analizar las medidas de tendencia central de un conjunto de datos de acuerdo a su naturaleza
Didáctica de enseñanza.
Pa.4 En base a un conjunto de datos calcular: media aritmética, mediana y moda; elaborar tabla de
frecuencias y obtener: rango, desviación media, desviación estándar, varianza y coeficiente de
variación.
La media aritmética, en su carácter de un solo número que representa a un conjunto de datos completo,
tiene importantes ventajas:
Desventajas:
1. Puede verse afectada por valores extremos que no son representativos del resto de los datos.
2. Resulta tedioso calcular la media debido a que utilizamos cada uno de los puntos de dato de nuestro
cálculo.
3. Somos incapaces de calcular la media para un conjunto de datos que tiene clases de extremo
abierto, ya sea en el inferior o en el superior de la escala.
La media aritmética, a menudo, puede mal interpretarse si los datos no entran en un grupo homogéneo.
Los valores extremos no afectan a la mediana tan intensamente como a la media. La mediana es fácil
de entender y se puede calcular a partir de cualquier tipo de datos – incluso a partir de datos agrupados
con clases de extremo abierto – a menos que la mediana entre en una clase de extremo abierto.
Podemos encontrar la mediana incluso cuando nuestros datos son descripciones cualitativas, en lugar
de números.
Ciertos procedimientos estadísticos que utilizan la mediana son más complejos que aquellos que
utilizan la media. Debido a que la mediana es una posición promedio, debemos ordenar los datos antes
de llevar a cabo cualquier cálculo. Esto implica consumo de tiempo para cualquier conjunto de datos
que contenga un gran número de elementos. Por consiguiente, si deseamos utilizar una estadística de
muestra para estimar un parámetro de población, la media es más fácil de usar que la mediana.
84
Ventajas y desventajas de la moda:
La moda, al igual que la mediana, se puede utilizar como una posición central para datos tanto
cualitativos como cuantitativos.
También, al igual que la mediana, la moda no se ve mayormente afectada por los valores extremos.
Incluso si los valores extremos son muy altos o muy bajos, nosotros escogemos el valor más frecuente
del conjunto de datos como el valor modal. Podemos utilizar la moda sin importar qué tan grandes o
qué tan pequeños sean los valores del conjunto de datos, e independientemente de cuál sea su
dispersión.
La podemos utilizar aun cuando una o más clases sean de extremo abierto.
Muy a menudo, no existe un valor modal debido a que el conjunto de datos no contiene valores que se
presenten más de una vez. En otras ocasiones, cada valor es la moda, pues cada uno de ellos se presenta
el mismo número de veces. Otra desventaja consiste en que cuando los datos contienen dos, tres o más
modas, resultan difíciles de interpretar y comparar.
En una distribución positivamente sesgada (es decir, sesgada hacia la derecha), la moda todavía se
encuentra en el punto más alto de la distribución, la mediana está hacia la derecha de la moda y la
media se encuentra todavía más a la derecha de la moda y la mediana.
En una distribución negativamente sesgada, la moda sigue siendo el punto más alto de la distribución,
la mediana está hacia la izquierda de ella y la media se encuentra todavía más a la izquierda de la moda
y la mediana.
Cuando la población está sesgada negativa o positivamente, con frecuencia la mediana resulta ser la
mejor medida de posición, debido a que siempre está entre la moda y la media. La mediana no se ve
altamente influida por la frecuencia de aparición de un solo valor como es el caso de la moda, ni se
distorsiona con la presencia de valores extremos como la media.
85
Práctica 4
En base a un conjunto de datos calcular: media aritmética, mediana y moda; elaborar tabla de
frecuencias y obtener: rango, desviación media, desviación estándar, varianza y coeficiente de
variación.
1. Encuentre la media aritmética, mediana y moda; elaborar tabla de frecuencias y obtener: rango,
desviación media, desviación estándar, varianza y coeficiente de variación; de los siguientes conjuntos
de datos:
a) 3, 4, 4, 6, 6, 6, 8, 8, 12
c) 27 30 25 34 30 32 26 31 29 30 32 30 33 32
25 33 34 27 30 31
d) Se evalúa la calidad de mermelada de guayaba, según los expertos el mínimo puntaje para que una
mermelada fuese considerada de buena calidad era si calificaba con 169.5 puntos de 190 posibles
evalué los siguientes datos de 60 muestras analizadas.
161 161 162 162 165 165 165 165 165 165 166 166
168 168 169 169 169 169 169 169 170 170 170 170
170 170 170 171 171 171 171 171 171 171 171 172
172 172 172 172 172 172 175 175 175 175 176 176
177 177 178 180 180 181 181 185 185 185 189 189
86
TEMA 4
Objetivo de aprendizaje.
4. Definir el concepto de covarianza y correlación
Criterio de Aprendizaje.
4.1. Practicar y analizar la covarianza y correlación de dos muestras de datos y determinar si las dos
están relacionadas.
Didáctica de enseñanza.
Pa. 5 Calcular y obtener covarianza y correlación de un conjunto de datos.
vemos que las cantidades y van al cuadrado y por tanto no pueden ser negativas.
Como se ve, la fórmula es muy parecida a las de las varianzas. Es sencillo comprobar que se verifica la
Proposición
Si las observaciones no están ordenadas en una tabla de doble entrada, entonces se tiene que
87
o lo que es lo mismo
Ejemplo
Se han clasificado 100 familias según el número de hijos varones ( ) o hembras ( ), en la tabla
siguiente:
0 1 2 3 4
0 4 6 9 4 1
1 5 10 7 4 2
2 7 8 5 3 1
3 5 5 3 2 1
4 2 3 2 1 0
2. ¿Qué número medio de hijas hay en aquellas familias que tienen 2 hijos?
3. ¿Qué número medio de hijos varones hay en aquellas familias que no tienen hijas?
4. ¿Qué número medio de hijos varones tienen aquellas familias que a lo sumo tienen 2 hijas?
5. Hallar la covarianza
Solución:
En primer lugar, definimos las variables X= número de hijos varones, e Y=número de hijas y
construimos la tabla con las frecuencias marginales, y con otras cantidades que nos son útiles en el
cálculo de medias y varianzas:
88
y1 y2 y3 y4 y5
0 1 2 3 4
4 6 9 4 1 24 0 0 0
5 10 7 4 2 28 28 28 44
7 8 5 3 1 24 48 96 62
5 5 3 2 1 16 48 144 63
2 3 2 1 0 8 32 128 40
0 32 52 42 20 146
El número medio de hijas en las familias con 2 hijos varones se obtiene calculando la distribución
condicionada de
89
n3j n3j yj
7 0
8 8
5 10
3 9
1 4
24 31
Del mismo modo, el número medio de hijos varones de las familias sin hijas, se calcula con la
distribución condicionada
ni1 ni1 xi
4 0
5 5
7 14
5 15
2 8
23 42
El número medio de hijos varones en las familias que a lo sumo tienen dos hijas, se calcula usando las
marginales de la tabla obtenida a partir de las columnas y1, y2 e y3
90
ni1 ni2 ni3 ni1+ni2+ni3 (ni1+ni2+ni3) xi
4 6 9 19 19
5 10 7 22 22
7 8 5 20 40
5 5 3 13 39
2 3 2 7 28
81 129
La covarianza es:
91
Práctica 5 Calcular y obtener covarianza y correlación de un conjunto de datos.
1) Las siguientes notas, son las calificaciones de 25 alumnos en las asignaturas de Matemáticas y
Termodinámica:
B 4 5 5 5 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9 9 9 9 1
0
Q 3 5 5 6 7 7 7 7 7 7 8 8 8 7 7 8 8 8 8 8 8 8 1 1 1
0 0 0
X 9 9 4 6 8 9 7 6 9 9 9 8 8 9 8 9
Y 3 8 3 8 3 8 8 8 3 8 12 12 8 8 8 12
X 9 9 10 9 15 10 12 12 10 10 12 10 10 12 12 10
Y 12 20 8 20 8 8 20 8 8 12 8 20 20 3 3 20
a) Escribir la distribución de frecuencias conjunta. ¿Cuál es el porcentaje de veces que transcurre más
de nueve minutos desde la anterior utilización y se imprimen menos de doce páginas? ¿Cuántas veces
se imprimen menos de doce páginas y transcurren nueve minutos desde la anterior utilización?
b) Frecuencias marginales. ¿Cuántas veces se imprimen como mucho doce páginas? ¿Cuántas páginas
como máximo se imprimen en el 80% de las ocasiones?
c) Hallar la distribución de frecuencias del número de páginas impresas condicionada a que han
transcurrido nueve minutos entre sucesivas utilizaciones.
d) Dibujar el diagrama de dispersión.
92
4) Las estaturas y pesos de los 50 niños nacidos en una maternidad durante una semana fueron los
siguientes:
E 50 51 53 50 51 48 50 49 52 52 49 50 52 51 52 49
P 3.2 4.1 4.5 3 3.6 2.9 3.8 3.8 3.6 3.9 3 3.8 4.1 3.5 4.0 3.1
50 51 50 51 52 53 52 52 51 50 51 54 50 51 51 51 52
3.1 4.3 3.3 3.9 3.7 4.1 4.2 3.5 3.8 3.6 3.4 4.6 3.5 3.6 3.1 4 3.8
51 52 51 50 51 49 51 48 50 52 53 52 50 52 51 51 51
4.2 4 4.4 3.9 3.7 3.4 3.3 2.7 3.4 3.6 4.4 4.3 3.3 4.2 4.2 3.3 3.7
a) Constrúyase una tabla de doble entrada, agrupando los pesos en intervalos de 0.5 kg.
b) ¿Es la estatura independiente del peso?
5) En el examen de una asignatura que consta de parte teórica y parte práctica, las calificaciones de
nueve alumnos fueron:
Teoría 5 7 6 9 3 1 2 4 6
Prácti 6 5 8 6 4 2 1 3 7
ca
Calcular la covarianza y el coeficiente de correlación lineal. Dibujar la nube de puntos. Comentar los
resultados.
6) Se desea investigar el ganado caprino y el ganado ovino de un país. En la tabla de doble entrada
adjunta se presentan los resultados de un estudio de 100 explotaciones ganaderas, seleccionadas
aleatoriamente del censo agropecuario. Se proporcionan las frecuencias conjuntas del número de
cabezas (en miles) de cabras (X) y ovejas (Y) que poseen las explotaciones.
X\ 0 1 2 3 4
Y
0 4 6 9 4 1
1 5 10 7 4 2
2 7 8 5 3 1
3 5 5 3 2 1
4 2 3 2 1 0
93
7) Se realiza una prueba a 20 aspirantes a un puesto de grabador consistente en un dictado con cierto
tiempo de duración (en minutos, que será variable para cada aspirante) y luego contar el número de
errores cometidos al transcribirlo a un ordenador. Los resultados fueron:
Tº 7 6 5 4 5 8 7 8 9 6 5 8 6 8 7 8 7 6 6 9
Er 8 7 6 6 7 10 9 9 10 8 6 10 8 9 8 8 7 8 6 8
r
Talla 39 40 40 40 41 41 41 41 42 42 42 42 43 43 44
Peso 55 60 65 70 60 65 70 85 65 70 75 80 65 75 85
Nºestud 1 3 3 4 3 4 6 1 8 8 7 2 2 1 2
ia.
9) Se trató a 5 enfermos de hepatitis con un mismo fármaco, variando el tratamiento en las cantidades
diarias suministradas. Medido el número de días que cada enfermo tardó en sanar, se tiene:
mg. de 10 20 30 40 50
fármaco
Días en 200 180 150 120 100
sanar
94
CAPITULO 4
MODELOS PROBABILÍSTICOS
INTRODUCCIÓN
Probabilidad, rama de las matemáticas que se ocupa de medir o determinar cuantitativamente la
posibilidad de que ocurra un determinado suceso. La probabilidad está basada en el estudio de la
combinatoria y es fundamento necesario de la estadística.
La definición de variable aleatoria permite el uso de un lenguaje común que ayuda a entender de
una forma sistemática los experimentos aleatorios. En la medida en que se analizan distintos
tipos de experimentos aleatorios se comienza a notar que el comportamiento de muchos de ellos
es bastante similar entre sí. Comienzan a repetirse características de una variable aleatoria a
otra lo que conlleva a continuar la sistematización del análisis al verificar esas características
comunes. Este análisis lleva a definir modelos probabilísticos particulares que permiten explicar
fenómenos aleatorios que tienen un comportamiento similar entre sí.
96
TEMA 1
Objetivo de aprendizaje.
1. Definir los conceptos de variable aleatoria, parámetros función y distribución de probabilidades.
Criterio de Aprendizaje.
1.1. Ilustrar los conceptos de variable aleatoria, parámetros función y distribución de probabilidades.
Didáctica de enseñanza.
TEMA 2
Objetivo de aprendizaje.
2. Definir las variables aleatorias continuas y discretas.
Criterio de Aprendizaje.
2.1. Ilustrar las variables aleatorias continuas y discretas.
Didáctica de enseñanza.
Ta. 6 Establezca cinco ejemplos relacionados con un experimento aleatorio discreto.
El modelo uniforme discreto es una variable aleatoria donde todos sus valores tienen igual
probabilidad de ocurrencia.
El modelo uniforme continuo es una variable aleatoria donde la probabilidad de que un evento ocurra
en un intervalo de ancho t es proporcional a ese intervalo.
La variable aleatoria se define al asignar a cada evento elemental un número entero. La numeración de
los posibles valores de la variable se inicia en uno y termina en el número ‘n’ de eventos elementales
asociados al experimento aleatorio.
En la presente unidad se pretende que el alumno adquiera la habilidad del manejo de las anteriores
herramientas estadísticas.
Variable Aleatoria:
Es aquella que al tener una función se asigna un número real a cada resultado en el espacio muestral de
un experimento aleatorio.
Una variable aleatoria es el resultado numérico de un experimento aleatorio. Por ejemplo, podemos
considerar X el número resultante de tirar un dado; o podemos tirar 6 dados y tomar X como la suma de
los seis valores resultantes. La distribución de una variable aleatoria es la colección de posibles
resultados con sus probabilidades asociadas. Esto puede ser descrito por una tabla, una formula, o un
histograma de probabilidades
Ejemplo.
97
Probabilidades para n Dados.
Supongamos que tiramos seis n dados regulares balanceados. Si X es la suma de los valores que
aparecen en los n dados, Que son las probabilidades asociadas a cada valor de X dentro de los posibles
valores de X = n , ... , 6n?
En el caso de n=1, esas posibilidades son todas 1/6. Para dos dados, es más fácil considerar una tabla
con los posibles resultados:
(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
Como hay 36 resultados posibles, todos igualmente probables, podemos ver que las probabilidades son:
X frecuencia P(X)
2 1 1/36
3 2 2/36
4 3 3/36
5 4 4/36
6 5 5/36
7 6 6/36
8 5 5/36
9 4 4/36
10 3 3/36
11 2 2/36
12 1 1/36
98
Si hubiera más de dos dados, hacer tablas como las anteriores es difícil. El número de posibles
resultados seria 6n, sin embargo basta contar el número de veces que cada suma se da entre los 6 n
posibles resultados para calcular la probabilidad de cada suma. Esto es fácil de hacer si consideramos la
función generadora para el número de veces que cada suma aparece:
f(x) = (x + x2 + x3 + x4 + x 5+x6)n
(x + x2 + x3 + x4 + x 5+x6)2= x 2+2x3+3x4+4x5+5x6+6x7+5x8+4x9+3x10+2x11+x12
Ejercicio.
Probabilidades para n mondas con dos caras águila o sol que son definidas por valor 1 y 2
respectivamente. Supongamos que tiramos cinco n monedas. Si X es la suma de los valores que
aparecen en los n monedas, Que son las probabilidades asociadas a cada valor de X dentro de los
posibles valores de X = n, ... , 5n?
En el caso de n =2, esas posibilidades son todas 1/5. Considere una tabla con los posibles resultados.
Determine la posibilidad de que se obtenga la suma asociada a esos resultados y determine las
propiedades del cada evento.
Variable Aleatoria:
Es aquella que al tener una función se asigna un número real a cada resultado en el espacio muestral de
un experimento aleatorio.
Variables discretas:
Son aquellas que toman determinado valor exacto como: El No. De hijos de una familia.
Variable Continua:
Modelo o distribución de probabilidades: función que distribuye probabilidades entre los valores de
una variable aleatoria.
99
Una variable aleatoria es una función que asigna un número real a cada resultado en el espacio
muestral de un experimento aleatorio.
Las variables aleatorias se denotan con una letra mayúscula, tal como X , y con una letra minúscula,
como x , el valor posible de X . El conjunto de los posibles valores de la variable aleatoria X
recibe el nombre de rango de X .
Una variable aleatoria discreta es una variable aleatoria con un rango finito.
Ejemplo:
Supóngase que el interés recae en resumir los resultados de este experimento aleatorio con el número
de características (de coloración y reducción de tamaño) que son aprobadas. Por lo cual, se define una
variable aleatoria, X , para ser igual al número de características aprobadas.
La cuarta columna de la siguiente tabla, contiene los valores de X asignados a cada resultado del
experimento. Por ejemplo al resultado (aprobado, aprobado) se le ha asignado x 2 .
En todos los procesos productivos las características del producto deben ser medidas para asegura que
el producto cuenta con las características especificadas en su diseño. En la práctica pueden presentarse
pequeñas variaciones en las longitudes medidas, por muchas causas, tales como vibraciones,
fluctuaciones de temperatura, diferencias entre quienes toman las mediciones, calibraciones, desgaste
en la herramienta de corte, desgaste en los cojinetes y cambios en la materia prima. Incluso el
procedimiento de medición puede producir variaciones en los resultados finales.
Evidencia parcial
Ta. 6 Establezca cinco ejemplos relacionados con un experimento aleatorio discreto.
Evaluación parcial
Entrega de Ta.6
101
TEMA 3
Objetivo de aprendizaje.
3. Definir los conceptos y expresar las funciones de probabilidad: uniforme, binomial, hipergeométrica
y Poisson.
Criterio de Aprendizaje.
3.1. Calcular mediante tablas de esas distribuciones discretas un conjunto de datos.
Didáctica de enseñanza.
TEMA 4
Objetivo de aprendizaje.
4. Describir las consideraciones para elegir un modelo probabilístico discreto
Criterio de Aprendizaje.
4.1. Seleccionar el modelo probabilístico discreto de acuerdo a la naturaleza de un conjunto de datos.
Didáctica de enseñanza.
Pa.6 Determine la probabilidad de que uno de estos dispositivos seleccionados al azar, contenga el
ejercicio dado.
Modelo Uniforme.
El modelo uniforme discreto es una variable aleatoria donde todos sus valores tienen igual
probabilidad de ocurrencia. La numeración de los posibles valores de la variable se inicia en uno y
termina en el número ‘n’ de eventos elementales asociados al experimento aleatorio. La regla de
asignación se indica en la siguiente ecuación.
…1
El modelo uniforme discreto se denotará como UD(n). La asignación de probabilidades de cada valor
de la variable está dada por la ecuación.
…2
102
…3
…4
…5
La siguiente tabla muestra los valores esperados más importantes correspondientes al modelo uniforme
discreto.
Ejercicio: Considere el experimento aleatorio de lanzar una moneda honesta. Si al resultado ‘sello’ se
le asigna el valor uno y al resultado ‘cara’ se le asigna el valor dos entonces la variable aleatoria
definida se corresponde con el modelo uniforme discreto n = 2.
Ejercicio: Considere la variable aleatoria definida para el experimento aleatorio de lanzar un dado
honesto. Esta variable corresponde al modelo uniforme discreto con n = 6.
Distribución binomial.
n
p x p x 1 p
n x
x
x 0,1,2...n
103
50
p x 0.01 0.99
x 50 x
x
x 0,1,2...50
50 50!
Donde que es el número de combinaciones de 50 partes tomadas x cada vez. Esta
x x! 50 x !
es una distribución discreta, ya que el número observado de disconformidades es x 0,1,2...50 y se
denomina distribución binómica o binomial.
p x 1 p x 0 p x 1
p 0 p 1
1
50
0.01 0.99
x 50 x
x 0 x
50!
0.99 50 0.01 0 50! 0.01 1 0.99 49
0!50! 1!49!
Distribución Exponencial
La variable aleatoria X que es igual a la distancia entre ocurrencias sucesivas de un proceso Poisson
con media 0 , tiene una distribución exponencial con parámetro . La función de densidad de
probabilidad de X es:
f x x; x , Para 0 x
Ejemplo:
La vida útil de un foco es una variable exponencial con un promedio de 500 hrs. Calcula la
probabilidad de que la vida de un foco cualquiera:
104
1 1 1
500
1
700
F 700 1 e 500
0.7534
1
400
F 400 1 e 500
0.5506
1
500
500
p x 500 ) e
x
dx
0
1
500
1
0
1 e 500 1 e
500
=0.6321-0
=0.6321
Ejercicio
La probabilidad de que un foco dure menos que el promedio (500 hrs. ) es de 63.21%
Distribución de Poisson
Una aplicación clásica de la distribución de Poisson en el control de calidad es como un modelo del
número de defectos o disconformidades que ocurren en una unidad del producto por ejemplo,
supóngase que el número de defectos por unidad en las conexiones de conductores en un dispositivo
electrónico de semiconductores tiene distribución de Poisson, con parámetro = 4 (o sea 4 defectos en
promedio cada unidad). Entonces, la probabilidad de que uno de estos dispositivos seleccionados al
azar contenga 2 defectos o menos (incluso ninguno) es:
p x 2 p 0 p 1 p 2
105
e x
p x x 0,1,2....
x!
2
e 4 0
p 0 0.0183156
0!
x P(x)
0 0.0183
1 0.0733 Resultado .2381
2 0.1465
3 0.1954
4 0.1954
5 0.1563
6 0.1042
7 0.0595
8 0.0298
9 0.0132
10 0.0053
11 0.0019
12 0.0006
13 0.0002
14 0.0000
15 0.0000
16 0.0000
. 0.0000
. 0.0000
. 0.0000
106
Práctica 6
Determine la probabilidad de que uno de estos dispositivos seleccionados al azar, contenga el ejercicio
dado.
En una agroindustria seleccionadora de manzana se aplico el control de calidad es como un modelo del
número de defectos o disconformidades que ocurren en una unidad del empaque, supóngase que el
número de defectos por caja tiene distribución de Poisson, con parámetro = 2 (o sea 2 defectos en
promedio cada unidad).
107
TEMA 5
Objetivo de aprendizaje.
5. Definir y expresar la distribución de probabilidades: Normal, Ji cuadrada, t de student y F.
Criterio de Aprendizaje.
5.1. Calcular mediante tablas de distribuciones continuas, la probabilidad de la ocurrencia de un evento.
Didáctica de enseñanza.
TEMA 6
Objetivo de aprendizaje.
6. Describir las circunstancias en que se elige un modelo probabilístico continuo.
Criterio de Aprendizaje.
6.1. Seleccionar el modelo probabilístico continuo de acuerdo a la naturaleza de un conjunto de datos.
Didáctica de enseñanza.
Ta.7 Solución de ejercicio
Distribución Normal
Sin lugar a dudas, la distribución más utilizada para modelar experimentos aleatorios es la distribución
normal. Esta distribución puede obtenerse al considerar el modelo básico de una variable aleatoria
binomial cuando el número de ensayos se vuelve cada vez más grande. Este fue el enfoque original
seguido por De Moivre en 1733. Desafortunadamente, su trabajo se perdió por algún tiempo, y Karl
Gauus Desarrolló, de manera independiente, la distribución normal casi cien años después. Aunque más
tarde se dio crédito a De Moivre, la distribución normal también se conoce como distribución
Gaussiana.
2
Ejemplo.
La resistencia a la tensión del papel utilizado en la fabricación de bolsas para las compras es una
característica de calidad importante, se sabe que la resistencia (x) tiene distribución normal, con media
40 lb 2 lb
p lg 2 (psi, del inglés poud per square inch) y desviación estándar p lg 2 , lo que se
denota por
x N 40,2 2 . El comprador de las bolsas necesita una resistencia de por lo menos
2
35 lbs p lg . La probabilidad de que una bolsa producida con este papel satisfaga o exceda esta
especificación es p x 35 . Nótese que
p x 35 1 p x 35
108
Para evaluar esta probabilidad a partir de las tablas de distribución estándar hay que estandarizar el
punto 35 y se encuentra que:
x 35 40
p x 35 p z
2
p z 2.5
25
0.0062
lbs
La probabilidad de que una bolsa exceda las 35 p lg 2 es de 99.38%
Ejercicio.
Un parámetro a evaluar como control de calidad en los empaque de manzana Red Deliciuos la textura.
Mediante un penetrómetro se sabe que la resistencia (x) tiene distribución normal, con media
40 lb 2 lb
p lg 2 (psi, del inglés poud per square inch) y desviación estándar p lg 2 , lo que se
denota por x N 40,2 2 . El comprador de manzana necesita una resistencia de por lo menos 38
lb/plg2. Determine la probabilidad de que una manzana empacada satisfaga o exceda esta
especificación.
Distribución T-Student
Supóngase que se toma una muestra de una población normal con media y varianza 2 . Si X es
el promedio de las n observaciones que contiene la muestra aleatoria, entonces la distribución de
Z X / / n es una distribución normal estándar. Supóngase que la varianza de la población 2
es desconocida. ¿Qué sucede con la distribución de esta estadística si se reemplaza por S? La
distribución t proporciona la respuesta a esta pregunta.
Sea <Z una variable aleatoria con distribución N(0,1) y V una variable aleatoria jicuadrada con k
grados de libertad. Si Z y V son independientes, entonces la variable aleatoria
Z
T
V /K
T k 1 / 2 1
f x x
k k / 2 x 2 / k 1 k 1 / 2
y se dice que sigue la distribución t con k grados de libertad, lo que se abrevia como t k .
109
La media y la varianza de la distribución t son = 0 y 2 k / k 2 para que k>2, respectivamente.
Ejemplo:
Un químico afirma que el rendimiento medio de la población de cierto proceso en lotes es 500 gramos
por milímetro de materia prima. Para verificar esta afirmación muestrea 25 lotes cada mes. Si el valor
t calculado cae entre t 0.05 y t 0.05 , queda satisfecho con su afirmación. ¿Qué conclusión
extraería de una muestra que tiene una media x 518 gramos por milímetro y una desviación estándar
muestral s 40 gramos? Suponga que la distribución de rendimientos es aproximadamente normal.
De las tablas se extrae el valor t 0.05 1.711 para 24 grados de libertad. Por tanto, el fabricante queda
satisfecho con esta afirmación si una muestra de 25 lotes rinde un valor t entre –1.711 y 1.711. Si
500 , entonces,
518 500
t 2.25
40 / 25
un valor muy por arriba de 1.771. La probabilidad de obtener un valor t , con v 24 , igual o mayor
que 2.25 es aproximadamente 0.02. Si 500 , el valor de t calculado de la muestra sería más
razonable. De aquí que es probable que el fabricante concluya que el proceso produce un mejor
producto del que piensa.
En una agroindustria de lácteos se realiza un análisis de acidez a leche caliente (recién ordeñada). El
resultado arroja una acidez expresada en º Dornikc superior a 18. Lo que indica que la materia prima
esta altamente contaminada y disminuirán en medida correctiva el precio a los productores. Para
verificar esta afirmación los productores muestrea 25 lotes cada mes. Si el valor t calculado cae entre
t 0.05 y t 0.05 , queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que
tiene una media 19 º D y una desviación estándar muestra 3 2 º D. ¿ A que conclusión llegaría si la
distribución de acidez es aproximadamente normal?
110
CAPITULO 5
PRUEBAS DE HIPÓTESIS
INTRODUCCIÓN
A menudo, el problema que enfrenta el científico o el ingeniero no es
tanto la estimación de un parámetro poblacional, sino más bien la
formación de un procedimiento de decisión que se base en los datos que
pueda producir una conclusión acerca de algún sistema científico. Por
ejemplo, un investigador médico puede decidir sobre la base de
evidencia experimental si beber café aumenta el riego de cáncer en
humanos; un ingeniero puede tener que decidir sobre la base de datos
muestrales si hay una diferencia entre la precisión de dos tipos de
medidores; o un sociólogo puede desear reunir los datos apropiados que
le permitan decidir si el tipo sanguíneo de una persona y el color de los
ojos son variables independientes. En cada uno de estos casos el
científico o el ingeniero postula o conjetura algo acerca de un sistema.
Además, cada uno debe incluir el uso de datos experimentales y la toma
de decisiones basadas en éstos. De manera formal, en cada caso, la
conjetura se puede poner en forma de hipótesis estadística. Los
procedimientos que conducen a la aceptación o rechazo de hipótesis
estadísticas como éstas comprenden un área principal de la inferencia
estadística y son los que y trataremos en la presente unidad.
1. Describir la naturaleza de una prueba de hipótesis y los tipos de hipótesis: una y 113
dos colas.
1.1. Practicar las pruebas de hipótesis, clasificarlas y esbozar el procedimiento de 113
contrastabilidad.
DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE
APRENDIZAJE)
1.1.1. Diferenciar las pruebas de hipótesis, clasificarlas y esbozar el procedimiento de
contrastabilidad.
112
TEMA 1
Objetivo de aprendizaje.
1. Describir la naturaleza de una prueba de hipótesis y los tipos de hipótesis: una y dos colas.
Criterio de Aprendizaje.
1.1. Practicar las pruebas de hipótesis, clasificarlas y esbozar el procedimiento de contrastabilidad.
Didáctica de enseñanza.
TEMA 2
Objetivo de aprendizaje.
2. Ilustrar los errores tipo I y II que se pueden presentar al aceptar o rechazar una hipótesis.
Criterio de Aprendizaje.
2.1. Demostrar los errores tipo I y II que se pueden presentar al aceptar o rechazar una hipótesis
Didáctica de enseñanza.
Ta.8 Defina hipótesis nulas y hipótesis alternas en función de cinco ejemplos de control estadístico en
alguna agroindustria. Además considere las opciones de error tipo I y error tipo II.
Pruebas de hipótesis.
Una hipótesis estadística es una aseveración o conjetura con respecto a una o más poblaciones.
La verdad o falsedad de una hipótesis estadística nunca se sabe con absoluta certidumbre a menos que
examinemos toda la población. Esto, por supuesto, sería poco práctico en la mayoría de las situaciones.
En su lugar, tomamos una muestra aleatoria de la población de interés y utilizamos los datos
contenidos en esta muestra para proporcionar evidencia que apoye o no a la hipótesis. La evidencia de
la muestra que es inconsistente con la hipótesis que se establece conduce al rechazo de ésta, mientras
que la evidencia que la apoya conduce a su aceptación.
Debe quedar claro al estudioso de la materia que el diseño de un procedimiento de decisión se debe
hacer con la idea en mente de la probabilidad de una conclusión errónea. Por ejemplo, suponga que la
conjetura (hipótesis) que postula el técnico es que la fracción p de defectuosos en cierto proceso es
0.10. El experimento es la observación de una muestra aleatoria del producto en cuestión. Suponga que
se prueban 100 artículos y se encuentra que 12 están defectuosos. Es razonable concluir que esta
evidencia no rechaza la condición p 0.10 , y por ello puede conducir a la aceptación de la hipótesis.
Sin embargo, tampoco rechaza p 12 o incluso p 15 . Como resultado, el lector se debe
acostumbrar a comprender que la aceptación de una hipótesis simplemente implica que los datos no
dan suficiente evidencia para rechazarla. Por otro lado, el rechazo implica que la evidencia muestral la
refuta. Puesto de otra forma, el rechazo significa que hay una pequeña probabilidad de obtener la
información muestral observada cuando, de hecho, la hipótesis es verdadera. Por ejemplo, en nuestra
hipótesis de proporción de defectuosos, una muestra de100 que revela 20 artículos defectuosos es
ciertamente evidencia de rechazo. ¿Por qué? Si, en realidad, p 0.10 , la probabilidad de obtener 20 o
más defectuosos es aproximadamente 0.0035. Con el pequeño riesgo resultante de una conclusión
errónea, parecería seguro rechazar la hipótesis de que p 0.10 . En otras palabras, el rechazo de una
113
hipótesis tiende a casi “excluir” la hipótesis. Por otro lado, es muy importante enfatizar que la
aceptación o, más bien, la falla al rechazo no excluyen otras posibilidades. Como resultado, el analista
de los datos establece una conclusión firme cuando se rechaza una hipótesis.
El planteamiento formal de una hipótesis a menudo está influido por la estructura de la probabilidad de
una conclusión errónea. Si el científico se interesa en apoyar con fuerza una opinión, desea llegar a la
opinión en la forma de rechazo de una hipótesis. Si el investigador médico desea mostrar fuerte
evidencia a favor de la opinión de que beber café aumenta el riesgo de contraer cáncer , la hipótesis a
aprobar debe ser de la forma “ no hay aumento en el riesgo de contraer cáncer como producto de beber
café”. Como resultado, la opinión se alcanza por medio de un rechazo. De manera similar, para apoyar
la afirmación de que un tipo de medidores es más preciso que otro, el ingeniero prueba la hipótesis de
que no hay diferencia en la precisión de los dos tipos de medidor.
La estructura de la prueba de hipótesis se formulará con el uso del término hipótesis nula. Éste se
refiere a cualquier hipótesis que deseamos probar y se denota con H 0 conduce a la aceptación de una
hipótesis alternativa, que se denota con H 1 . Una hipótesis nula con respecto a un parámetro
poblacional siempre se establecerá de modo que especifique un valor exacto del parámetro, mientras
que la hipótesis alternativa permite la posibilidad de varios valores. De aquí, si H 0 es la hipótesis nula
p 0.5 para una población binominal, la hipótesis alternativa H 1 sería una de las siguientes:
Pruebas de Hipótesis
Hipótesis
Afirmación acerca de los parámetros de la población.
Hipótesis nula
Es una afirmación acerca de los valores de uno o más parámetros de la población. Se pone a prueba
usando la evidencia muestral. Establece que la diferencia entre el parámetro poblacional y el
estadístico muestral se debe a la variación aleatoria del muestreo. Se denota por H0.
Región de rechazo
También llamada región crítica. Es el rango de valores de un estadístico muestral que conducirá al
rechazo de la hipótesis nula, bajo el nivel de significancia dado.
114
Error de tipo I
Se incurre en este error cuando incorrectamente se rechaza la hipótesis nula. Denotamos por a la
probabilidad de que se cometa un error de tipo I.
Error de tipo II
Se incurre en este error cuando incorrectamente no se rechaza la hipótesis nula. Denotamos por b la
probabilidad de que se cometa un error de tipo II.
Colas
Una prueba de una cola es una en la que la hipótesis alternativa indica una dirección. Una prueba de
dos colas es aquella en la que la hipótesis alternativa no especifica dirección.
Prueba de Hipótesis:
Estadístico de prueba
Es un estadístico de la muestra cuya distribución muestral puede ser especificada para la hipótesis nula
o para la hipótesis alternativa, aunque para la hipótesis alternativa esto pueda ser bastante complejo.
Después de especificar el nivel de significancia a, la distribución muestral de este estadístico de prueba
puede usarse para definir la región de rechazo.
Ejemplo:
115
Según la FEDEFUT, el peso promedio de un jugador nuevo de la Liga Nacional de Fútbol es de 168.
Ahora, la nutricionista del equipo XYZ piensa que el peso promedio del equipo XYZ es diferente que
168. Como se están haciendo reclutamientos, escoge una muestra aleatoria del peso de 40 candidatos.
Asuma que = 23
H0: = 168
H1: 168
Nivel de significancia (probabilidad de rechazar la hipótesis nula cuando esta es cierta): 0.05.
Siendo simétrica la curva normal, Se tiene que Z1 = 1.96 y Z2 = 1.96, entonces C1 = 175.13 y C2 =
160.87
En general, la hipótesis nula se construye para ser la hipótesis que siendo cierta, ninguna decisión
concerniente a un cambio se hará (cambio nulo). Rechazar la hipótesis nula significa tomar decisiones
que conllevan un cambio, y por lo tanto, representaran un costo. En este sentido, incurrir en un error de
tipo I conlleva una mayor preocupación.
La hipótesis alternativa describe condiciones para las cuales algo debe hacerse. Es la hipótesis de
investigación o acción. En un ambiente de investigación o experimental, la hipótesis alternativa es la
que queremos establecer, al rechazar la hipótesis nula, con un nivel suficientemente bajo de
significancia tal que es improbable que la nueva hipótesis sea erróneamente aceptada.
Es importante entonces el especificar un nivel adecuado de significancia. Cometer un error del tipo I
tiene mayores consecuencias, entonces se escoge un valor pequeño de a. 0.1, 0.05, 0.01, más
comúnmente 0.05.
Hay una relación inversa entre a y b. A menos de que se aumente el tamaño de la muestra, se puede
reducir a solamente aumentandob. Ahora bien, conviene determinar en cada experimento cuales son
las consecuencias de cometer un error de tipo II.
Ta.8 Defina hipótesis nulas y hipótesis alternas en función de cinco ejemplos de control estadístico en
alguna agroindustria. Además considere las opciones de error tipo I y error tipo II.
117
TEMA 3
Objetivo de aprendizaje.
3. Describir el procedimiento para realizar prueba de hipótesis sobre la media de una distribución
normal y los casos en los que se emplea esta prueba.
Criterio de Aprendizaje.
3.1. Practicar pruebas de hipótesis sobre la media de una muestra de datos, así como el procedimiento
de prueba para aceptar o rechazar la hipótesis e interpretar los resultados.
Didáctica de enseñanza.
Ta.9 Realizar el ejercicio, probando la hipótesis.
En este tema se consideran pruebas de hipótesis sobre la media de una población (o la media de una
distribución de probabilidad), donde la varianza de la población es conocida.
Las suposiciones para esta prueba son mínimas. La población o distribución de interés tiene media y
varianza 2 , con 2 conocida. El estadístico de prueba se basa en la media muestral X , por lo que
también se supondrá que la población está distribuida de manera normal o que se aplican las
condiciones del teorema del límite central. Esto significa que la distribución de X es aproximadamente
normal con media y varianza 2 /n.
Habitualmente, es más conveniente estandarizar la media muestral y utilizar una estadística de prueba
basada en la distribución normal estándar. Esto es, el procedimiento de prueba para H 0 : 0 utiliza
el estadístico de prueba
X 0
Z0
n
118
cierta, la probabilidad de que la estadística de prueba Z 0 caiga entre Z a 2 y Z a 2 es 1 a .
Z 0 Za
2 (3)
Z 0 Za
2 (4)
Za / 2 Z 0 Za / 2
(5)
En general, es más fácil comprender la región crítica y el procedimiento de prueba cuando la estadística
de prueba es Z 0 más que X . Sin embargo, la misma región crítica siempre puede escribirse en
términos del valor calculado de la media muestral x . Un procedimiento idéntico al anterior es el
siguiente:
Rechazar H 0 : 0 si x a o x b
Donde
a 0 Z a / 2 / n
b 0 Z a / 2 / n
Ejemplo:
Los sistemas de escape de emergencia para tripulaciones de aeronaves son impulsados por un
combustible sólido. Una de las características importantes de este producto es la rapidez de
combustión. Las especificaciones requieren que la rapidez promedio de combustión sea 50 cm/s. Se
sabe que la desviación estándar de esta rapidez es a 2 cm./s. El experimentador decide especificar
una probabilidad para el error tipo I, o nivel de significancia, de a 0.05 selecciona una muestra
aleatoria de n = 25 y obtiene una rapidez promedio muestral de combustión de x 51.3cm / s. ¿ A qué
conclusiones debe llegar?
2. H 0 : 50cm / s.
119
3. H 1 : 50cm / s.
4. a 0.05
5. La estadística de prueba es
x 0
Z0
/ n
6. Rechazar H 0 si Z 0 1.96 o Z 0 1.96 . Nótese que esto es consecuencia del paso 4, donde se
especifica a 0.05 , de modo que las fronteras de la región crítica son Z 0.025 1.96 y
Z 0.025 1.96
51.3 50
Z0 3.25
2 / 25
8. Conclusión: Dado que Z 0 3.25 1.96 , se rechaza H 0 : 50 con nivel de significancia de 0.05.
Planteado de manera más completa, se concluye que, con base en una muestra de 25 mediciones, la
rapidez promedio de combustión es diferente de 50 cm/s. De hecho, existe una evidencia fuerte que la
rapidez promedio de combustión es mayor que 50 cm/s.
Ejercicio
1. Conocemos que las alturas X de los individuos de una ciudad, se distribuyen de modo gaussiano.
Deseamos contrastar con un nivel de significación de si la altura media es diferente de 174
cm. Para ello nos basamos en un estudio en el que con una muestra de n=25 personas se obtuvo:
2. Consideramos el mismo ejercicio anterior. Comprobado que se rechaza el hecho de que la altura
media de la población sea igual a 174 cm. Realizar el contraste sobre si la altura media es menor de 174
cm.
Pruebas de Hipótesis sobre las Medias de dos Distribuciones Normales, Varianzas Desconocidas.
Ejemplo
120
Índices de Octano en Carretera
Formula 1 Formula 2
( con tetraetil-plomo) (Sin plomo)
89.5 89.5
90.0 91.5
91.0 91.0
91.5 89.0
92.5 91.5
91.0 92.0
89.0 92.0
89.5 90.5
91.0 90.0
92.0 91.0
Se desea probar la hipótesis de que el índice octánico medio de la formulación 1 (con plomo) es igual
al índice de octano medio para la formulación 2; o sea,
H 0 : 1 2
H 1 : 1 2
Rechazar H 0 si t 0 ta / 2 ,v
n1 10 n 2 10
x1 90.7 x 2 90.8
S1 1.16 S 2 1.03
S 1.34
1
2
S 22 1.07
n1 1 S12 n2 1 S 22
Sp V n1 n2 2
n1 n2 2
Sp
10 11.34 10 11.03
V 10 10 2 18
10 10 2
S p 1.09
x1 x 2
t0
1 1
Sp
n1 n2
90.7 90.8
t0 0.21
1 1
1.09
10 10
121
0.21 2.878
La decisión es aceptar H 0
Ejercicio
Establecer las pruebas de hipótesis sobre la igualdad de las medias 1 , y 2 de dos distribuciones
normales donde las varianzas 12 y 22 son desconocidas. Para probar esta hipótesis se usará una
estadística t . Se requiere la hipótesis de normalidad para desarrollar el procedimiento de prueba, pero
los alejamientos moderados de la normalidad no tendrán efectos adversos sobre el procedimiento.
Se desea probar la hipótesis de que el contenido de plomo entre los productos originados de la laguna y
del Valle del Mezquital es diferente.
H 0 : 1 2
H 1 : 1 2
122
TEMA 4
Objetivo de aprendizaje.
4. Describir el procedimiento para realizar prueba de hipótesis sobre la varianza de una distribución
normal y los casos en que se emplea esta prueba.
Criterio de Aprendizaje.
4.1. Practicar el procedimiento para realizar prueba de hipótesis sobre la varianza de una distribución
normal y los casos en que se emplea esta prueba.
Didáctica de enseñanza.
In 1 y Ta.10 Investigar y desarrollar, tres ejercicios relacionados con el control de calidad aplicado a la
agroindustria, donde se aplique prueba de hipótesis sobre la varianza de una distribución normal
Algunas veces se necesitan pruebas sobre la varianza o la desviación estándar de una población. En
esta sección se presentan dos procedimientos; uno se basa en la hipótesis de que la población es
normal, mientras que el otro es una prueba para una muestra grande que no requiere la suposición de
normalidad.
Supóngase que se desea probar la hipótesis de que la varianza de una población normal a 2 es igual a
un valor específico, por ejemplo, a 02 . Sea X 1 , X 2 ,.... X n una muestra aleatoria de n observaciones
tomadas de esta población. Para probar.
H 0 : 2 02
H 1 : 2 02 (1)
X 02
n 1 S 2 (2
02
X 02 X a2 / 2 , n 1 (3)
O si
X 02 X 12a / 2, n 1
(4)
123
Donde X a / 2, n 1 y X 1a / 2 ,n 1 son los puntos que corresponden a los porcentajes 100a / 2 inferior y
2 2
El mismo estadístico de prueba se utiliza para hipótesis alternativas unilaterales. Para la hipótesis
unilateral.
H 0 : 2 02
(5
H 1 : 2 02
Se rechaza H 0 si
X 02 X a2,n 1
(6)
Para la hipótesis unilateral
H 0 : 2 02
(7
H 1 : 2 02
Se rechaza H 0 si
X 02 X 12a ,n 1
(8
Ejemplo:
X 02
n 1 s 2
02
124
6. Se rechaza H 0 si X 0 X 0.05,19 30.14
2 2
7. Cálculos:
19 0.0153
X 02 29.07
0.01
8. Conclusiones: Puesto que X 0 29.07 X 0.05,19 30.14 , se concluye que no hay ninguna evidencia
2 2
fuerte de que la varianza del volumen de llenado sea mayor que 0.01 (onzas de fluido) 2
In.1 y Ta.10 Investigar y desarrollar, tres ejercicios relacionados con el control de calidad aplicado a la
agroindustria, donde se aplique prueba de hipótesis sobre la varianza de una distribución normal
125
TEMA 5
Objetivo de aprendizaje.
5. Describir el procedimiento de la prueba de hipótesis sobre p de una muestra de datos de una
distribución binomial y los casos en que se emplea esta prueba.
Criterio de Aprendizaje.
5.1 Practicar el procedimiento de la prueba de hipótesis sobre p de una muestra de datos de una
distribución binomial y los casos en que se emplea esta prueba.
Didáctica de enseñanza.
Pa.7 Elaborar ejercicios sobre prueba de hipótesis p
La distribución binomial.
Esta distribución describe una variedad de procesos y describe datos discretos, no continuos, que son
resultado de un experimento conocido como proceso de Bernoulli.
Si X1 y X2 contabilizan en cada caso el número de éxitos en cada muestra se tiene que cada una de ellas
se distribuye como una variable aleatoria binomial:
De modo que los estimadores de las proporciones en cada población tienen distribuciones que de un
modo aproximado son normales (cuando n1 y n2 son bastante grandes)
126
El contraste que nos interesa realizar es el de si la diferencia entre las proporciones en cada población
es una cantidad conocida
Contraste bilateral
Entonces se define
Contrastes unilaterales
En el contraste
127
Se rechazará H0 si . Para el test contrario
Se rechaza H0 si .
Ejemplo
El gerente de ventas de una empresa agroindustrial asegura que la venta del producto depende del color
que se use en el empaque. Con el propósito de evaluar a la anterior consideración se estableció un
experimento donde 25 amas de casa elegidas aleatoriamente en forma independiente seleccionaron a su
agrado una muestra del producto en comparación: empaque color rojo y empaque color azul.
Solución:
Los resultados indicaron que las amas de casa prefirieron el producto con empaque azul. Al esperar
que el color del empaque no influye en la selección del producto se espera una conformación de
proporcionalidad igual al 50 % ( P = (0.5 y q =0.5 ). a un nivel de significancia a=0.05.
Ho: P = 0.5
Ha: P 0.5
P2=7/25 = 0.28
= 0.72-0.28= 0.44
128
Práctica 7
En todos los problemas que siguen a continuación, se supone que las muestras han sido elegidas de
modo independiente, y que las cantidades cuantitativas que se miden, se distribuyen de modo
gaussiano. En temas posteriores se verá cómo contrastar si estas premisas pueden ser aceptadas o no al
examinar las muestras.
Ejercicio 1.
Ejercicio 2.
El número de accidentes mortales en una ciudad es, en promedio, de 12 mensuales. Tras una campaña
de señalización y adecentamiento de las vías urbanas se contabilizaron en 6 meses sucesivos 8, 11, 9, 7,
10, 9 accidentes mortales. ¿Fue efectiva la campaña?
Ejercicio 3.
Ejercicio 4.
Ejercicio 5.
Una población infantil se dice que es susceptible de recibir una campaña de educación e higiene si su
porcentaje de niños con dientes cariados es superior al 15%. Una población con 12.637 niños, ¿debe
hacerse la campaña si de 387 de ellos 70 tenían algún diente cariado?
129
CAPITULO 6
ANÁLISIS DE LA VARIANZA
INTRODUCCIÓN
El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar dos o más
medias, que es necesario porque cuando se quiere comparar más de dos medias es incorrecto
utilizar repetidamente el contraste basado en la t de Student.
El método que resuelve ambos problemas es el anova, aunque es algo más que esto: es un método
que permite comparar varias medias en diversas situaciones; muy ligado, por tanto, al diseño de
experimentos y, de alguna manera, es la base del análisis multivariante.
1. Analizar las causas del error experimental durante las mediciones. 132
1.1. Ilustrar y formular modelo lineal a partir de mediciones experimentales o datos 132
de texto.
131
TEMA 1
Objetivo de aprendizaje.
1. Analizar las causas del error experimental durante las mediciones.
Criterio de Aprendizaje.
1.1. Ilustrar y formular modelo lineal a partir de mediciones experimentales o datos de texto.
Didáctica de enseñanza.
Al conducir un experimento una persona encuentra uno o más de tres tipos generales de errores: error
humano, error sistemático, y error al azar.
Error humano (un error) ocurre cuando el experimentador, incurre en una equivocación. Los ejemplos
serían cuando se instala un experimento incorrectamente, cuando se lee mal un instrumento, o cuando
se incurre en una equivocación en un cálculo.
Error sistemático, es un error inherente en el experimento instalado que hace sesgar a los resultados
en la misma dirección, es decir, siempre demasiado grande o siempre demasiado pequeño. Algunos
errores sistemáticos pueden ser corregidos fácilmente. Por ejemplo, si un equilibrio lee 0,25 g cuando
no hay masa en ella, esto introduciría un error sistemático a cada medida, todo sería demasiado grande
por 0,25 g. Esto puede ser corregido poniendo a cero el equilibrio.
Todos los experimentos tienen error al azar, que ocurre porque ninguna medición no se puede hacer
con precisión infinita. Los errores al azar harán una serie de medidas demasiado grande y a veces
demasiado pequeña. Un ejemplo del error al azar podía ser al hacer sincronizaciones con un
cronómetro. Usted puede parar a veces el reloj demasiado pronto, o a veces demasiado tarde. Cualquier
caso introduce error al azar en sus medidas. (nota que cuando un ser humano está implicado en el
proceso real de la medida, el/ella puede introducir el error experimental válido que no está dentro de la
definición del error humano. Su tiempo de reacción finito no es un error; es una limitación de una
porción del proceso experimental, del ser humano haciendo la medida.) El error al azar puede ser
reducido haciendo un promedio de varias mediciones.
Una forma para analizar error experimental con un % del cálculo del error. El % del error es útil cuando
se tiene un solo resultado experimental que se desee comparar con un valor estándar, o cuando se
tienen dos valores experimentales obtenidos por diversos medios que se deseen comparar.
El % del error se calcula según la fórmula siguiente.
expt. # - std. #
% error = x 100 %
std. #
"expt. #" es su valor experimental, y el "std. #" es el valor del standard o del referente. Usando esta
fórmula, un resultado positivo indica que su resultado fuera más grande que el estándar, mientras que
un resultado negativo implica un resultado experimental más pequeño que el estándar. Mientras que %
132
del error le dice el tamaño relativo de su error, no le da ninguna pista en cuanto al tipo de ese error
(error al azar o error sistemático)).
En ciertos casos uno puede utilizar una cantidad estadística llamada la desviación de estándar ,
denotada generalmente por la sigma griega minúscula de la letra, σ , o la abreviatura std.,
Podemos resumir:
- % pequeños del error, dentro de uno o de dos σ estándar:, principalmente al azar.
- % pequeños del error, no dentro de dos o de tres σ estándar: principalmente sistemático.
- % grandes del error, dentro de uno o de dos σ estándar: grande, principalmente errores del random.
- % grandes del error, no dentro de dos o de tres σ estándar: principalmente sistemático.
133
TEMA 2
Objetivo de aprendizaje.
2. Reconocer las fuentes de variación, describir el procedimiento del análisis de varianza y explicar el
concepto de grado de libertad.
Criterio de Aprendizaje.
2.1. Ilustrar y diferenciar las fuentes de variación, el procedimiento del análisis de varianza y el
concepto de grado de libertad.
Didáctica de enseñanza.
De acuerdo con la hipótesis nula, según la cual se supone que las medidas poblacionales de los tres
grupos son iguales, se puede obtener una medición de la variación total o suma de los cuadrados,
__
sumando las diferencias elevadas al cuadrado entre cada observación y una medida global X sobre la
base de todas las observaciones. La variación total se calcularía como:
Supóngase que el gerente de producción de una planta en la cual se fabrica y envasa cereal en cajas de
368 gramos, considera sustituir una máquina antigua que afecta directamente la producción. Es más
supóngase que tres productores le han permitido usar sus equipos para efectuar pruebas , y cuyos
precios de compra y contratos de mantenimientos son totalmente iguales . Para tomar la decisión de
compra , el gerente de producción decide llevar a cabo un experimento para determinar las diferentas
más importantes entre las tres macas de equipo en el tiempo promedio (en segundos) que necesitan los
obreros para su producción. Se asignan en forma aleatoria 15 operarios con experiencia, capacidad y
edades similares, para recibir adiestramiento en una de las tres máquinas de modo que cada máquina
tenga cinco operadores. Después de una capacitación adecuada , suficiente y practica, el gerente de
producción mide el tiempo que necesitan los operadores para trabajar con sus equipos respectivos.
MÁQUINA
1 2 3
25.40 23.40 20.00
26.31 21.80 22.20
24.10 23.50 19.75
23.74 22.75 20.60
25.10 21.60 20.40
Media 24.93 22.61 20.59
134
H0: 1 = 2 =3 = ...= c Todas las máquinas son iguales
H1: No todas las máquinas son iguales
En la tabla se observa que existen diferencias en las medias maestrales para las tres máquinas. La
pregunta es si estos datos son lo suficientemente diferentes para que el gerente de producción llegue a
la conclusión de que los promedios poblacionales no son todos iguales.
Grados de libertad
Para calcular s2 se necesita conocer primero la media. Por consiguiente se puede decir que solo n-1
de los valores de muestra están “libres” para variar. Es decir , hay n-1 grados de libertad.
135
TEMA 3
Objetivo de aprendizaje.
3. Definir el tamaño de muestra, la unidad experimental y número de repeticiones.
Criterio de Aprendizaje.
3.1. Practicar para definir en un conjunto de datos el tamaño de muestra, la unidad experimental y
número de repeticiones.
Didáctica de enseñanza.
TEMA 4
Objetivo de aprendizaje.
4. Identificar de acuerdo a la estructura de los datos, el experimento completamente al azar, el
experimento en bloques al azar y el experimento factorial.
Criterio de Aprendizaje.
4.1. Diferenciar de acuerdo a la estructura de los datos, el experimento completamente al azar, el
experimento en bloques al azar y el experimento factorial.
Didáctica de enseñanza.
TEMA 5
Objetivo de aprendizaje.
5. Describir el procedimiento del análisis de varianza para ese tipo de experimentos.
Criterio de Aprendizaje.
5.1 Diferenciar el procedimiento del análisis de varianza para ese tipo de experimentos.
Didáctica de enseñanza.
Pa.8 Análisis de varianza (ANOVA)
Diseño de experimentos
Los experimentos son usados por los investigadores en todas las áreas de la ciencia ya se para describir
algo acerca de un proceso en particular o para comparar el efecto de varias condiciones sobre algún
fenómeno.
Para el diseño y análisis de experimentos se requiere que toda persona involucrada en el experimento
tenga una idea clara de lo que exactamente se será estudiado , como serán colectados los datos y al
menos una idea cualitativa de cómo serán analizados los datos.
136
2. Selección de factores y niveles el experimento debe seleccionar el factor o los factores (variable o
variables independientes) que serán investigados en el experimento. También se deberá seleccionar los
valores o niveles del factor o factores que se usaran en el experimento y que definen los tratamientos.
Al definir los tratamientos se esta definiendo al denominado especio de exploración o región de
exploración.
3. Definir a la unidad experimental. La unidad experimental es aquella subdivisión menor del material
experimental y que puede definir un tratamiento diferente. Para la selección de las unidades
experimentales debe tomarse en cuenta el especto práctico, no puede considerarse representativo el uso
de una planta para comparar dosis de fertilizante. En el aspecto estadístico debe tomarse en cuenta el
tamaño de la unidad experimental y el número de repeticiones para la precisión del experimento. Se
entiende por número de repeticiones al número de unidades experimentales que se repiten con el
mismo tratamiento.
5. Elección del diseño experimental. El diseño experimental es la forma de asignar los tratamientos o
las unidades experimentales, esto determina un modelo o un análisis a seguir. El experimentador debe
determinar la diferencia en la respuesta verdadera que desea detectar, así como la magnitud de riesgo
que esta dispuesto a tolerar , con lo cual un tamaño de muestra apropiado puede ser seleccionado.
También debe determinar el orden en el cual los datos deberán ser recolectados y el método de
aleatorización que será empleado.
El bloqueo es la inclusión en el diseño de algunos factores que aunque no son de interés, si pueden ser
causa de una fuerte variación en las unidades experimentales y que no pueden mantenerse constantes
para todas las unidades experimentales del experimento. Un bloque es un grupo de unidades
experimentales que son más o menos homogéneas, de modo que la asignación de tratamientos
diferentes a dichas unidades produzca en las observaciones un efecto más fácil de distinguir de otros
factores aleatorios.
Se llama bloque completo a un grupo de unidades experimentales que contienen todos los tratamientos
del experimento y bloque incompleto si contiene solo una parte de todos los tratamientos. Para el caso
de dos tratamientos , los bloques completos son parejas de unidades experimentales semejantes y se les
denomina observaciones apareadas.
6. Determinar el número de repeticiones. Las repeticiones son las veces que se reproduce cada
tratamiento en la unidad experimental. Las repeticiones permiten obtener una estimación de la varianza
del error experimental e incrementan la precisión del experimento ya que de hecho son el tamaño de
muestra de cada una de las poblaciones estudiadas.
137
7. Proyecto de resultados y análisis. Estos aspectos deben determinarse antes de efectuar el
experimento , para que puedan señalarse cuales son las suposiciones básicas del modelo y determinar
si el experimento cumple satisfactoriamente tales suposiciones.
9. Efectuar el análisis estadístico. Para este análisis existen programas de computadora , pero deben
complementase con graficas, cuadros o lagunas rutinas de calculo extra que sean fácilmente
explicables.
El modelo.
Las observaciones pueden expresarse en general mediante el siguiente modelo estadístico lineal:
Yij = +i + εij
i = 1,2,...t j= 1,2,...n
εij = Es el componente de error aleatorio ocasionado por todos los factores no constantes en cada una
de las poblaciones estudiadas.
El interés por desarrollar el análisis de varianza radica en que se desea probar la hipótesis sobre la
igualdad de los efectos de los tratamientos, es decir:
Yij = + εij
El procedimiento del análisis de varianza se resume en el cuadro siguiente:
F.V G.L SC CM F0
TRATAMIENTOS t-1 SCTr CMTr=SCTr/(t-¡) CMTr/CME
ERROR nt-t SCE CME= SCE/(nt-t)
138
TOTAL nt-1 SCT
t n t n 2
Y
SCT = (Yij Y ..)
2
2
Yij ..
i 1 j 1 i 1 j 1 nt
t t
Yi .2 Y..2
SCTr = n (Yi Y ..)
2
.
i 1 i 1 n nt
Es el diseño experimental más sencillo, y se origina por la asignación aleatoria de los tratamientos a un
conjunto de unidades experimentales previamente establecidas. En este diseño pueden probarse
cualquier número de tratamientos resultando deseable, aunque no esencial, asignar al mismo número de
unidades experimentales a cada tratamiento.
Es un diseño experimental de mucha utilidad en todos los campos de la ciencia, siempre y cuando se
consiga homogeneidad del material experimental y del sitio donde se vaya a desarrollar el experimento.
Se podrían enumerar una serie de ventajas y desventajas del diseño:
Ventajas:
1.- Tanto la planificación como el análisis son los más simples si se les compara con los otros diseños
conocidos.
2.- Produce el máximo número de grados de libertad para el error, lo que es muy útil en pequeños
ensayos.
3.- Cuando existe un número desigual de replicaciones por tratamientos, no es causa de complicaciones
en el análisis estadístico.
Desventajas:
2.- Su utilidad es restringida en los experimentos de campo, debido a la heterogeneidad del suelo, que
puede ser muy grande. Para evitar que la misma enmascare los resultados del experimento, debe
recurrirse a diseños muy eficientes.
3.- Presenta desventajas cuando el material no es homogéneo, ya que no se puede aumentar mucho el
tamaño del experimento, debido a que esto motiva variaciones muy altas, que enmascaran el efecto del
tratamiento.
139
En cuanto al número de observaciones para cada tratamiento o factor, se determina en base a los costos
y a la potencia de la prueba.
Seguidamente se presenta con un ejemplo, los pasos a seguir para la realización del análisis en este tipo
de diseño, donde se incluyen: modelo lineal aditivo, supuestos, hipótesis a probar.
En el presente cuadro se muestran los resultados (área intestinal en dmª), en un ensayo donde se prueba
el efecto de 4 desparasitantes en cerdos estabulados.
Desparasitantes
OBS(n) 1 2 3 4
1 4.87 3.30 6.80 1.28
2 4.60 2.25 5.70 3.88
3 1.33 5.85 4.62 5.00
4 5.58 6.16 3.80 3.25
5 5.88 8.35 2.75 1.56
6 2.81 5.93 4.93 4.25
7 4.10 1.50 4.93 4.46
8 5.63 5.85 3.80 5.53
total 34.84 38.19 37.33 29.21 139.53
Modelo lineal:
Yij i ij
μ: media general
i=1,2,...,t
j=1,2,...,n
MODELO I MODELO II
t
i 0
i 1 2 i ~ NID(0, 2 )
140
ij ~ NID(0, 2 ) ij ~ NID(0, 2 )
Hipótesis:
MODELO I MODELO II
i 0
2
Ho:
Ho: i 0
i 0
2
Ha: i 0 Ha:
El modelo I se utiliza para tratamientos fijos como el caso del ejemplo, el modelo II, se aplica para
aquellos tratamientos elegidos al azar.
F. V. G .L SC CMI CMII
TRATAMIENTOS t 1 2 i 2 2
t Yi .
FC
2
n n i
i 1 n t 1
ERROR t ( n 1) diferencia 2 2
TOTAL nt 1 t n 2
Yij FC
i 1 j 1
t n
( Yij ) 2
i 1 j 1
FC
n. t
2 2 2 2 2
34 .80 38.19 37 .33 29 .21 139 .53
SCtrat 6. 139
8 32
2
2 2 2 2 139 .53
SCtot 4 .87 4 .60 ....... 4 .46 5.53 92 . 596
32
141
Cuadrados medio del tratamiento
SCtrat
CMtrat 2 . 0463
t 1
SCEE
CMEE 3. 0877
t ( n 1)
Análisis de Varianza:
F DE V G DE L SC CM F0
Tratamientos 3 6.139 2.0463 0.662
Error 28 86.457 3.0877
Total 31
Prueba de hipótesis:
CMtrat
FC 0. 662
CMEE
2
2 n ( t 1)
Fteorico
2
Para probar la hipótesis compare el F calculado (0,662) con el F tabulado , este se encuentra en la tabla
de "F", con los grados de libertad del numerador (tratamiento) y los grados de libertad del denominador
(error experimental), y con un nivel de significación o probabilidad de cometer error tipo I ().
Ftab,5% = 2.95 Ftab , 1% = 4,57
Fcal = 0.662
De acuerdo a la no significación de F, se acepta la Ho: i=0, es decir, no hay diferencia entre los
tratamientos (desparasitantes) estudiados; las áreas intestinales promedios correspondientes a los cerdos
criados estabulados tratados con 4 desparasitantes, fueron estadísticamente iguales.
. . .
. . .
Yt1 Yt2 Ytb
El modelo estadístico para este diseño es:
Yij = +I +βj + εij
i= 1,2,...,t; j= 1,2,...,b;
F.V G.L SC CM F0
TRATAMIENTOS t-1 SCTr CMTr=SCTr/(t-1) CMTr/CME
BLOQUES b-1 SCBlo CMBlo = SCBLo/b-1
ERROR (t-1)(b-1) SCE CME= SCE/(t-1)(b-1)
TOTAL tb-1 SCT
2
t b
Y
SCT = Y 2
ij ..
i 1 j 1 tb
t
Yi .2 Y..2
SCTr =
i 1 b tb
b
Yi .2 Y..2
SCBlo=
i 1 t tb
Experimento factorial
Muchos experimentos requieren del estudio de los efectos de dos o más factores, los experimentos
factoriales son los diseños más eficientes para este tipo de análisis. Se entiende por experimento
factorial aquel donde en cada ensayo o repetición completa del experimento se investigan todas las
posibles combinaciones de los niveles de los factores considerados. Por ejemplo, si se tienen 2 niveles
del factor 1 y 3del factor 2, entonces cada repetición o ensayo contiene todas las 2x3 =6
combinaciones.
143
En algunos tratamientos puede encontrarse que las diferencias en respuesta entre los niveles de un
factor no es la misma en todos los niveles de otros. Cuando esto ocurre entonces existe una interacción
entre los factores. Por ejemplo, considérese un factor a y un factor b como se muestra en el siguiente
cuadro:
b0 b1
a0 a0b0 = 20 a0b1 = 40
a1 a1b0 = 50 a1b1 = 12
Al primer nivel del factor b, el efecto simple del factor a es A= (a1b0)-(a0b0) = 50-20 = 30 y el efecto
simple del factor a al segundo nivel del factor b es A = (a 1b1)-(a0b1) = 12-40= -28. Entonces el efecto
de a depende del nivel seleccionado para el factor b , entonces se dice que existe interacción entre los
factores a y b. Lo anterior se ilustra gráficamente como sigue:
60
A B
b0
50
b1
b1 b1
40
b1
Respuesta
30 b1
20 b0 b0
10 b1
0
a0 a1 a0 a1
Figura. Experimento factorial sin interacción (A) y experimento factorial con interacción (B)
Graficas de este tipo son útiles en la interpretación de las interacciones significativas y en los informes
de resultados para personas con poco o ningún entrenamiento estadístico, pero no pueden usarse como
única técnica de análisis.
F.V G.L SC CM F0
TRATAMIENTO (A) a-1 SCA CMA=SCA/(a-1) CMA/CME
TRATAMIENTO (B) b-1 SCB CMB = SCB/(b-1) CMB/CME
INTERACCIÓN (AB) (a-1)(b-1) SCAB CMAB = SCAB/(a-1)(b-1) CMAB/CME
ERROR ab.(n-1) SCE CME= SCE/(t-1)(abn-1)
TOTAL abn-1 SCT
i j k abn
144
2
Y a
Y2
SCA= i.. ...
i bn abn
b Y. 2j . Y...2
SCB=
j an abn
2
a bYij. Y...2
SC =
i
j n abn
145
Práctica 8
Análisis de varianza (ANOVA)
1. Determinar si el color del envase de un producto influye en las ventas del artículo. Se estableció un
diseño experimental donde se evalúo el envase en tres colores: Rojo, Azul y Amarillo, y observaron las
ventas en cada presentación. Obteniéndose los siguientes resultados.
Color Ventas $
Azul 400
Azul 250
Azul 550
Azul 600
Azul 550
Rojo 300
Rojo 200
Rojo 450
Rojo 500
Rojo 500
Amarillo 480
Amarillo 220
Amarillo 360
Amarillo 400
Amarillo 650
2. En un sistema Regional de Control de Calidad, con 15 laboratorios afiliados se quiere investigar las
fluctuaciones entre 3 diferentes maneras de medir RGR (Recuento de Glóbulos Rojos). La primera
forma es usando equipos automatizados de recuento, o contadores hematológicos, tales como el
Technicon H301 y similares. De entre todos los afiliados que usen ese método se eligen cinco de ellos
al azar para conformar el Grupo 1. La segunda manera es usando el método microhematocrito y para
ello, se eligen al azar, otros cinco afiliados que usan tal método para conformar el Grupo 2. Finalmente,
el Grupo 3 se conforma con otros cinco laboratorios seleccionados al azar, de entre los que usan otros
métodos, como por ejemplo el macrohematocrito, recuento en cámara, etc. Los 15 laboratorios siguen
un programa de Control de Calidad interno y se suponen calibrados. Se envía a cada laboratorio una
muestra ciega, con una sangre calibrada en el laboratorio de referencia de: (2,9467 0,0004).106
gl/ml.
146
3. Para controlar la influencia del factor humano en las mediciones clínicas se debe hacer medir lo
mismo a varios operadores diferentes. Así, se pueden comparar los valores medidos por cada uno, entre
sí, con un modelo de Anova. En el ejercicio siguiente se usa un modelo de un factor para ilustrar el
método, sin embargo, cuanto más factores se tomen en cuenta, mejor será la sensibilidad del modelo
estadístico para detectar las diferencias.
Registro 1.
Registro 2.
Registro 3.
147
CAPITULO 7
REGRESIÓN LINEAL
INTRODUCCIÓN
Una respuesta a la pregunta típica que hace cualquier estudiante que se enfrenta a las
dificultades del razonamiento matemático, ¿ para que me sirven las matemáticas?, se plantea
aquí como una muestra de la matemática aplicada en aspectos tangibles y cotidianos como la
estadística y la matemática financiera.
Pero también en aspectos no tan tangibles como lo son los temas de potenciación,
radiación, fracciones y ecuaciones trigonométricas que sirven de apoyo para otros temas como el
cálculo diferencial e integral, el cual tiene una aplicación más directa., con estos elementos el
estudiante de la Carrera de Procesos Agroindustriales se beneficia porque complementa su
formación básica en matemáticas.
148
TEMA 1
Objetivo de aprendizaje.
1. Analizar la importancia de los usos de la regresión lineal simple.
Criterio de Aprendizaje.
1.1. Describir e ilustrar con ejemplos las aplicaciones practicas de la regresión lineal simple en el
ámbito profesional.
Didáctica de enseñanza.
Con este tipo de regresiones nos conformamos con encontrar relaciones funcionales de tipo lineal, es
decir, buscamos cantidades a y b tales que se pueda escribir
De forma que sea una variable que toma valores próximos a cero.
Obsérvese que la relación explica cosas como que si X varía en 1 unidad, varía la cantidad b. Por
tanto:
Si b>0, las dos variables aumentan o disminuyen a la vez;
Si b<0, cuando una variable aumenta, la otra disminuye.
Por tanto, en el caso de las variables peso y altura lo lógico será encontrar que b>0.
El problema que se plantea es entonces el de cómo calcular las cantidades a y b a partir de un conjunto
de n observaciones
De forma que se minimice el error. Las etapas en que se divide el proceso que vamos a desarrollar son
de forma esquemática, las que siguen:
Medimos el error que se comete al aproximar Y mediante calculando la suma de las diferencias entre
los valores reales y los aproximados al cuadrado (para que sean positivas y no se compensen los
errores):
149
2. Una aproximación de Y, se define a partir de dos cantidades a y b. Vamos a calcular
aquellas que minimizan la función
3. Posteriormente encontraremos fórmulas para el cálculo directo de a y b que sirvan para cualquier
problema.
Regresión de Y sobre X
Una vez que tenemos definido el error de aproximación mediante la relación las cantidades que lo
minimizan se calculan derivando con respecto a ambas e igualando a cero (procedimiento de los
mínimos cuadrados):
150
La relación no es más que otra manera de escribir la relación, que se denomina ecuaciones normales.
La primera de se escribe como
Regresión de X sobre Y
Las mismas conclusiones se sacan cuando intentamos hacer la regresión de X sobre Y. Para calcular la
recta de regresión de X sobre Y es totalmente incorrecto despejar de
151
Pues esto nos da la regresión de X sobre , que no es lo que buscamos. La regresión de X sobre Y se
hace aproximando X por , del modo
Donde
Pues de este modo se minimiza, en el sentido de los mínimos cuadrados, los errores entre las cantidades
xi y las
Ejemplo
En una muestra de 1.500 individuos se recogen datos sobre dos medidas antropométricas X y Y. Los
resultados se muestran resumidos en los siguientes estadísticos:
Obtener el modelo de regresión lineal que mejor aproxima Y en función de X. Utilizando este modelo,
calcular de modo aproximado la cantidad Y esperada cuando X=15.
Solución:
152
Lo que se busca es la recta, que mejor aproxima los valores de Y (según el criterio de
los mínimos cuadrados) en la nube de puntos que resulta de representar en un plano (X,Y) las 1.500
observaciones. Los coeficientes de esta recta son:
En este punto hay que preguntarse si realmente esta predicción puede considerarse fiable. Para dar una
respuesta, es necesario estudiar propiedades de la regresión lineal que están a continuación.
Una vez que ya tenemos perfectamente definida , (o bien ) nos preguntamos las relaciones que
hay entre la media y la varianza de esta y la de Y (o la de X). La respuesta nos la ofrece la siguiente
proposición:
En cuanto a la varianza, no necesariamente son las mismas para los verdaderos valores de las variables
X y Y, y sus aproximaciones y , pues sólo se mantienen en un factor de r2, es decir,
Basta probar nuestra afirmación para la variable Y, ya que para X es totalmente análogo:
153
Donde se ha utilizado la magnitud que denominamos coeficiente de correlación, r, y que ya definimos
anteriormente como
Como consecuencia de este resultado, puede decirse que la proporción de varianza explicada por la
Nos gustaría tener que r=1, pues en ese caso ambas variables tendrían la misma varianza, pero esto no
es cierto en general. Todo lo que se puede afirmar, como sabemos, es que
Y por tanto
La cantidad que le falta a la varianza de regresión, , para llegar hasta la varianza total de Y, ,
154
Por ello
Y el coeficiente de determinación (que sirve para determinar la bondad del ajuste de X en función de Y)
vale:
Para los ajustes de tipo lineal se tiene que los dos coeficientes de determinación son iguales a r2, y por
tanto representan además la proporción de varianza explicada por la regresión lineal:
Por ello:
Ejemplo 1
155
De una muestra de ocho observaciones conjuntas de valores de dos variables X e Y, se obtiene la
siguiente información:
Calcule:
1. La recta de regresión de Y sobre X. Explique el significado de los parámetros.
2. El coeficiente de determinación. Comente el resultado e indique el tanto por ciento de la variación
de Y que no está explicada por el modelo lineal de regresión.
Solución:
1. En primer lugar calculamos las medias y las covarianza entre ambas variables:
Con estas cantidades podemos determinar los parámetros a y b de la recta. La pendiente de la misma es
b, y mide la variación de Y cuando X aumenta en una unidad:
Al ser esta cantidad negativa, tenemos que la pendiente de la recta es negativa, es decir, a medida que X
aumenta, la tendencia es a la disminución de Y. En cuanto al valor de la ordenada en el origen, a,
tenemos:
156
Es decir, el modelo de regresión lineal explica el de la variabilidad de Y en función de la de X. Por
Lo cual hay que considerar con ciertas reservas, pues como hemos visto en el apartado anterior, hay
una razonable cantidad de variabilidad que no es explicada por el modelo.
Ejemplo 2
Se realizan 8 mediciones de textura y grado de madurez a 10 manzanas golden, obteniéndose los
siguientes resultados:
¿Existe una relación lineal importante entre ambas variables? Calcular la recta de regresión de la
textura en función del grado de madurez y la del grado de madurez en función de la textura. Calcular la
bondad del ajuste ¿En qué medida, por término medio, varía el grado de madurez?
Solución:
Para saber si existe una relación lineal entre ambas variables se calcula el coeficiente de correlación
lineal, que vale:
Ya que
157
Por tanto el ajuste lineal es muy bueno. Se puede decir que el ángulo entre el vector formado por las
desviaciones del grado de madurez con respecto a su valor medio y el de la textura con respecto a su
valor medio, , es:
Es decir, entre esos vectores hay un buen grado de paralelismo (sólo unos 19 grados de desviación). La
recta de regresión del grado de madurez en función de la textura es:
Por tanto podemos decir que el de la variabilidad del grado de madurez en función de la
textura es explicada mediante la recta de regresión correspondiente. Lo mismo podemos decir en
158
cuanto a la variabilidad de la textura en función del grado de madurez. Del mismo modo puede decirse
que hay un de varianza que no es explicada por las rectas de regresión. Por
tanto la varianza residual de la regresión del grado de madurez en función de la textura es:
Regresión Lineal
Un problema clásico en estadística es tratar de determinar la relación entre dos variables aleatorias X y
Y. Por ejemplo, podríamos considerar el alto y ancho de una muestra de adultos.
La regresión lineal trata de explicar esta relación con una línea recta que trata de acercarse lo mas
posible a todos los puntos de la muestra.
Donde el "residual" e es una variable aleatoria de media cero. El coeficiente a y b son escogidos de
forma tal que la suma de los cuadrados de los residuales sea lo mas cercano a cero posible.
En multitud de ocasiones, son varias las variables que se observan en la realización de un muestreo,
existiendo entre ellas dependencias estadísticas. En tales situaciones puede plantearse el problema de
hasta qué punto el conocimiento de unas variables, llamadas explicativas, aportan información
suficiente para predecir los valores de otras denominadas de respuesta.
Dependiendo de los contextos, de las hipótesis que se consideren válidas, de la naturaleza de las
variables y del número de éstas, se utilizarían los diferentes métodos de regresión.
El problema de la regresión lineal simple entre dos variables X y Y se reduce a calcular la recta de
regresión que mejor represente su distribución conjunta. Los datos se presentan como una matriz de
dos columnas:
159
Siendo (xi, yi), con i= 1, 2, ..., n, el i-ésimo par observado.
Nota: en el Anexo se pueden encontrar más ejercicios, además de las tablas de: Z, Ji2,
160
TEMA 2
Objetivo de aprendizaje.
2. Expresar las ecuaciones para estimar los parámetros de regresión lineal, definiendo el coeficiente de
correlación R2 y relacionarlo con la precisión de la recta estimada.
Criterio de Aprendizaje.
2.1. Practicar e ilustrar las ecuaciones de mínimos cuadrados en la estimación de la recta e interpretar
los parámetros de la regresión y el coeficiente de correlación R2.
Didáctica de enseñanza.
Pa.9 Regresión Lineal
Estimación de parámetros
Siendo
El coeficiente de correlación
Que sólo toma valores en el intervalo [-1, 1], nos da una idea de hasta qué punto el ajuste lineal es
razonable:
161
Si r es próximo a -1: el ajuste es aceptablemente bueno, distribuyéndose las observaciones (xi, yi)
alrededor de una recta de pendiente negativa.
Si r es próximo a 0: el ajuste no es aceptable, indicando que no existe relación lineal entre las
variables.
Si r es próximo a +1: el ajuste es aceptablemente bueno, distribuyéndose las observaciones (xi, yi)
alrededor de una recta de pendiente positiva.
Contraste de independencia
El contraste de independencia entre las variables es más objetivo que la simple observación del
coeficiente de correlación r. Así se plantea comprobar si los datos observados corroboran o no la
hipótesis nula:
Que se distribuye como una tn-2 de Student, se puede contrastar la hipótesis nula H0 al nivel de
significación del 5%.
Caso
Se dispone de los datos de ocho anestesias de diferente duración, efectuadas con un anestésico volátil y
del tiempo en que se restablece la conciencia suficiente como para contar hacia atrás desde un número
determinado sin error:
Duración Duración
anestesia (min) despertar (min)
150 13
127 16
160 21
210 20
250 16
130 13
60 12
55 14
Se intenta probar la hipótesis de que la duración del despertar no está influida por la de la anestesia.
El coeficiente de correlación para esta muestra es de 0.562231, a medio camino entre el 0 y el 1, no
permitiendo dar una respuesta segura sobre el contraste; en cambio, el estadístico A toma un valor de
1.66531, del que se puede deducir que la hipótesis no puede rechazarse al nivel del 5%; en conclusión,
no hay indicios de que la duración del despertar esté linealmente relacionada con el tiempo de duración
162
de la anestesia. Si se hubiese rechazado la hipótesis de independencia, se podrían ajustar los datos a la
recta de ecuación
Se trata de predecir el valor de una variable respuesta (y) como función lineal de una familia de m
variables explicativas (x1, x2, ..., xm), a partir de una muestra de tamaño n cuyas observaciones se
ordenan matricialmente:
Siendo yi la i-ésima variable respuesta y xi,j la j-ésima variable explicativa asociada a la observación i.
Así las cosas, se trata de ajustar los datos a un modelo de la forma
1. Los residuos ei son normales de media 0 y varianza común desconocida ; además, estos residuos
son independientes.
2. El número de variables explicativas (m) es menor que el de observaciones (n); esta hipótesis se
conoce con el nombre de rango completo.
3. No existen relaciones lineales exactas entre las variables explicativas.
Siendo
163
Habiéndose indicado la transposición matricial mediante el superíndice T.
Estimación de la varianza
El estimador insesgado de la varianza , conocido con el nombre de varianza residual, tiene por
expresión
Siendo
Mide el ajuste del modelo, se interpreta como el porcentaje de variación de la variable respuesta
explicada por el modelo; así, cuanto más se acerque R2 a 100, con más confianza se podrá considerar el
modelo lineal como válido.
Contraste de regresión
Que se distribuye como una Fm,n-m-1 de Snedecor. El contraste se realiza con un nivel de significación
del 5%.
Caso
164
En una muestra de 25 hospitales, el analista ha recogido los siguientes datos sobre el costo anual en
1988 (variable respuesta), así como sobre el personal sanitario y el número de camas durante el mismo
año.
Se quiere ajustar un modelo lineal que devuelva el coste de mantenimiento hospitalario en función del
personal sanitario y del número de camas.
En primer lugar observamos que el número de variables explicativas es 2, por lo que se necesitan
estimar tres parámetros de regresión: 222.28 para el término independiente, 1.28 para la variable
personal sanitario y 2.24 para el número de camas. La desviación típica residual y el coeficiente de
determinación corregido toman los valores 107.80 y 76.49%, respectivamente. Finalmente, el contraste
de regresión rechaza la hipótesis de independencia al nivel del 5%, dando a entender que no hay
indicios de que el modelo lineal
La formula de regresión de la muestra que represéntale modelo de regresión en línea recta sería:
Ŷі =bo + b1Xі
Siendo una matriz simétrica, definida positiva de orden n × n. En este caso, se puede calcular el
estimador de por el método de mínimos cuadrados generalizados. Este método se desarrolla en dos
etapas: en una primera etapa se transforma el modelo de regresión original
Para ello y por ser una matriz simétrica, definida positiva, existe una matriz cuadrada P tal que
Esta matriz no tiene porque ser única, pero si existe. Multiplicando por P la ecuación de regresión se
obtiene
(10.3)
*
Denominando = P , X* = PX y *
= P , se obtiene la ecuación de regresión
166
Por tanto los errores son incorrelados y homocedásticos. Ahora se puede aplicar el método de mínimos
cuadrados ordinarios a estos datos transformados para obtener el estimador
A continuación se exponen dos situaciones comunes en las que se puede aplicar este método de
estimación.
Heterocedasticidad.
Y la matriz P
167
Esto equivale a trabajar con el modelo transformado
Sobre este modelo se aplica ahora el método de mínimos cuadrados ordinarios. En particular, si se
trabaja con el modelo de regresión lineal se obtiene el siguiente estimador del coeficiente de regresión
Este estimador se denomina estimador por mínimos cuadrados ponderados y es un caso particular
del estimador por mínimos cuadrados generalizados. En la práctica, para utilizar este estimador hay que
calcular estimadores de los parámetros 12,..., n2 , lo que puede hacerse por uno de los siguientes
métodos:
Y estimar la función g.
* Hacer grupos en las observaciones (en el orden en que se han recogido) normalmente del mismo
tamaño k y suponer que en cada grupo la varianza es constante. Entonces se estima la varianza en cada
grupo a partir de las observaciones del grupo. Una forma de conseguir esto es ajustar el modelo de
regresión por mínimos cuadrados ordinarios a las observaciones originales y a partir de los residuos de
este modelo obtener los estimadores de la varianza en cada grupo.
Observaciones dependientes.
168
En la mayoría de las situaciones la estructura de dependencia de los errores puede ajustarse a un
modelo paramétrico. Un modelo sencillo y muy utilizado es el modelo AR , (modelo autorregresivo
de orden uno). En este caso se verifica que los errores siguen la ecuación
siendo la autocorrelación de orden 1 del proceso t, por tanto, < 1, y at es una sucesión de variables
aleatorias independientes e igualmente distribuídas.
La matriz P de transformación es
-1
Y la matriz es
169
Nuevamente, en la práctica, -1 es desconocido y se tiene que estimar. Por la forma de la matriz -1, es
suficiente con estimar el parámetro y sustituir en la matriz. Para estimar , puede utilizarse el
siguiente procedimiento: ajustar a los datos el modelo de regresión lineal por mínimos cuadrados
ordinarios y calcular los residuos mínimo cuadráticos
-1 -1
sustituyendo por en la matriz se obtiene la matriz estimada , a partir de la cual se obtiene el
estimador
Se continúa el proceso de forma iterativa (volver al Paso 1) hasta obtener la convergencia del estimador
F (estimador iterativo de Cochran y Orcutt (1949)).
En este problema también se pueden considerar otros estimadores del parámetro o modelos de
dependencia más complejos que dependen de un número mayor de parámetros.
Ejemplo
“Se desea ajustar un modelo de regresión lineal simple de diseño fijo a cien observaciones, donde los
valores de la variable explicativa son xi = i/n, i = 1,...,100 (diseño fijo equiespaciado) y los valores de la
variable respuesta vienen dados en la tabla adjunta (leídos por columnas). Analizar la hipótesis de
independencia de los residuos”.
2'4 1'4 2'3 2'1 2'9 4'5 3'5 3'6 2'3 2'5
1 3 4 1 1 2 5 3 2 9
3'1 1'4 2'5 2'1 2'6 4'1 3'0 3'6 2'4 3'1
0 9 6 3 4 4 4 4 6 5
2'6 1'8 2'5 1'8 2'5 4'1 3'3 3'4 2'3 3'2
1 5 5 5 3 7 4 0 1 9
1'8 1'6 2'9 2'2 2'7 3'6 3'2 3'1 2'4 3'2
170
7 9 5 5 5 6 1 7 1 3
1'4 2'2 2'7 2'1 2'2 2'7 3'3 3'1 2'6 2'7
7 8 2 5 9 0 1 6 9 0
1'0 2'4 2'8 2'8 2'8 2'5 2'7 3'4 3'2 2'0
1 2 4 0 1 6 6 7 4 8
1'4 1'9 2'0 3'1 3'1 2'3 3'3 3'5 2'8 2'5
8 1 8 4 9 0 9 2 0 7
1'4 2'7 2'1 3'0 3'4 3'1 3'8 3'5 3'2 3'1
7 3 0 3 3 0 4 3 9 7
1'8 1'9 2'0 3'0 3'2 3'8 4'0 3'2 3'1 2'8
5 3 3 5 2 9 7 2 4 0
1'9 1'9 1'7 3'3 4'2 3'6 3'4 2'5 2'7 2'3
1 3 0 1 4 0 5 2 8 8
Los residuos de este modelo presentan una clara dependencia positiva. Esto se observa en el gráfico de
residuos frente al índice
171
Figura Residuos MCO según índice.
En la Figura 10.3. Se representa el correlograma (f.a.s.) de los residuos del modelo y se observa que las
primeras autocorrelaciones de los residuos son muy altas. En particular, r1 = 0'758, con desviación
típica = 0'099. Utilizando el contraste de independencia de Ljung-Box (Sección 4.7.2.) se obtiene
para m = 5 (número de retardos) que
172
En la Figura se representa el gráfico de autocorrelaciones parciales (f.a.p.) de los residuos y se observa
que la fap de orden uno es muy grande. De todo se concluye que no se acepta la hipótesis de
independencia.
De los gráficos representados en las Figuras 10.3 y 10.4 se deduce que la sucesión de errores del
modelo de regresión sigue una estructura de dependencia del tipo AR (1) con = 0'758. En base a ello
se estima la recta de regresión por mínimos cuadrados generalizados utilizando la matriz de
transformación dada anteriormente. Se obtiene el siguiente modelo de regresión
Las dos rectas de regresión obtenidas por mínimos cuadrados y por mínimos cuadrados generalizados
se representan en la Figura siguiente. En este ejemplo la diferencia entre las dos rectas estimadas es
pequeña.
173
Figura. Las dos rectas ajustadas.
174
Práctica 9
Regresión lineal
2. Sea la variable dependiente Z predicha a través de la expresión lineal aY+b, donde Y es una
variable regresora. Deduce la expresión de los estimadores de a y b por mínimos cuadrados.
3. Sean las variables X = "número de hijos" y Y = "gastos navideños". La siguiente tabla recoge las
frecuencias observadas en cierta encuesta:
Y \X 0 1 2
5 3 3 2
10 8 9 3
15 5 9 7
20 0 1 2
Da las medias y desviaciones típicas de cada variable, así como el coeficiente de correlación lineal
entre las dos.
4. Considera una regresión Y=a+bX. Se pretende predecir el comportamiento de Y para X=X0. Explica
las diferencias entre un intervalo de confianza para el valor esperado de Y y un intervalo de predicción
para Y.
5. Se quiere predecir la variable Z a partir de alguna (y sólo una) de las variables X, Y y V. ¿Cómo
decidirías cuál de las tres escoger?
6. ¿Cómo se expresa la calidad de un análisis de regresión?
8. La siguiente tabla presenta una muestra experimental relacionada con un estudio sobre la influencia
del tiempo trascurrido desde el despertar (T) en el rendimiento en una prueba sicotécnica (R):
9.
T 2'5 2'8 3'1 3'3 3'9 4'0 4'5
R 9'6 9'9 9'8 9'9 9'2 9'1 7'8
Los puntos adoptan una disposición claramente parabólica. Describe un modelo matemático y un
método de análisis adecuados.
175
10. Un fabricante de motos pretende determinar qué factores influyen en la velocidad máxima que
pueden alcanzar sus modelos. Efectúa mediciones de la velocidad máxima que alcanzan ochenta motos,
para las cuales registra los valores de cuarenta variables continuas que piensa pueden tener relación con
aquélla: potencia, cilindrada, dimensiones, aerodinámica, etc. Propón un método para llevar a cabo el
estudio, detallando los pasos principales.
12. En un estudio llevado a cabo en ocho ciudades de México, se obtuvo el número de autos y celulares
por cada mil habitantes:
Discute qué proporción de la variación de la tasa de celulares por mil habitantes puede explicarse a
partir de la tasa de autos. Dato: la recta de mínimos cuadrados de "móviles" sobre "autos" es
19'83+0'81×autos, con r=0'87.
176
V REFERENCIAS
Levin, I. Richard; Rubin S. David. 1996. “Estadística para Administradores”, Ed. Prentice Hall,
Sexta Edición
León T., Aurelio et al. “Antología de Matemáticas IV”, Colegio de Bachilleres del Estado de
Puebla.
www.//ftp.metprev.uma.es
http://ftp.medprev.uma.es/libro/html.htm
http://www.hrc.es/bioest/Anova_1.html
http://www.itson.mx/un/posgrado/Estadistica/Descriptiva%20,%20teoria,%20ejercicios.doc
http://highered.mcgraw-
hill.com/sites/9701033612/information_center_view0/tabla_de_contenido.html
http://www.seh-lelha.org/ancova.htm
http://www.sportsci.org/resource/stats/ancova.html
http://trochim.human.cornell.edu/kb/expcov.htm
http://www.angelfire.com/emo/tomaustin/Met/guiaseismuestra.htm
http://www.uv.es/~meliajl/Research/LibroBMDP/BMBPinde.html
http://www3.uji.es/~mateu/ejer-tema5-d37.doc
http://www.hrc.es/bioest/Ejemplos_histo.html
http://www.gesell.com.ar/geselinos/egb/problema.htm
VI GLOSARIO
177
VII ANEXOS
Ejercicios y ejemplos
Ejemplo:
Sea el experimento que consiste en lanzar tres monedas al aire. El espacio muestral será:
E ccc, ccx, cxc, xcc, cxx, xcx, xxc, xxx
Si a cada elemento de E le hacemos corresponder, por ejemplo, el número de caras, hemos definido una variable aleatoria.
ccc 3; xcc 2; xxc 1; ccx 2
cxx 1; xxx 0; cxc 2; xcx 1
Se utilizan letras mayúsculas para designar las v.a. y sus respectivas letras minúsculas para los valores concretos de las
mismas.
x1 x2 x3 xn
X
P( X xi ) p1 p2 p3 pn
Ejemplo: La v.a. “número de caras en el lanzamiento de tres monedas” tiene la siguiente función de probabilidad:
Nº de caras 0 1 2 3
f(x)= P ( X x i ) 1 3 3 1
8 8 8 8
Función de distribución de una v.a. discreta.
Sea X una v.a. cuyos valores suponemos ordenados de menor a mayor.
Se llama función de distribución de la variable X a la función que asocia a cada valor de la v.a. la probabilidad acumulada
hasta ese valor, es decir, F ( x ) p ( X x )
xi 1 2 3 4 5
pi 0,1 0,3 0,2 0,3
Solución:
La suma de todas las probabilidades es 1, por tanto,
0,1 0,3 p ( X 3) 0,2 0,3 1 luego p(X=3)=0,1
xi pi xi . pi x i2 . p i
1 0,1 0,1 0,1
2 0,3 0,6 1,2
3 0,1 0,3 0,9
4 0,2 0,8 3,2
5 0,3 1,5 7,5
2 xi2 . p i 2 12,9 (3,3) 2 2,01
Experimento de Bernoulli
Es un experimento que tiene las siguientes características:
1. En cada prueba del experimento sólo son posibles dos resultados: el suceso ha llamado A llamado éxito y el suceso A
llamado fracaso.
Si representamos por X la variable aleatoria binomial que representa el número de éxitos obtenidos en las n del
experimento, podemos escribir:
n r rn
p(obtener r éxitos )=p(X=r)=
p .(1 p)
r
Esta expresión recibe el nombre de función de probabilidad de una distribución binomial o de Bernoulli.
Dado que en este tipo de experiencias los cálculos pueden ser laboriosos, se han construido unas tablas que nos
proporcionan la probabilidad de que la variable X tome distintos valores, según los distintos valores de n y r.
179
Media: n. p
Varianza: 2
n. p.q; q 1 p
Ejercicios resueltos.
1.- Calcula la probabilidad de que una familia que tiene 4 hijos, 3 de ellos sean varones.
4 3 1 1
p(obtener 3 varones)=P(X=3)=
.05 .0,5
3 4
Recuerda:
4 4 4.3.2
es un número combinatorio cuyo valor se obtiene así:
3 3 3.2.1
m .(1)m2.hastenrfactoesnlumerado m!
En general
n n.(-1) 2.31 n!.(m)
2.- Se tiene una moneda trucada de modo que la probabilidad de sacar cara es cuatro veces la de sacar cruz. Se lanza 6
veces la moneda. Calcula las siguientes probabilidades:
Obtener dos veces cruz.
Obtener a lo sumo dos veces cruz.
Solución:
Calculamos en primer lugar la probabilidad de cara y de cruz:
p(cara)+p(cruz)=1. Si llamamos x a la probabilidad de sacar cruz, podemos escribir:
4x+x=1; 5x=1; x=0,2
Así resulta: p(cruz)=0,2 y p(cara)=0,8
180
Es una distribución binomial de parámetros n=6 y p=0,2
6 2 4
p(X 2) .(0,2) .(0,8) 15.(0, 4).(0, 096)4 0,24
Probabilidad de obtener a lo sumo dos veces cruz:
2
p ( X 2) p ( X 0) p( X 1) p ( X 2)
6 0 6 1 5 6 2 4
=
.(0,2)8 .(0,)280,9
0 1 2
3.- La probabilidad de que un alumno de 1º de Bachillerato repita curso es de 0,3. Elegimos 20 alumnos al azar. ¿Cuál es la
probabilidad de que haya exactamente 4 alumnos repetidores?
Solución:
Se trata de una binomial de parámetros 20 y 0,3, es decir, B(20; 0,3)
Si X es el número de alumnos que repiten,
20 4 16 20! 4 16
p(X 4) .0,3 .0,7 .0,3 .0,7 0,13
4 4!.16!
181
4.- Calcula la esperanza matemática, la varianza y la desviación típica de la variable aleatoria X, cuya función de
probabilidad viene dada por la siguiente tabla:
xi -4 -1 2 5
p( X xi ) 0,1 0,5 0,3 0,1
Solución:
La esperanza matemática es la media: (4).0,1 (1).0,5 2.0,3 5.0,1 0,2
2 x i2 . p i 2 (4) 2 .0,1 (1) 2 .0,5 2 2 .0,3 5 2.0,1 0,2 2 5,76
5,76 2,4
5.- Sea la siguiente función de probabilidad:
1 3 5 7 9
xi
pi 0,2 0,2 0,4 0,1 0,1
Solución:
1 3 5 7 9
xi
F(x)=P(X ≤ xi) 0,2 0,4 0,8 0,9 1
p ( X 5) 0,8 ; p( X 7) p( X 3) p( X 5) p ( X 7)
182
Ejercicios propuestos.
( Solución: 40 y 6,19)
2.- Una determinada raza de perros tiene 4 cachorros en cada camada. Si la probabilidad de que un cachorro sea macho es
de 0,55, se pide:
a) La probabilidad de que en una camada dos exactamente sean hembras
b) Probabilidad de que en una camada al menos dos sean hembras.
3.- Considera una variable aleatoria discreta X cuya distribución de probabilidad es la siguiente:
xi 1 2 3
P(X = xi) k 0,45 k
a) Calcula el valor de k
b) Halla la función de probabilidad
c) Halla la función de distribución F.
Solución
k = 0,275.
Función de probabilidad:
xi 1 2 3
f(x)=P(X = xi) 0,275 0,45 0,275
Función de distribución:
xi 1 2 3
F(x)=P(X ≤ xi) 0,275 0,725 1
4.- Considera una variable aleatoria X cuya función de probabilidad viene dada por la siguiente tabla:
x -25 -10 0 5
f(x) a 2a 3a 4a
a) Deduce el valor de a.
b) Halla la función de distribución F
c) Calcula la esperanza, la varianza y la desviación típica.
5.- La probabilidad de que un estudiante obtenga el título de arquitecto es 0,3. Calcula la probabilidad de que un grupo de 7
estudiantes matriculados en primer curso:
a) Ninguno de los 7 finalice la carrera.
b) Finalicen los 7.
c) Al menos 2 acaben la carrera.
d) Sólo finalice uno la carrera.
6.- El 20 % de los tornillos de un gran lote so defectuosos. Se cogen tres tornillos al azar y se pide calcular razonadamente:
a) La probabilidad de que los tres sean defectuosos.
b) La probabilidad de que ninguno sea defectuoso.
183
c) La probabilidad de que solamente uno sea defectuoso.
Conocimientos previos
Para hallar el área del recinto limitado por la curva f(x), el eje de abscisas y las rectas x=a y x=b, se utiliza la siguiente
fórmula:
b
Area f ( x)dx
a
Ejercicio:
3
Resuelve la siguiente integral definida: 1
( x 2 2 x 3) dx
Solución:
3
3 x3
1
( x 2 2 x 3)dx
3
x 2 3x F (3) F (1)
1
1 5
F (3) 9 9 9 9 F (1) 1 3
3 3
3 5 5 32
luego 1
( x 2 2 x 3)dx 9 ( ) 9
3 3 3
184
Cuando se calculan áreas los resultados se toman en valor absoluto.
Ejercicio:
x
Sea f ( x ) con x 0,6 . Comprueba que es una función de densidad y calcula p (2 x 5)
18
Solución:
6 x
Para que sea función de densidad 0 18
dx tiene que valer 1. Veamos:
6
6 x 1 x2 1 36
0 18
dx
18 2 0 18 2
0 1
5
5 x 1 x2 1 25 4 21 7
p( 2 x 5) dx
2 18 18 2 2 18 2 2 36 12
Función de distribución.
Como en el caso de la v.a. discreta, la función de distribución proporciona la probabilidad acumulada hasta un determinado
valor de la variable, es decir, F ( x) p ( X x) .
Cumple las siguientes condiciones:
Su valor es cero para todos los puntos situados a la izquierda del menor valor de la variable.
Su valor es 1 para todos los puntos situados a la derecha del mayor valor de la variable.
2 xi2 p i 2 b
2 x 2 f ( x)dx 2
a
185
Ejercicio 1.
La función de densidad de una v.a. continua viene definida por :
2x si 0 x 1
f ( x)
0 en el resto
a) Halla la función de distribución.
b) Calcula la media y la varianza.
Solución:
a) La función de distribución se obtiene integrando la función de densidad, es decir,
A la izquierda de 0, su valor 0.
A la derecha de 1, su valor es 1
Entre 0 y 1: F ( x) p( X x) 2 xdx x 2
0
x
x
0 x2
0 si x 0
2
es decir, F ( x) x si 0 x 1
1 para x 1
b 1 2
b) Cálculo de la media:
a
x. f ( x).dx 0
x.2 x.dx
3
b 1 4 1
Cálculo de la varianza:
2
x 2 f ( x)dx 2 x 2 .2 x.dx
a 0 9 18
Ejercicio 2.
Calcula la media, la varianza y la desviación típica de una v.a. que tiene como función de densidad:
x3
f ( x) con x 1,5
24
Solución:
5
b x3 1 5 2 1 x 3 3x 2 29
Media: x. f ( x).dx x.
24 1
dx ( x 3 x ) dx
a 24 24 3 2 1 9
2 2
b 5 x3 29 1 5 3 29
Varianza: 2 x 2 f ( x) dx 2 x 2 dx ( x 3 x 2 )dx
a 1 24 9 24 1
9
5 2
1 x4 29 104
x3 1,28 .
24 4 1 9 81
Ejercicio 3.
x2 1
Sea f ( x) con x 2,5 , una función de densidad.
36
a) Calcula su función de distribución.
186
b) Calcula p (3 x 4) .
Solución:
x
x x2 1 1 x 2 1 x3 x 3 3x 2
a) F ( x) p( X x) dx ( x 1)dx ( x )
2 36 36 2 36 3 2 108
Su valor es cero para todos los puntos situados a la izquierda de 2
Su valor es 1 para todos los puntos situados a la derecha de 5
4 4
4 x2 1 1 4 2 1 x3 1 x 3 3x 17
b) p (3 x 4)
3 36
dx
36 3
( x 1) dx
36 3
x
3
36 3
3 54
Distribución normal.
Hay muchas v.a. continuas cuya función de densidad tiene forma de campana.
Ejemplos:
- La variable peso en una población de personas de la misma edad y sexo.
- La variable altura de la población citada.
- etc.
Se dice que estas variables tienen una distribución normal y la función de densidad recibe el nombre de curva normal o
campana de Gauss.
Para expresar que una v.a. continua X, tiene una distribución normal de media y desviación típica , escribimos
N ( , ) .
Existen unas tablas que permiten calcular probabilidades en distribuciones normales reducidas. Por ello es aconsejable
transformar cualquier v.a. X que sigue que sigue una distribución N ( , ) en otra variable Z que siga una distribución
N(0,1).
El cambio de variable que es necesario hacer es el siguiente:
X
Z
a) p ( Z 1,23)
La probabilidad pedida se encuentra directamente en las tablas. Basta buscar 1,2 en la columna y 0,03 en la fila. Su
intersección nos da la probabilidad.
187
b) p ( Z 1,24)
En este caso la probabilidad pedida no está en las tablas. Sin embargo, si tenemos en cuenta que el área total bajo la gráfica
ha de ser 1, deducimos de la figura que:
p ( Z 1,24) 1 p ( Z 1,24) 1 0,8925 0,1075 .
c) p ( Z 0,72)
Como la gráfica es simétrica respecto al eje de ordenadas, p( Z 0,72) p( Z 0,72) y ya estamos en el caso
anterior. Comprueba que el resultado final es 0,2358.
d) p (0,5 Z 1,76)
Ejercicio 4
El peso de los individuos de una población se distribuye normalmente con media de 70 Kg. y desviación típica 6 Kg. De
una población de 2000 personas, calcula cuántas tendrán un peso comprendido entre 64 y 76 Kg.
Solución:
Se trata de una distribución N(70,6)
64 70 76 70
p (64 X 76) p Z p (1 Z 1) p ( Z 1) p ( Z 1)
6 6
188
p ( Z 1) 0,8413 (directamente en las tablas)
p ( Z 1) p ( Z 1) 1 p ( Z 1) 1 0,8413 .
Ejercicio 5.
La duración media de un lavavajillas es de 15 años y su desviación típica 0,5. Sabiendo que su vida útil se distribuye
normalmente, halla la probabilidad de que al adquirir un lavavajillas dure más de 15 años.
Solución:
Es una distribución normal de media 15 y desviación típica 0,5, es decir, N(15; 0,5).
15 15
p ( X 15) p ( Z ) p( Z 0) p ( Z 0) 0,5
0,5
Ejercicio 6.
La nota media de las pruebas de acceso correspondientes a los estudiantes que querían ingresar en una facultad era 5,8 y la
desviación típica 1,75. Fueron admitidos los de nota superior a 6.
a) ¿Cuál fue el porcentaje de admitidos si la distribución es normal?
b) ¿Con qué probabilidad exactamente cuatro de diez estudiantes son admitidos?
Solución:
Apartado a):
6 5,8
p ( X 6) p ( Z ) p ( Z 0,11) 1 p ( Z 0,11) 1 5438 0,4562 45,62%
1,75
Apartado b):
Es una distribución binomial de parámetros n=10 y p=0,4562
r 4
10.9.8.7
(0,4562) 4 (0,5438) 6 0,235
4.3.2.1
Cuando n es grande y p está próximo a 0,5 el comportamiento de una distribución binomial B(n, p) es aproximadamente
igual a una distribución normal, N ( np, npq )
Esto permite sustituir el estudio de una B ( n, p ) por el de una N ( np, npq ) .
Suele considerarse que la aproximación es buena cuando np>5 y nq>5
Dado que por mucho que se parezca nunca es igual una binomial que una normal, es necesario aplicar en el cálculo de
probabilidades un ajuste que recibe el nombre de corrección de Yates.
189
Si X es la binomial y X’ la normal, la corrección consiste en lo siguiente:
1 1
p ( X r ) p r X r
2 2
(Se asocia un intervalo unidad centrado en el punto)
1 1
p ( a X b) p a X b
2 2
(se alarga el intervalo ½ por la izquierda y ½ por la derecha.)
Ejercicio 7.
Se lanza una moneda correcta al aire 400 veces. Calcula la probabilidad de obtener un número de caras comprendido entre
180 y 210, ambos inclusive.
Solución:
Calculamos la media y la desviación típica de la distribución binomial:
1 1 1
np 400. 200 ; npq 400. . 10 . Por tanto,
2 2 2
179,5 200 210,5 200
p(180 X 210) p(179,5 X 210,5) p Z
10 10
p (2,05 Z 1,05) p ( Z 1,05) p ( Z 2,05)
pero p ( Z 1,05) 0,8531
y p ( Z 2,05) p ( Z 2,05) 1 p ( Z 2,05) 1 0,9798 0,0202
Ejercicio 8.
Un tirador acierta en el blanco en el 70% de los tiros. Si el tirador participa en una competición y tira 25 veces, ¿cuál es la
probabilidad de que acierte más de 10 tiros?
Solución:
Es una distribución B(25; 0,7) que podemos aproximar a través de la normal:
n. p 25.0,7 17,5 5
n.q 25.0,3 7,5 5
La aproximación será buena.
10,5 17,5
p ( X 10) p( X 11) p( X 10,5) p Z p( Z 3,06)
2,29
p ( Z 3,06) 0,9998
190
Ejercicios propuestos.
1.- Un profesor de matemáticas ha observado que las notas obtenidas por sus alumnos en los exámenes de Estadística siguen
una distribución N(6; 2,5).
Se han presentado al último examen 32 alumnos, ¿cuántos sacaron al menos un 7?.
( Sol. 11 )
2.- Una empresa lleva a cabo una prueba para seleccionar nuevos empleados. Por la experiencia de pruebas anteriores, se
sabe que las puntuaciones siguen una distribución normal de media 80 y desviación típica 25.
¿Qué porcentaje de candidatos obtendrá entre 75 y 100 puntos?
(Sol. 36,74% )
1
3- Calcula el valor de k para que la función f ( x) kx si x 0, 10 sea función de densidad.
5
Obtenido el valor de k, calcula la media y la desviación típica de la distribución.
4.- El peso de los toros de una determinada ganadería se distribuye normalmente con una media de 500 Kg. y 45 Kg. de
desviación típica. Si la ganadería tiene 2000 toros,
a) Cuántos pesarán más de 540 Kg.?
b) Cuántos pesarán menos de 480 Kg.?
c) Cuántos pesarán entre 490 y 510 Kg.?
5.- Una de las pruebas de acceso a la Universidad para mayores de 25 años consiste en un test con 100 preguntas, cada una
de las cuales tiene 4 posibles respuestas y sólo una correcta. Para superar esta prueba deben obtenerse, al menos, 30
respuestas correctas.
Si una persona contesta al azar, ¿cuál es el número esperado de respuestas correctas?.
¿Qué probabilidad tendrá de superar la prueba?
6.- Después de realizar varios sondeos sobre una población con escasa cultura, se ha conseguido averiguar que únicamente
el 15 % de la misma es favorable a los tratamientos de psicoterapia. Elegida al azar una muestra de 50 personas de dicha
población, se desea saber:
a) La probabilidad de que haya más de 5 personas favorables a dichos tratamientos.
b) La probabilidad de que a lo sumo haya 6 personas favorables.
191