1165 - U3 - A5 Caracteristicas de La Informacion Contable
1165 - U3 - A5 Caracteristicas de La Informacion Contable
1165 - U3 - A5 Caracteristicas de La Informacion Contable
inferencia
INTERACTIVO
Córdoba (España)
2022
Título de la obra:
Interactivo
Autores:
Editor técnico:
Córdoba (España)
https://proyectodescartes.org
Proyecto iCartesiLibri
https://proyectodescartes.org/iCartesiLibri/index.htm
ISBN: 978-84-18834-44-8
Esta obra está bajo una licencia Creative Commons 4.0 internacional: Reconocimiento-No Comercial-Compartir Igual.
Tabla de contenido
Prefacio 9
1. Estadística unidimensional 11
1.1 Introducción 13
1.1.1 Un poco de historia 14
1.1.2 Definición de Estadística 20
1.2 Conceptos generales 22
1.3 Tabulación y gráficos estadísticos 25
1.3.1 Tabulación de datos y gráficos estadísticos 27
1.3.2 Gráficos estadísticos 32
1.4 Medidas de centralización y de posición 38
1.4.1 Media aritmética 39
1.4.2 Mediana 44
1.4.3 Moda 47
1.4.4 Cuartiles 52
1.4.5 Diagrama de caja y bigotes (Box-whisker) 56
1.5 Medidas de dispersión 63
1.5.1 Rango y desviación media 64
1.5.2 Varianza 66
1.5.3 Desviación típica 68
1.5.4 Coeficiente de variación de Pearson 73
1.6 Manejo de calculadora 77
1.7 Problemas resueltos 82
2. Estadística bidimensional 85
2.1 Introducción. Variable estadística bidimensional 87
iii
2.2 Tabulación de una variable bidimensional 90
2.3 Diagrama de dispersión 91
2.4 Correlación 94
2.4.1 Covarianza 97
2.4.2 Coeficiente de correlación lineal 99
2.5 Concepto de regresión. Método de los mínimos cuadrados 102
2.5.1 Rectas de Regresión 104
2.5.2 Estimaciones 109
2.6 Problemas resueltos 111
3. Combinatoria 115
3.1 Introducción 117
3.2 Principio general de recuento 121
3.3 Variaciones sin repetición 123
3.4 Variaciones con repetición 126
3.5 Permutaciones sin repetición 129
3.6 Permutaciones con repetición 132
3.7 Combinaciones sin repetición 136
3.8 Combinaciones con repetición 142
3.9 Resumen 146
3.10 Problemas resueltos 150
3.11 Créditos del capítulo 151
4. Probabilidad 153
4.1 Introducción 155
4.2 Experimentos aleatorios y deterministas 158
4.2.1 Espacio muestral 159
4.2.2 Sucesos y tipos de sucesos 162
iv
4.3 Operaciones con sucesos 163
4.3.1 Álgebra de Boole de sucesos 167
4.3.2 Sistema completo de sucesos 169
4.4 Concepto de probabilidad 171
4.4.1 Definición de Bernoulli 171
4.4.2 Definición de Laplace 172
4.4.3 Definición de Kolmogorov 172
4.5 Probabilidad condicionada 175
4.5.1 Concepto de probabilidad condicionada 177
4.5.2 Criterio de independencia de sucesos 180
4.6 Teorema de la probabilidad total 182
4.7 Teorema de Bayes 184
4.8 Problemas resueltos 189
5. Variable Estadística Discreta 193
5.1 Introducción 195
5.2 Función de probabilidad. Propiedades y parámetros 198
asociados
5.3 Distribución binomial 206
5.3.1 Función de probabilidad de la distribución binomial 211
5.3.2 Parámetros de la distribución binomial 214
5.3.3 Ajuste de una serie de datos a una binomial 220
5.4 Otras distribuciones discretas 222
5.4.1 Distribución hipergeométrica 223
5.4.2 Distribución de Poisson 228
5.4.3 Distribución Geométrica 233
5.4.4 Distribución binomial negativa 236
v
5.4.5 Distribución uniforme 240
5.5 Problemas resueltos 242
6. Distribución Normal 245
6.1 Introducción 247
6.1.1 Idea intuitiva de función de densidad 247
6.1.2 Definición de Función de densidad 249
6.2 La distribución normal 251
6.2.1 La distribución normal cero uno 255
6.2.2 Tipificación 257
6.3 Manejo de la tabla de la N(0,1) 260
6.3.1 Probabilidad p(Z < a). Barrido a la izquierda 263
6.3.2 Probabilidad p(Z > a). Barrido a la derecha 264
6.3.3 Franja entre dos valores 265
6.4 Manejo inverso de la tabla de la N (0, 1) 268
6.4.1 Calculo del valor za tal que p(z < za ) = k
269
6.4.2 Cálculo del valor za tal que p(z > za ) = k
271
6.4.3 Cálculo del valor za tal que p(−za < z < za ) = k
273
6.5 Aproximación de una binomial por una normal 275
6.6 Problemas resueltos 281
7. Inferencia EstadísticaMuestreo 285
7.1 Introducción 287
7.2 Muestreo probabilístico. Tipos de muestreo 288
7.3 Distribución en el muestreo de la proporción 301
7.4 Distribución en el muestreo de las medias muestrales 304
vi
7.5 Teorema central del límite 308
7.6 Problemas resueltos 313
8. Inferencia estadística Intervalos de confianza 317
8.1 Introducción 319
8.2 Estimación. Estimación puntual y estimación por intervalos 320
8.3 Intervalos de confianza 323
8.4 Error máximo admisible 338
8.5 Tamaños muestrales 344
8.7 Formulario resumen 354
8.8 Problemas resueltos 356
8.9 Créditos del capítulo 357
9. Contraste de Hipótesis 359
9.1 Introducción 361
9.2 Hipótesis nula y alternativa. Tipos de contraste 364
9.3 Planteamiento general de un problema de contraste 368
9.4 Error en un contraste de hipótesis 390
9.5 Problemas resueltos 404
9.6 Créditos del capítulo 405
vii
Pierre-Simon Laplace (Normandía, Francia, 23 de marzo de 17491- París, 5 de marzo de
1827) fue un astrónomo, físico y matemático francés, como estadístico sentó las bases de
la teoría analítica de la probabilidad (Crédito: Jean-Baptiste Paulin Guérin -
http://www.photo.rmn.fr/, Dominio público, https://es.wikipedia.org/)
Prefacio
Este libro digital interactivo se ha diseñado utilizando el editor de
DescartesJS, de tal forma que se pueda leer en ordenadores y
dispositivos móviles sin necesidad de instalar ningún programa o
plugin.
El libro es una tercera versión del publicado por los mismos autores
en el proyecto iCartesiLibri (Estadistica Probabilidad e Inferencia).
1
Véase https://proyectodescartes.org/iCartesiLibri/descripcion.htm.
9
Parte I
Estadística unidimensional
13
Esta primera idea que todos tenemos puede suponer un aceptable
punto de partida inicial para comenzar nuestro curso.
14
En muchos monumentos egipcios se encontraron interesantes
estelas, jeroglíficos, en una palabra, "documentos" en los que se
puede interpretar una gran organización y administración estatal en
lo que se refiere a contabilización de riqueza agrícola, ganadera e
industrial, así como a movimientos poblacionales, censos, etc.
15
En la Biblia también podemos encontrar referencias estadísticas. Así
por ejemplo, en uno de los libros del Pentateuco, bajo el nombre de
Números, puede leerse lo que podría interpretarse como el censo
que realizó Moisés después de la salida de Egipto.
16
Grecia, la cuna del pensamiento occidental, también tuvo
importantes observaciones estadísticas en lo que refiere a
distribución de terreno, servicio militar, etc.
17
En la edad moderna se produce un gran desarrollo científico-
matemático que enriquece mucho a la Estadística. Científicos
importantes de esta época como Copérnico, Galileo, Bacon,
Descartes…, contribuyen al desarrollo de lo que se conoce como el
método científico donde la estadística tiene un papel fundamental.
18
Siguiendo los pasos de Galton, Ronald Fisher (1890 – 1962), en su
publicación Métodos estadísticos para investigadores establece los
fundamentos de la metodología estadística actual.
19
Video
En el siguiente vídeo, elaborado por la UNED, podemos ver una
historia de la Estadística.
Escena 1.1. Escena desarrollada por Héctor Javier Herrera Mejía y John Jairo García Mora.
21
En la anterior escena interactiva tienes una introducción a la
Estadística.
22
Variables Cualitativas o Atributos. Los atributos son aquellos
caracteres que no pueden ser descritos numéricamente, (al menos
en principio). Para su descripción utilizamos la palabra, el
sustantivo, adjetivo y adverbio fundamentalmente. Por ejemplo:
Sexo profesión, estado civil, color de ojos, color de pelo,
nacionalidad, etc.
23
Cuantitativas continuas. Aquellas que no se pueden expresar
solamente mediante un número entero, es decir, aquellas que
por su naturaleza admiten que entre dos valores cualesquiera
la variable pueda tomar cualquier valor intermedio, por
ejemplo peso, tiempo. etc…
Escena 1.2. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
24
Escena 1.3. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
25
En prensa, internet y televisión fundamentalmente, y también en las
ciencias sociales, se recurre de manera muy habitual a los gráficos
estadísticos (pictogramas, climogramas, pirámides de población,
diagramas de barras, de sectores) como elementos aglutinadores de
la información a la par que fáciles de descifrar. Los gráficos
estadísticos por tanto, constituyen también una herramienta
fundamental en lo que se refiere a una primera información sencilla y
rápida de las características más elementales de una distribución
estadística.
26
1.3.1 Tabulación de datos y gráficos estadísticos
27
Generalmente las tablas que nos encontraremos reunirán la
información mínima necesaria para la representación gráfica y el
cálculo de parámetros estadísticos fundamentales en una
distribución.
28
Escena 1.4. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
29
Observa una tabulación mínima en la siguiente imagen:
30
Escena 1.5. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
31
Escena 1.6. Escena desarrollada por José Ireno Fernández Rubio, María José García
Cebrian y Consolación Ruiz Gil(RED Descartes)
Diagramas de barras
32
En el eje de abscisas se sitúan a igual distancia los distintos atributos
o bien los valores discretos de la variable y posteriormente a partir
de cada atributo o valor discretos se levantan barras de igual grosor y
cuya altura sea la de la correspondiente frecuencia absoluta
observada.
Escena 1.7. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
33
Escena 1.8. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
Diagrama de sectores
34
Escena 1.9. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
Escena 1.10. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
35
Histograma
del intervalo).
Polígono de frecuencias.
correspondiente.
36
También se traza el histograma de las frecuencias acumuladas, en
cada dato se acumula la frecuencia de los datos anteriores.
Escena 1.11. Escena desarrollada por José Ireno Fernández Rubio, María José García
Cebrian y Consolación Ruiz Gil (RED Descartes)
37
1.4 Medidas de centralización y de posición
Todos sabemos lo que significa la nota media de los exámenes de un
curso, o el hermano mediano en una familia o seguir la moda en
cuanto a determinada tendencia. En estadística vamos a estudiar
ciertos valores que resuman la tendencia habitual o central de los
datos de una distribución. A los parámetros o medidas estadísticas
que informan sobre la tendencia habitual o central de los datos de
una distribución se les denomina en estadística medidas de
tendencia central. Las más utilizadas son la media aritmética, la
mediana y la moda.
38
1.4.1 Media aritmética
39
ˉ = x1 ⋅ f1 + x2 ⋅ f2 + ⋯ + xn ⋅ fn
X
N
Abreviadamente:
n
ˉ = ∑i=1 xi ⋅ fi
X
X′ = a ⋅ X ⟹ X ˉ′ = a ⋅ X
ˉ ⋅b
a, b ∈ R
a= 0
40
Para el caso de variable continua, sola-
mente tenemos que sustituir xi por ci ,
de clase
Escena 1.12. Escena desarrollada por José Ireno Fernández Rubio (RED Descartes)
41
Observa ejemplos para el cálculo de la media para variable discreta y
continua.
Escena 1.13. Escena desarrollada por José Ireno Fernández Rubio (RED Descartes)
42
En esta otra escena puedes ver más ejemplos.
Escena 1.14. Escena desarrollada por José Ireno Fernández Rubio, María José García
Cebrian y Consolación Ruiz Gil (RED Descartes)
43
Para completar el estudio sobre la media también puedes consultar
más información sobre la Media ponderada pulsando sobre la
imagen siguiente:
1.4.2 Mediana
44
Estamos ante un parámetro que prioriza más la posición que ocupa el
dato en cuestión que el propio valor en sí mismo.
45
N
2 − Fi−1
M e = Li−1 + ⋅a
fi
Li−1 = Lˊımite inferior del intervalo mediana
a = Amplitud del intervalo mediana
Fi−1 = Frecuencia acumulada anterior al intervalo mediana
fi = Frecuencia absoluta del intervalo mediana
N = Total de datos
En la siguiente escena
puedes practicar con el
cálculo de la mediana en
casos muy sencillos,
(pocos datos) y en otros
en los que es necesaria la
tabulación de los datos.
Puedes también
observar el polígono de
frecuencias acumuladas
y la interpretación
gráfica de la mediana que
se hace sobre este
polígono en caso de
variable discreta.
46
Escena 1.16. Escena desarrollada por José Ireno Fernández Rubio, María José García
Cebrian y Consolación Ruiz Gil(RED Descartes)
1.4.3 Moda
Cuando alguien nos dice que determinada cosa está de moda, por
ejemplo un equipo de fútbol, una canción, una prenda de vestir, un
oficio, una tendencia u opinión política, etc., entendemos que ese algo
es muy frecuente en nuestro entorno y que por tanto nos lo vamos a
encontrar con mucha frecuencia.
47
Se define la moda como el valor de la variable estadística que tiene la
frecuencia absoluta más alta. Si existen varios valores con esta
característica, entonces se dice que la distribución tiene varias modas
(distribución plurimodal).
D1 + D2
Li−1 = Lˊımite inferior del intervalo modal
a = Amplitud de los intervalos
D1 = Diferencia de la frecuencia absoluta entre el intervalo modal
y el anterior
D2 = Diferencia de la frecuencia absoluta entre el intervalo modal
y el siguiente
Escena 1.17. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
49
En la siguiente escena puedes practicar con el cálculo del intervalo
modal para variable continua en el caso en que los intervalos tengan
la misma amplitud. También en la escena puedes relacionar el valor
modal con el histograma de frecuencias absolutas.
Escena 1.18. Escena desarrollada por José Ireno Fernández Rubio(RED Descartes)
50
En las siguientes escenas puedes practicar con el cálculo de la moda y
resto de parámetros para variables discretas, continuas y también
continuas con intervalos de diferente amplitud. Es conveniente que
realices algunos ejercicios de forma manual y que compruebes los
resultados con los que se obtienen en la escena.
Variable discreta
Escena 1.19. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
51
Variable continua
Escena 1.20. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
1.4.4 Cuartiles
52
Estos valores en estadística están relacionados con los parámetros
de posición.
N
4 − Fi−1
Q1 = Li−1 + ⋅a
fi
Li−1 = Lˊımite inferior del intervalo Q1
a = Amplitud del intervalo Q1
Fi−1 = Frecuencia acumulada anterior a Q1
fi = Frecuencia absoluta del intervalo Q1
N = Total de datos
3⋅ N
4
− Fi−1
Q3 = Li−1 + ⋅a
fi
Li−1 = Lˊımite inferior del intervalo Q3
a = Amplitud del intervalo Q3
Fi−1 = Frecuencia acumulada anterior a Q3
fi = Frecuencia absoluta del intervalo Q3
N = Total de datos
54
En las escenas de cálculo de la moda, para variables discreta o
continua, del apartado anterior, puedes introducir datos y calcular,
además de los cuartiles y percentiles, los demás parámetros
estadísticos.
Escena 1.21. Escena desarrollada por José Ireno Fernández Rubio, María José García
Cebrian y Consolación Ruiz Gil(RED Descartes)
55
Ahora puedes experimentar cómo los valores atípicos influyen
sensiblemente en la media y en los cuartiles, y esa influencia es
menor para la mediana.
Escena 1.22. Escena desarrollada por osé R. Galo Sánchez (RED Descartes)
57
Escena 1.23. Escena desarrollada por Juan Guillermo Rivera Berrío (RED
Descartes)
58
En la siguiente escena podemos ver con más detalle cómo
Escena 1.24. Escena desarrollada por María José García Cebrian (RED Descartes)
59
Ahora puedes practicar y comprobar si has comprendido el
significado y los elementos de los diagramas de cajas y bigotes.
Escena 1.25. Escena desarrollada por María José García Cebrian (RED Descartes)
Valores atípicos
⎧x > Q3 + 1, 5 ⋅ (Q3 − Q1 )
x es valor atˊıpico ⟺ ⎨o
⎩
x < Q1 − 1, 5 ⋅ (Q3 − Q1 )
61
Veamos otro ejemplo:
No de Frecuencia
Frecuencia
hermanos acumulada
0 2 2
1 8 10
2 15 25
3 6 31
7 1 32
9 1 33
3 33 ⋅ 3
= 8, 25 ⟹ Q1 = 1
= 24, 75 ⟹ Q3 = 2
4 4
62
1.5 Medidas de dispersión
Un alumno tiene tres exámenes con notas 6, 5 y 4 y otro alumno con
notas 1, 5 y 9. Las notas medias de ambos es 5 y la mediana también 5
, sin embargo estos parámetros no describen las características de
ambas distribuciones puesto que se observa claramente que las
notas del primer alumno son más homogéneas que las del segundo.
63
1.5.1 Rango y desviación media
ˉ ∣ ⋅ fi
∑i=1 ∣∣xi − X
n
Dm =
∣
N
Escena 1.26. Escena desarrollada por José Ireno Fernández Rubio (RED Descartes)
65
1.5.2 Varianza
n ˉ ) ⋅ fi
∑i=1 (xi − X
2 2
S =σ =
66
Algunas propiedades de la varianza:
Var(X) > 0
Var(X + b) = V (X)
Var(a ⋅ X) = a2 ⋅ V (X)
Var(a ⋅ X + b) = a2 ⋅ V (X)
67
n
∑i=1 x2i ⋅ fi 2
2
S =σ = 2
− (X
ˉ)
68
La desviación típica es una medida del grado de dispersión de las
observaciones alrededor de su valor medio, se define como la raíz
cuadrada positiva de la varianza. Tiene el mismo cometido que ésta y
además la ventaja de que las unidades en las que se mide son las
mismas que las de los datos de la distribución. Puede considerarse la
medida de dispersión por excelencia y aparece como tecla o función
directa en cualquier calculadora o programa estadístico.
2
∑i=1 (xi − X
ˉ ) ⋅ fi
n
S=σ=
n
∑i=1 x2i ⋅ fi 2
S=σ= − (X )
ˉ
N
69
Algunas propiedades de la desviación típica son las siguientes:
S(X) = Sx = Var(X) ≥ 0
S(X + b) = S(X)
S(a ⋅ X) = a ⋅ S(X)
S(a ⋅ X + b) = a ⋅ S(X)
70
Escena 1.27. Escena desarrollada por José Ireno Fernández Rubio (RED Descartes)
Recuerda que puedes ampliar las escenas, para interactuar con ellas
en una ventana aparte.
71
Escena 1.28. Escena desarrollada por José Ireno Fernández Rubio (RED Descartes)
72
1.5.4 Coeficiente de variación de Pearson.
σ
CV = ˉ
73
Practica con el cálculo del coeficiente de variación, en la siguiente
escena.
Escena 1.29. Escena desarrollada por José Ireno Fernández Rubio (RED Descartes)
74
Estas puntuaciones típicas son valores que resultan de dividir la
diferencia de cada valor menos la media entre la desviación típica de
la población. A este proceso también se le suele denominar
tipificación. Una vez efectuada la tipificación obtendremos una
variable estadística cuya media aritmética es cero y cuya desviación
típica es uno.
x−X ˉ
z=
Sx
Escena 1.30. Escena desarrollada por José R. Galo Sánchez (RED Descartes)
75
En la escena anterior, puedes observar, mediante la normalización de
datos, la comparación de las notas dadas a 100 alumnos por dos
profesores. Se presentan cuatro situaciones.
x−X ˉ
z=
Sx
Escena 1.31. Escena desarrollada por José R. Galo Sánchez (RED Descartes)
76
1.6 Manejo de calculadora.
78
Una vez pulsada esta tecla aparece otra pantalla con el título
"Cálculos estadísticos".
79
En la pantalla de resultados observarás:
80
Variable discreta
Variable continua
81
1.7 Problemas resueltos
A continuación tienes el enunciado de diferentes problemas.
Trabájalos y una vez los hayas resuelto puedes hacer clic sobre el
botón para ver la solución.
82
1.8 Créditos del capítulo
83
Parte II
Estadística bidimensional
87
En este sentido la Estadística también ofrece su ayuda y aborda con
bastante éxito esta empresa.
EJEMPLO 1
88
MATEMÁTICAS 2 4 5 5 6 6 7 7 8 9
LENGUA 2 2 5 6 5 7 5 8 7 10
Los pares de valores {(2,2), (4,2), (5,5), ..., (8,7), (9,10)}, forman la
distribución bidimensional.
EJEMPLO 2
EJEMPLO 3
(2, 0), (2, 2), (0, 5), (2, 1), (1, 2), (2, 1), (3, 1), (4, 0), (0, 4), (2, 2),
(2, 1), (2, 1), (4, 0), (3, 1), (2, 4), (2, 1), (1, 2), (2, 1), (2, 0), (3, 0),
(3, 1), (2, 2), (2, 2), (2, 1), (0, 5), (1, 3), (2, 2), (2, 1), (1, 3), (1, 4)
89
2.2 Tabulación de una variable bidimensional.
Una vez que hemos recogido todos los datos, la mejor forma de
estudiarlos es disponerlos en una tabla estadística. Existen
fundamentalmente dos tipos de tabulación para variables
bidimensionales.
X1 Y1 f1
X2 Y2 f2
⋯ ⋯ ⋯
⋯ ⋯ ⋯
Xm Ym fm
90
Estas dos distribuciones reciben el nombre de distribuciones
marginales. En la última celda aparecerá el total de la última fila y de
la última columna, es decir, el número total de elementos estudiados
(N ).
mismas coordenadas.
91
En el caso en el que existan frecuencias absolutas distintas de uno. Se
puede utilizar el denominado prismograma. Es similar a un diagrama
de barras o de rectángulos, pero intentando darle un aspecto
tridimensional.
92
Nota: Como alternativa al prismograma, se puede utilizar un
diagrama de puntos en los que de forma “artesanal” se disponga en
las coordenadas de cada valor, tantos puntos como indique su
frecuencia absoluta.
93
2.4 Correlación.
El objetivo de cualquier estudio bidimensional es observar si existe
algún tipo de relación entre las dos variables estudiadas. La relación
entre las dos variables cuantitativas queda reflejada mediante la
función a la que parece acercarse la nube de puntos representada en
el diagrama de dispersión. Prestaremos una especial atención a
relación lineal aunque puedan existir otras interesantes como la
cuadrática, exponencial, etc.
94
Correlación lineal negativa. El caso especial de correlación lineal
en el que al crecer una variable, la otra decrece.
95
La fuerza menor o mayor según los casos, mide el grado de
bondad o grado en el que la función línea representa a la nube
de puntos. En el caso de correlación lineal, si la nube es
estrecha y alargada, esto indica que la relación es fuerte; si la
nube de puntos tiene una tendencia elíptica o circular, la
relación es débil.
El sentido mide la variación de los valores de una variable con
respecto a la otra. En el caso de correlación lineal, si al crecer
los valores de la primera, lo hacen también los de la segunda, la
relación es directa (pendiente positiva); si al crecer los valores
de A disminuyen los de B , la relación es inversa (pendiente
negativa).
Video
A continuación tenemos un vídeo que nos introduce en la idea general
de relación entre variables o correlación.
σxy =
N
n m
∑i=1 ∑j=1 xi ⋅ yj ⋅ fij
ˉ ⋅ Yˉ
σxy =
−X
N
97
Lo más importante para la utilización de las calculadoras es la
introducción de datos en el modo estadística, que todos los modelos
de calculadora científica tienen.
98
2.4.2 Coeficiente de correlación lineal.
σxy
r=
σx ⋅ σy
Karl Pearson
99
Este coeficiente tomará siempre valores comprendidos entre -1 y 1 y
según sean estos, podremos deducir que:
100
Nube de puntos y valores del coeficiente de correlación lineal
Escena 2.1. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
Video
101
2.5 Concepto de regresión. Método de los
mínimos cuadrados.
Podemos decir que la regresión lineal es una técnica estadística
que trata de estudiar la relación entre varias variables estadísticas.
Cuando solamente tenemos dos variables diremos que estamos en
regresión lineal simple. En investigación, el análisis de
regresión se utiliza para predecir una de las variables a partir de la
otra u otras.
103
2.5.1 Rectas de Regresión.
σxy
y − Yˉ = 2 ⋅ (x − X
ˉ)
σx
ˉ = σxy ⋅ (y − Yˉ )
x−X
σy2
ˉ , Yˉ )
(X
104
En la siguiente escena puedes practicar con el cálculo de todos los
parámetros relacionados con la regresión en variables
bidimensionales. Puedes introducir los datos que desees
seleccionando previamente las filas que necesites (máximo de 36).
Sigue las instrucciones y podrás comprobar el valor de todos los
parámetros y la representación gráfica de la nube de puntos y de las
dos rectas de regresión.
Escena 2.2. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
105
Una vez que conozcas este procedimiento, el resto suele ser muy
parecido. Como ejemplo, recordar el caso de la calculadora
DESCARTES (ver el apartado 2.4.1). Realiza algún ejercicio de
regresión utilizando la calculadora para variable bidimensional de
DESCARTES.
Video
En el siguiente video puedes asistir a una clase sobre regresión lineal
106
En la siguiente escena puedes manipular la nube de puntos y
observar como varía el ajuste por mínimos cuadrados y como
cambian las rectas de regresión.
Escena 2.3. Escena desarrollada por Juan Jesús Cañas Escamilla y José R. Galo Sánchez
(RED Descartes)
107
La siguiente escena sirve para analizar la influencia que puede tener
la variación de un solo dato en un análisis estadístico, en concreto en
la regresión lineal.
108
2.5.2 Estimaciones.
Una vez que conocemos la mayor o menor relación entre las variables
mediante el coeficiente de correlación lineal y que hemos calculado
las rectas de regresión, podemos utilizarlas para predecir el valor de
una de las variables a partir de la otra. La fiabilidad de la estimación
depende fundamentalmente de dos consideraciones:
109
En la siguiente escena puedes realizar estimaciones para ejercicios
concretos. Puedes introducir los valores de X , de Y y las frecuencias
que desees. Una vez introducidos los datos sólo tienes que seguir las
indicaciones que se dan en la escena y realizar las estimaciones que
quieras, tanto para la variable X como para la variable Y .
Escena 2.4. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
110
2.6 Problemas resueltos
A continuación tienes el enunciado de diferentes problemas.
Trabájalos y una vez los hayas resuelto puedes hacer clic sobre el
botón para ver la solución.
111
2.7 Créditos del capítulo
112
Parte III
Combinatoria
117
Es evidente también que con un manejo aceptable de las técnicas de
recuento que analizaremos en esta unidad; se pueden abordar de una
forma más interesante problemas de probabilidad en los que el único
enfoque posible sea el concepto de probabilidad en el sentido clásico
de Laplace y nos veamos obligados a contar casos posibles y
favorables.
Video
118
Videos
119
A continuación veamos una curiosidad que relaciona la combinatoria
con la filosofía. Imaginemos que el libro definitivo, el que explica las
verdades universales existe y que tiene por ejemplo 100 páginas. Con
este simple supuesto, la combinatoria nos dice que dicho libro, en
realidad es el fruto de una variación con repetición de 30 elementos (
26 letras, el espacio entre palabras, el punto, la coma y los dos
puntos) tomados de n en n (donde n es el total de signos que se
podrían introducir en 100 páginas). En realidad las posibles
agrupaciones son inimaginables , pero eso sí finitas.
120
3.2 Principio general de recuento
Las estafas piramidales, la extensión de rumores, las visitas a una
página web,..., a menudo manejan o conducen a números
escandalosamente grandes. Las circunstancias anteriores y muchas
otras tienen como motor de transmisión algo tan simple como el
"boca a boca", de manera que números pequeños conducen al final a
situaciones inabarcables como resultado del principio general de
recuento. También la base sobre la que se apoya el edificio de la
teoría combinatoria es el principio general de recuento que a su vez
es el mismo principio de cardinalidad del producto cartesiano en la
teoría de conjuntos.
121
En el lenguaje de teoría de conjuntos se expresa como:
} ⟹ Card(A × B) = n ⋅ m
Card(A) =n
=m
Card(B9
122
Video
123
Pensemos que disponemos de tres puestos. Para el primero se puede
elegir a cualquiera de los ocho participantes. Para el segundo, no
puedo elegir al que ya está elegido para el primero, por tanto
solamente podremos elegirlo entre los siete restantes. Para el
tercero, siguiendo el mismo razonamiento nos quedarán seis
participantes. Ahora aplicando el principio general de recuento al
conjunto (P 1 × P 2 × P 3), el total de resultados posibles para el
reparto de los tres premio sería: 8 × 7 × 6 = 336.
calcula:
124
Vn,m = n ⋅ (n − 1) ⋅ (n − 2) ⋅ ⋯ ⋅ (n − m + 1)
Escena 3.1. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
125
3.4 Variaciones con repetición
Dentro de los juegos de apuestas más populares en España se
encuentra sin duda la quiniela de fútbol. ¿Cuántos resultados
posibles pueden darse en catorce encuentros entre equipos de
primera y segunda división?. Este problema puede resolverse
también sin conocimientos previos de combinatoria.
126
Piensa también por ejemplo en:
calcula:
V Rn,m = nm
127
Escena 3.2. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
128
3.5 Permutaciones sin repetición
Imaginemos cuatro amigos que deciden fotografiarse juntos en una
fiesta para conservar el momento. Si deciden que la fotografía sea de
los cuatros en línea. ¿De cuántas formas diferentes podrán realizar la
fotografía?.
129
Un técnico de sonido tiene que unir 10 terminales en 10
conexiones. Si lo hiciera al azar, ¿ de cuántas formas diferentes
podría completar las conexiones?
¿De cuántas formas diferentes se pueden introducir 4 cartas
diferentes en 4 sobres distinto?
Video
130
Denominamos permutaciones ordinarias o sin repetición de n
elementos, a cada uno de los distintos grupos que pueden formarse
de manera que:
Pn = n ⋅ (n − 1) ⋅ (n − 2) ⋅ ... ⋅ 3 ⋅ 2 ⋅ 1
n! = n ⋅ (n − 1) ⋅ (n − 2) ⋅ ... ⋅ 3 ⋅ 2 ⋅ 1
Si n = 0 ⟹ 0! = 1
Si n = 1 ⟹ 1! = 1
131
Escena 3.3. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
132
Es decir, que si giramos los vasos para que se vean las etiquetas
distinquiríamos todas las permutaciones, pero si no vemos las
etiquetas, ordenaciones que antes eran distintas las veríamos iguales.
133
Las permutaciones anteriores serían identificadas como:
134
Denominamos permutaciones con repetición de n elementos en los
que uno de ellos se repite a veces, otro b veces y así hasta el último
que se repite k veces, donde (a + b + c + ⋅k = n) a todas las
ordenaciones posibles de estos n elementos.
Pna,b,c,⋅k
y se calcula como:
n!
Pna,b,c,⋅k =
a! ⋅ b! ⋅ c! ⋅ ... ⋅ k!
135
Escena 3.4. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
136
Así pues, todas las permutaciones de estos tres colores se deberían
analizar como una sola agrupación. Por tanto, para localizar todos los
posibles colores resultantes de la mezcla de tres de los cinco de que
disponemos, V5,3 entre las P3 .
137
Denominamos combinaciones ordinarias o sin repetición de n
elementos tomados de m en m, (siendo m menor o igual que n) a las
distintas agrupaciones de m elementos de manera que:
Cn,m = ( ) =
n n!
m! ⋅ (n − m)!
Vn,m
Vn,m = Cn,m ⋅ Pm ⟹ Cn,m =
Pm
138
Video
139
Escena 3.5. Escena desarrollada por Juan Jesús Cañas Escamilla Y Juan Guillermo
Rivera Berrío(RED Descartes)
1.( ) = 1
n
0
2.( ) = 1
n
n
140
3.( ) = n
n
1
4.( ) = ( )
n n
n−m
m
n+1
5.( ) + ( )=( )
n n
m m+1 m+1
Escena 3.6. Escena desarrollada por Miguel Ángel Cabezón Ochoa (RED Descartes)
141
Binomio de Newton
142
Estamos por tanto ante una combinación (no importa el orden), y con
posibilidad de repetición. Estamos ante una combinación con
repetición de 20 elementos tomados de 6 en 6: CR20,6 .
n+m−1
CRn,m = (
)
143
Para explicar la fórmula anterior vamos a desarrollar un método de
codificación que nos ayude sobre un ejemplo concreto y que sea un
poco más fácil que el del principio. Supongamos que en un
restaurante se ofrecen cuatro posibilidades de menús; digamos
A, B, C y D. Si un grupo de 6 amigos decide hacer un pedido,
calculemos todos los casos distintos que podrían realizarse. Desde el
punto de vista combinatorio, estamos ante combinaciones con
repetición de cuatro elementos tomados de seis en seis.
En primer lugar utilizamos tres líneas (rayas) para separar las cuatro
posibles opciones de los distintos menús. También utilizaremos el
.
símbolo( ) (punto) para significar el pedido de cada persona. De esta
forma, el pedido de por ejemplo cuatro menús A y dos menús B lo
codificaríamos:
144
La posición inversa también se manifiesta asequible, es decir,
descifrar cualquier código que se confeccione con tres rayas y seis
puntos como un determinado y único pedido también sería sencillo.
Por ejemplo si queremos descifrar el código ..∣..∣∣.., lo podríamos
interpretar como dos menús A, dos menús B , ningún menú C y dos
menús D .
9! 9 4+6−1
CR4,6 = P R96,3 = =( )=( )
6! ⋅ 3! 6 6
145
Escena 3.7. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
3.9 Resumen
En el siguiente video puedes observar de forma resumida todos los
casos de agrupaciones enumerados en este tema.
146
Video
147
Escena 3.8. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
148
Video
Para empezar a hacer problemas, puedes ver el siguiente vídeo:
149
3.10 Problemas resueltos
A continuación tienes el enunciado de diferentes problemas.
Trabájalos y una vez los hayas resuelto puedes hacer clic sobre el
botón para ver la solución.
150
3.11 Créditos del capítulo
151
Parte IV
Probabilidad
El problema de Mére
La historia se pone de acuerdo en que el cruce de correspondencia
respecto a dicho problema que establecen Pascal y el genial abogado
y matemático también francés Pierre de Fermat, puede considerarse
como origen de esta teoría.
156
Posteriormente es el matemático Christian Huygens quien publica en
1656 el primer libro impreso sobre probabilidad, De ratiociniis in ludo
aleae. Es sobre todo en el siglo siguiente cuando el matemático
francés Abraham de Moivre profundiza e impulsa de forma más
intensa el estudio de la probabilidad con la introducción de
importantes conceptos como el de la normal.
Video
En el siguiente vídeo podemos ver una visión de la probabilidad en el
programa REDES
157
4.2 Experimentos aleatorios y deterministas
Existen experimentos en los que conocidas las condiciones iniciales
se pueden predecir los resultados finales. Por ejemplo:
158
algunos conceptos que seguramente ya conoces de cursos anteriores
pero que conviene recordar.
E = {1, 2, 3, 4, 5, 6}
E = {1, 2, 3, 4, 5, 6}
E = {A, B, ................., Z}
160
Los ejemplos que podrían exponerse son innumerables y seguro que
ya estás pensando en diversas situaciones. No obstante, de partida,
queremos que te fijes y pienses en lo que te vamos a exponer.
Observa el ejemplo (1) y el (4), el espacio muestral es el mismo, pero
¿puede considerarse el mismo?, esto es, los sucesos que aparecen sí
son los mismos pero la ocurrencia de cada suceso en el experimento
(1) no tiene el mismo comportamiento que la ocurrencia de cada
suceso en el experimento (4) ¿No te parece?
Escena 4.1. Escena desarrollada por José R. Galo Sánchez (RED Descartes)
161
4.2.2 Sucesos y tipos de sucesos
AC o Aˉ
162
En la escena siguiente puedes observar algunos ejemplos de un
suceso y del suceso contrario o complementario.
Escena 4.2. Escena desarrollada por José R. Galo Sánchez (RED Descartes)
163
Así se pueden definir en el conjunto de todos los sucesos asociados a
cualquier espacio muestral, fundamentalmente dos operaciones que
dotarán a dicho conjunto de una sólida estructura matemática
importante conocida con el nombre de Álgebra de Boole.
Unión de sucesos
164
Intersección de sucesos
A Juan le gusta el fútbol, el baloncesto, las películas de aventuras, la
música clásica y los documentales de viajes. A su amiga Irene le van
las películas románticas, el tenis, la música disco y los documentales
de viajes. ¡Qué pocas cosas tenemos en común! exclamó Irene. Sin
embargo podríamos quedar para ver algún documental de viajes.
Efectivamente es algo que ambos adoramos. Es nuestra
INTERSECCIÓN agregó Juan.
Resta de sucesos
El lunes Manuel salió con sus amigos Miguel, Pablo, María , Laura y
Sofía y se le ocurrió contar una ocurrencia muy graciosa que le paso
en su último viaje. Fue muy divertido y a todos les entusiasmó.
165
El jueves siguiente Manuel volvió a salir con otro grupo de amigos
entre los que también estaban Laura y Sofía. Manuel volvió a contar
la misma anécdota pero antes se disculpó con Laura y Sofía
diciéndoles que por favor no contaran el final. Por supuesto que al
RESTO de el grupo les resutó igual de divertida.
166
En relación con las operaciones unión e intersección surgen también
dos importantes tipos de sucesos.
Escena 4.3. Escena desarrollada por Juan Guillermo Rivera Berrío (RED Descartes)
Ω
167
El conjunto de todos los sucesos de un espacio muestral, junto con las
operaciones unión e intersección definidas anteriormente, cumple
una serie de propiedades que lo dotan de una estructura matemática
conocida como álgebra de Boole.
(Ω, ∪, ∩) tiene estructura de a
ˊlgebra de Boole
En el siguiente cuadro se resumen las propiedades y consecuencias
directas más importantes que se desprenden de dicha estructura.
A ∪ ∅ = A y A ∩ ∅ = ∅
A ∪ E = E y A ∩ E = A
Una tercera consecuencia son las leyes de De Morgan, que son muy
útiles en la práctica, ya que en muchas situaciones se podrán calcular
probabilidades de un suceso a partir de las probabilidades de otros
más fáciles o bien que se den como datos. Recuerda por tanto:
A ∪ B = Aˉ ∩ B
ˉ
El
El complementario
complementario de
de la
la unión
unión es
es la
la intersección
intersección de
de
los
los complementarios
complementarios
168
A ∩ B = Aˉ ∪ B
ˉ
El
El complementario
complementario de
de la
la intersección
intersección es
es la
la unión
unión de
de
los complementarios
los complementarios
Escena 4.4. Escena desarrollada por Juan Guillermo Rivera Berrío (RED Descartes)
169
Se dice que los sucesos A1 , A2 , A3 . ⋯ , An , constituyen un sistema
A1 ∪ A2 ∪ ⋯ ∪ An = E
Ai ∩ Aj = ∅ para cualquier i, j
170
4.4 Concepto de probabilidad
La idea de probabilidad es uno de esos conceptos que cualquier ser
humano tiene preaprendido. Todos tenemos conocimiento intuitivo
de lo que supone que una cosa sea muy difícil que ocurra (acertar en
la lotería) o de algo que sea más fácil que ocurra (lanzar una moneda y
que salga cara). Otra cosa es la definición matemática. Desde el punto
de vista formal, el concepto de probabilidad se puede abordar desde
tres puntos de vista diferentes.
nA
p(A) = lim
n→∞ n
171
4.4.2 Definición de Laplace
Nu
ˊ mero de casos favorables
p(A) =
Nu
ˊ mero de casos posibles
1) p(A) ≥ 0
2) p(E) = 1
3) p(A ∪ B) = p(A) + P (B),
siendo A y B incompatible
172
Como primeras consecuencias y propiedades de la definición
axiomática tenemos:
ii) p(∅) = 0
ii)
iii) p(A ∪ B ) = p(A) + p(B ) − p(A ∩ B )
iii)
Generalización
Generalización
Que
Que se
se expresan
expresan como:
como:
•• La
La probabilidad
probabilidad deldel suceso
suceso contrario a A es
uno
uno menos
menos lala probabilidad
probabilidad de A.
•• La
La probabilidad
probabilidad deldel suceso
suceso imposible es cero.
•• La
La probabilidad
probabilidad de de dos
dos sucesos
sucesos compatibles es
la
la suma
suma de
de las
las probabilidades
probabilidades de cada uno
menos
menos lala de
de la
la intersección.
intersección. Esta propiedad se
puede
puede generalizar
generalizar aa más
más de
de dos sucesos.
173
Video
174
Escena 4.5. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
Este final de conversación entre dos amigos nos indica que la cita se
va a producir INDEPENDIENTEMENTE de lo que ocurra con las
posibles inclemencias del tiempo. Sin embargo, existen muchas
situaciones en las que la ocurrencia de un suceso influye en la
ocurrencia o no de otro.
175
Así por ejemplo en medicina, el hecho de que una mujer sea
portadora de cierta enfermedad influye en que el próximo hijo que
tenga adquiera dicha enfermedad, o por ejemplo si una persona es
fumadora el riesgo de padecer hipertensión es mucho mayor que en
un no fumador.
2
El problema de Monty Hall o paradoja de Monty Hall es un problema matemático de
probabilidad basado en el concurso televisivo estadounidense Trato hecho (Let's Make a
Deal). El problema fue planteado y resuelto por el matématico Steve Selvin en la revista
American Statistician en 1975 y posteriormente popularizado por Marilyn vos Savant en
Parade Magazine en 1990. El problema fue bautizado con el nombre del presentador de
dicho concurso, Monty Hall (https://es.wikipedia.org/).
176
Escena 4.6. Escena desarrollada por Mª José García Cebrian (RED Descartes)
177
Siempre que tenga sentido, se denomina probabilidad condicionada
del suceso A respecto del suceso B , (probabilidad de A condicionado
a B ) y se representa p(A/B) al cociente:
p(A ∩ B)
p(A/B) = siempre que p(B)
=0
p(B)
p(A ∩ B)
p(B/A) = siempre que p(A)
=0
p(A)
178
Escena 4.7. Escena desarrollada por Mª José García Cebrian (RED Descartes)
p(A1 ∩ A2 ∩ A3 ⋯ ∩ An )
179
4.5.2 Criterio de independencia de sucesos
Cuando se cumpla que p(B/A) coincida con p(B) se dice que los
sucesos A y B son independientes. En este caso la probabilidad de la
intersección obtenida en el epígrafe anterior quedaría simplemente
como el producto de las probabilidades de cada suceso.
180
Videos
182
n
p(B) = ∑ p(Ai ) ⋅ p(B/Ai )
i=1
Demostración
B = (B ∩ Ai ) ∪ (B ∩ A2 ) ∪ ⋯ ∪ (b ∩ An ) unioˊn disjunta
⟹ (B ∩ Ai ) ∩ (B ∩ Ai ) = ∅
En consecuencia
n
⟹ ∑i=1 p(Ai ) ⋅ p(B/Ai )
p(I) = 0, 5 ⋅ 0, 4 + 0, 35 ⋅ 0, 1 + 0, 15 ⋅ 0, 3 = 0, 28
183
En la siguiente escena puedes practicar con la probabilidad
condicionada y aplicar el Teorema de la probabilidad total.
Escena 4.8. Escena desarrollada por José Ireno Fernández Rubio (RED Descartes)
ejemplo:
184
Se conoce, después de muchos estudios y durante muchos
años, que la probabilidad de retraso de un avión en un día
lluvioso es del 5%. Si se ha producido un retraso. ¿Cuál sería la
probabilidad de que el día sea lluvioso?.
Se conoce que la probabilidad de tener cierta enfermedad si
has dado positivo en un determinado test es del 99%. Si una
persona ha dado positivo al test. ¿Cuál sería la probabilidad de
no tener la enfermedad? (lo que se denomina un falso
positivo)
Situaciones como las anteriores son las que se van a resolver con este
segundo gran resultado relativo a la probabilidad condicionada.
Formalmente; supongamos que A1 , A2 , A3 , ⋯ An , constituyen un
185
En estas condiciones podemos deducir que:
p(Ai )p(B/Ai )
p(Ai /B) =
p(Ai )p(B/Ai )
p(Ai /B) =
n
∑i=1 p(Ai )p(B/Ai )
Video
En el siguiente vídeo puedes recabar algunas ideas sobre el Teorema
de Bayes.
186
Una situación clásica de aplicación del teorema de Bayes es la
siguiente:
187
a) p(Def ) = p(A) ⋅ p(Def /A) + p(B) ⋅ p(Def /B) + p(C) ⋅
p(Def /C) = 0, 45 ⋅ 0, 03 + 0, 3 ⋅ 0, 04 + 0, 25 ⋅ 0, 05 = 0, 038
p(B)⋅p(Def /B) 0,3⋅0,04
b) p(B/Def ) = p(Def ) = 0,45⋅0,03+0,3⋅0,04+0,25⋅0,05 = 0, 3158
p(A)⋅p(Def /A) 0,45⋅0,03
c) p(A/Def ) = p(Def )
= 0,45⋅0,03+0,3⋅0,04+0,25⋅0,05
= 0, 3553
p(C)⋅p(Def /C) 0,25⋅0,05
d) p(C/Def ) = p(Def )
= 0,45⋅0,03+0,3⋅0,04+0,25⋅0,05
= 0, 32894
Escena 4.9. Escena desarrollada por José Ireno Fernández Rubio (RED Descartes)
188
4.8 Problemas resueltos
A continuación tienes el enunciado de diferentes problemas.
Trabájalos y una vez los hayas resuelto puedes hacer clic sobre el
botón para ver la solución.
189
4.9 Créditos del capítulo
190
Parte V
195
Si consideramos una función que asocie a cada resultado posible del
experimento la suma de los resultados de las caras superiores
obtenidas; esta función podría tomar los valores desde 2 hasta 12.
Ω→R
(1, 1) → 2
(1, 2) → 3
(2, 1) → 3
⋯
⋯
196
Además se puede asociar a cada valor de la variable la probabilidad
de que tome dicho valor;
1 2 3
p(X = 2) = 36 , p(X = 3) = 36
, p(X = 4) = 36
,
4 5 6
p(X = 5) = 36 , p(X = 6) = 36
p(X = 7) = 36
,
5 4 3
p(X = 8) = 36 , p(X = 9) = 36
, p(X = 10) = 36
,
2 1
p(X = 11) = 36 , p(X = 12) = 36
Se define una variable aleatoria como una función que asocia a cada
suceso de un espacio muestral un número real.
X :Ω→R
A → X(A)
197
Supongamos que se nos ocurre el experimento aleatorio
consistente en preguntar a los alumnos de un determinado
instituto por el tiempo que tardan en desplazarse desde su casa
al centro. La variable aleatoria en este caso vendría determinada
por un intervalo de tiempo en el que al menos teóricamente
podría tomar cualquier valor entre 0 y 25 minutos
aproximadamente.
Supongamos que se nos ocurre como experimento aleatorio salir
a la calle y aleatoriamente preguntar a las personas el dinero que
se han gastado en las últimas rebajas. La variable aleatoria en
este caso vendría determinada por una gran diversidad de
valores dentro de posiblemente también un intervalo bastante
grande (0, ...).
f (xi ) = p(X = xi ) = pi
p(X = xi ) = pi > 0
∑i p(X = xi ) = ∑i pi = 1
198
A partir de la función de probabilidad se puede definir la denominada
función de distribución como:
F (xi ) = p(X ≤ xi )
PARÁMETROS ASOCIADOS
n
X = μ = ∑ xi ⋅ pi
i=1
Varianza
n
σ 2 = ∑(xi − μ)2 ⋅ pi
i=1
i=1
199
Desviación típica
n
σ= ∑(xi − μ)2 ⋅ pi
i=1
n
σ= ∑ x2i ⋅ pi − μ2
i=1
PROPIEDADES
200
Propiedades de la varianza
EJEMPLO 1
n
1 2 2 1
X = μ = ∑ xi ⋅ pi = 2 ⋅ +3⋅ + ⋯ + 11 ⋅ + 12 ⋅ =7
36 36 36 36
i=1
201
n n
σ= ∑ x2i ⋅ pi − μ2 =
∑ x2i ⋅ pi − μ2 ⟹
i=1 i=1
1 2 2 1
σ= 22 ⋅ + 32 ⋅ + ⋯ + 112 ⋅ + 122 ⋅ − 72 = 2, 42
36 36 36 36
EJEMPLO 2
n
1 3 3 1
X = μ = ∑ xi ⋅ pi = 0 ⋅ + 1 ⋅ + 2 ⋅ + 3 ⋅ = 1, 5
8 8 8 8
i=1
n n
σ= ∑ x2i ⋅ pi − μ2 = ∑ x2i ⋅ pi − μ2 ⟹
i=1 i=1
1 3 3 1
σ= 02 ⋅ + 12 ⋅ + 22 ⋅ + 32 ⋅ − 1, 52 = 0, 8666
8 8 8 8
202
EJEMPLO 3
n
X = μ = ∑ xi ⋅ pi
i=1
1 3 5 7 9 11
=1⋅ +2⋅ +3⋅ +4⋅ +5⋅ +6⋅ = 4, 47
36 36 36 36 36 36
203
n n
σ= ∑ x2i ⋅ pi − μ2 =
∑ x2i ⋅ pi − μ2 ⟹
i=1 i=1
1 3 9 11
σ= 12 ⋅ + 22 ⋅ + ⋯ 52 ⋅ + 62 ⋅ − 4, 472 = 1, 41
36 36 36 36
EJEMPLO 4
n
12 36 216 24 6
X = μ = ∑ xi ⋅ pi = 0 ⋅ +1⋅ +2⋅ +3⋅ = = 1, 2
72 72 720 720 5
i=1
n n
σ= ∑ x2i ⋅ pi − μ2
= ∑ x2i ⋅ pi − μ2 ⟹
i=1 i=1
12 36 216 24
σ= 02 ⋅ + 12 ⋅ + 22 ⋅ + 32 ⋅ − 1, 22 = 0, 7483
72 72 720 720
204
En la siguiente escena aparecen el diagrama de barras para
frecuencias relativas del lanzamiento de dos dados un total de veces
que puedes modificar mediante el control "nº de veces".
Escena 5.1. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
205
5.3 Distribución binomial
(B(n, p))
206
Para la simulación de modelos de probabilidad como por ejemplo el
modelo de una distribución binomial existe un artefacto muy simple y
con bastantes aplicaciones didácticas como es el aparato de Galton.
207
Video
3
Véase Caja de Galton.
208
En cada bifurcación la bola puede ir a la izquierda con probabilidad p
o a la derecha con probabilidad "q = 1 − p". La variable aleatoria que
toma valor 0 si cae a la izquierda o 1 si cae a la derecha se llama de
Bernoulli y la variable X que da el número de unos al finalizar el
experimento (lugares a la derecha) se denomina binomial.
Escena 5.2. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
209
Podrías simular modelos para el lanzamiento de dados, cartas, o
cualquier otra experiencia en la que aparezcan solamente dos
resultados posibles: éxito (bola que va a la derecha) y fracaso (bola
que va a la izquierda).
4
Escena descargada de Phet interactive solutions.
210
5.3.1 Función de probabilidad de la distribución
binomial
A = Fracaso
211
Uno de los casos en los que se obtienen "r " éxitos sería:
A A A A A⋯A A A A
7! 7! 7
= ( ) = C7,4
4,3
P7 = =
4! ⋅ 3! 4! ⋅ (7 − 4)! 4
Es decir que todos los casos posibles en los que se presentan cuatro
éxitos y tres fracasos sería el número combinatorio:
7
( )
4
212
En general, la expresión para todos los casos en los que se pueden
presentar "r " éxitos y "n − r " fracasos sería:
n! n
Pnr,n−r = = ( ) = Cn,r
r!(n − r)! r
n
p(X = r) = ( )pr (1 − p)n−r
r
En la siguiente escena puedes observar las representaciones gráficas
de distintas distribuciones binomiales. Puedes cambiar los valores de
la binomial que coinciden con los controles "n" y "p".
Escena 5.3. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
213
Observa cómo cambia la forma de la gráfica y extrae tus propias
conclusiones.
E[X] = 1 ⋅ p + 0 ⋅ (1 − p) = p
var[X] = 12 ⋅ p + 02 ⋅ (1 − p) − p2 = p − p2 = p ⋅ (1 − p) = p ⋅ q
214
Por tanto:
Media: μ = n ⋅ p
Varianza: σ 2 = n ⋅ p ⋅ q siendo q = 1 − p
Tabulación de la binomial
215
Existen tablas muy extensas para las binomiales. La más popular era
la que condensaba en una página todas las binomiales de hasta n =
10 y distintas probabilidades comprendidas entre un valor mínimo
0, 01 y un máximo de 0,5 con paso de 0, 05.
216
EJEMPLO:
217
a) Probabilidad de contestar 5 preguntas bien.
a) p(x = 5) = 0, 0584
218
o también:
Video
En el siguiente vídeo podemos asistir a una clase sobre la distribución
binomial:
219
5.3.3 Ajuste de una serie de datos a una binomial
Por ejemplo:
220
En la siguiente escena puedes comprobar si una serie de datos se
parece a los obtenidos en una binomial y como se calcularían los
parámetros de esa binomial.
221
Escena 5.4. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
222
Familia uniforme
Existen bastantes
situaciones
interesantes que no se
pueden enfocar bajo la
óptica directa de la
binomial. En los Familia
siguientes epígrafes se hipergeométrica
estudiarán algunas
distribuciones teóricas
discretas clásicas con
las que se pueden
abordar un gran
número de problemas
concretos.
Familia de
Poisson
k N −k N = tamaño de la poblacioˊn
( )⋅( )
n−x k = Nuˊ mero de individuos que...
p(X = x) = x
N n = tamaño de la muestra
( ) x = valor que toma la variable
n
225
μ=n⋅p
N −n
σ2 = n ⋅ p ⋅ q ⋅
N −1
N −n
σ= n⋅p⋅q⋅
N −1
EJEMPLO 1:
10 30
( )⋅( )
4 4
p(X = 4) = = 0, 07
40
( )
8
226
EJEMPLO 2:
N = 20
n = 15
X = nuˊ mero de piezas defectuosas de las 15 escogidas
p(X ≥ 1) = 1 − p(X < 1 == 1 − p(X = 0)
2 20 − 2
( )⋅( )
0 15 816 18
1− =1− = = 0, 947
20 15504 19
( )
15
227
Lógicamente hay un límite para los valores de la población de manera
que la escena funcione con fluidez (valores menores de 200).
Escena 5.5. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
228
bien el caso en que los cálculos que se derivan de la fórmula de la
binomial sean tan farragosos que saquen de rango nuestra
calculadora. Sería importante disponer de otra alternativa más
interesante.
λ
y a su vez este es independiente del número de éxitos en otro
instante o espacio.
Si llamamos X=
nº de ˊexitos obtenidos en un determinado periodo. Diremos que
X sigue una distribución de Poisson.
−λ λk
f (k) = p(X = k) = e ⋅
k!
229
Los parámetros media, varianza y desviación típica de esta
distribución vienen dados por
μ=λ
σ2 = λ
σ= λ
EJEMPLO 1:
Solución:
λ = 500000 ⋅ 0, 00001 = 5
230
EJEMPLO 2:
Poisson de paraˊmetro λ = 2
p(X > 3) = 1 − p(X ≤ 3)
1 − [p(X = 0) + p(X = 1) + p(X = 2) + p(X = 3)]
e−2 ⋅ 20 e−2 ⋅ 21 e−2 ⋅ 22 e−2 ⋅ 23
1− + + + = 0, 143
0! 1! 2! 3!
Video
En el siguiente vídeo podemos asistir a una clase sobre la distribución
de Poisson:
Escena 5.6. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
232
5.4.3 Distribución Geométrica
233
′
f ′ (k ′ ) = p(X ′ = k ′ ) = (1 − p)k ⋅ p
Los parámetros media, varianza y desviación típica de esta
distribución vienen dados por:
1 1−p 1−p
μ = ; σ2 = y σ =
p p2 p2
EJEMPLO 1:
234
EJEMPLO 2:
Un matrimonio quiere tener una hija, y por ello deciden tener hijos
hasta el nacimiento de la esperada hija.
235
Escena 5.7. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
236
Esta situación puede ilustrar bastante bien el problema que resuelve
la distribución binomial negativa. Una distribución binomial
negativa de parámetros "r" y "p" surge como una secuencia infinita
de intentos de tipo Bernoulli en los que:
k−1 r
f (k) = p(X = k) = ( )p ⋅ (1 − p)k−r
r−1
1 1−p 1−p
μ = r ⋅ ; σ 2 = r ⋅ 2 y σ = r⋅
p p p2
237
EJEMPLO 1:
8 7 4 4 6
p(X = 10) = ( ) ⋅ ( ) ⋅ ( ) = 0, 03185
3 11 11
1
μ=4⋅ = 6.25...
7/11
EJEMPLO 2:
238
Podemos enfocar el problema como una binomial negativa de
parámetros X = 10, k = 3 y p = 0, 4
9
p(X = 10) = ( ) ⋅ 0, 43 ⋅ 0, 67 = 0, 0645
2
Escena 5.8. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
239
5.4.5 Distribución uniforme
Supongamos un experimento
aleatorio en el que los resultados
posibles pueden tomar un
conjunto de “n” valores discretos
y donde cualquiera de estos
valores puede obtenerse con
igual probabilidad.
X → U (n)
Por ejemplo el lanzamiento de un dado correspondería a una
distribución uniforme con n = 6. La función de probabilidad de una
distribución uniforme viene dada por:
1
P (x) = para x = {1, 2, 3, ⋯ , n}
n
240
n
1 1 1 1+n
μ = ∑i⋅ = ⋅ (1 + 2 + 3 + ⋯ + n) = ⋅ ( )⋅n=
2
i=1
n n n
1+n
2 n
1 1 1+n 2
σ 2 = ∑ i2 ⋅ − μ2 = ⋅ (12 + 22 + 32 + ⋯ + n2 ) − ( ) =
2
i=1
n n
n2 − 1
12
n2 − 1
σ=
12
Escena 5.9. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
241
5.5 Problemas resueltos
A continuación tienes el enunciado de diferentes problemas.
Trabájalos y una vez los hayas resuelto puedes hacer clic sobre el
botón para ver la solución.
242
5.6 Créditos del capítulo
243
Parte VI
Distribución Normal
Escena 6.1. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
248
6.1.2 Definición de Función de densidad
249
Algunos ejemplos de función de densidad
⎧0 si x < 1
f (x) = ⎨
x−1 si 1 ≤ x ≤ 2
⎩
−x + 3 si 2 ≤ x ≤ 3
0 si x > 3
⎧0 si x < 0
g(x) = ⎨ 12 x si 0 ≤ x ≤ 2
⎩0
si x > 2
⎧0 si x < 0
h(x) = ⎨ 12 si 0 ≤ x ≤ 2
⎩0
si x > 2
250
La media o esperanza matemática es el valor más representativo de
todos los que toma la variable continua X , puede imaginarse como el
punto sobre el eje de abscisas en el cuál la superficie generada por la
función y el eje permanecerían en equilibrio. El cálculo matemático se
haría:
∞
∫
x ⋅ f (x)dx
−∞
∞
∫ x2 ⋅ f (x)dx − μ2
−∞
251
Aunque fue reconocida por primera vez por el francés Abraham de
Moivre (1667-1754), posteriormente, Carl Friedrich Gauss (1777-
1855) elaboró desarrollos más profundos y formuló la ecuación de la
curva. Se suele conocer popularmente como la "campana de Gauss".
Media μ
Desviacioˊn tˊıpica σ
N (μ, σ)
1 − 12 ( σ )
x−μ
2
f (x) = e
σ 2π
252
Las principales características (propiedades) de esta función son:
253
Videos
Puedes observar dos clases sobre la distribución normal
correspondientes a la Universidad Politécnica de Valencia.
254
6.2.1 La distribución normal cero uno
1 −x2
f (x) = ⋅e 2
2π
z
1
p(Z ≤ z) = ∫
−x2
⋅ e 2 dx
2π
−∞
255
Afortunadamente no tendremos que realizar este tipo de ejercicio
cada vez que queramos calcular una probabilidad ya que disponemos
de una tabulación que permite calcular con bastante precisión el
valor de que la variable tome valores menores o menores o iguales
que cualquier valor "z " comprendido entre 0 y 4 con incrementos de
una céntésima.
256
Detalle de la tabulación de la N (0, 1). Ejemplo de cálculo de una
probabilidad (aréa correspondiente al barrido a la izquierda de la
función):
6.2.2 Tipificación
x−μ
Z=
σ
257
En la siguiente escena puedes comprobar como la gráfica de la
función de densidad de cualquier distribución normal, mediante ese
cambio de variable, se transforma en la gráfica de la función de
densidad de la N(0,1). Para ello basta con que cambies los controles
media y desviación típica de la escena.
Escena 6.2. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
258
Cálculo de probabilidades a la izquierda mediante
tipificación
Escena 6.3. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
259
Cálculo de probabilidades a la derecha mediante
tipificación
Escena 6.4. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
261
Ejemplo de tabulación de la N (0, 1)
262
6.3.1 Probabilidad p(Z < a). Barrido a la izquierda
263
6.3.2 Probabilidad p(Z > a). Barrido a la derecha
264
6.3.3 Franja entre dos valores
- Para el caso p(a < z < b), siendo "a" y "b" valores positivos.
265
- Para el caso p(−a < z < −b), siendo "−a" y "−b" valores
negativos.
- Para el caso p(−a < z < b), siendo "−a" negativo y "b" positivo.
266
En la siguiente escena puedes practicar con el cálculo de
probabilidades a la derecha (barrido a la derecha). Puedes elegir, en el
primer control de menú, la opción << mayor >> y, en el segundo
control, << valor de z >> puedes cambiarlo directamente. La
escena resuelve directamente sin necesidad de realizar ninguna
táctica. No obstante, es conveniente que practiques con la tabla y que
compruebes tus resultados con los que se reflejan en la escena de
forma directa.
Escena 6.5. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
267
6.4 Manejo inverso de la tabla de la N (0, 1)
Existen muchas ocasiones en las que nos interesa saber cuál es el
valor de una determinada distribución que deja a su izquierda o
derecha una probabilidad determinada. Pensemos por ejemplo en
una nota de corte para acceso a una determinada titulación, o en los
valores de perímetro craneal que determinan que un feto se
encuentre entre los percentiles 25 y 75. También se verá en temas
posteriores la importancia del cálculo de los denominados "zeta sub
alfa medios y zeta sub alfa", tan importantes en intervalos de
confianza y contraste de hipótesis. En definitiva, conviene tener
cierta habilidad en la utilización de la tabla de la N (0, 1) en el sentido
expuesto anteriormente. Recordemos también la propia limitación de
la tabla en cuanto a que presenta únicamente valores entre 0 y como
mucho 4 y, además, que las probabilidades correspondientes son
únicamente de lo que denominamos barridos a la izquierda.
268
6.4.1 Calculo del valor za tal que p(z < za ) = k
0.52.
269
En la siguiente escena puedes calcular directamente, y sin necesidad
de utilizar ninguna tabla, los valores que dejan una probabilidad a la
izquierda de lo que quieras. Basta con que introduzcas el valor
deseado en el control <<probabilidad>>. No obstante, puedes
practicar el cálculo de este tipo de valores con la tabla de la N (0, 1).
También, puedes utilizar la escena para comprobar el error que se
comete al realizar los cálculos de forma manual (con la tabla), o de
forma directa en la escena.
Escena 6.6. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
270
6.4.2 Cálculo del valor za tal que p(z > za ) = k
barrido a la derecha de valor "k ", es decir, tal que p(z > za ) = k .
Si p(z > za ) = 0.2, entonces p(z < za ) = 1−, es decir, p(z <
za ) = 0.80.
271
En la siguiente escena puedes calcular directamente y sin necesidad
de utilizar ninguna tabla los valores que dejan una probabilidad a la
derecha de lo que quieras. Basta con que introduzcas el valor
deseado en el control <<probabilidad>>.
Escena 6.7. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
272
No obstante, puedes practicar el cálculo de este tipo de valores con la
tabla de la N (0, 1). También puedes utilizar la escena para
comprobar el error que se comete al realizar los cálculos de forma
manual, (con la tabla) o de forma directa en la escena.
k/2.
El valor "0.5 + k/2" habitualmente no coincidirá exactamente
con uno de los que aparece en la tabla, por tanto debemos
considerar el más proximo. En el caso en el que haya dos o más
que estén a la misma distancia de "k ", lo habitual es considerar
como valor de za la media aritmética de los calculados.
273
Si p(−za < z < za ) = 0.9, entonces p(z < za ) = 0.5 +
274
Escena 6.8. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
275
Según los datos que se desprenden del problema, estamos ante una
distribución binomial de parámetros B(1000, 0.005). Para responder
a las preguntas que se plantearon anteriormente, nos podemos
encontrar con algunos serios incovenientes, pues la calculadora
científica clásica, evidentemente, no puede con la carga operacional y
se sale de rango. En estos casos es muy útil el resultado que se
estudiará en el siguiente epígrafe y que proporciona las condiciones
en las que una distribución binomial puede aproximarse por una
distribución normal transformando las situaciones anteriores en
preguntas que se contestan muy fácilmente en el nuevo ambiente de
la distribución normal. El planteamiento del problema si lo
abordamos mediante una binomial sería:
Teorema de Moivre
n⋅p≥5 n ⋅ (1 − p) ≥ 5
Entonces
B(n, p) → N (n ⋅ p, n ⋅ p ⋅ q )
Escena 6.9. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
277
CORRECCIÓN POR CONTINUIDAD (Corrección de
Yates)
278
279
Veamos un ejemplo muy sencillo de aplicación del teorema de Moivre
con la corrección de Yates. Supongamos que el 90% de los miembros
de un club pasan sus vacaciones en la playa. Calcula una
aproximación, obtenida utilizando tablas de la normal, de la
probabilidad de que, en un grupo de 6000 miembros del club, 5450 o
menos vayan a ir a la playa a pasar sus vacaciones.
280
6.6 Problemas resueltos
A continuación tienes el enunciado de diferentes problemas.
Trabájalos y una vez los hayas resuelto puedes hacer clic sobre el
botón para ver la solución.
281
6.7 Créditos del capítulo
282
Parte VII
Inferencia Estadística
Muestreo
Por ejemplo:
287
Llamaremos parámetro a cualquier valor representativo de una
población; media, mediana, moda varianza…
288
Los métodos de muestreo probabilístico son aquellos que se basan
fundamentalmente en el principio de equiprobabilidad; es decir:
aquellos en los que todos los individuos tienen la misma probabilidad
de ser elegidos para formar parte de una muestra. Este aspecto es
crucial con respecto a la representatividad de dichas muestras y debe
tratarse con mucho cuidado ya que procedimientos que en principio
parecen aleatorios muchas veces no lo son. Pensemos en una
macroencuesta a nivel mudial. Imaginemos que deseamos realizar un
estudio sobre hábitos alimenticios y para ello elegimos de forma
aleatoria números de teléfono en los distintos países y realizamos
llamadas para contactar con los individuos de nuestra muestra.
¿Estamos seguros de que todos los individuos de la población han
tenido la misma probabilidad de ser elegidos? En principio el
procedimiento es aleatorio pero todavía en algunos países el teléfono
es un artículo de lujo al que una gran parte de la población aún no
tiene acceso. En consecuencia esos individuos no tendrían ninguna
posibilidad de ser elegidos con nuestro procedimiento.
289
Observa la siguiente escena interactiva:
Escena 7.1. Escena desarrollada por Mª José García Cebrian (RED Descartes)
290
Dentro de los métodos de muestreo probabilísticos pueden
destacarse los siguientes:
291
EJEMPLO: Una ganadería tiene 3000 vacas. Se quiere extraer una
muestra de 120. Explica cómo se debería obtener la muestra:
Solución:
292
7.2.3 Muestreo aleatorio estratificado
293
EJEMPLO: Supongamos que nos interesa estudiar el grado de
aceptación que la implantación de la nueva ley educativa ha tenido
entre los padres de alumnos de una provincia. Seleccionamos 600
individuos. Se conoce que los 10000 niños escolarizados se
distribuyen: 6000 en colegios públicos, 3000 en colegios concertados
y 1000 en privados no concertados.
a) Afijación simple.
b) Afijación proporcional.
Solución:
294
Representatividad de las muestras - Muestreo estratificado
Escena 7.2. Escena desarrollada por Mª José García Cebrian (RED Descartes)
295
Practica en la siguiente escena:
Escena 7.3. Escena desarrollada por Mª José García Cebrian (RED Descartes)
296
7.2.4 Muestreo aleatorio por conglomerados
297
EJEMPLO: Supongamos que interesara estudiar algún aspecto
concerniente a los políticos que componen las corporaciones locales
de municipios de aproximadamente 15000 habitantes. Sabemos que
por término medio una corporación local en estos casos suele estar
compuesta por 12 políticos de los distintos partidos. ¿Cómo realizar
el muestreo si necesitáramos una muestra de tamaño 600?
298
7.2.5 Muestreo no aleatorio
299
300
7.3 Distribución en el muestreo de la proporción
Supongamos una población de la que conocemos la proporción “p” de
individuos que cumple cierta característica. Si de esta población
extraemos muestras de tamaño “n”, y en cada muestra a su vez
estudiamos la proporción de individuos que cumple la característica
estudiada, obtendremos diferentes proporciones muestrales:
P̂
a la variable aleatoria formada por los distintos valores que toman las
proporciones muestrales.
301
La desviación típica de la variable "proporciones muestrales" es:
p(1 − p)
σ=
n
p(1 − p)
Para n suficientemente grande ⟹ p̂ → N (p, )
n
EJEMPLO: En una población se conoce que un 2% de la misma es
favorable a la construcción de un centro de rehabilitación para
toxicómanos. Si suponemos que en un barrio de la misma viven 500
personas. Calcula la probabilidad de encontrar en dicho barrio más
de 9 personas favorables a la construcción de dicho centro.
302
En la siguiente escena puedes observar el comportamiento de la
distribución de las proporciones muestrales cuando cambias el
tamaño de la población.
Escena 7.5. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
303
7.4 Distribución en el muestreo de las medias
muestrales
Supongamos que tenemos una población de la que se conoce la
media y la desviación típica, llamémoslas:
Media = μ
Desviacioˊn tˊıpica = σ
Supongamos también que extraemos muestras de tamaño “n” de
dicha población. Cada muestra proporcionará una determinada
media (media muestral).
304
Llamamos a la variable aleatoria que toma los distintos valores de las
medias muestrales de tamaño "n"
X̂
Las características principales de esta variable aleatoria son:
X̂ = μ
σ
n
n
305
Video
306
b) p(98 ≤ X̂ ≤ 102) = p( 98−100 3,2 )
102−100
3,2 ≤z≤
= 0(−0, 62 ≤ z ≤ 0, 62)
p(z ≤ 0, 62) − p(z ≤ −0, 62) = 0, 4648
Escena 7.6. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
307
7.5 Teorema central del límite
El teorema central del límite es sin duda el resultado más importante
relacionado con el muestreo y las distribuciones en el muestreo de
las medias muestrales y de las proporciones muestrales. Este
resultado tiene muchas versiones. Una de las más simples es la que
sigue:
Media = μ
Desviacioˊn tˊıpica = σ
Entonces se verifica:
X̂ = μ
σ
Sn =
n
308
1) Si se sabe que la población de partida es normal entonces sea cual
sea el tamaño de las muestras, la distribución de las medias
muestrales será una distribución normal.
Video
En el siguiente vídeo podemos observar Una clase sobre teorema
central del límite.
309
En las siguientes escenas puedes comprobar la tesis del teorema
central del límite en tres casos de distribuciónes de partida. El primer
caso sobre una población de partida normal, el segundo con una
distribución de partida no normal sesgada a la derecha y en el tercer
caso partiendo de una distribución uniforme.
Escena 7.7. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
310
Teorema central del límite en una distribución de
partida no normal, sesgada a la derecha
Escena 7.8. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
311
Teorema central del límite en una distribución de
partida uniforme
Escena 7.9. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
312
7.6 Problemas resueltos
A continuación tienes el enunciado de diferentes problemas.
Trabájalos y una vez los hayas resuelto puedes hacer clic sobre el
botón para ver la solución.
313
7.7 Créditos del capítulo
314
Parte VIII
Inferencia estadística
Intervalos de confianza
319
8.2 Estimación. Estimación puntual y estimación
por intervalos
Al proceso mediante el cuál inferimos valores de parámetros
poblacionales a partir de los resultados obtenidos en una muestra
extraida aleatoriamente se denomina estimación.
320
En los estudios estadísticos se pueden utilizar diferentes estimadores
para un mismo parámetro. Dos de las características principales que
poseen los estimadores son el sesgo y la eficiencia.
321
La estimación puntual es poco útil como aproximación del parámetro
poblacional que se desea estimar ya que solamente proporciona un
valor concreto, el cual además varía con cada elección de la muestra.
Desde el punto de vista estadístico, es mucho más interesante no
concretar un valor sino obtener un intervalo dentro del cuál se tiene
cierta confianza de que se encuentre el parámetro poblacional
desconocido y objeto principal de nuestra estimación.
322
(1 − α)
Nivel de significación o de riesgo: Es la diferencia entre la certeza y
el nivel de confianza deseado, es decir
Zα/2
323
Por ejemplo, cuando decimos que en un estudio hecho por una
empresa se estimó que la estatura media de los jóvenes españoles
oscila entre 172 cm y 178 cm, y que el trabajo se realizó con un nivel
de confianza del 95%, entendemos que la verdadera estatura media
poblacional será seguramente un valor comprendico entre los dos
anteriores y que la probabilidad de que el intervalo [172, 178]
realmente cubra a la verdadera estatura media es de 0, 95.
Entendiendo esto último como que si realizamos la estimación por
ejemplo 100 veces, con la elección de 100 muestras aleatorias
distintas, aproximadamente 95 de nuestras respuestas en forma de
intervalos de confianza cubriran al verdadero valor del parámetro
estatura media poblacional. ¿Será nuestra respuesta [172, 178] uno
de estos intervalos, digamos buenos? Hay un 95% de posibilidades de
que sí.
p̂
Sabemos que la distribución en el muestreo de las proporciones
muestrales, sigue una normal de parámetros
p(1 − p)
N (p, )
n
ˆ−p
p̂
= z seguira
ˊ una N (0, 1)
p(1−p)
n
±x α2
(1 − α)
bastaría con ir a la tabla de la normal y localizar el valor que deja un
barrido a su izquierda de
α
1−
2
325
De lo anterior, la notación empleada. Por ejemplo, para calcular los
valores críticos asociados a un nivel de confianza del 95% se
razonaría:
p̂(1 − p̂)
p̂ ± z α2 ⋅
n
326
EJEMPLO: En una muestra de 100 personas extraida de una
población, 20 de ellas son portadoras de cierta enfermedad. Estima
un intervalo de confianza a un nivel del 95% para la proporción de
personas portadoras de la enfermedad.
20
p̂ = 100= 0, 2
Para 1 − α = 0, 95 ⟹ z α2 = 1, 96
0,2⋅0,8
0, 2 − 1, 96 ⋅ 100
= 0, 2 − 0, 0784 = 0, 1216
0, 2 + 1, 96 ⋅ 0,2⋅0,8
100
= 0, 2 + 0, 0784 = 0, 2784
327
Intervalos de confianza, estimación de una proporción
poblacional
Escena 8.1. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
328
por ejemplo la estatura media de los alumnos de primaria de una
ciudad. Supongamos también que extraemos una muestra aleatoria
simple de tamaño “n” en la que obtenemos un valor concreto para la
media muestral. Sabemos que si la población de partida es normal o el
tamaño de la muestra es mayor de 30, la distribución en el muestreo
de las medias muestrales sigue una normal de parámetros:
σ
X̂ → N (μ, ) ⟹ Tipificando
n
X̂ − μ
⟹ σ sigue una N (0, 1)
n
(1 − α)
Simplemente mirando y deduciendo en la tabla de la normal N (0, 1)
p( − z α2 ≤ z ≤ z α2 )
⎧ X̂ σ−μ = −z α2 ⟹ X̂ = μ − z α2 ⋅ σ
⎨ n
n
=1−α ⟹
⎩ X̂ σ−μ
= +z ⟹ X̂ = μ + z ⋅ σ
α α
2 2 n
n
329
σ
X ±z ⋅ α
2
n
La media muestral X = 102
Para 1 − α = 0, 90 ⟹ z α2 = 1, 64
Aplicando la fórmula:
2 2
102 − 1, 64 ⋅ 400
= 102 − 1, 64 ⋅ 20
= 102 − 0, 164 = 101, 836
2 2
102 + 1, 64 ⋅ 400
= 102 + 1, 64 ⋅ 20
= 102 + 0, 164 = 102, 164
330
Video
331
Intervalos de confianza, estimación de media
poblacional
Escena 8.2. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
μ
332
Consideremos también que extraemos una muestra aleatoria simple
de tamaño “n” en la que obtenemos un valor concreto para la media
muestral. Sabemos que si la población de partida es normal o el
tamaño de la muestra es mayor de 30, la distribución en el muestreo
de las medias muestrales sigue una normal de parámetros:
σ
X̂ → N (μ, )
n
⟹ Tipificando
X̂ − μ
⟹ σ sigue una N (0, 1)
n
333
Video
Desviacioˊn tˊıpica poblaicional = σ
σ → Ŝ
Cuasidesviacioˊn tˊıpica Ŝ
334
En esta distribución pueden calcularse los valores que encierran una
probabilidad de
(1 − α)
Simplemente mirando y deduciendo en la tabla de la normal N (0, 1)
p( − z α2 ≤ z ≤ z α2 )
⎧ X̂ −μ = −z α2 ⟹ X̂ = μ − z α2 ⋅ Ŝ
= 1 − α ⟹ ⎨ X̂ −μ
Ŝ n
n
⎩
= +z α2 ⟹ X̂ = μ + z α2 ⋅ Ŝ
Ŝ n
n
. Teniendo en
cuenta que no se conoce la media poblacional μ; la sustituimos por la
media muestral obtenida X , llegando así a la siguiente expresión para
determinar el intervalo de confianza:
Ŝ
X ± zα/2 ⋅
n
n−1
i=1
335
n
(xi − μ)2 ⋅ fi
Ŝ = ∑
n−1
i=1
n
(xi − μ)2 ⋅ fi n
⟹ ∑ ⋅
n−1
n
i=1
n
n (xi − μ)2 ⋅ fi
⟹ ⋅∑
n−1 n
i=1
n
n (xi − μ)2 ⋅ fi
⟹ ⋅ ∑
n−1
n
i=1
n
= S
n−1
En consecuencia:
n
Ŝ = S
n−1
336
Intervalo de confianza para la media poblacional
Desconocida la desviación típica de la población
Escena 8.3. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
337
8.4 Error máximo admisible
Vamos a imaginarnos un juego. Supongamos que hay situada una
linea en el suelo que se encuentra a cierta distancia de nosotros. El
juego consiste en lanzar un palo que puede ser de disitintas
longitudes y tratar de que alguna de las partes de nuestro palito
toque a la línea dibujada en el suelo.
Por lógica mientras más pequeño sea el palo que lanzamos más difícil
será tocar la línea y al contrario, con uno más largo la dificultad será
menor. Evidentemente los jugadores mejores en este juego
necesitarán un longitud de palo más pequeño que los peores. Las
reglas del juego deben fijar por tanto una longitud máxima para los
palitos, algo parecido a lo que en intervalos de confianza llamaremos
error máximo admisible.
p̂ ⋅ (1 − p̂)
E = zα/2 ⋅
n
339
Para el caso del tamaño muestral, al estar en un denominador, cuando
aumenta disminuye el radio del intervalo. por tanto ganamos
precisión.
340
Intervalo de confianza para estimar una
proporción poblacional desconocida
Escena 8.4. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
341
8.4.2 Error máximo admisible (media poblacional)
σ
E = z α2 ⋅
n
Ŝ
Ez α2 ⋅
n
342
En las siguiente escena puedes observar cómo varía el error máximo
admisible, es decir, el radio del intervalo y por tanto la longitud del
mismo cuando cambiamos los controles correspondientes al nivel de
confianza y al tamaño de las muestras consideradas.
343
Intervalo de confianza para la media poblacional
Conocida la desviación típica de la población
Escena 8.5. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
345
Por ejemplo:
346
Para un nivel de confianza:
(1 − α)
Deduciendo de la fórmula correspondiente al error máximo
admisible en el caso de la proporción:
347
Llegamos a la siguiente expresión para el tamaño mínimo de muestra
en el caso de estimación de una proporción
z α2
n ≥ ( ) ⋅ p ⋅ (1 − p)
E
348
Escena 8.6. Escena desarrollada por Juan Jesús Cañas Escamilla(RED Descartes)
349
8.6 Tamaño muestral mínimo para la estimación
de la media.
Consideremos dos nuevas situaciones:
350
Fijados estos, simplemente despejando algebraicamente en las
fórmulas, podemos calcular el tamaño mínimo de la muestra que
debe utilizarse para cumplir con las premisas estipuladas.
(1 − α)
Deduciendo de la fórmula correspondiente al error máximo
admisible en el caso de la estimación de media poblacional con
deviación típica conocida:
Error maˊx admisible = z α2 ⋅ σn
z α2 ⋅ σn ≤ E ⟹ despejando n
2
⟹ (z α2 ⋅
σ
n
) ≤ E 2 ⟹ = z 2α ⋅
σ2
n
≤ E2
2
2 σ2
⟹ zα ⋅
E2
≤ n
2
2
n ≥ (z α2 ⋅ )
σ
E
351
Error maˊx admisible = z α2 ⋅
Ŝ
n
z α2 ⋅
Ŝ
n
≤ E ⟹ despejando n
2
⟹ (z α2 ⋅ )
2
Ŝ
n
≤ E 2 ⟹ = z 2α ⋅ Ŝn ≤ E 2
2
2
⟹ z 2α ⋅ EŜ 2 ≤ n
2
2
n ≥ (z α2 ⋅ )
Ŝ
E
352
En la siguiente escena puedes calcular diversos tamaños muestrales
variando los controles correspondientes al nivel de confianza y al
error máximo admisible.
Escena 8.7. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
353
De la misma manera, puedes practicar en la siguiente escena en la
que la desviación típica poblacional se sustituye por las cuasi-
desviaciones típicas muestrales.
Escena 8.8. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
354
Es bueno disponer por tanto de un formulario resumen y sencillo al
que acudir cuando se tiene alguna duda en cuanto a la fórmula a
utilizar o en la expresión de la misma.
355
8.8 Problemas resueltos
A continuación tienes el enunciado de diferentes problemas.
Trabájalos y una vez los hayas resuelto puedes hacer clic sobre el
botón para ver la solución.
356
8.9 Créditos del capítulo
357
Parte IX
Contraste de Hipótesis
362
En estadística para decidir sobre dos situaciones competitivas,
complementarias y excluyentes recurriremos al procedimiento
conocido por el nombre de Contraste de Hipótesis.
363
Es decir, lanzamos una moneda al aire 15 veces y aceptamos la
hipótesis nula (la moneda no está trucada) si el número de caras
obtenidas está entre 2 y 13. Si (H0 ) es cierta y el resultado de nuestro
de tipo II o error β .
364
La hipótesis contraria se designa por H1 y se llama Hipótesis
Por ejemplo:
H0 : μ = 100 gramos
H1 : μ =
100 gramos
H0 : p ≥ 0, 45
H1 : p < 0, 45
H0 : μ ≥ 7, 785
H1 : μ < 7, 785
365
Por el contrario, el abogado
defensor no tiene que demostrar, su
labor es más defensiva ya que si el
fiscal no demuestra su acusación
entonces el reo será declarado (no
culpable), es decir, inocente.
Evidentemente esto es un
planteamiento muy simple de la
situación ya que a menudo los abogados defensores van más allá de
la pura estrategia defensiva y tratan de demostrar la inocencia,
aunque siempre subyace el lema in dubio pro reo, (en caso de duda, a
favor del reo) al que todos estamos acostumbrados o el de es
preferible no condenar a 10 culpables que condenar a un solo inocente.
366
Unilateral derecho: llamamos contraste unilateral derecho
a aquél en el que la hipótesis nula se formula en términos de
menor o igual y la alternativa en términos de mayor. En estos
casos la región de aceptación sería el área que deja a su
izquierda el valor crítico que previamente determina el nivel
de significación.
367
En los ejemplos planteados al principio, el primero sería un contraste
bilateral, el segundo y tercero unilaterales izquierdos.
368
2. Elección del estadístico de contraste (en nuestro caso media o
proporción muestral).
p̂ − p0
Z=
p0 ⋅(1−p0 )
n
X − μ0
Z=
σ/ n
369
Estadístico de contraste para el caso de ua media con desviación
típica poblacional desconocida.
X − μ0
Z=
Ŝ / n
370
La escena te lo proporciona directamente aunque te recomendamos
que utilices la tabla de la normal y después compares tus resultados
con los que ofrece la escena.
Escena 9.1. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
371
En la siguiente escena puedes practicar con la localización de la
región crítica en contrastes bilaterales.
Escena 9.2. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
372
Región de aceptación y rechazo en un contraste unilateral
izquierdo.
373
Escena 9.3. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
374
El valor en este caso del estadístico de contraste sería:
40 103, 25 − 100
Cuasi Ŝ = ⋅ 5, 345 ⟹ Ŝ = 5, 413 ⟹ 5,413
= 3, 797
39
4
375
Para el caso de rechazo de la hipótesis nula.
H0 ⟹ μ = 120 euros
H1 ⟹ μ =
120 euros
X − μ0
Z=
Ŝ
n
1 − α = 0, 99 ⟹ {
−Zα/2 = −2, 575
= 2, 575
Zα/2
376
X0 = 128
100
Valor particular de S0 = 40 ⟹ Ŝ =
99
⋅ 40 = 1, 005 ⋅
40 = 40, 2015
128 − 120
Z= = 1, 9899
40, 2015/10
377
Videos
En el primer vídeo puedes ver una clase resumen de planteamiento
general de un problema de contraste de hipótesis. Y en el segundo
otra clase de introducción al contraste de hipótesis.
378
9.3.1 Contraste de hipótesis para una proporción.
} Ya que pretendemos demostrar que la
H0 : p ≤ 0, 75
: p > 0, 75
H1
proporcioˊn ha mejorado
120
= 0, 89166. Al ser un
constraste unilateral derecho. Determinamos la región de aceptación
y rechazo para un nivel de significación de α = 0, 025.
379
Calculamos ahora el estadístico de contraste:
0, 891666 − 0, 75 0, 141666
Z= = = 3, 5839
0, 03952847
0,75⋅(1−0,75)
120
3, 5839 ∈
/ (−∞, 1, 96) ⟹ Rechazamos H0
Conclusión:
380
En las siguientes escenas se ofrece una esquematización de los pasos
a dar en un contraste de hipótesis para una proporción para los casos
de contraste bilateral, unilateral derecho o unilateral izquierdo.
381
Contraste de hipótesis bilateral para una proporción
Escena 9.4. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
382
Contraste de hipótesis unilateral derecho para una
proporción
Escena 9.5. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
383
Contraste de hipótesis unilateral izquierdo para una
proporción
Escena 9.6. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
384
En estadística inferencial el barómetro universal que cuantifica si el
cambio observado es fruto de las fluctuaciones propias del azar o
bien se trata de un cambio mucho más importante o significativo es el
contraste de hipótesis para la media. Partamos de un ejemplo:
385
En este caso el planteamiento del contraste quedaría como sigue:
μ0 = 23, 75 ⎫
⎬ ⟹ z=
σ = 4, 875 25, 34 − 23, 75
= 3, 58769
( 4,875 )
⎭
= 121
n
121
= 25, 34
3, 58769 ∈
/ (−∞, 1, 751) ⟹ Rechazamos H0
Conclusión:
386
En la siguiente tabla se resumen de forma muy concisa toda la
formulación necesaria para la realización de un problema de
cualquier tipo de contraste para una media.
387
Puedes practicar tanto como desees. Es recomendable observar lo
que ocurre con un contraste de una media para distintos niveles de
significación y también si varía mucho o poco la opción de desviación
típica poblacional conocida o desconocida.
Escena 9.7. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
388
Contraste de hipótesis unilateral derecho para la media
Escena 9.8. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
389
Contraste de hipótesis unilateral izquierdo para la
media
Escena 9.9. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
390
Asumiendo que la elección está en gran parte supeditada a estos
valores concretos escogidos de una muestra específica, el error se
antoja como algo natural y por tanto consustancial al propio proceso
del contraste de hipótesis. Puesto que el error es protagonista
irrenunciable, aprendamos a convivir con él, estudiarlo, acotarlo y
por supuesto utilizarlo.
391
Ahora bien, la probabilidad de que una moneda cargada se lance 10
veces y obtengamos entre 1 y 9 caras no puedo calcularla ya que no
sé qué probabilidad de salir cara tienen las monedas cargadas. El
error por tanto no puedo controlarlo como antes, no tiene la misma
naturaleza que el primero.
Este ejemplo puede ilustrar los dos tipos de errores que se pueden
cometer al realizar un contraste de hipótesis.
392
En la siguiente tabla se resumen todas las situaciones y errores
posibles al realizar una prueba de contraste de hipótesis.
393
Los valores más usados para el nivel de significación en los trabajos
de inferencia suelen ser.
α = 0, 05
α = 0, 01
α = 0, 1
indicaciones:
En H1 siempre debemos colocar lo que realmente
equivocamos.
394
En caso de duda, siempre elegir un test con dos colas, sólo
cuando el planteamiento es muy claro se elige un test de una
cola.
Puedes cambiar los controles con los valores que desees. Trata de
interpretar las distintas situaciones que van apareciendo. Quizás el
control más determinante sea el de las "medias muestrales".
395
Situación general de error tipo I en contraste bilateral
Escena 9.10. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
396
Situación general de error tipo I en contraste unilateral
izquierdo
Escena 9.11. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
397
Situación general de error tipo I en contraste unilateral
derecho
Escena 9.12. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
398
Pero ¿cuál es beta? De hecho, sería una información ciertamente
relevante poder comunicar en un estudio de contraste el valor de
este tipo de error. En los paquetes estadísticos no se da información
de este error ya que sería necesario concretar el valor de H1 . Sin
399
Estadístico de contraste:
19 − 18
z= = 1, 666
( )
3,6
36
X − 18
z= < 1, 6957 ⟹ X − 18 < 1, 01742
( 3,6
)
36
26
400
La siguiente imagen ilustra la situación típica para el error de tipo II
401
En las escenas debes observar los controles y como influyen en el
resultado del contraste. También es importante que aprecies que en
el momento en que se acepta la hipótesis nula por estar el valor del
estadístico "z " dentro de la zona de aceptación, en la parte inferior
aparece el cálculo del posible error tipo II. Importante también es
entender que en el momento en que se rechaza la hipótesis nula,
desaparece la posibilidad de calibrar el error tipo II.
Escena 9.13. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
402
Situación general de error tipo II en contraste
unilateral derecho
Escena 9.14. Escena desarrollada por Juan Jesús Cañas Escamilla (RED Descartes)
403
9.5 Problemas resueltos
A continuación tienes el enunciado de diferentes problemas.
Trabájalos y una vez los hayas resuelto puedes hacer clic sobre el
botón para ver la solución.
404
9.6 Créditos del capítulo
405
Bibliografía
406