Tema 58 PDF
Tema 58 PDF
Tema 58 PDF
1. INTRODUCCIÓN
1.1. Localización
1.2. Objetivos y contenidos.
1.3. Indicaciones
4. TIPOS DE MUESTREO.
4.1. Muestreo aleatorio o probabilístico.
4.2. Muestreo no aleatorio o no probabilístico.
BIBLIOGRAFÍA
ESQUEMA RESUMEN
CUESTIONES
©MELC S.A.
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
1. INTRODUCCIÓN
1.1. Localización
Este es un tema del bloque de Estadística y Teoría de Probabilidades que incluye básicamente
los temas del 57 al 68 del temario. El tema que nos ocupa pertenece a la parte del bloque
dedicada a la estadística.
El tema comienza con una descripción del origen de la Estadística como ciencia y su relación
con otras ciencias.
En la última sección se dan las definiciones de los parámetros fundamentales de una población
y una muestra: media y desviación típica. A continuación, se desarrolla brevemente la teoría
inferencial suficiente para introducir dos resultados fundamentales que relacionan a la media
poblacional y la media muestral: la ley de los grandes números y el teorema central del límite.
Se dan aplicaciones para la inferencia de la media poblacional a partir de la muestral mediante
intervalos de confianza y en este mismo sentido se observa la acotación mínima para el tamaño
muestral con una confianza determinada.
www.magister.es
2
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
1.3. Indicaciones
Para una exposición de dos horas de duración podría seguirse la siguiente estrategia:
1. Situar el tema dentro del temario e indicar sus relaciones con otros temas. Indicar los
objetivos. Escribir en la pizarra el orden de la exposición sin demasiados detalles.
2. Explicar la doble vertiente histórica que da lugar a la Estadística y algunos de sus
matemáticos más importantes.
3. Dar una definición de Estadística.
4. Caracterizar lo que es un fenómeno aleatorio y determinista.
5. Definir el concepto de población e individuo de un fenómeno aleatorio.
6. Definir censo y marco de un fenómeno aleatorio.
7. Definir el concepto de muestreo.
8. Introducir la definición de muestra y tamaño muestral.
9. Dar una explicación sobre lo que se considera muestra representativa.
10. Definir encuesta y el error de muestreo o sesgo.
11. Dar las características del muestreo aleatorio o probabilístico.
12. Dar los seis ejemplos básicos de muestreo aleatorio con sus ventajas y sesgos.
13. Dar las características del muestreo no aleatorio o no probabilístico.
14. Dar los seis ejemplos básicos de muestreo no aleatorio con sus ventajas y sesgos.
15. Definir la media, varianza y desviación típica poblacional.
16. Introducir el concepto de muestra aleatoria simple a partir de una variable aleatoria.
17. Dar brevemente la definición de estimador y la definición de estimador insesgado y
consistente.
18. Dar como ejemplos de estimadores la media, varianza y cuasivarianza muestral.
19. Enunciar las propiedades de la media muestral.
20. Enunciar las propiedades de la varianza y cuasi varianza muestral.
21. Introducir y demostrar la ley de los grandes números. Explicar su importancia eon relación
a la media muestral y poblacional para muestras grandes.
3 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
22. Enunciar el teorema central del límite y aplicar para la estimación de la media poblacional
mediante intervalos de confianza para tamaños muestrales elevados.
23. Explicar el concepto de valor esperado o esperanza matemática.
Para la realización de una prueba escrita podrá elaborarse un esquema similar al anterior. Sin
embargo, dado que en general no es posible desarrollar los contenidos con igual amplitud, son
aconsejables las siguientes modificaciones:
Escribir el título del tema destacado del resto al comienzo de la primera hoja del ejercicio.
Dividir el ejercicio en secciones en una forma similar a la que empleamos en el texto.
A continuación del título comenzar con la sección de introducción. En esa sección
comenzar describiendo con brevedad la situación del tema dentro del temario.
Dejar un espacio libre a continuación para completar la introducción al final del resto del
ejercicio. En ese espacio comentaremos finalmente, también con brevedad, los contenidos
que incluimos del tema.
Desarrollar el tema diferenciando claramente definiciones, listas de propiedades, teoremas
y comentarios generales.
Si no se recuerda con exactitud una demostración (que se considere importante para el
desarrollo del tema) deberían incluirse algunos comentarios sobre el enunciado, y uno o dos
ejemplos ilustrativos.
Como norma general, podría ser útil a la hora de realizar el examen escrito empezar cada
sección en una nueva hoja. De esta forma, si hemos eliminado partes del desarrollo del
tema, será posible, si disponemos de tiempo, completar algunos aspectos antes de entregar
el ejercicio.
Otro aspecto muy importante en el ejercicio escrito es la presentación. Sería recomendable
numerar los gráficos y las tablas que se realicen (para poder referirnos a ellos en el texto) y
situarlos siempre al mismo lado de la hoja. Dentro de las posibilidades de cada cual, sería
también recomendable cuidar la escritura (letra clara, líneas de escritura más o menos
paralelas, . . ., etc.)
En nuestros días los métodos estadísticos ocupan un lugar prominente en las distintas ciencias
tanto naturales como sociales y constituyen una de las herramientas más utilizadas y apreciadas
por los investigadores. La estadística actual es el resultado de la confluencia de dos disciplinas
que evolucionaron independientemente hasta unirse en un cuerpo común hacia el siglo XIX:
El cálculo de probabilidades que nace en el siglo XVII como teoría matemática de los
juegos de azar (dados, barajas, lotería, etc.).
La "estadística" (o ciencia del estado, del latín Status) que estudia la descripción de datos y
tiene raíces muy antiguas (los primeros censos conocidos se remontan a los chinos,
realizados 2.000 años a.J.C.).
www.magister.es
4
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
Los orígenes de la estadística inferencial están ligados a la teoría de errores y al método de ajuste
por mínimos cuadrados (Gauss y Markov). La teoría moderna del muestreo, la estimación y el
contraste de hipótesis se debe a la escuela anglo-americana (Fisher, Pearson y Neyman).
La estadística es, aparte de un importante objeto de estudio como parte de las matemáticas, una
de las más importantes herramientas de las ciencias aplicadas y de la técnica. Los datos
numéricos son la información más habitual que extraemos del mundo que nos rodea y la
estadística se utiliza siempre que es necesario analizar datos como, por ejemplo, en las ciencias
de la naturaleza como la física, la química, la biología, economía, sociología o medicina.
La estadística estudia por tanto fenómenos aleatorios o de azar que se pueden definir como
aquellos experimentos caracterizados por las dos propiedades siguientes:
Presentan notables variaciones en los efectos, de modo que resulta imposible predecir el
resultado de una experiencia particular.
Ejemplos de fenómeno aleatorio son el sondeo de intención de voto en unas elecciones, mientras
que ejemplo de un fenómeno determinista es el cálculo de la velocidad de un móvil en el vacío.
5 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
Ejemplo: Cada una de las personas con posibilidad de votar en unas elecciones bajo el
fenómeno aleatorio “Intención de voto”.
Ejemplo: El conjunto formado por todas las personas que tienen posibilidad de votar en unas
elecciones bajo el fenómeno aleatorio “Intención de voto”.
Para el estudio del fenómeno aleatorio sobre una población, es necesario inicialmente
contrastar el resultado de dicho fenómeno en cada individuo de alguna de las poblaciones
definidas anteriormente. A este procedimiento lo denominaremos censo o marco.
www.magister.es
6
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
En muchas ocasiones, no es posible realizar un censo o marco por muy diferentes motivos, y
entre otros:
En las situaciones donde no es posible realizar un estudio del influjo del fenómeno aleatorio
mediante censos o marcos, se aplica la teoría de muestreo.
Definición de muestra representativa: Es aquella muestra que logra una versión simplificada
de la población, y reproduce, de algún modo, el mismo comportamiento y características ante
el fenómeno aleatorio que esta, pero a pequeña escala y siempre que su estudio sea viable.
La recogida de los datos sobre los individuos de un censo o muestra se llama encuesta.
Es evidente que todo proceso de muestreo lleva asociado un error, debido a la obtención de
conclusiones respecto de valoraciones sobre una muestra y no sobre el total de la misma. A
esto se denomina error o sesgo del muestreo.
7 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
Por otra parte, llamaremos falacia a las inferencias o conclusiones erróneas que podamos
realizar a partir de una muestra respecto del estudio de un fenómeno aleatorio sobre una
determinada población. La teoría del muestreo trata de impedir y minimizar la aparición de
falacias, aunque pueden llegar a presentarse incluso con muestras representativas, si las
condiciones de estudio no son las adecuadas o están sesgadas intencionadamente.
4. TIPOS DE MUESTREO.
Una tabla de números aleatorios es un conjunto ordenado de dígitos generado de tal forma que
cada dígito 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 tiene la misma probabilidad de aparecer en cada lugar del
conjunto.
www.magister.es
8
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
Las calculadoras y los ordenadores poseen programas sencillos para generar tablas de números
aleatorios. De forma rudimentaria, podemos generar una tabla de números aleatorios poniendo
en una bolsa diez etiquetas con los diez dígitos y sacándolas una a una con reposición.
Para crear una muestra aleatoria de tamaño n con una tabla de números aleatorios se procede de
la forma siguiente:
o Se asigna una etiqueta numérica con la misma longitud a cada elemento de la población. Si
hay 100 elementos empezaríamos con 00 y acabaríamos en 99. Si hay 1000 elementos
tendríamos que empezar con el 000 y acabar con el 999.
Si los elementos de la población están ordenados en una lista elaborada al azar con un número
de individuos N y se desea extraer una muestra de tamaño n (n ≤ N), se puede proceder en la
forma siguiente: Se divide la población en n subconjuntos de los que se extraen un elemento de
cada uno de ellos. El modo de proceder para la selección de un elemento de cada conjunto es el
siguiente: primero se determina el entero k más próximo al cociente N / n. Después se elige al
azar un elemento n1 de los k primeros de la lista y, por último, se van tomando sucesivamente
los elementos n1 + k, n1 + 2k hasta n1 + (n – 1)k.
9 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
www.magister.es
10
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
Es un muestreo aleatorio bastante complejo que trata de obtener la muestra mediante etapas y
que puede presentar en cada etapa diferentes tipos de muestreo aleatorio como por ejemplo
conglomerados, estratificados, etc.
Es el que se utiliza, por ejemplo, en las encuestas y estudios sobre poblaciones distribuidas en
amplias zonas geográficas. Se divide el país en donde se encuentra la población en zonas
denominadas unidades primarias de muestreo (UPM). Dentro de cada UPM se forman áreas
más pequeñas del orden de 500 habitantes que se denominan distritos del censo (DC).
Para elaborar la encuesta se selecciona una muestra aleatoria de un cierto número de UPM, en
cada una de estas unidades se extrae una muestra aleatoria de DC y, finalmente, en cada DC de
la muestra aleatoria se extrae una muestra de individuos.
Esta forma de muestreo tiene ventajas obvias. Por un lado, no es necesario manejar la lista de
todos los individuos del país. Además, los individuos elegidos para la encuesta se encuentran
distribuidos en grupos concentrados geográficamente en unas pocas regiones, con lo que es
más barato el trabajo de los encuestadores.
Son aquellos muestreos en los que se incumplen las principales características del muestreo
aleatorio en lo que se refiere a la equiprobabilidad de cada individuo de la población en la aparición
en la muestra o que la población se mantenga constante. Sin embargo, en muchas ocasiones son
11 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
utilizados consciente o inconscientemente, puesto que son más sencillos de llevar a cabo y la
utilización de muestreos aleatorios suele presentar costes muy elevados o inasumibles.
Hay que tener en cuenta que este tipo de muestreo genera muestras que no tienen por qué ser
representativas y, por lo tanto, no se puede garantizar la fiabilidad acerca de las inferencias y
generalizaciones respecto al estudio del fenómeno aleatorio sobre la población mediante estas
muestras.
Pese a no haber condiciones de aleatoriedad, estos métodos tienen sus propios criterios para la
selección de los individuos de la muestra que procuran de alguna manera la representatividad
de la misma.
Por ejemplo, si queremos hacer una encuesta en una ciudad, lo más sencillo es ponerse en un
lugar concreto y preguntar a la gente que pasa.
Es un muestreo no aleatorio en el que se procede a seleccionar los individuos que deciden por
propia iniciativa y voluntariamente ser elementos de la muestra. Además, este tipo de muestreo
puede admitir la aparición en la muestra de repeticiones de individuos.
Por ejemplo, los muestreos vía sms que proponen los programas de televisión y radio son un
claro muestreo por voluntarismo.
www.magister.es
12
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
Por ejemplo, dentro del estrato “mujer” la cuota puede ser la selección de 30 mujeres con
edades comprendidas entre los 18 y 25. La selección final de las 30 mujeres puede llevarse a
cabo con o sin aleatoriedad.
13 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
La muestra se crea a sí misma a partir de la selección de varios individuos los cuales conducen
a otros, y estos a otros, y así hasta conseguir una muestra suficiente.
Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones
"marginales", delincuentes, determinados tipos de enfermos, etc.
www.magister.es
14
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones
"marginales", delincuentes, determinados tipos de enfermos, etc.
Sea una población cuyos individuos poseen una característica común descrita por una variable
estadística cuantitativa X que toma valores diferentes x1, x2, . . ., xr mediante una distribución
de frecuencias relativas f1, f2, . . ., fn.
X2 V ( X ) M (( X X ) 2 ) xi X 2 f i
i
X V (X ) x X fi
2
i
i
Observaciones.
1. Los valores o parámetros poblacionales media y desviación típica son esenciales para la
descripción y valoración de cada población.
2. En muchas ocasiones el estudio estadístico no se puede efectuar mediante censo y hay que
recurrir a muestras para el estudio de la población. En este sentido, uno de los objetivos
consistirá en inferir el valor de la media y la desviación poblacionales.
Michel Gamboa (2018) define variable estadística como las condiciones, factores o cualidades
que pueden ser observadas, tienen la propiedad de poder variar, de asumir valores, y por
tanto, es una característica medible (se necesitan escalas de medición).
Algunas de las propiedades de los parámetros media poblacional y desviación típica
poblacional son:
15 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
X M ( X ) f i xi f i xi M ( X )
i i
X Y M ( X Y ) f i , j xi y j f i , j xi f i , j yx j
i j i j
f i , j xi f i , j yi f i xi f j y j
i j i j i j
M ( X ) M (Y ) X Y
X Y M X Y f i , j xi y j
i, j
f i , j f i , f , j
y por tanto,
X Y M X Y f i , j xi y j f i , f , j xi y j
i, j i, j
f i , xi f , j y j M ( X ) M (Y ) X Y
i j
2 ( X ) M (( X M ( X )) 2 ) f i xi M ( X )2
i
www.magister.es
16
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
f i xI2 f i M ( X ) 2 2 M ( X ) f i xi
i i i
M ( X 2 ) M ( X ) 2 f i 2 M ( X ) M ( X )
i
M ( X 2 ) M ( X ) 2 2M ( X ) 2 M ( X 2 ) M ( X ) 2
2 X M (( X M ( X )) 2 ) M ( 2 ( X M ( X )) 2 )
2 M (( X M ( X )) 2 ) 2 X2
X2 Y M (( X Y ) 2 ) M ( X Y )2
M ( X 2 Y 2 2 X Y ) M ( X ) 2 M (Y ) 2 2M ( X ) M (Y )
M ( X 2 ) M (Y 2 ) 2M ( X Y ) M ( X ) 2 M (Y ) 2 2M ( X ) M (Y )
M ( X 2 ) M (Y 2 ) 2M ( X ) M (Y ) M ( X ) 2 M (Y ) 2 2M ( X ) M (Y )
M ( X 2 ) M ( X ) 2 M (Y 2 ) M (Y ) 2 X2 sY2
Definición de muestra aleatoria simple: Sea un fenómeno aleatorio en el que se estudia una
característica de una población sobre el que se mide un cierto parámetro asociado a la variable
estadística X con determinada distribución de probabilidades. Llamaremos muestra aleatoria
simple de la variable aleatoria X a la variable aleatoria n-dimensional:
17 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
Por tanto, si X es discreta con función de masa p(x), la función de masa conjunta de la muestra
aleatoria simple (X1, X2, . . ., Xn) será:
n
px1 , x2 ,. . . , xn pxk px1 px2 . . . pxn
k 1
n
f x1 , x2 ,. . . , xn f xk f x1 f x2 . . . f xn
k 1
Ejemplos.
1. Sea (X1, X2, . . ., Xn), la muestra aleatoria simple de una variable aleatoria X con
distribución de Poisson P() con un parámetro desconocido. La distribución de esta muestra
aleatoria simple vendrá dada por la función de masa:
n
xk
n n
x e k 1
e n
p x1 , x2 ,. . . , xn p xk
k
n
( x )!
k 1 k 1 ( xk )!
k
k 1
2. Sea (X1, X2, . . ., Xn), la muestra aleatoria simple de una variable aleatoria X con
distribución normal N(, ) con y parámetros desconocidos. La distribución de esta
muestra aleatoria simple vendrá dada por la función de densidad:
n
xk
2 xk 2
k 1
n n 2 2 2 2
f x1 , x2 ,. . . , xn f xk
e e
k 1 k 1 2 2
n
Para ello definiremos funciones n-dimensionales que estimen de un modo tan aproximado
como sea necesario al parámetro desconocido. Por tanto, estimar un parámetro es asignarle un
valor obtenido a partir de una medición de una función (estimador) del parámetro sobre una
muestra.
www.magister.es
18
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
Definición de estimador: Sea (X1, X2, . . ., Xn), una muestra aleatoria simple de una variable
aleatoria X con distribución conocida p(θ) y con θ parámetro desconocido. Se llama estimador
de un parámetro desconocido θ, a toda función T(X1, X2, . . . , Xn) que permita aproximar a
dicho parámetro. Se verifica que, como (X1, X2, . . ., Xn) es una muestra o variable aleatoria
que tiene una función de distribución, el estimador también gozará de los mismos privilegios.
Esta propiedad indica que el estimador elegido es una buena función para aproximar al
parámetro θ.
La elección del estimador adecuado para la inferencia del parámetro desconocido es una
cuestión bastante delicada y hay varios procedimientos para encontrarlos de manera centrada.
La media muestral: Sirve para estimar el parámetro media si es que este es desconocido
para la distribución de X.
1 n
T X1, X 2 , . . . , X n Xk
n k 1
T X1, X 2 , . . . , X n
1 n
Xk X
n k 1
2
n
T X1, X 2 , . . . , X n
1
Xk X
2
n 1 k 1
Se suele representar mediante S2.
19 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
1 n 1 n 1 n
M X k M X k M X i n X X
1
n k 1 n k 1 n k 1 n
1 n 1 2 n 1 n 2 X2
s X k 2 s X k 2 s X i 2 n X
2 1 2
n k 1 n k 1 n k 1 n n
Concluimos entonces que la media muestral es un estimador consistente para la media poblacional,
ya que, al hacer tender el tamaño muestral a valores grandes, la varianza tiende a cero.
Esta propiedad hace de la media muestral sea un gran estimador para la media ya que
“cuanto más grande sea el tamaño muestral de las muestras usadas, menos dispersa será
la media muestral". Es decir, los datos de la medición de la media muestral estarán tanto
más localizados cuanto más grande sea el tamaño de las muestras que empleamos. Por
tanto, según lo dicho antes, el estimador media muestral es consistente.
1 n
2
n
n n
1
M s 2 M X k X M X k2 X 2 X k X
2
n k 1 n k 1 k 1 k 1
1 n 2 n
1 n 2
M X k n X 2 X X k M X k n X 2 X n X
2 2
n k 1 k 1 n k 1
www.magister.es
20
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
1 n 2 1 n 2 1 n
M X k2 n X 2n X M X k2 n X M ( X k2 ) M ( X )
2
n k 1 n k 1 n k 1
1 2 2
n M (X 2) M (X ) M (X 2) M (X )
n
Como tenemos que s2(X) = M(X2) – M(X)2, entonces, para uno de los elementos de la resta
ocurrirá:
M X 2 s 2 X M X X2 X2
2
M X s X M X
2 2 2
X2
n
X2
n 1 n
2
n
1 n
xk X xk X
2
S2 s X2
n 1 k 1 n 1 n k 1 n 1
n
M S2 M
s2
n
M (s 2 )
n n 1 2
X X2
n 1 n 1 n 1 n
5.6. Relación entre la media muestral y poblacional: La ley de los grandes números.
Entre los resultados más importantes en la estadística están la ley de los grandes números y el
teorema central del límite. Ambos tratan sobre la media muestral.
Lo que se deduce de estos resultados es que la media muestral es una variable estadística tanto
más localizada alrededor de su media cuanto más grande sea el número n de variables que la
forman. En el límite de grandes valores de n solo hay probabilidad de encontrar la media
muestral concentrada en su valor medio.
21 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
Teorema de Chebyshev. Sea una variable aleatoria X con función de probabilidad asociada
Px. Sean μX y σX la media y desviación típica poblacionales respectivamente. Se verifica que,
Px | X x | k x 1
1
k 0
k2
Enunciamos ahora la ley de los grandes números. Este resultado es consecuencia fundamental de la
desigualdad de Chebyshef y juega un importante papel en la teoría de probabilidades y estadística
relacionando la media muestral y poblacional de una variable aleatoria X. En particular:
Proporciona una interpretación de la media como un valor esperado.
Proporciona en el caso binomial una formulación del concepto de probabilidad en términos
de límites de frecuencias.
Ley de los grandes números: Dada una variable aleatoria simple (X1, X2, . . ., Xn) de una
variable estadística X con distribución conocida p(θ) y con θ parámetro desconocido. Se
verifica que
lim Px X x 1
n
Demostración.
Dada la variable aleatoria simple (X1, X2, . . ., Xn) de una variable estadística X con
distribución conocida y teniendo en cuenta que la v.a X tiene media y desviación:
E X x
sX
x
n
1
Px | X x | k x 1 2 k 0
n k
Px | X x | 1 x2
n 2
www.magister.es
22
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
2
lim Px | X x | lim 1 x 2 1
n n
n
Y concluimos
lim Px X x 1
n
Observaciones.
1. La ley de los grandes números explica que la media muestral es una variable aleatoria que,
bajo cualquier distribución, tanto más cercana es a la media poblacional de la variable X de
la que procede al aumentar el número de variables que la forman.
lim Px X p 1
n
Es decir, que cuantas más repeticiones o experimentos de Bernoulli independientes e
idénticos realicemos, más aproximación existe entre la media muestral o proporción de
éxitos y el valor poblacional p.
3. El valor medio o media aritmética de una variable aleatoria M(X) o E(X) recibe el nombre
a menudo de valor esperado o esperanza matemática de la v.a. X. La razón de esta
denominación está en la ley de los grandes números ya que cuando se repite un número
grande de veces la medición de la v.a. X, la media aritmética en cada caso es una media
muestral que, de acuerdo con la ley de los grandes números será con gran probabilidad muy
cercana al valor de la media poblacional μx.
Teorema central del límite: Sea X una variable estadística. Dado un intervalo I
cualquiera de la recta. Para cada n natural sea pn ( X I ) , la probabilidad de que la media
muestral esté en el intervalo I. En este caso,
lim pn ( X I ) N ( x, , )dx
n I
n
23 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
Observaciones.
1. Lo que el teorema expresa es un resultado general que nos dice que, para tamaños
muestrales suficientemente grandes, la media muestral es una variable estadística con
distribución normal de media, la media poblacional y de desviación, el cociente de la
desviación poblacional entre la raíz cuadrada del tamaño muestral.
X N X , X
n
Veamos ahora la aplicación directa de este teorema para la inferencia de la media poblacional a
partir de la media muestral utilizando intervalos de confianza.
Si dada una variable estadística X con distribución de desviación típica conocida σX,
deseamos formar un intervalo de confianza ( X – ε, X + ε) para la media poblacional para
tamaños muestrales suficientemente grandes entonces el teorema central del límite asegura
que:
lim pn ( X X X ) N ( x, , )dx
n I
n
O lo que es lo mismo,
lim pn ( X X ) N ( x, , )dx
n I
n
X X
lim pn 1
X n X n X n
n
z / 2
X n
En tal caso,
X
z / 2
n
www.magister.es
24
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
De este modo, para inferir acerca de la media poblacional μ X podemos utilizar de nuevo la
media muestral ya que con una confianza 1 – α, la media poblacional se encontrará, para
muestras suficientemente grandes, en el intervalo
X
X z / 2 X , X z / 2
n n
se distribuye según una t de Student con n – 1 grados de libertad., a la que denotamos por tn – 1.
X X
lim pn 1
n
n
S n S n n S n / n
lim pn tn 1 1
n
n
S n S n n
tn 1, / 2
Sn n
En tal caso,
Sn
tn 1, / 2
n
25 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
S Sn
X tn 1, / 2 n , X tn 1, / 2
n n
Concluimos que para inferir acerca de la media poblacional μ X podemos utilizar de nuevo
la media muestral ya que con probabilidad 1 – α la media poblacional se encontrará, para
muestras suficientemente grandes, en el intervalo
S Sn
X tn 1, / 2 n , X tn 1, / 2
n n
Observaciones.
1. Este procedimiento nos determina una cota inferior para el tamaño muestral ya que dada la
desviación conocida σ X, un valor ε > 0 cualquiera y una confianza 1 – α establecida de que
la media poblacional y la muestral se diferencian como máximo en ε, el menor natural n
que cumple es tal que,
X
2
z / 2 n z / 2 x n z / 2 x
n
El valor medio o media poblacional μ X = M(X) de una variable estadística recibe a menudo el
nombre de valor esperado o esperanza matemática de la variable X.
La razón de estas denominaciones radica en los resultados de los teoremas de la ley de los grandes
números y central del límite. La cuestión es que cuando uno repite la medición de una variable
cualquiera X un número grande de veces, el valor medio de los resultados es una media muestral de
tamaño grande y por tanto de acuerdo con los teoremas anteriores ese valor medido será con gran
probabilidad muy cercano al valor medio o media poblacional μ = M(X) de X.
www.magister.es
26
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
cabo de un cierto tiempo. Lo que ocurre es que M(X) es una media muestral y cuanto más
tiempo transcurre más grande va siendo el tamaño de la muestra que emplea, con lo que se
entra en un régimen en que se aprecia la ley de los grandes números.
Ejemplo. Supongamos un juego en que el premio es una cantidad a si se gana y tal que la
probabilidad de ganar es p. Sea X la variable premio obtenido. Su valor medio es
Es decir, con gran probabilidad el premio medio que esperamos obtener por jugada será muy
cercano a μ = p⋅a y este ha de ser el precio por participar en el juego si tal juego es justo.
27 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
BIBLIOGRAFÍA
(1998): Matemáticas Aplicadas a las ciencias sociales II, Edelvives.
(1995): Matemáticas I Bachillerato LOGSE, McGraw-Hill.
CARRASCO, J.L. El método estadístico en la investigación médica. Madrid: Editorial Ciencia.
FREEDMAN D., PISANI R., PURVES R. y ADHIKARI A. (1993): Estadística. Antoni Bosch
Editor.
GAMBOA GRAUS, M. E. (2018): “Estadística aplicada a la investigación educativa”, en
Revista Dilemas Contemporáneos: Educación, Política y Valores, nº2, año V, art 5.
GARCÍA PÉREZ, A. (1992): Estadística aplicada: Conceptos básicos. Editorial UNED.
HULLEY S.B. (1993): Cummings SR. Diseño de la investigación clínica. Barcelona: Ed
Doyma
JOHNSON R. A. y BHATTACHARYYA G. K. (2001): Statistics, Principles and Methods,
Wiley and Sons, Inc.
KELSEY I.L., THOMPSON W.D., EVANS A. (1986): Methods in observational
epidemiology. New York: Oxford University Press. Este tema fue actualizado el 25/03/10 por
David Martínez Sanz.
SÁNCHEZ DE RIVERA, D. Peña (1987): Estadística, modelos y métodos. Alianza Universal.
WEISSTEIN, E. W. (1999): CRC Concise Encyclopedia of Mathematics, Chapman Hall.
www.magister.es
28
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
ESQUEMA-RESUMEN.
En nuestros días los métodos estadísticos ocupan un lugar prominente en las distintas ciencias
tanto naturales como sociales y constituyen una de las herramientas más utilizadas y apreciadas
por los investigadores. La estadística actual es el resultado de la confluencia de dos disciplinas
que evolucionaron independientemente hasta unirse en un cuerpo común hacia el siglo XIX:
El cálculo de probabilidades que nace en el siglo XVII como teoría matemática de los
juegos de azar (dados, barajas, lotería, etc.).
La "estadística" (o ciencia del estado, del latín Status) que estudia la descripción de datos y
tiene raíces muy antiguas (los primeros censos conocidos se remontan a los chinos,
realizados 2000 años a. C.).
Algunos de los más insignes matemáticos que han trabajado en esta rama son los Bernoulli,
Laplace, Poisson, Gauss, Markov, Fisher, Pearson y Neyman.
La estadística estudia, por tanto, fenómenos aleatorios o de azar que se pueden definir como
aquellos experimentos caracterizados por las dos propiedades siguientes:
Presentan notables variaciones en los efectos, de modo que resulta imposible predecir el
resultado de una experiencia particular.
Todos los posibles resultados se conocen de antemano.
Se verifica la “ley de la estabilidad de las frecuencias” que enuncia:
29 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
Población objetivo o teórica: Está formada por todos los individuos bajo el influjo del
fenómeno aleatorio.
Población disponible: Es la que resulta tras la depuración de los individuos de la
población objetiva no accesibles a priori. Sin embargo, esta no es la población final que
manejaremos en muchos casos puesto que pueden existir factores que no conocemos que
hagan inaccesibles a otros individuos a priori accesibles.
Población investigada: Es la parte realmente accesible de la disponible.
En muchas ocasiones, no es posible realizar un censo o marco por muy diferentes motivos, y
entre otros:
El estudio puede deteriorar el sistema. Por ejemplo, la medida de la resistencia de una
pieza industrial o la resistencia ante el impacto de un vehículo. Pensemos también en el
estudio del efecto de una sustancia medicinal en cada individuo. No podemos correr riesgos
ni destruir el sistema o individuo de la población.
www.magister.es
30
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
Es inviable desde un punto de vista económico. El estudio de todos los individuos de una
población, en tamaños grandes, puede constituir un problema costoso en tiempo, dinero,
etc. que no estamos dispuestos a admitir.
Es inviable desde un punto de vista práctico: Puede ocurrir que la población sea infinita
o tan numerosa que excede las posibilidades del estudio.
Definición de muestra representativa: Es aquella muestra que logra una versión simplificada
de la población, y reproduce, de algún modo, el mismo comportamiento y características ante
el fenómeno aleatorio que esta, pero a pequeña escala y tal que su estudio sea viable.
La recogida de los datos sobre los individuos de un censo o muestra se llama encuesta.
Es evidente que todo proceso de muestreo lleva asociado un error, debido a la obtención de
conclusiones respecto de valoraciones sobre una muestra y no sobre el total de la misma. A
esto se denomina error o sesgo del muestreo.
Por otra parte, llamaremos falacia a las inferencias o conclusiones erróneas que podamos
realizar a partir de una muestra respecto del estudio de un fenómeno aleatorio sobre una
determinada población. La teoría del muestreo trata de impedir y minimizar la aparición de
falacias, aunque pueden llegar a presentarse incluso con muestras representativas, si las
condiciones de estudio no son las adecuadas o están sesgadas intencionadamente.
4. TIPOS DE MUESTREO.
31 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
www.magister.es
32
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
Son aquellos muestreos en los que se incumplen las principales características del muestreo
aleatorio. Sin embargo, en muchas ocasiones son utilizados consciente o inconscientemente,
puesto que son más sencillos de llevar a cabo y la utilización de muestreos aleatorios suele
presentar costes muy elevados o inasumibles. Hay que tener en cuenta que este tipo de
muestreo genera muestras que no tienen por qué ser representativas y, por lo tanto, no se puede
garantizar la fiabilidad acerca de las inferencias y generalizaciones respecto al estudio del
fenómeno aleatorio sobre la población mediante estas muestras.
1. Muestreo no aleatorio de conveniencia. Es un muestreo no aleatorio en el que se procede
a seleccionar los individuos que menos esfuerzo presentan por cuestiones económicas,
físicas o temporales.
2. Muestreo no aleatorio voluntario o de voluntarismo. Es un muestreo no aleatorio en el
que se procede a seleccionar los individuos que deciden por propia iniciativa y
voluntariamente ser elementos de la muestra. Además, este tipo de muestreo puede admitir
la aparición en la muestra de repeticiones de individuos.
3. Muestreo no aleatorio por cuotas o accidental. Se toma a los individuos más
“representativos” de la población como representantes de la población en la muestra. Por lo
tanto, utiliza una técnica parecida al muestreo aleatorio por estratos en cuanto a que
determina divisiones de la población mediante características, pero se diferencia en la
elección no aleatoria de los individuos dentro de cada estrato. En este sentido, es muy
típico de este muestreo elegir los individuos con una serie de condiciones mediante
“cuotas”. La elección de los elementos dentro del estrato puede entrar la aleatoriedad o, por
el contrario, el voluntarismo.
33 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
Sea una población cuyos individuos poseen una característica común descrita por una variable
estadística cuantitativa X que toma valores diferentes x1, x2, . . ., xr mediante una distribución
de frecuencias relativas f1, f2, . . ., fn.
Observaciones.
1. Los valores o parámetros poblacionales media y desviación típica son esenciales para la
descripción y valoración de cada población.
2. En muchas ocasiones, el estudio estadístico no se puede efectuar mediante censo y hay que
recurrir a muestras para el estudio de la población. En este sentido, uno de los objetivos
consistirá en inferir el valor de la media y la desviación poblacionales.
www.magister.es
34
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
Definición de muestra aleatoria simple: Sea un fenómeno aleatorio en el que se estudia una
característica de una población sobre el que se mide un cierto parámetro asociado a la variable
estadística X con determinada distribución de probabilidades. Llamaremos muestra aleatoria
simple de la variable aleatoria X a la variable aleatoria n-dimensional (X1, X2, . . ., Xn) cuyas
variables aleatorias unidimensionales Xk con k = 1, 2, . . . n, que la componen son
independientes y con la misma distribución de probabilidad (idénticamente distribuidas) que X.
Definición de estimador: Sea (X1, X2, . . ., Xn), una muestra aleatoria simple de una variable
aleatoria X con distribución conocida p(θ) y con θ parámetro desconocido. Se llama estimador
de un parámetro desconocido θ, a toda función T(X1, X2, . . . , Xn) que permita aproximar a
dicho parámetro.
Definición de estimador centrado o insesgado: Se dirá que el estimador es centrado o
insesgado respecto del parámetro θ si E [ T(X1, X2, . . . , Xn)] = θ
Definición de estimador consistente: Se dirá que el estimador es consistente para el
parámetro θ si se verifica que:
lim E[T ( X 1 , . . ., X n )] y lim V [T ( X 1 , . . ., X n )] 0 .
n n
La media muestral: Sirve para estimar el parámetro media si es que este es desconocido
1 n
para la distribución de X. T X 1 , X 2 , . . . , X n X k . Se suele representar mediante X .
n k 1
La varianza muestral: Sirve para estimar el parámetro varianza 2 si es que este es
1 n
desconocido para la distribución de X. T X 1 , X 2 , . . . , X n X k X
n k 1
. Se representa
2
mediante s2.
35 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
n
T X1, X 2 , . . . , X n
1
X k X . Se suele representar mediante S2.
2
n 1 k 1
Esta propiedad hace de la media muestral sea un gran estimador para la media ya que
“cuanto más grande sea el tamaño muestral de las muestras usadas, menos dispersa será la
media muestral". Es decir, los datos de la medición de la media muestral estarán tanto más
localizados cuanto más grande sea el tamaño de las muestras que empleamos. Por tanto,
según lo dicho antes, el estimador media muestral es consistente.
5.6. Relación entre la media muestral y poblacional: La ley de los grandes números.
Enunciamos ahora la ley de los grandes números. Este resultado es consecuencia fundamental
de la desigualdad de Chebyshef y juega un importante papel en la teoría de probabilidades y
estadística relacionando la media muestral y poblacional de una variable aleatoria X. En
particular:
Ley de los grandes números: Dada una variable aleatoria simple (X1, X2, . . ., Xn) de una
variable estadística X con distribución conocida p(θ) y con θ parámetro desconocido. Se
verifica que
lim Px X x 1
n
Observaciones.
1. La ley de los grandes números explica que la media muestral es una variable aleatoria que,
bajo cualquier distribución, tanto más cercana es a la media poblacional de la variable X de
la que procede al aumentar el número de variables que la forman.
www.magister.es
36
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
lim Px X p 1
n
Es decir, que cuantas más repeticiones o experimentos de Bernoulli independientes e
idénticos realicemos, más aproximación existe entre la media muestral o proporción de
éxitos y el valor poblacional p.
3. El valor medio o media aritmética de una variable aleatoria M(X) o E(X) recibe el nombre
a menudo de valor esperado o esperanza matemática de la v.a. X. La razón de esta
denominación está en la ley de los grandes números ya que cuando se repite un número
grande de veces la medición de la v.a. X, la media aritmética en cada caso es una media
muestral que, de acuerdo con la ley de los grandes números será con gran probabilidad muy
cercana al valor de la media poblacional μ x.
Teorema central del límite: Sea X una variable estadística. Dado un intervalo I
cualquiera de la recta. Para cada n natural sea pn ( X I ) , la probabilidad de que la media
muestral esté en el intervalo I. En este caso,
lim pn ( X I ) N ( x, , )dx
n I
n
Observaciones.
1. Lo que el teorema expresa es un resultado general que nos dice que, para tamaños
muestrales suficientemente grandes, la media muestral es una variable estadística con
distribución normal de media, la media poblacional y de desviación, el cociente de la
desviación poblacional entre la raíz cuadrada del tamaño muestral.
X N X , X
n
Veamos ahora la aplicación directa de este teorema para la inferencia de la media poblacional a
partir de la media muestral utilizando intervalos de confianza.
37 www.magister.es
MAGISTER OPOSICIONES ©MELC S.A. Matemáticas. Tema 58
Si dada una variable estadística X con distribución de desviación típica conocida σX,
deseamos formar un intervalo de confianza ( X – ε, X + ε) para la media poblacional para
tamaños muestrales suficientemente grandes entonces mediante el teorema central del
límite, el intervalo deseado será
X
X z / 2 X , X z / 2
n n
Observaciones.
1. Este procedimiento nos determina una cota inferior para el tamaño muestral ya que dada la
desviación conocida σ X, un valor ε > 0 cualquiera y una confianza 1 – α establecida de que
la media poblacional y la muestral se diferencian como máximo en ε, el menor natural n
2
que cumple es tal que, n z / 2 x
2. Por un procedimiento análogo, si la desviación es desconocida, dado un valor ε > 0
cualquiera y una confianza 1 – α establecida de que la media poblacional y la muestral se
diferencian como máximo en ε, el menor natural n que cumple es tal que,
2
S
n tn 1, / 2 n
El valor medio o media poblacional μ X = M(X) de una variable estadística recibe a menudo el
nombre de valor esperado o esperanza matemática de la variable X.
La razón de estas denominaciones radica en los resultados de los teoremas de la ley de los
grandes números y central del límite. La cuestión es que cuando uno repite la medición de una
variable cualquiera X un número grande de veces, el valor medio de los resultados es una
media muestral de tamaño grande y por tanto de acuerdo con los teoremas anteriores ese valor
medido será con gran probabilidad muy cercano al valor medio o media poblacional μ = M(X)
de X.
www.magister.es
38
Matemáticas. Tema 58 ©MELC S.A. MAGISTER OPOSICIONES
CUESTIONES.
1. Probar que la media muestral de la variable X es el único número respecto del cual la
suma de las desviaciones de los datos es cero.
Solución
Sea una variable aleatoria simple de la variable X, (X1, X2, . . ., Xn) y sea μ un número que
verifique que la suma de las desviaciones de los datos con respecto a ese valor es cero:
f X
i
i i 0
f X
i
i i f i X i f i X 1 0 X
i i
Solución
Sea una variable aleatoria simple de la variable X, (X1, X2, . . ., Xn). Basta operar en la
forma siguiente:
1
n i
s X f i X i X
2 1
fi X i X
n i
2
s X
39 www.magister.es