Act 5 Lec..
Act 5 Lec..
Act 5 Lec..
Las poblaciones que el investigador puede estudiar son muy diversas, pero
generalmente se relacionan con personas. Por ejemplo, puede estudiar la
opinión de las amas de casa con respecto a ciertos métodos de planificación
familiar, la edad promedio de los alumnos de una escuela, el coeficiente
intelectual promedio de los universitarios, etc.
Universo y Muestra
Una muestra es un conjunto de unidades, una porción del total, que nos
representa la conducta del universo en su conjunto.
Una muestra, en un sentido amplio, no es más que eso, una parte del todo que
llamamos universo y que sirve para representarlo.
Sin embargo, no todas las muestras resultan útiles para llevar a cabo un trabajo
de investigación. Lo que se busca al emplear una muestra es que, observando
una porción relativamente reducida de unidades, se obtengan conclusiones
semejantes a las que lograríamos si estudiáramos el universo total. Cuando
una muestra cumple con esta condición, es decir, cuando nos refleja en sus
unidades lo que ocurre en el universo, la llamamos muestra representativa.
Por lo tanto, una muestra representativa contiene las características relevantes
de la población en las mismas proporciones en que están incluidas en tal
población. Sus conclusiones son susceptibles de ser generalizadas al conjunto
del universo, aunque para ello debamos añadir un cierto margen de error en
nuestras proyecciones.
Muestras Aleatorias
Como dijimos, en ellas cada uno de los elementos del universo tiene una
probabilidad determinada y conocida de ser seleccionado. Los procedimientos
más usuales para la obtención de muestras aleatorias son
K = N/n
Donde:
2. Se efectúa un sorteo para elegir un número que sea inferior o igual al valor
de K. Como primera unidad para integrar la muestra se elige aquella que,
en la lista general, posea idéntico número de orden al sorteado. Si
designamos con A este primer valor, la segunda unidad elegida será la que
lleve el número A + K, la tercera corresponderá a A + 2K y así
sucesivamente hasta llegar a A + (n – 1)K.
Se desea realizar una encuesta donde se intuye que las opiniones sobre el
tema en cuestión van a ser muy dependientes del ingreso económico de los
habitantes. Se trata de una ciudad donde la mayoría de vecindarios son
mixtos (se entremezclan pobres y ricos), con pocos situados en ambos
extremos. De las siguientes opciones. ¿Cuál sería el tipo de muestreo más
indicado para hacer el estudio estadístico correspondiente?
Su respuesta:
Muestreo simple al azar
Correcto: La distribución de las unidades de observación están distribuidas
de manera adecuada para su aplicación.
ESTIMACION
En estadística se llama estimación al conjunto de técnicas que permiten dar un
valor aproximado de un parámetro de una población a partir de los datos
proporcionados por una muestra.
En su versión más simple, una estimación de la media de una determinada
característica de una población de tamaño N sería la media de esa misma
característica para una muestra de tamaño n.
ESTIMADOR
Un estimador de un parámetro poblacional es una función de los datos
muestrales. En pocas palabras, es una fórmula que depende de los valores
obtenidos de una muestra, para realizar estimaciones.
Por ejemplo, un estimador de la media poblacional? sería la media muestral,
según la siguiente fórmula:
donde (x1, x2, …, xn) sería el conjunto de datos de la muestra.
En el ejemplo se habla de una estimación puntual. Sin embargo, el estimador
es una variable aleatoria que asigna a cada valor de la función su probabilidad
de aparición, esto es, la probabilidad de la muestra de la que se extrae.
ESTIMACION PUNTUAL
Consiste en la estimación del valor del parámetro mediante un sólo valor,
obtenido de una fórmula determinada. Por ejemplo, si se pretende estimar la
talla media de un determinado grupo de individuos, puede extraerse una
muestra y ofrecer como estimación puntual la talla media de los individuos de la
muestra.
Estimación por intervalos
Consiste en la obtención de un intervalo dentro del cual estará el valor del
parámetro estimado con una cierta probabilidad. En la estimación por intervalos
se usan los siguientes conceptos:
Intervalo de confianza
El intervalo de confianza es una expresión del tipo [?1, ?2] ó ?1 ? ? ? ?2, donde
? es el parámetro a estimar. Este intervalo contiene al parámetro estimado con
una determinada certeza o nivel de confianza.
Variabilidad del parámetro
Si no se conoce, puede obtenerse una aproximación en los datos aportados
por la literatura científica o en un estudio piloto. También hay métodos para
calcular el tamaño de la muestra que prescinde de este aspecto. Habitualmente
se usa como medida de esta variabilidad la desviación típica poblacional y se
denota?
Error de la estimación
Es una medida de su precisión que se corresponde con la amplitud del
intervalo de confianza. Cuanta más precisión se desee en la estimación de un
parámetro, más estrecho deberá ser el intervalo de confianza y, por tanto,
menor el error, y más sujetos deberán incluirse en la muestra estudiada.
Llamaremos a esta precisión E, según la fórmula E = ?2 - ?1.
Nivel de confianza
Es la probabilidad de que el verdadero valor del parámetro estimado en la
población se sitúe en el intervalo de confianza obtenido. El nivel de confianza
se denota por (1-?), aunque habitualmente suele expresarse con un porcentaje
((1-?)•100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que
se corresponden con valores ? de 0,05 y 0,01, respectivamente.
Valor ?
También llamado nivel de significación. Es la probabilidad (en tanto por uno) de
fallar en nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel
de confianza (1-?). Por ejemplo, en una estimación con un nivel de confianza
del 95%, el valor ? es (100–95)/100 = 0,05.
Valor crítico
Se representa por Z?/2. Es el valor de la abscisa en una determinada
distribución que deja a su derecha un área igual a ?/2, siendo 1-? el nivel de
confianza. Normalmente los valores críticos están tabulados o pueden
calcularse en función de la distribución de la población. Por ejemplo, para una
distribución normal, de media 0 y desviación típica 1, el valor crítico para ? =
0,05 se calcularía del siguiente modo: se busca en la tabla de la distribución
ese valor (o el más aproximado), bajo la columna “Área”; se observa que se
corresponde con ?0,64. Entonces Z?/2 = 0,64. Si la media o desviación típica
de la distribución normal no coinciden con las de la tabla, se puede realizar el
cambio de variable t=(X-?)/? para su cálculo.
Con estas definiciones, si tras la extracción de una muestra se dice que “3 es
una estimación de la media con un margen de error de 0,6 y un nivel de
confianza del 99%”, podemos interpretar que el verdadero valor de la media se
encuentra entre 2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3
se obtienen restando y sumando, respectivamente, la mitad del error, para
obtener el intervalo de confianza según las definiciones dadas.
Para un tamaño fijo de la muestra, los conceptos de error y nivel de confianza
van relacionados. Si admitimos un error mayor, esto es, aumentamos el
tamaño del intervalo de confianza, tenemos también una mayor probabilidad de
éxito en nuestra estimación, es decir, un mayor nivel de confianza.