TEORÍA DE MUESTREO Ojo
TEORÍA DE MUESTREO Ojo
TEORÍA DE MUESTREO Ojo
Una parte fundamental para realizar un estudio estadístico de cualquier tipo es obtener unos
resultados confiables y que puedan ser aplicables. Como ya se comentó anteriormente, resulta
casi imposible o impráctico llevar a cabo algunos estudios sobre toda una población, por lo que
la solución es llevar a cabo el estudio basándose en un subconjunto de ésta denominada
muestra.
Sin embargo, para que los estudios tengan la validez y confiabilidad buscada es necesario que
tal subconjunto de datos, o muestra, posea algunas características específicas que permitan, al
final, generalizar los resultados hacia la población en total. Esas características tienen que ver
principalmente con el tamaño de la muestra y con la manera de obtenerla.
A lo largo del curso se hacen uso de dos tipos de razonamiento: el deductivo y el inductivo. El
primero está relacionado directamente con la teoría de probabilidad, que se aborda en la unidad
4, y que a partir de las características de la población se obtienen las posibles características de
una muestra. El segundo tipo de razonamiento se relaciona con la denominada inferencia
estadística: utilizar las características de un subconjunto de la población (la muestra) para hacer
afirmaciones (inferir) sobre la población en general. Éste será el caso de esta unidad.
El muestro, como ya se mencionó, implica algo de incertidumbre que debe ser aceptada para
poder realizar el trabajo, pues aparte de que estudiar una población resulta ser un trabajo en
ocasiones demasiado grande, Wonnacott y Wonnacott ofrecen las siguientes razones extras:
El muestreo puede ser más exacto. Esto es en el caso en el que el estudio sobre la
población total puede causar errores por su tamaño o, en el caso de los censos, que sea
necesario utilizar personal no lo suficientemente capacitado; mientras que, por otro
lado, el estudio sobre una muestra podría ser realizada con menos personal pero más
capacitado.
1
UNIVERSIDAD PERUANA LOS ANDES – SEDE SATIPO
UNIDAD DE EJECUCION CURRICULAR DE INVESTIGACION DE MERCADOS.
DOCENTE: Lic. Adm. Gustavo A. Díaz Chacón
=============================================================================
Ya que hemos mencionado la necesidad de realizar muestras, continuaremos con algunas
características que deben tener éstas para que, realmente, se puedan realizar inferencias
(inducciones) sobre ellas hacia la población total.
Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:
1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra
hacia la población total.
2. El porcentaje de error que se pretende aceptar al momento de hacer la generalización.
Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
prácticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de
confianza menor. Comúnmente en las investigaciones sociales se busca un 95%.
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipótesis que
sea falsa como si fuera verdadera, o la inversa: rechazar a hipótesis verdadera por considerarla
falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y
considerarlo como 0%, entonces la muestra es del mismo tamaño que la población, por lo que
conviene correr un cierto riesgo de equivocarse.
Hay que considerar que p y q son complementarios, es decir, que su suma es igual a la unidad:
p+q=1. Además, cuando se habla de la máxima variabilidad, en el caso de no existir
antecedentes sobre la investigación (no hay otras o no se pudo aplicar una prueba previa),
entonces los valores de variabilidad es p=q=0.5.
Una vez que se han determinado estos tres factores, entonces se puede calcular el tamaño de la
muestra como a continuación se expone.
1
UNIVERSIDAD PERUANA LOS ANDES – SEDE SATIPO
UNIDAD DE EJECUCION CURRICULAR DE INVESTIGACION DE MERCADOS.
DOCENTE: Lic. Adm. Gustavo A. Díaz Chacón
=============================================================================
Vamos a presentar dos fórmulas, siendo la primera la que se aplica en el caso de que no se
conozca con precisión el tamaño de la población, y es:
donde:
Hay que tomar nota de que debido a que la variabilidad y el error se pueden expresar por medio
de porcentajes, hay que convertir todos esos valores a proporciones en el caso necesario.
Por ejemplo: Si se quiere un porcentaje de confianza del 95%, entonces hay que
considerar la proporción correspondiente, que es 0.95. Lo que se buscaría en seguida es el valor
Z para la variable aleatoria z tal que el área simétrica bajo la curva normal desde -Z hasta Z sea
igual a 0.95, es decir, P(-Z<z<Z)=0.95.
Donde:
1
UNIVERSIDAD PERUANA LOS ANDES – SEDE SATIPO
UNIDAD DE EJECUCION CURRICULAR DE INVESTIGACION DE MERCADOS.
DOCENTE: Lic. Adm. Gustavo A. Díaz Chacón
=============================================================================
q es la variabilidad negativa.
N es el tamaño de la población.
E es la precisión o el error.
Por ejemplo: En el Colegio de Bachilleres, una institución de nivel medio superior, se desea
realizar una investigación sobre los alumnos inscritos en primer y segundo años, para lo cual se
aplicará un cuestionario de manera aleatoria a una muestra, pues los recursos económicos y el
tiempo para procesar la información resultaría insuficiente en el caso de aplicársele a la
población estudiantil completa.
En primera instancia, suponiendo que no se conoce el tamaño exacto de la población, pero con
la seguridad de que ésta se encuentra cerca a los diez millares, se aplicará la primera fórmula.
Se considerará una confianza del 95%, un porcentaje de error del 5% y la máxima variabilidad
por no existir antecedentes en la institución sobre la investigación y porque no se puede aplicar
una prueba previa.
Primero habrá que obtener el valor de Z de tal forma que la confianza sea del 95%, es decir,
buscar un valor de Z tal que P(-Z<z<Z)=0.95. Utilizando las tablas o las funciones de Excel se
pueden obtener, o viendo (en este caso) el ejemplo anterior, resulta que Z=1.96.
Con lo que se tiene una cota mínima de 370 alumnos para la muestra y así poder realizar la
investigación sin más costo del necesario, pero con la seguridad de que las condiciones
aceptadas para la generalización (confiabilidad, variabilidad y error) se mantienen.