Ejercicios Estadistica

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 17

ESTADISTICA No.

Definiciones

Estadística
Es la parte de las Matemáticas que se encarga del estudio de una determinada
característica en una población, recogiendo los datos, organizándolos en tablas,
representándolos gráficamente y analizándolos para sacar conclusiones de dicha
población.
Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para
recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y
tomar decisiones razonables basadas en tal análisis.

Objetivos de la estadística
La estadística como ciencia se encarga de recopilar, e interpretar datos que en el futuro
servirán para proyectar posibles problemáticas futuras, consiguiendo según estos datos,
la solución más viable y rápida.
El objetivo de la estadística es mejorar la comprensión de hechos a partir de
datos. (Moore, p.267)

El objetivo básico de la estadística es hacer inferencia acerca de una población con base
a la información contenida en una muestra, ¿qué significa esto?
El término inferir se aplica a llegar a una conclusión basada en evidencias existentes,
todo mediante un proceso de pensamiento lógico que considera todos los factores
presentes de manera objetiva y fuente confiable, para luego tomar una decisión o
determinación informada

Tipos de Estadística

Estadística Descriptica
En el ámbito científico, se conoce con el nombre de Estadística Descriptiva a la disciplina
matemática que se encarga de recolectar, analizar, clasificar, graficar y describir las
propiedades de los distintos datos matemáticos de una población. Así mismo, por lo
general, la Estadística Descriptiva es tenida como la disciplina que procesa datos, a fin de
prepararlos para su uso en tablas, gráficas o medidas numéricas, que permiten entonces
el análisis de la información numérica, a fin de entender sus característica

Objetivo de la estadística descriptiva


ESTADÍSTICA DESCRIPTIVA Describir las características principales de los datos
reunidos.
Y a través del análisis numérico, entender y traducir a hechos, reacciones o
comportamientos, la realidad numérica observada en una población, a fin de poder
inferir su comportamiento ante un fenómeno preciso, pudiendo entonces hacer
proyecciones correctas, que vengan a señalar cómo se comportaría determinada
población ante este.

OBJETIVO DE LA INFERENCIA ESTADÍSTICA Extraer las conclusiones útiles sobre la


totalidad de todas las observaciones posibles basándose en la información recolectada.
En este sentido, se puede afirmar que la Estadística Inferencial se encarga
específicamente de tomar muestras de poblaciones, a fin de someterlas a distintos
procesos inductivos, que le permitan deducir los modelos o patrones a los cuales
responde, tomando como hipótesis que si una parte de determinada población se
comporta o caracteriza de forma específica, el resto también lo hará

Unidades de estudio y unidades de información

UNIDAD DE ESTUDIO Es la unidad de la cual se necesita información, es el individuo o


conjunto de individuos de donde se obtiene el dato; la unidad de estudio corresponde a la
entidad que va a ser objeto de medición y se refiere al qué o quién es sujeto de interés en
una investigación. Es posible que paraobtener la información tengamos que recurrir a
pasos intermedios. La unidad de estudio es únicaen un trabajo de investigación y
caracteriza a toda la línea de investigación
Unidad de información
Es la unidad que nos brinda información de la unidad de estudio, cuando la unidad de
estudio es la población el individuo se convierte en unidad de información, en un estudio
retrospectivo las unidades de información son las historias clínicas.

POBLACIÓN Y MUESTRA

Cuando se realiza un estudio de investigación, se pretende generalmente inferir o


generalizar resultados de una muestra a una población. Se estudia en particular a un
reducido número de individuos a los que tenemos acceso con la idea de poder
generalizar los hallazgos a la población de la cual esa muestra procede.
Este proceso de inferencia se efectúa por medio de métodos estadísticos basados en la
probabilidad.

La población
Representa el conjunto grande de individuos que deseamos estudiar y generalmente
suele ser inaccesible.
Es, en definitiva, un colectivo homogéneo que reúne unas características determinadas.

La muestra
Es el conjunto menor de individuos (subconjunto de la población accesible y limitado
sobre el que realizamos las mediciones o el experimento con la idea de obtener
conclusiones generalizables a la población).
La muestra debe ser representativa de la población y con ello queremos decir que
cualquier individuo de la población en estudio debe haber tenido la misma probabilidad de
ser elegido.

Las razones para estudiar muestras

En lugar de poblaciones son diversas y entre ellas podemos señalar:

a) Ahorrar tiempo y costo. Se invierte en menos individuos.


b) Es más posible de abarcar. Estudiar la totalidad a las personas con una característica
determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de
realizar.
c) Aumentar la calidad del estudio. Al disponer de más tiempo y recursos, las
observaciones y mediciones realizadas a un reducido número de individuos pueden ser
más exactas y plurales que si las tuviésemos que realizar a una población.

Datos Estadísticos

Los datos estadísticos, en este marco, son los valores que se obtienen al llevar a cabo un
estudio de tipo estadístico. Se trata del producto de la observación de aquel fenómeno
que se pretende analizar.
Para que resulten útiles, los datos estadísticos deben organizarse y considerarse a partir de
un contexto. Es importante tener en cuenta que el procesamiento de los datos
estadísticos es lo que genera información. El dato por sí mismo, considerado como algo
aislado, carece de interés.

Variables estadísticas
Variable es una palabra que representa a aquello que varía o que está sujeto a algún tipo
de cambio. Se trata de algo que se caracteriza por ser inestable, inconstante y mudable

Una variable estadística es el conjunto de valores que puede tomar cierta característica de
la población sobre la que se realiza el estudio estadístico y sobre la que es posible su
medición. Estas variables pueden ser: la edad, el peso, las notas de un examen, los
ingresos mensuales, las horas de sueño de un paciente en una semana, el precio medio del
alquiler en las viviendas de un barrio de una ciudad, etc.

Variable cualitativa
Las variables cualitativas se refieren a características o cualidades que no pueden ser
medidas con números. Podemos distinguir dos tipos:
Variable cualitativa nominal
Variable cualitativa ordinal
Variable binaria o dicotómica

Variable cualitativa nominal


Una variable cualitativa nominal presenta modalidades no numéricas que no admiten
un criterio de orden. Por ejemplo:
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y
viudo.
– Color (blanco, rojo, azul,…)

Variable cualitativa ordinal o variable cuasicuantitativa


Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe
un orden. Por ejemplo:
La nota en un examen: suspenso, aprobado, notable, sobresaliente.
Puesto conseguido en una prueba deportiva: primero, segundo y tercer lugar
Medallas de una prueba deportiva: oro, plata, bronce.
– Nivel económico (pobre, clase media, rico)

Variable Binaria o Dicotómica


Deben estar constituidas por dos valores exhaustivos, es decir, los dos niveles de la
variable cubren todos los valores posibles de la variable, y no existe ningún otro resultado
viable: infarto de miocardio o no; el enfermo es hipertenso o no; es varón o mujer, etc

Variable cuantitativa
Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden
realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:
Variable discreta
Variable continúa

Variable discreta
La variable solo puede tomar valores en número determinado de valores. En cada
intervalo de valores la variable solo puede tomar un valor.
Las variables discretas se caracterizan por contar únicamente valores finitos. De esta
manera, las variables cuantitativas discretas son aquellas que sólo tienen en cuenta
números dentro de una escala de valores que pueden ser separados entre sí, indicando
valores específicos
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Canastas en un partido (20; 21; 22; pero no 21,5)
– Hijos por familia (0, 1, 2, 3,…)

Variable continúa
Las variables continuas por su parte son aquellas que pueden tomar un número infinito de
valores dentro de dos números, es decir, cuentan con la asignación de número decimales.
Su precisión varía dependiendo del instrumento que se use para medirlas.
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
– Peso (53,53 kg; 89,4 kg,…)

Las variables se pueden clasificar también según si son independientes o dependientes:


Variable independiente: Es una variable que su valor no depende de otra variable. La
variable independiente suele representarse en las gráficas en el eje de abcisas (x).En un
diseño experimental a la variable independiente se le suele denominar también variable
de entrada, o variable manipulada.
Variable dependiente: Es una variable cuyos valores dependen de los valores que tome
otra variable. Se representa en el eje de ordenadas y.

Ejemplos
Se realiza un estudio estadístico sobre la relación de los pacientes que tienen asma
respecto a ciertas variables también estudiadas. Suponemos que existe una variable
binaria en el estudio que indica si los individuos son o no fumadores. El investigador puede
establecer la hipótesis de que el tabaco influye en los pacientes generando el asma.
Utilizaría la variable “fumador” como variable independiente para confirmar su relación
con la variable dependiente “asma”.
En un estudio estadístico realizado en un instituto se intenta hacer ver a los alumnos que
estudiar día a día influye positivamente en las notas obtenidas. Se considera como variable
independiente (o explicativa) la variable “promedio de horas de estudio” y como variable
dependiente las “notas obtenidas por cada alumno”.

Pregunta
¿Qué es una muestra?

Ejemplo
Para estudiar cuál es el candidato presidencial por el cual votarán los peruanos en las
próximas elecciones, se toma una muestra de 3500 personas de todo el país. La pregunta
es la siguiente, ¿por quién votará en las próximas elecciones presidenciales? Determine
la población y la muestra.
En este caso, la población sería la población electoral del país, es decir, peruanos con
derecho a voto.
La muestra sería el conjunto de 3500 peruanos que forman parte de la población.

Muestra aleatoria
En estadística, una muestra es la selección de un numero de observaciones de a partir de
una población objeto de investigación; una muestra aleatoria es cuando la elección sigue
un método impredecible. El muestreo aleatorio puede referirse también a tomar una serie
de observaciones independientes de la misma distribución de probabilidad.
Tipos de muestra aleatoria
Muestra aleatoria simple se selecciona directo cuando todas las potenciales observaciones
de la población son equiponderables.
Una muestra auto-ponderada, es aquella en la que cada individuo o un objeto, en la
población de interés tienen la misma oportunidad de ser seleccionadas para la muestra.
Las muestras aleatorias simples son auto-ponderadas.
El muestreo estratificado implica seleccionar muestras independientes de un número de
subpoblaciones, grupo o estratos dentro de la población. Por ejemplo, si queremos
analizar los datos de unas elecciones por género o por grupo de edad, deberemos
cerciorarnos de obtener muestras representativas de todas las subpoblaciones.
El muestreo por clusters, consiste en seleccionar las observaciones de la muestra por
grupos con intereses relacionados. Por ejemplo, si se plantea conocer la opinión pública de
un trasvase en un rio, deberemos hacer dos clusters aquello de la zona beneficiada
(reciben el agua del rio) y aquellos de la zona perjudicada (tendrán menos caudal en el
rio). El análisis de muestras por cluster debe tener en cuenta la correlación intra-grupo que
refleja el hecho de que las unidades en la misma agrupación es probable que sean más
similares que dos unidades escogido al azar.
PARÁMETRO No. 2

Un parámetro estadístico es un número que se obtiene a partir de los datos de


una distribución estadística.
Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por
una gráfica.
Tipos de parámetros estadísticos
Hay tres tipos parámetros estadísticos:
De centralización
De posición
De dispersión

Medidas de centralización
Nos indican en torno a qué valor (centro) se distribuyen los datos.
Las medidas de centralización son:
Media aritmética
La media es el valor promedio de la distribución.
Mediana
La mediana es la puntación de la escala que separa la mitad superior de la distribución
y la inferior, es decir divide la serie de datos en dos partes iguales.
Moda
La moda es el valor que más se repite en una distribución.

MEDIDAS DE TENDENCIA CENTRAL

Medida de tendencia central: valor que se encuentra en el centro o a la mitad de un


conjunto de datos.

Hay muchas formas distintas de determinar el centro; por lo tanto, tenemos diferentes
definiciones de las medidas de tendencia central, incluyendo media, mediana, moda y mitad
del rango. Comenzaremos con la media
En resumen, el propósito de las medidas de tendencia central es:
Mostrar en qué lugar se ubica la persona promedio o típica del grupo.
Sirve como un método para comparar o interpretar cualquier puntaje en relación con el
puntaje central o típico.
Sirve como un método para comparar el puntaje obtenido por una misma persona en dos
diferentes ocasiones.
Sirve como un método para comparar los resultados medios obtenidos por dos o más
grupos
MEDIA ARITMETICA
Medida de tendencia central que se obtiene sumando los puntajes y dividendo el total entre
el número de puntajes
La media (aritmética) generalmente es la más importante de todas las medidas numéricas
utilizadas para describir datos; constituye lo que la mayoría de la gente denomina promedio
Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus
bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales
entre cada uno de ellos
.

Fórmula

Ejemplo del cálculo simple


Verificación del plomo en el aire A continuación se presentan cantidades de plomo,
medidas (en microgramos por metro cúbico o mg/m3) en el aire. La Environmental
Protection Agency estableció un estándar de calidad del aire respecto del plomo: 1.5
mg/m3. Las mediciones que se presentan más adelante se registraron en el edificio 5 en
distintos días, inmediatamente después de la destrucción causada por los ataques terroristas
del 11 de septiembre de 2001. Calcule la media de esta muestra de niveles de plomo en el
aire.
5.40 1.10 0.42 0.73 0.48 1.10

SOLUCIÓN La media se calcula empleando la fórmula. Primero se suman los puntajes y


después se dividen entre el número de ellos:

La media del nivel de plomo es 1.538 mg/m3.

LA MEDIANA

Medida de tendencia central que implica el valor que está en medio, cuando los valores
originales de los datos se presentan en orden de magnitud creciente (o decreciente).

Para calcular la mediana:


Para calcular la mediana, primero clasifique los valores (acomódelos en orden), luego siga uno de
estos dos procedimientos:

• 1. Si el número de valores es impar, la mediana es el número que se localiza


exactamente a la mitad de la lista.
• 2. Si el número de valores es par, la mediana se obtiene calculando la media de los
dos números que están a la mitad.
De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana
representarán el 50% de los datos, y los que sean mayores que la mediana representarán
el otro 50% del total de datos de la muestra.
• Ordenamos los datos de menor a mayor.
• 2. Si la serie tiene un número impar de medidas la mediana es la puntuación
central de la misma.
• 2, 3, 4, 4, 5, 5, 5, 6, 6 Me = 5
• 3. Si la serie tiene un número par de puntuaciones la mediana es la media entre
las dos puntuaciones centrales.
• 7, 8, 9, 10, 11, 12 Me = 9.5

LA MODA
La moda es la medida de tendencia central que se define como aquel valor nominal que
tiene la frecuencia mayor. Por lo tanto, una distribución de frecuencias puede tener más
de una moda o, inclusive, no tener moda cuando todos los datos tienen frecuencia 1.
La moda se simboliza con sus dos primeras iniciales: Mo
Se dice que cuando un conjunto de datos tiene una moda la muestra es unimodal,
Cuando dos valores ocurren con la misma frecuencia y ésta es la más alta, ambos valores
son modas, por lo que el conjunto de datos es bimodal.
● Cuando más de dos valores ocurren con la misma frecuencia y ésta es la más alta, todos
los valores son modas, por lo que el conjunto de datos es multimodal.
● Cuando ningún valor se repite, se dice que no hay moda. amodal
EJEMPLO Calcule las modas de los siguientes conjuntos de datos.
a. 5.40 1.10 0.42 0.73 0.48 1.10
b. 27 27 27 55 55 55 88 88 99
c. 1 2 3 6 7 8 9 10

Principales características de la moda:


a) Es el valor que más se repite
b) No está afectada por valores extremos.
1, 1, 1, 5, 7, 9, 1000 Mo = 1

Medidas de posición
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de
individuos.
Para calcular las medidas de posición es necesario que los datos estén ordenados
de menor a mayor.
La medidas de posición son:
Cuartiles
Los cuartiles dividen la serie de datos en cuatro partes iguales.
Deciles
Los deciles dividen la serie de datos en diez partes iguales.
Percentiles
Los percentiles dividen la serie de datos en cien partes iguales.

Medidas de dispersión
Las medidas de dispersión nos informan sobre cuanto se alejan del centro los valores de la
distribución.
Las medidas de dispersión son:
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los valores de una distribución
estadística.
Desviación media
La desviación media es la media aritmética de los valores absolutos de
las desviaciones respecto a la media.
Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media.
Desviación típica
La desviación típica es la raíz cuadrada de la varianza.

Desviación respecto a la media


La desviación respecto a la media es la diferencia en valor absoluto entre cada valor de la variable
estadística y la media aritmética.
Di= xi − x

Ejemplo

En el examen de matemáticas Pedro ha sacado un 9, la media de la clase es de 6.7. Calcular la


desviación respecto a la media de la nota de Pedro.
Aplicando la fórmula
Di=xi− X = 9− 6.7 = 2.3
Desviación media
La desviación media es la media aritmética de losvalores absolutos de las desviaciones respecto
a la media.
La desviación media se representa por

Calcular la desviación media de la distribución:


VARIANZA
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una
distribución estadística.
La varianza se representa por .

Calcular la varianza de la distribución:


9, 3, 8, 8, 9, 8, 9, 18

Desviación estándar
(denotada con el símbolo σ o s, dependiendo de la procedencia del conjunto de datos) es una
medida de dispersión para variables de razón (variables cuantitativas o cantidades racionales) y de
intervalo. Se define como la raíz cuadrada de la varianza de la variable.
Su formula

Ejemplo interactivo paso a paso para calcular la desviación estándar


6,2,3,1
Primero calculamos la media 12/4 = 3
Luego l x - ẋ l 6 – 3 = 32 = 9
2 – 3 = -12 = 1
3 – 3 = 02 = 0
1 – 3 _ -22 = 4 14/4 = 3.5
Por ultimo √3.5 = 1.87

Distribución muestral
DISTRIBUCIÓN MUESTRAL Una distribución muestral es una distribución
de Probabilidad de una estadística muestral calculada a partir de todas las muestras
posibles de tamaño "n" elegidas al azar de una población determinada. Generalmente nos
interesa conocer una o más de los siguientes características de la distribución muestral. 1.-
Su forma funcional (como aparece en su representación gráfica). 2.- Su media. 3.- Su
desviación estándar (error estándar)

Parámetro
Parámetro: Es una cantidad numérica calculada sobre una población y resume los
valores que esta toma en algún atributo.
Intenta resumir toda la información que hay en la población en unos pocos
números (parámetros) ejemplo: la altura media de los sujetos.

Estadístico
Estadístico: Es una cantidad numérica calculada sobre la muestra que resume su
información sobre algún aspecto. Se usa para aproximar un parámetro.

Estimación
En inferencia estadística se llama estimación al conjunto de técnicas que
permiten dar un valor aproximado de un parámetro de una población a partir de los
datos proporcionados por una muestra.
Por ejemplo, una estimación de la media de una determinada característica de
una población de tamaño N podría ser la media de esa misma característica para
una muestra de tamaño

Pueden dividirse los procedimientos de estimación en dos tipos, estimación


puntual y estimación por intervalo. Supongamos que en un ecosistema de pinos se
estima la altura media de las plantas mediante un solo número, por ejemplo 8.75
metros, o podríamos afirmar que la altura de los árboles varía en un intervalo de
6.45 a 10.15 metros. El primer tipo se llama estimación puntual, ya que se puede
asociar al único número que presenta la estimación, un punto sobre una recta. El
segundo tipo se llama estimación por intervalo, porque se tienen dos puntos que
definen un intervalo sobre una recta
Qué son parámetros, estimaciones de parámetros y distribuciones de muestreo

Cuando usted desea determinar información acerca de una característica


particular de la población (por ejemplo, la media), generalmente toma una muestra
aleatoria de esa población porque no es factible medir toda la población. Utilizando
esa muestra, usted calcula la característica de la muestra correspondiente, que se
usa para resumir información acerca de la característica desconocida de la
población. La característica de interés de la población se conoce como parámetro
y la característica correspondiente de la muestra es el estadístico de la muestra o
la estimación de parámetro

El estadístico es un resumen de información acerca de un parámetro obtenido a


partir de la muestra, el valor de un estadístico depende de la muestra específica
que fue extraída de la población. Sus valores cambian aleatoriamente de una
muestra aleatoria a la siguiente, por lo que un estadístico es una cantidad aleatoria
(variable). La distribución de probabilidad de esta variable aleatoria se denomina
distribución de muestreo

Acerca de los parámetros


Los parámetros generalmente se representan con letras griegas para distinguirlos
de los estadísticos de muestra. Por ejemplo, la media de la población se
representa con la letra griega mu (μ) y la desviación estándar de la población, con
la letra griega sigma (σ). Los parámetros son constantes fijas, es decir, no varían
como las variables. Sin embargo, sus valores por lo general se desconocen,
porque es poco factible medir una población entera.

Acerca de las distribuciones de muestreo


Una distribución de muestreo es la distribución de probabilidad de un estadístico
dado, como la media. Para ilustrar una distribución de muestreo, examinemos un
ejemplo sencillo donde se conoce toda la población. Por ejemplo, la siguiente tabla
muestra los pesos de toda la población de 6 calabazas. Las calabazas solo
pueden tener uno de los valores de peso incluidos en la siguiente tabla.

Incluso si se conoce toda la población, con fines ilustrativos, tomamos todas las
muestras aleatorias posibles de la población que contengan 3 calabazas (20
muestras aleatorias). Luego, calculamos la media de cada muestra. La distribución
de muestreo de las medias de las muestras es descrita por todas las medias de
muestra de cada muestra aleatoria posible de 3 calabazas, lo cual se refleja en la
siguiente tabla.

DISTRIBUCIÓN NORMAL No. 3

Distribución Normal

Su propio nombre indica su extendida utilización, justificada por la frecuencia o


normalidad con la que ciertos fenómenos tienden a parecerse en su
comportamiento a esta distribución.
Muchas variables aleatorias continuas presentan una función de densidad cuya
gráfica tiene forma de campana.
La distribución normal, distribución de Gauss o distribución gaussiana, es la distribución
de probabilidad continua más utilizada en el curso de estadística. La distribución normal
nos permite crear modelos de muchísimas variables y fenómenos, como por ejemplo, la
estatura, la temperatura ambiental de una ciudad, los errores de medición, y muchos otros
fenómenos naturales, sociales, y hasta psicológicos.

Características de la distribución normal


Toma en cuenta la media (µ) y la desviación estándar
(σ).
• El área bajo la curva es igual a uno.
• Es simétrica respecto al centro, o a la media.
• 50% de los valores son mayores que la media, y
50% de los valores son menores que la media.
• La media es igual a la mediana y a la moda.
• Tiene una asíntota en y = 0 (eje x).

La distribución normal estándar


La distribución normal estándar, es aquella distribución
normal que tiene una media igual a cero, y
una desviación estándar igual a uno. Veamos la función
densidad normal estandarizada, que trabaja con la
variable estandarizada z en el eje horizontal:

ejemplo
Por ejemplo, si se desea encontrar la probabilidad de que la variable estandarizada z, tome
un valor entre 0 y 1,50; hay que encontrar el área bajo la curva entre z = 0 y z = 1,50.
a) P(0 ≤ Z ≤ 1,25).
b) P(Z ≥ 1,25).
c) P(Z ≤ −1,25).
d) P(0 ≤ Z ≤ 1,33).
a) P(0 ≤ Z ≤ 1,25). Rpta: 0,3944
b) P(Z ≥ 1,25). Rpta: 0,1056
c) P(Z ≤ −1,25). Rpta: 0,1056
d) P(0 ≤ Z ≤ 1,33). Rpta: 0,4082

¿Y si mi distribución normal no es estandarizada?


En esos casos, se convierten los valores de la variable (x) a z, es decir, se estandarizan los
valores de la variable (x).
La fórmula de la variable estandarizada «z», la cual indica cuántas desviaciones estándar se
aleja el valor x de la media, es la siguiente:

Ejemplo: Se supone que los resultados de un examen siguen una distribución normal con
media 78 y desviación típica 36. Se pide:
1. ¿Cuál es la probabilidad de que una persona que se presenta el examen obtenga una
calificación superior a 72?

Respuestas
476 estudiantes
0
11

Teorema del límite central

El teorema del límite central es un teorema fundamental de probabilidad y estadística. El


teorema describe la distribución de la media de una muestra aleatoria proveniente de una
población con varianza finita. Cuando el tamaño de la muestra es lo suficientemente
grande, la distribución de las medias sigue aproximadamente una distribución normal.

El teorema central del límite (TCL) es una teoría estadística que establece que, dada
una muestra suficientemente grande de la población, la distribución de las medias
muestrales seguirá una distribución normal.

Además, el TCL afirma que a medida que el tamaño de la muestra se incrementa, la media
muestral se acercará a la media de la población. Por tanto, mediante el TCL podemos
definir la distribución de la media muestral de una determinada población con
una varianza conocida. De manera que la distribución seguirá una distribución normal si el
tamaño de la muestra es lo suficientemente grande.

Principales propiedades del Teorema del Limite Central


Si el tamaño de la muestra es suficientemente grande, la distribución de las medias
muestrales seguirá aproximadamente una distribución normal. La media poblacional y la
media muestral serán iguales.
Es decir, la media de la distribución de todas las medias muestrales será igual a la media del
total de la población.
La varianza de la distribución de las medias muestrales será σ²/n. Que es la varianza de la
población dividido entre el tamaño de la muestra.

Ejemplo para comprender el Teorema


Imaginemos que queremos analizar las rentabilidades medias históricas del índice P&G,
que como sabemos, tiene unas 500 compañías dentro del mismo. Pero no tenemos
suficiente información como para analizar la totalidad de las 500 compañías del índice. En
este caso la rentabilidad media del P&G sería la media poblacional.
Ahora bien, siguiendo al TCL podemos coger una muestra de estas 500 empresas para
realizar el análisis. La única limitación que tenemos es que en la muestra tiene que haber
más de 30 compañías para que se cumpla el teorema. Entonces imaginemos que cogemos
50 compañías del índice de manera aleatoria y repetimos el proceso varias veces. Los pasos
a seguir del ejemplo serían los siguientes:
Elegimos la muestra de unas 50 compañías y obtenemos la rentabilidad media de la
totalidad de la muestra.
De manera continuada seguimos escogiendo 50 compañías y obtenemos la rentabilidad
media.
La distribución de todas las rentabilidades medias de todas las muestras escogidas se
aproximará a una distribución normal.
Las rentabilidades medias de todas las muestras seleccionadas se aproximará a la
rentabilidad media del total del índice. Tal y como demuestra el teorema Central del Límite.
Por tanto mediante inferencia de la rentabilidad media de la muestra podemos acercarnos a
la rentabilidad media del índice.

Ejercicios de aplicación
Ejemplo: Una empresa de mensajería que opera en la ciudad tarda una media de 35
minutos en llevar un paquete, con una desviación típica de 8 minutos. Supongamos que
durante el día de hoy han repartido doscientos paquetes.
a) ¿Cuál es la probabilidad de que la media de los tiempos de entrega de hoy esté entre 35 y
36 minutos?
b) ¿Cuál es la probabilidad de que, en total, para los doscientos paquetes hayan estado más
de 115 horas?

Por el teorema del límite central sabemos que la media muestral se comporta como una

𝑆=√(𝜎^2/𝑛)=𝜎/√𝑛=8/√200=0.5656
normal de esperanza 35 y desviación típica:

P [ 35 ≤ 𝑋 ̅ ≤ 36 ]
P [ 0 ≤ Z ≤ 1.768 ]
P = 0.4616
Tenemos una probabilidad del 0,4616 de que la media del tiempo de entrega de hoy haya
estado entre 35 y 36 minutos.

b). Por lo que respecta a la segunda pregunta, de entrada debemos pasar las horas a
minutos, ya que ésta es la unidad con la que nos viene dada la variable. Observa que 115
horas por 60 minutos nos dan 6.900 minutos. Se nos pide que calculemos la probabilidad
siguiente:

P [ ̅ ≥ 6900/200 ]
P [ ̅ ≥ 34.5 ]
P [ Z ≥ -0.884 ]
P [ Z ≤ 0.884 ]
P = 0.5 + 0.3106 = 0.8106
ESTIMACIÓN DE PARÁMETROS No. 4

Distribución muestral de Proporciones


Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino
que queremos investigar la proporción de artículos defectuosos o la proporción de
alumnos reprobados en la muestra. La distribución muestral de proporciones es la
adecuada para dar respuesta a estas situaciones. Esta distribución se genera de igual
manera que la distribución muestral de medias, a excepción de que al extraer las
muestras de la población se calcula el estadístico proporción (p=x/n en donde "x" es el
número de éxitos u observaciones de interés y "n" el tamaño de la muestra) en lugar del
estadísitico media.

La estimación de parámetros es el procedimiento utilizado para conocer las


características de un parámetro poblacional, a partir del conocimiento de la muestra.
Con una muestra aleatoria, de tamaño n, podemos efectuar una estimación de un valor
de un parámetro de la población; pero también necesitamos precisar un:
Intervalo de confianza

Intervalo de confianza
Se llama así a un intervalo en el que sabemos que está un parámetro, con un nivel de
confianza específico.
Nivel de confianza
Probabilidad de que el parámetro a estimar se encuentre en el intervalo de confianza.
Error de estimación admisible
Que estará relacionado con el radio del intervalo de confianza

Estimación puntual
La estimación de parámetros tiene por finalidad asignar valores a los parámetros
poblacionales a partir de los estadísticos obtenidos en las muestras. Dicho de otra
manera, la finalidad de la estimación de parámetros es caracterizar las poblaciones a
partir de la información de las muestras (por ejemplo, inferir el valor de la Media de la
población a partir de los datos de la muestra).
Si la muestra es representativa de la población, podemos esperar que los estadísticos
calculados en las muestras tengan valores semejantes a los parámetros poblacionales, y
la estimación consiste en asignar los valores de los estadísticos muestrales a los
parámetros poblacionales. Los estadísticos con que obtenemos las estimaciones se
denominan estimadores.
La estadística provee técnicas que permiten obtener conclusiones generales a partir de
un conjunto limitado – pero representativo – de datos. Cuando inferimos no tenemos
garantía de que la conclusión que obtenemos sea exactamente correcta. Sin embargo, la
estadística permite cuantificar el error asociado a la estimación.
El objetivo de la estimación puntual es usar una muestra para obtener números que, en
algún sentido, sean los que mejor representan a los verdaderos valores de los
parámetros de interés.
Notaci´on: θ = parametro que se quiere estimar θ ˆ = estimador de θ

Características estimadores
Sesgo: se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor
esperado) del estimador y el verdadero valor del parámetro a estimar. Es deseable que
un estimador sea insesgado o centrado, es decir, que su sesgo sea nulo por ser su
esperanza igual al parámetro que se desea estimar.
Por ejemplo, si se desea estimar la media de una población, la media aritmética de la
muestra es un estimador insesgado de la misma, ya que su esperanza (valor esperado) es
igual a la media de la población.

Consistencia: También llamada robustez, se utilizan cuando no es posible emplear


estimadores de mínima varianza, el requisito mínimo deseable para un estimador es que
a medida que el tamaño de la muestra crece, el valor del estimador tiende a ser el valor
del parámetro, propiedad que se denomina consistencia.

Ejemplo

En una población de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho tres
muestreos aleatorios (número de muestras= 100) con los siguientes resultados:
vemos que el muestreo en que n=100 la Media de las Medias muestrales toma el mismo
valor que la Media de la población.

EFICIENCIA:
Un estimador es más eficiente o preciso que otro, si la varianza del primero es menor
que la del segundo.

SUFICIENTE
Se dice que un estimador es suficiente cuando resume toda la información relevante
contenida en la muestra, de forma que ningún otro estimador pueda proporcionar
información adicional sobre el parámetro desconocido de la población

CONVERGENCIA:
Para estudiar las características de un estimador no solo basta con saber el sesgo y la
varianza, sino que además es útil hacer un análisis de su comportamiento y estabilidad
en el largo plazo, esto es, su comportamiento asintótico. Cuando hablamos de
estabilidad en largo plazo, se viene a la mente el concepto de convergencia. Luego,
podemos construir sucesiones de estimadores y estudiar el fenómeno de la
convergencia.

2) En una ciudad se toma una muestra de 160 personas, de las cuales 49


practican deporte. Determina y calcula un estimador puntual para la proporción
de personas que practican deporte en la ciudad.

3) Se ha realizado un estudio estadístico donde el peso, en kg, y el sexo de los


recién nacido durante seis meses en un hospital. El peso de 15 de ellos es :
3.215 3.315 2.987 2.853 3.054 2.900 2.873 3.108
3.115 2.799 2.869 3.008 3.106 3.115 2.875
Además, 7 de esos bebés son niños. Determina un estimador puntual para :
a) El peso medio de la población.
b) La proporción de niños nacidos.

Al lanzar una moneda al aire 20 veces, salen 12 caras. ¿Cuál es la estimación


puntual de la probabilidad de cara? ¿Es evidente que la moneda está trucada?,
¿Por qué?

n=20 X=12
La estimación puntual es p=12/20=0,6

Estimación por intervalos

Ante las limitaciones que presenta la estimación puntual se puede hacer uso de otro
método de estimación, la estimación por intervalos, éste es un procedimiento
alternativo cuando la estimación puntual no es capaz de proporcionar información
eficiente para describir el comportamiento de una característica de la población.
La estimación por intervalos es un procedimiento de la estadística inferencial
mediante el cual se realizan cálculos con los datos de una muestra cuyo resultado
son dos valores números que definen un rango, intervalo o conjunto numérico que
servirá para estimar el parámetro poblacional.

Por ejemplo, si se desea estimar el promedio de edad de la población estudiantil de una


universidad y para ello elegimos una muestra, utilizando la estimación por intervalos se
obtienen dos valores, por ejemplo 22.5 y 24.5, lo que quiere decir que el verdadero
valor del promedio de edad de esa población estudiantil se encontrará dentro del rango
de 22.5 a 24.5 años de edad, aunque nunca se sabrá con exactitud su verdadero valor.
Una manera de expresar formalmente este resultado es utilizando corchetes: [22.5,
24.5].
Estimación de la media de una población mediante intervalos de confianza
Como se ha señalado uno de los métodos para estimar la media de una población es a
través de intervalos de confianza.
Existen dos fórmulas para poder estimar la media de una población a través de
intervalos de confianza y el uso de cada una de ellas depende del caso que se examine.
En primer lugar se mostrará un método generalmente utilizado cuando se dispone de
muestras grandes, es decir, para aquellas muestras compuestas de 30 o más datos. Este
método también puede ser utilizado para muestras menores a 30 datos, siempre y
cuando se tenga pleno conocimiento que la distribución de los datos de la población sea
normal y que se conozca el valor de la varianza poblacional o de la desviación estándar
poblacional.
En segundo lugar se mostrará un método empleado para el caso de muestras pequeñas
cuando se desconoce el valor de la varianza poblacional o de la desviación estándar
poblacional, siempre y cuando también se tenga pleno conocimiento de que la
distribución de los datos de la población sea normal.
Por último se presentará un método para estimar la diferencia que existe entre las
medias poblacionales de dos conjuntos de datos distintos. Este método ofrece grandes
ventajas cuando se desea conocer si existen diferencias significativas en la forma en que
se concentran los datos de dos poblaciones distintas.
Formulas
IC intervalo de confianza
e error

IC = [ x −𝑒 ;𝑥+𝑒 ]
_ _

e = zα/ 2.σ
√n

Los elementos que conforman el intervalo de confianza son:


_
X = Media de la muestra.

𝜎/√𝑛= Es el error estándar de la media muestral.


Zα/2 = Es el valor de Z situado bajo la curva normal estandarizada.

El nivel de confianza
El nivel de confianza sirve para determinar el valor de Zα/ 2. Para esto, uno determina un
nivel de confianza considerable, por ejemplo, 90%, 95%, 98% o 99%. Este nivel de
confianza se define como (1 – α)% y señala el porcentaje de todos los intervalos que se
pueden construir con todas las medias muestrales posibles que contendrán al verdadero
valor de la media poblacional. Cabe señalar que se define como el nivel de significancia
y representa la probabilidad de que el parámetro μ no se encuentre considerado dentro
del intervalo estimado. Los niveles de confianza más comunes y sus respectivos valores
de Z α/ 2 son:
Ejemplo 1
Una máquina de refrescos está ajustada de tal manera que la cantidad de líquido
despachada se distribuye aproximadamente en forma normal con una desviación
estándar igual a 0.15 litros. Si se toma una muestra de 25 refrescos cuya media fue de
2.25 litros, ¿cuál sería el intervalo de confianza de 95% para la media de todos los
refrescos que sirva esta máquina?
n = 25
X = 2.25

𝜎= 0.15
Z α/ 2 = 1.96

Un fabricante de papel para computadora tiene un proceso de producción que opera


continuamente a lo largo del turno. Se espera que el papel tenga una media de longitud
de 11 pulgadas. De 500 hojas se selecciona una muestra de 29 hojas con una media de
longitud del papel de 10,998 pulgadas y una desviación estándar de 0,02 pulgadas.
Calcular la estimación del intervalo de confianza del 99%
Solución:
Los datos del problema son

Si se estima la media de una población con distribución normal y desviación estándar 3,


a través de un intervalo de 95% de confianza, y para ello se extrae una muestra de
tamaño 25, el error máximo de la estimación es:
a) 0.2352
b) 1.0266
c) 2.064
d) 1.176
Si se tiene un nivel de confianza de 98%, el nivel de significancia será de:
a) 0.001
b) 0.1
c) 0.01
d) 0.02

Al asumir la nueva administración de un banco, los nuevos directivos encontraron un


problema: no disponen de información detallada sobre los préstamos otorgados a través
de una tarjeta de crédito.
Conseguir esta información les tomará varias semanas y el nuevo director general desea
conocer, en menos de 24 horas, ¿cuál es el promedio aproximado de endeudamiento de
los tarjetahabientes? Por lo anterior, el departamento de crédito revisó de manera
aleatoria los expedientes de 36 clientes y observó que su promedio de endeudamiento
ascendía a 8 168 pesos con una desviación estándar de 1 200 pesos. ¿Cuál es el
intervalo para estimar el promedio de endeudamiento de toda la población de
tarjetahabientes que se le informaría al nuevo director general si se utiliza un nivel de
confianza de 90% y de 99%?

También podría gustarte