Varianza y Desviación Estándar
Varianza y Desviación Estándar
Varianza y Desviación Estándar
ANTECEDENTES:
La estadística es diferente para cada persona de acuerdo a su visión y la utilización que la quiera dar. Es por
eso que más adelante nosotros adoptaremos una visión de estadística. Cabe mencionar como antecedentes
históricos que la palabra estadística tiene su origen en STATISTIK que proviene de la palabra statista
(Estadística), utilizada por primera vez por Gottfried Achenwaii (1719-1772).
Por otra parte se sabe que el doctor E.A.W. Zimmenman introdujo el término Estadística en Inglaterra. Su
uso y divulgación lo realizo Sir John Sinclain en su obra “Statistical Account of Scotland (1791-1799).
DEFINICIÓN:
Es la rama de las matemáticas que se encarga de enseñar las reglas para colectar, organizar presentar y
procesar los datos obtenidos al realizar varias veces el experimento asociado a un fenómeno o variable de
interés, y para el diseño estadístico y para tomar decisiones cuando aparecen situaciones de incertidumbre.
ESTADÍSTICA:
Inferencial: Trata los métodos para generar conclusiones sobre una población a través de una muestra
aleatoria obtenida de ella. También permite desarrollar conclusiones sobre varias poblaciones empleando
muestras aleatorias de ellas.
PRESENTACIÓN NUMÉRICA:
Ejemplo: Durante una semana se observo que las tasas de interés de CETES (certificados de la tesorería) fueron:
22.32%, 21.40%, 20.70%, 20.69%, 20.06%
Series de Frecuencias: Consiste en organizar los datos obtenidos convenientemente por medio de dos
columnas, la de la izquierda indicara la o las características del fenómeno o experimento del estudio y la otra
columna indica el numero de casos presentados. (Frecuencia)
1 10
2 6
3 8
4 3
5 ó más 1
Series de Clase y Frecuencias o de datos agrupados: Este tipo de presentación generalmente se utiliza con
objeto de facilitar la interpretación de la información por medio de tablas de datos ordenados y agrupados por
intervalos, dando origen a una tabla conocida, como Distribución de Frecuencias.
PRESENTACIÓN GRAFICA:
Dentro de este tipo de representación se tienen: Gráfica de barras, Cartogramas, Sectores circulares o de
pastel, Diagramas lineales, Pictogramas, Polígono de frecuencias e Histogramas.
Gráfica de barras: Este tipo generalmente se utiliza para mostrar datos de eventos de tipo cualitativos tanto
nominales o categóricos y ordinales o genéricos.
Pictogramas: Se utiliza a menudo para presentar en forma entendible para la mayoría de la gente.
Histograma: es un diagrama de barras que representa a escala el número de elementos que comprende cada
una de las clases de una distribución de frecuencias.
Procedimiento:
1. Se determinan los límites reales de cada clase, los cuales representan los valores extremos de
la base de las barras del histograma. Cada clase tiene su límite real inferior (L.R.I.) y un límite
real superior (L.R.S.). Es necesario agregar una clase al principio y otra al final para determinar
los límites reales.
2. En un par de ejes perpendiculares se representan los límites reales en el eje vertical.
3. Se trazan barras de tal forma que la base quede determinada por los límites reales y la altura
por la frecuencia de cada clase
Polígono de frecuencia: es una figura cerrada delimitada en su base por el eje horizontal, incluyendo la clase
anterior a la primera y la clase siguiente a la última; y cuyos vértices son los puntos centrales de la horizontal
superior de cada barra del histograma. Para trazarlo es necesario determinar la marca de clase.
Este se presenta en una pequeña muestra con valores menores de 10, para obtenerlas se saca un promedio
de todos los datos, encontrándose en forma ascendente; donde se encuentran las más comunes como son:
Media Aritmética
Mediana
Moda
Media Geométrica G
Media Armónica H
Mediana: Es el valor medio o la media aritmética de los valores medios en una muestra de datos
ordenados.
Para su cálculo se organizan los datos en forma ascendente y si se tiene un número impar de elementos, la
mitad del arreglo será la mediana y si por el contrario se encontrará un número par de elementos será el
promedio de los 2 que se hallen a la mitad.
N
F1
Donde contiene:
Moda: Si, X 1 , X 2 ... X n que no son necesariamente diferentes, constituyen una muestra aleatoria de
Donde contiene: 1
xˆ Linf C
1 f mod f inf
1 2
2 f mod f sup
Media Geométrica: Se aplica para calcular promedios cuando la información no tiene una tendencia lineal, y
su fórmula es:
G N ( X 1 )( X 2 )...( X n ) G N ( X 1 ) f1 ( X 2 ) f 2 ...( X n ) fn
Media Armónica: Se aplica cuando la información respectiva se expresa mediante razones y proporciones y
su fórmula es:
1 1 1 f1 f 2 f n
1 X1 X 2 X n 1 X1 X 2 X n
H N H N
Cuantiles
Son valores que dividen a la muestra en subdivisiones análogas, es decir, con el mismo número de datos.
El valor de Q2 es igual a la mediana y análogamente los valores que dividen los datos en 10 partes se
llaman deciles y se representan por D1 , D2 ,..., D9 mientras que los valores que dividen los datos en 100
partes iguales se llaman percentiles y se representan por P1 , P2 , P3 ,..., P99