Clase1 PDF
Clase1 PDF
Clase1 PDF
•2
Conceptos básicos cont.
•Muestra Aleatoria: es una muestra bien
representativa de la población. Se considera que cada
elemento de la población ha tenido la misma
oportunidad de formar parte de la muestra.
Las conclusiones basadas en una muestra aleatoria son
confiables.
fi: población
ikt: muestra
Conceptos básicos cont.
Variable: una variable es una característica observable que
varía entr e los difer entes individuos de una población. La
información que disponemos de cada individuo es resumida
en variables.
Dato: es un valor particular de la variable
7
División de la Estadística
Estadistica fi escriptiva: Conjunto cíe
técnicas y métodos que son usados para
recolectar, organizar, y presentar en
forma de tablas y gráficas información
numérica. También se incluyen aquí el
cálculo de medidas estadísticas de
centralidad y de variabilidad.
9
Pasos en un estudio estadístico
Plantear hipótesis sobre una población:
Los fumadores tienen "más ausencias" laborales
que los no fumadores.
¿En qué sentido? ¿Mayor número? ¿Tiempo medio?
70 85 85 75 65 90 110 95 90 70
60 75 SO 120 85 95 90 70 100 65
80 90 95 90 95 110 100 85 SO 75
La variable en estudio es
•1 6
Tabla de Frecuencias cont.
Ordenamos los datos en forma creciente:
Diagramas de barras
- Alturas proporcionales a
las frecuencias (abs. o rel.)
- Se pueden aplicar también
a variables discretas
Diagramas de sectores
(tartas, polares)
- El área de cada sector es
proporcional a su
frecuencia (abs. o rel.)
Gráficos para variables cualitativas cont.
21
Gráficos diferenciales para
variables numéricas
.
•n
•4 •6 0
•1
Estadísticos de forma intuitiva
24
Estadísticos
Posición (Basados en el orden
Dividen un conjunto ordenado de datos en grupos con la misma
•cantidad de individuos.
Cuantiles, percentiles, martiles, deciles,...
Centralización
Indican valores con respecto a los que los datos parecen agruparse.
Media, mediana y moda
Dispersión
Indican la mayor o menor concentración de los datos con respecto
a las medidas de centralización.
Desviación estándar, coeficiente de variación, rango, varianza
Forma
· Asimetría
· Apuntamiento o curtosis
Centralización
Añaden unos cuantos casos particulares a las
medidas de posición. Son medidas que buscan
posiciones (valores) con respecto a los que los
datos muestran tendencia a agruparse.
Variabilidad Entre-Sujetos:
Ejemplo: Los clientes tienen comportamientos, hábitos de compras,
características y gustos distintos. Una forma de visualizar la variabilidad es
observando corno se distribuyen los clientes en cuanto a comportamiento
hábitos de compras, características y gustos distintos.
33
Conceptos de Variabilidad cont.
Variabilidad Intra-Sujetos:
Ej.: Los mismos clientes pueden cambiar a través del tiempo. Los
ciudadanos con derecho a voto en un país, pueden cambiar sus
preferencias, especialmente a días de una elección. Esto puede ser
más intenso en aquellos individuos más indecisos.Tarnbién es
relevante mencionar que el instrumento mismo y cómo fue diseñado,
puede alterar las respuestas de los individuos. También es llamada
variabilidad por error de medición según, sea el caso.
Variabilidad Muestra':
Se introduce al estudiar una muestra de la población. En muchas
investigaciones de mercado al estudiar una población objetivo mediante
una encuesta, debemos hacerlo a través de una muestra.
34
Conceptos de Variabilidad cont.
35
Conceptos de Variabilidad cont.
La media de estos 350 datos es 61.9, Ío que corresponde media poblacional
63,7 62,4 56.5 66.9 61.7 55.7 87.4 58.9 62.7 59.1
61,6 70,1 58.8 59.6 57,3 59.3 59.0 60.6 61.6 65.8
65,2 57,9 53.6 65.0 59,5 571 66.3 57.2 66.2 57.7
68O 65,0 653 65.5 578 631 6O1 66O 598 6O5
Conceptos de Variabilidad cont.
Conceptos de Variabilidad cont.
•
40 muestras de tamaño 30
68
66 ••
64
•• ••
•• ••
••
ee
••
• •• ••
••••
••
•
••
60 ••
••
••
••
58
56
TIT1I
oT I T 1 I10 20 40
30
o
Muestra
Muestra
Conceptos de Variabilidad cont.
40 muestras de tamaño 100
40
Distribución de Frecuencias
Distribución de Frecuencias
Medidas de Resumen de Centralización
46
Medidas de Resumen de Centralización cont.
La media es sensible a la presencia de datos
extremos.
La mediana es muy útil cuando la distribución de la
variable es poco simétrica.
47
•Medidas de Resumen de Centralización cont.
48
Medidas de Resumen de Dispersión
Medidas de Resumen de Dispersión cont.
Desviación Estándar
54
Medidas de Resumen de Dispersión cont.
55
Coeficiente de variación •
s 56
Medidas basadas en el Orden (Posición)
Estadísticos de Posición
59
Estadísticos de Posición cont.
Percentil de orden k = cuantil de orden kii100
65
Box-plot (Caja con bigotes)
•6 6
Box-plot cont.
Un gráfico asociado a los cuartiles es el box-plot: en un eje se
ubican los siguientes 5 números extraídos de una muestra:
mínimo, cuartil 1, cuartil 2, cuartil 3 y máximo.
69
Estadísticos de Forma: Asimetría y Curtosis
Momentos de una distribución
Los momentos de una distribución son medidas obtenidas a partir de
todos sus datos y de sus frecuencias absolutas. Estas medidas
caracterizan de tal forma a las distribuciones que si los momentos de
dos distribuciones son iguales, diremos que las distribuciones son
iguales. Podemos decir que dos distribuciones son más semejantes
cuanto mayor sea el número de sus momentos que coinciden.
Se define el momento de orden h respecto al origen de una
variable estadística como:
71
Estadísticos de Forma cont.
Forma de una distribución
Cuando dos distribuciones coinciden en sus medidas de
posición y dispersión, no tenemos datos analíticos para ver si
son distintas. Una forma de compararlas es mediante su forma.
Bastará con comparar la forma de sus histogramas o diagramas
de barras para ver si se distribuyen o no de igual manera.
•7 2
La asimetría y su medida
El objetivo de la medida de la asimetría es, sin
necesidad de dibujar la distribución de
frecuencias, estudiar la deformación horizontal de
los valores de la variable respecto al valor central
de la media. Las medidas de forma pretenden
estudiar la concentración de la variable hacia uno
de sus extremos.
Una distribución es simétrica cuando a la derecha
y a la izquierda de la media existe el mismo
número de valores, equidistantes dos a dos de la
media, y además con la misma frecuencia.
73
La asimetría y su medida cont.
•7 4
•La asimetría y su medida cont.
•Coeficiente de asimetría de Fisher
En una distribución simétrica los valores se sitúan en torno a
•la media aritmética de forma simétrica. El coeficiente de
•asimetría de Fisher se basa en la relación entre las distancias a
•la media y la desviación típica.
•75
La asimetría y su medida cont.
Coeficiente de asimetría de Pearson
Se basa en el hecho de que en una distribución simétrica, la
media coincide con la moda. A partir de este dato se define el
coeficiente de asimetría de Pearson como:
76
La curtosis y su medida
El concepto de curtosis o apuntamiento de una distribución
surge al comparar la forma de dicha distribución con la forma
de la distribución Normal. De esta forma, clasificaremos las
distribuciones según sean más o menos apuntadas que la
distribución Normal.
Coeficiente de Curtosis de Fischer
El coeficiente de curtosis o apuntamiento de Fischer
pretende comparar la curva de una distribución con la curva de
la variable Normal, en función de la cantidad de valores
extremos e la distribución. Basándose en el dato de que en una
distribución normal se verifica que:
77
La curtosis y su medida cont.
•Se define el coeficiente de curtosis de Fisher
como:
78