Descriptiva II 2017 UNQ
Descriptiva II 2017 UNQ
Descriptiva II 2017 UNQ
ESTADISTICA DESCRIPTIVA
En un problema de Probabilidad, se supone que se conocen las propiedades de
la población en estudio, y se formulan y responden preguntas respecto de una
muestra.
Una fábrica de zapatos está investigando cajas que sean más resistentes a la
compresión. Para eso analiza 4 tipos de cajas diferentes. ¿Las cajas difieren en
su resistencia a la compresión?
Recolección de datos
Organizar y resumir datos – sacar conclusiones
Censo vs. Muestra: tiempo y $$
Variables cualitativas
Registran la presencia de un atributo, una categoría, éstas deben ser
mutuamente excluyentes y exhaustivas (pueden cuantificarse, de alguna
manera). Por ejemplo:
Por ejemplo:
Fuma – No fuma
Grupo sanguíneo: A, B, AB, 0
Variables cuantitativas
Cuantitativa continua:
Altura de los alumnos
Como cargar R:
http://www.r-project.org/
http://cran.r-project.org/
Figura en Argentina la Universidad Nacional de La Plata:
http://mirror.fcaglp.unlp.edu.ar/CRAN/
Instalar paquetes en R: Desde la ventana de comandos:
>library(Devore7)
GRAFICOS
Gráfico de tallo hoja (Stem leaf)
Gráfico de puntos (Dot plots)
Diagrama de barras (Bar charts)
Histograma (Histogram)
Diagrama de frecuencias acumuladas
Polígono de frecuencias
Boxplot
QQplot
Datos:
15, 16, 21,23, 23, 26, 26, 30, 32, 41
84 49 61 40 83 67 45 66 70 69 80 58 68 60 67 72 73 70 57 63 70 78 52 67
53 67 75 61 70 81 76 79 75 76 58 31
> stem(xmp01.01$temp)
The decimal point is 1 digit(s) to the right of the |
3 | 1
4 | 059
5 | 23788
6 | 01136777789
7 | 000023556689
8 | 0134
> stem(xmp01.05$bingePct)
0 | 4
0 |
1 | 134
1 | 5678889
2 | 12234
2 | 56666777889999
3 | 0112233344
3 | 555666677777888899999
4 | 11122222334444
4 | 5566666677788888999
5 | 001112222334
5 | 55666667777888899
6 | 011112444
6 | 55666778
Gráfico de puntos
Es un atractivo resumen de datos numéricos cuando el conjunto es
relativamente pequeño.
Así como el tallo hoja, el grafico de puntos nos da información sobre
localización, dispersión, extremos y cortes.
> dotplot(xmp01.05$bingePct)
Diagrama de Barras
Rcmdr:
Datos – Conjuntos de datos en paquetes – Leer conjunto de datos en paquete
adjunto: Devore7 – ex01.29
Ejemplo
Tras encuestar a 25 familias acerca del número de hijos que tenían, se
obtuvieron los siguientes resultados: datos discretos.
> hist(tmp)
Medidas de resumen
Media Muestral
Modo o Moda
Es la observación de mayor frecuencia.
Puede haber más de una.
Puede no existir.
Es de poca importancia.
En la 1ª y 2ª muestra, Modo=2
> summary(tmp)
Min. 1st Qu. Median Mean 3rd Qu. Max.
31.00 59.50 67.50 65.86 75.00 84.00
Ejemplo
Varianza Muestral
En la 3ª y 4ª Muestra, Media y Mediana coinciden (5)
y el Rango también coincide (10)
Se calcula la Varianza Muestral como:
Gráficamente esto es ….
Histograma y Box Plot, para los datos de los pesos reportados y reales
de pacientes.