Analisis Exploratorio de Datos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 61

La Estadística Aplicada

a la Investigación:
Análisis y Discusión de
los Datos Cuantitativos
VÍCTOR F. ZENA G.
ING. ELECTRÓNICA (UNA – PY)
MSC. ING. BIOMÉDICA (UPV – ES)
PHD. ING. ELECTRÓNICA (UPV-ES)
Evaluación

Tareas (4)
Tarea 1 – 10/10/2020
Tarea 2 – 17/10/2020
Tarea 3 - 24/10/2020
Tarea 4 - 31/10/2020
Software estadístico

 R

• Software libre
• Línea de códigos –
Orientado a objetos.
• Gran versatilidad en gráficos
• Lenguaje R
https://www.r-project.org
Software estadístico (I)

 Matlab

• Amplia toolbox estadística


• Aplicable a varias disciplinas científica
• Gran versatilidad en gráficos
• Líneas de códigos
• Lenguaje M

https://la.mathworks.com
Software estadístico (III)
¿Para qué sirve la
estadística?
 La ciencia se ocupa en general de fenómenos
observables.
 La ciencia se desarrolla observando hechos,
formulando leyes que lo explican y realizando
experimentos para validar o rechazar dichas
leyes.
 Los modelos que crea la ciencia son de tipo
deterministas y aleatorios (estocástico)
 La estadística se utiliza como tecnología al
servicio de las ciencias donde la incertidumbre y
la variabilidad forman parte de su naturaleza.
La estadística es la
ciencia de…

 Sistematización, recogida, ordenación y


presentación de los datos referentes a un
fenómeno que presenta variabilidad para su
estudio metódico con objeto de
 Deducir las leyes que rigen esos fenómenos,
 Y poder de esa forma hacer previsiones sobre los
mismos, tomar decisiones u obtener conclusiones.
Presentación ordenada
de datos
 Tablas de frecuencias y gráficas

Género Freq
Hombre 31
Mujer 59

Las tablas de
frecuencias y gráficos
son dos maneras
equivalentes de
expresar los resultados
Estudio estadístico… pasos
 Plantear la hipótesis sobre una población
- Los fumadores se ausentan más al trabajo que los no fumadores
- ¿En qué sentido? ¿Mayor número de ausencias? ¿tiempo medio de ausencia?
 Decidir que datos recoger (diseño de experimentos)
- ¿qué individuos pertenecerán al estudio (muestras)
Fumadores y no fumadores en edad laboral
Criterios de exclusión ¿cómo se eligen? ¿descartamos los que padecen enfermedades crónicas?
- ¿qué datos recoger de los mismos? (variables)
Número de ausencias
Tiempo de duración de cada ausencia
¿Sexo? ¿Sector laboral? ¿otros factores?
 Recolectar datos (muestreo)
- ¿Estratificado? ¿Sistemáticamente?
 Describir los datos obtenidos
- Tiempo medio de ausencias en fumadores y en no fumadores (estadísticos).
- Porcentaje de ausencias por fumadores y sexo (frecuencias), gráficos…
 Realizar Inferencia sobre la población
- Los fumadores están ausentes 10 veces/año más de media que los no fumadores
 Cuantificar la confianza en la inferencia
- Nivel de confianza del 95%
- Significación del contraste p=2%
Método científico y
estadística

Plantear Diseño de
Hipótesis experimento

Recoger
Obtener
datos y
conclusiones
analizarlos
Población y muestra

 es el conjunto sobre el que estamos


interesados en obtener conclusiones (hacer
inferencia).
Normalmente es muy grande para se abarcado.

 Muestra es un conjunto suyo al que tenemos


acceso y sobre el que realmente hacemos las
observaciones Población
- Debería ser representativo
- Está formado por miembros seleccionados de
la población (individuos, unidades
experimentales) Muestra
Variables
 Es una característica observable que varía entre los
diferentes individuos de una población. La información
que disponemos de cada individuo es resumida en
variables.
 Pueden ser o no numéricos
Son variables:
- Grupo sanguíneo (A, B, AB, O): cualitativas
- Nivel de felicidad (Deprimido, ni ahí, feliz): Ordinal
- El número de hijos (0, 1, 2, 3 …): numérica discreta
- Altura (1,62; 1,70;): var num. continua
Variables
 Cualitativas
Si sus valores no se pueden asociar naturalmente a un número (no
se pueden hacer operaciones algebraicas con ellos)
- Nominales: si sus valores no se pueden ordenar (sexo, grupo
sanguíneo, religión, nacionalidad, si/no)
- Ordinales: si sus valores se pueden ordenar (mejoría a un
tratamiento, grado de satisfacción, intensidad de dolor)
 Numéricas o cuantitativas
Si sus valores son numéricos (tiene sentido hacer operaciones
algebraicas con ellos)
- Discretas: si toma valores enteros (número de hijos, nro. de
cigarros, num. de cumpleaños)
- Continuas: si entre dos valores, son posibles infinitos valores
intermedios (altura, presión, distancia, edad)
Ejercicio 1

 Un estudio fue realizado para evaluar la polución


del aire y la mortalidad diaria de ancianos de
una ciudad. En 10 meses de estudio había en
promedio 3 muertes/dia. Pero en los meses de
elevada polución el promedio de muertes era de
4,5 muertes/dia. La polución se midió en
nro_partículas_suspendidas/mm3/mmHg

Identificar las variables utilizadas en el estudio, y el


tipo de cada una.
Ejercicio 2

 Defina si cada una de las siguientes


observaciones constituyen un ejemplo de
variables discretas o continuas:

▪ Número de suicidios en Paraguay en un año.


▪ Concentración de plomo en el agua potable
▪ Periodo de tiempo de estadía en un Hotel de
CDE
▪ Cantidad hijos
Ejercicio 3

 Identifique el tipo de variable


- Presión arterial
- Tiempo de pérdida de energía eléctrica de un Bo.
- Etapas del embarazo
- Número de hijos de una mujer paraguaya
- Grados funcionales de la ICC (Insuficiencia
Cardíaca Crónica)
Gráfico para variables
cualitativas
 Gráficos de barras
- Alturas proporcionales a las frecuencias
- Se pueden aplicar también a variables
discretas
 Diagrama de torta o sectores
- No usarlo con variables ordinales
- El área de cada sector es proporcional a su
frecuencia
 Pictogramas
- Fáciles de entender
- El área de cada modalidad debe ser
proporcional a la frecuencia
Gráficos en variables
numéricas
 Varían en función de si las variables son discretas o continuas.
Variables discretas pueden utilizarse gráfico de barras
Para variables continuas.. histogramas
Medidas y escalas de
medición
 Medición
Asignación de números a objetos o eventos de acuerdo con un
conjunto de reglas. Las escalas de medición son consecuencias
de los diferentes conjuntos de reglas.
 Escala nominal
Consiste en asignar o “nombrar” las observaciones en varias
categorías mutuamente excluyentes. (aplica a variables
cualitativas)
Ejemplo:
- Variables cualitativas: usar nros.
- Variables dicotómicas: masculino - femenino
sano – enfermo
fumador – no fumador
Medidas y escalas de
medición
 Escala ordinal
Además de poder diferenciarse en categorías, pueden clasificarse
en grados (orden) según un criterio.
Ej.: clase baja – clase media – clase alta
pac. bastante mejorado – pac. Mejorado – pac. sin mejorar
 Escala de intervalos
No solo se pueden ordenar las mediciones (como en ordinal) sino
que también se conoce al distancia entre dos mediciones
cualesquiera.
Ej.: se sabe que la diferencia entre una medida 20 y 30 es igual a
una diferencia entre 30 y 40.
A diferencia de la escala ordinal, la de intervalos es realmente
cuantitativa. El punto cero es relativo (caso de la temperatura)
Medidas y escalas de
medición
 Escala de razones
Puede determinarse tanto la igualdad como los
intervalos. Es fundamental un punto cero.

Escala de razón Escala intervalos


Medidas y escalas de
medición

Escala de medidas

Nominal Datos nominales


(cualitativos)

Ordinal Datos ordinales


(cualitativos)

Intervalo
Datos cuantitativos
Razón
Muestreo aleatorio simple
 Definición: sistema de
selección en que se
extrae una muestra de
tamaño n de una
población de tamaño
N, de modo que cada
muestra posible de
tamaño n tenga la
misma probabilidad
de ser seleccionada

CON Reemplazo Se devuelve la muestra a la población una vez


extraída la información necesaria

NO se devuelve la muestra a la población, la


SIN Reemplazo muestra queda separada de la población
Muestreo aleatorio simple
 Tabla aleatoria
Muestreo aleatorio simple
 Ejercicio 4: se desea obtener una muestra
aleatoria simple de n=10 correspondiente a las
edades de un total de 160 individuos.

Mediante tabla aleatoria….

Mediante software… (Excel, SPSS etc..)

Ejercicio 4.1: Extraer individuos entre 55 kg a 120 kg y


edades entre 25 a 60 años. Luego, extraer el 15% como
muestra aleatoria simple (sin repetición).
Distribución de frecuencias
 Definición: son tablas donde se disponen las modalidades de
las variables por filas, en las columnas el número de
ocurrencias por cada valor, porcentajes, etc. La finalidad es
facilitar la obtención de la información que contienen los
datos
Tabla de datos agrupados en intervalos
Ejemplo de tabla

 ¿cuántos individuos tienen


menos de 2 hijos?
- Frec. Indiv. sin hijos + frec.
Indi. Con hijos=
= 419 + 255 = 674 individuos.
 ¿Qué % de individuos tiene
6 hijos o menos?
- 97,3%
 ¿Qué cantidad de hijos es
tal que al menos el 50% de
la población tiene una
cantidad inferior o igual?
- 2 hijos
Distribución de frecuencias
 Intervalos: cada uno de los grupos de valores de la variable que
ocupa una fila.

𝑘 = 1 + 3,322 × log10 𝑛
Regla de Sturges

donde k es el numero de intervalos o clases y n el número de


valores en el conjunto de datos.
 Límites aparentes: valores, mayor y menor que son observados
en cada intervalo
 Amplitud de variación (R): diferencia entre los límites máximos y
mínimos de los datos (rango de valores)
 Tamaño de clase o intervalo
𝑅
𝑤=
𝑘
Distribución de frecuencias
 Ejercicio 5: En un estudio de cáncer se utilizaron dos métodos. Los
investigadores obtuvieron muestras de 203 pacientes. Los pacientes
tenían edades entre 26 y 82 años de edad.
Utilizando la tabla ejem231.xlsx,:
a) Construya con los datos:
- Una tabla de distribución de frecuencias en SPSS
- Un histograma
b) ¿Qué porcentaje de las mediciones es menor que 10?
c) ¿Qué proporción de individuos tiene mediciones mayores o iguales
que 20?
d) ¿Qué porcentaje de mediciones está entre 20 y 49, inclusive?
e) ¿Cuántas mediciones son mayores que 39?
f) ¿qué proporción de las mediciones es menor que 10 o mayor que 69?
Medidas de tendencia
central
 Media: se obtiene sumando todos los valores en
una población o muestra y dividiendo entre el
número de valores sumados

σ𝑁
𝑖=1 𝑥𝑖
Población 𝜇=
𝑁

σ𝑛𝑖=1 𝑥𝑖
Muestra 𝑥ҧ =
𝑛
Medidas de tendencia
central
 Media

Ejemplo: Una muestra aleatoria de 10 individuos tienen las


Siguientes edades:

Edades
σ𝑛𝑖=1 𝑥𝑖
42 31 32 𝑥ҧ =
𝑛
28 23 37
42 + 28 + 28 +∙∙∙ +40 + 22 428
28 50 40 𝑥ҧ = = = 37,6
12 12
61 34 22
Medidas de tendencia
central
 Media. Obs: la media se ve afectada por valores
extremos!

Salario de médicos:

75$
σ𝑛𝑖=1 𝑥𝑖
75$ 𝑥ҧ =
𝑛
80$
75$ + 75$ + 80$ + 280$ + 80$ 590$
280$ 𝑥ҧ = = = 118$
5 5
80$

118$ no es del todo representativo del conjunto de datos


Medidas de tendencia
central
 Mediana: el valor que divide al conjunto de datos
a la mitad. Cuando las variables han sido
arregladas en orden de magnitud
Si n es impar:

1 2 3 4 5

Si n es par:

1 2 3 4 5 6

3,5

𝑛+1
𝑚𝑒𝑑𝑖𝑎𝑛𝑎 =
2 𝑡é𝑟𝑚𝑖𝑛𝑜
Medidas de tendencia
central
 Mediana
Edades
42 31 32
22 23 28 28 31 32 34 37 40 42 50 61
28 23 37
28 50 40
61 34 22 12 + 1
𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = = 6,5𝑡é𝑟𝑚𝑖𝑛𝑜
2

32 + 34
𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = = 33 𝑎ñ𝑜𝑠
2
✓ Es única.
✓ Los valores extremos no tienen efectos importantes sobre la mediana
Medidas de tendencia
central
 Moda: el valor que más se repite (el valor que
ocurre con mayor frecuencia)

Edades

42 31 32 42 31 32 42 31 32
28 23 37 28 23 37 28 23 37
28 50 40 25 50 40 28 50 40
61 34 22 61 34 22 61 40 22

Edad modal No hay edad modal Edades modales


28 28, 40
 Percentiles y cuartiles: parámetros de
localización
Media y mediana son parámetros de “localización”
Extremo superior Septuagésimo percentil (P75)
25%
P75 = Q3 o tercer cuartir
Q3

25%

Quincuagésimo percentil (P50)


Mediana, Q2
P50 = mediana o Q2
25%

Q1
Vigésimo quinto percentil (P25)
25% Whisker
P25 = Q1 o primer cuartir
Extremo inferior
Outlier
Diagrama de cajas y bigotes
 Resumen con 5 números:

0.08
 Mínimo, cuartiles y máximo.

0.06
 Suelen dar una buena idea

densidad
de la distribución.

0.04
P25 P50 P75

0.02
Mín. Máx.

 La zona central, ‘caja’,


contiene al 50% central de

0.00
las observaciones. 40 45 50 55 60 65

 Su tamaño se llama ‘rango Pesos (kg)


intercuartílico’ (IQR)

 Es costumbre que ‘los


bigotes’, no lleguen hasta
0.04

los extremos, sino hasta las


observaciones que se
0.03

separan de la caja en no
densidad

más de 1,5 IQR.


0.02

 Más allá de esa distancia se Mín. P25 P50 P75 Máx.


0.01

consideran anómalas, y así


se marcan.
0.00

80 90 100 110 120 130 140


Altura (cm)
Medidas de
Tendencia Central

Media Mediana Moda


Medidas de dispersión
 Dispersión (variación, expansión): variedad que
muestran las observaciones.

Misma µ para
ambas poblaciones

Población A
#edades

Población B

µ edades
Medidas de dispersión

 Rango: diferencia entre el valor más pequeño y


el más grande de un conjunto de observaciones

𝑅 = 𝑥𝐿 − 𝑥𝑆

Edades
42 31 32
28 23 37 𝑅 = 𝑥𝐿 − 𝑥𝑆 = 61 − 22 = 39 𝑎ñ𝑜𝑠
25 50 40
61 34 22

✓ Utilidad limitada
Medidas de dispersión
 Miden el grado de dispersión de las variables
independientemente de su causa
 Amplitud o Rango:

0.05
Diferencia entre observaciones extremas.Mín. P25 P50 P75 Máx.

2,1,4,3,8,4. El rango es 8-1=7

0.04

 Es muy sensible a los valores extremos.

0.03
25% 25% 25% 25%

0.02
 Rango intercuartílico:
Rango intercuartílico
- Es la distancia entre primer y tercer cuartil.

0.01
Rango intercuartílico = P75 - P25
Rango
-

- Parecida al rango, pero eliminando 0.00


150 160 170 180 190
las observaciones más extremas
inferiores y superiores.
- No es tan sensible a valores extremos.
Medidas de dispersión
 Varianza S2 : Mide el promedio de las desviaciones (al cuadrado) de las
observaciones con respecto a la media.

1
S =  ( xi − x ) 2
2

n i
- Es sensible a valores extremos (alejados de la media).

- Sus unidades son el cuadrado de las de la variable (kg2, edad2, etc..). De


interpretación difícil para un principiante.

- La expresión es “fea”, pero de gran belleza “natural” (físicamente). Contiene la


información geométrica relevante en muchas situaciones donde la energía interna
de un sistema depende de la posición de sus partículas.

* Energía de rotación (vía el coeficiente de inercia): patinadores


con brazos extendidos (dispersos) o recogidos (poco dispersos)
* Energía elástica: Muelles ‘estirados’ con respecto a su posición de
equilibrio (dispersos) frente a muelles en posición cercana a su
posición de equilibrio (poco dispersos)
Medidas de dispersión

 Varianza (s2): medida de dispersión alrededor de


la media
Edades σ𝑛𝑖=1(𝑥𝑖 − 𝑥)ҧ 2
2
𝑠 =
42 31 32 𝑛−1
Grados de libertad
28 23 37
28 50 40
61 34 22

2
2
42 − 37,6 + 28 − 37,6 2 + ⋯ + 22 − 37,6 2
𝑠 = = 128,24 𝑎ñ𝑜𝑠 2
12 − 1
Medidas de dispersión
50

Desviación estándar (‘desviación típica’)


40

Es la raíz cuadrada de la varianza


30
 Tiene las misma dimensionalidad (unidades)
que la variable. Versión ‘estética’ de la varianza.
20

 Ciertas distribuciones como la normal o


gaussiana quedarán completamente 10
Desv. típ. = 568,43

determinada por la media y la desviación estd. Media = 2023


0 N = 407,00
1. 2. 2. 3.
50 90 30 1.70 2.
10 50 90 30
0 0 0 0 0 0 0 0
A una distancia de una desv. estd. de la media hay
más de la ‘más de la mitad’.
Peso recién nacidos en partos gemelares

* A una distancia de dos desv. estd. de la media las tendremos casi todas.
Medidas de dispersión

 Desviación estándar (s): raíz cuadrada de la


varianza
Edades
σ𝑛𝑖=1(𝑥𝑖 − 𝑥)ҧ 2
42 31 32 𝑠=
𝑛−1
28 23 37
28 50 40
61 34 22

42 − 37,6 2 + 28 − 37,6 2 + ⋯ + 22 − 37,6 2


𝑠= = 128,24 = ±11,32 𝑎ñ𝑜𝑠
12 − 1

Edades = 37,60 ± 11,32 años


Medidas de dispersión
Coeficiente de variación

S
Es la razón entre la desviación estd. y la media.
 Mide la desviación típica en forma de
CV =
“qué tamaño tiene con respecto a la media”
x
 También se la denomina variabilidad relativa.

 Es frecuente mostrarla en porcentajes


 Si la media es 80 y la desviación típica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)

 Es una cantidad adimensional. Interesante para comparar la variabilidad de


diferentes variables.
 Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más dispersión
en peso que en altura.

 No debe usarse cuando la variable presenta valores negativos o donde el valor 0


sea una cantidad fijada arbitrariamente
 Por ejemplo 0ºC ≠ 0ºF
Medidas de dispersión

 Coeficiente de variación: desviación estándar


como porcentaje de la media.
𝑠
𝐶. 𝑉. = ∙ (100)
𝑥ҧ

¿Cuál tiene mayor variabilidad?


4,53
Muestra Muestra 𝐶. 𝑉. = ∙ 100 = 6,88
65,77
1 2
Edad 25 11
Peso medio (kg) 65,77 36,28
4,53
s (kg) 4,53 4,53 𝐶. 𝑉. = ∙ 100 = 𝟏𝟐, 𝟒𝟖
36,28
Medidas de
dispersión

Coeficiente
Desviación
Rango Varianza de
estándar
variación
Resumen
 Posición
Dividen un conjunto de datos ordenados en grupos:
percentiles, cuartiles.
 Centralización
Indican valores de las variables a los que los datos
tienden a agruparse: Media, Moda, Mediana
 Dispersión
Indican la mayor o menor concentración de datos con
respecto a la medida de centralización
 Forma
- Asimetría
- Apuntamiento o curtosis
Ejemplo
 El 5% de los recién nacidos tienen un peso demasiado
bajo. ¿Qué peso se considera “demasiado bajo”?
Percentil 5 o cuantil 0,05
25
20
frecuencia

15
10
5
0

1 2 3 4 5

Peso al nacer (Kg) de 100 niños


Ejemplo
 ¿Qué peso es superado solo por el 25% de los individuos?
Percentil 75 o cuantil 0,75 o tercer cuartil
30
25
20
frecuencia

15
10
5
0

50 55 60 65 70 75 80 85

Peso (Kg) de 100 deportistas


Ejemplo
 El colesterol se distribuye simétricamente en la población.
Supongamos que se consideran patológicos los valores
extremos. El 90% de los individuos son normales ¿Entre qué
valores se encuentran los individuos normales?
Percentil 5 y 95
20
15
frecuencia
10
5
0

150 160 170 180 190


Altura (cm) en 100 varones
Ejemplo
 ¿Entre qué valores se encuentran la mitad de los
individuos “más normales” de una población?
Percentil 25 y 75
20
15
frecuencia

10
5
0

150 160 170 180 190

Altura (cm) en 100 varones


Gráfico de tallos y hojas

Hay 3 elementos con


Frecuencia Raíz & Hoja valores de 50 y 1 con valor
54, total 4 observaciones
1.00 Extremes (=<46)
4.00 5 . 0004
7.00 5 . 5556899
6.00 6 . 013444
13.00 6 . 5555666777888
28.00 7 . 0000011122222222333333344444
18.00 7 . 666666666677888999
12.00 8 . 000002234444
5.00 8 . 56889
5.00 9 . 01223
3.00 9 . 679
5.00 Extremos (>=100)
Ejemplo Estadísticos

Número de años de escolarización


N Válidos 1508
Perdidos 0
Número de años de escolarización
Media 12,90
Porcentaje Mediana 12,00
Moda 12
Frecuencia Porcentaje acumulado
Percentiles 10 9,00
3 5 ,3 ,3
20 11,00
4 5 ,3 ,7 25 12,00
5 6 ,4 1,1 30 12,00
6 12 ,8 1,9 40 12,00
50 12,00
7 25 1,7 3,5
60 13,00
8 68 4,5 8,0 70 14,00
9 56 3,7 11,7 75 15,00
10 73 4,8 16,6 80 16,00
11 85 5,6 22,2 ≥20%? 90 16,00

12 461 30,6 52,8


13 130 8,6 61,4
14 175 11,6 73,0
15 73 4,8 77,9
16 194 12,9 90,7 ≥ 90%?
17 43 2,9 93,6
18 45 3,0 96,6
19 22 1,5 98,0
20 30 2,0 100,0
Total 1508 100,0
Asimetría o sesgo
 Una distribución es simétrica si la mitad
izquierda de su distribución es la
imagen especular de su mitad
derecha.

 En las distribuciones simétricas media y


mediana coinciden. Si sólo hay una
moda también coincide

 La asimetría es positiva o negativa en


función de a qué lado se encuentra la
cola de la distribución.

 La media tiende a desplazarse hacia


las valores extremos (colas).

 Las discrepancias entre las medidas


de centralización son indicación de
asimetría.
Estadísticos asimetría
 Hay diferentes estadísticos que sirven para detectar asimetría.
 Basado en diferencia entre estadísticos de tendencia central.
 Basado en la diferencia entre el 1º y 2º cuartiles y 2º y 3º.
 Basados en desviaciones con signo al cubo con respecto a la
media.
 Los calculados con software. Tedioso hacer a mano.
 En función del signo del estadístico diremos que la asimetría
es positiva o negativa.
 Distribución simétrica ➔ asimetría nula.

0.20
0.5
0.20

0.4

0.15
0.15

0.3

0.10
0.10

0.2

0.05
0.05

0.1

x s x s
x s
66 % 78 %
78 %
0.00

0.00
0.0

8 10 12 14 16 18 20 -2 -1 0 1 2 3 0 2 4 6 8 10 12 14
Apuntamiento o curtosis
 La curtosis nos indica el grado de apuntamiento
(aplastamiento) de una distribución con respecto a la
distribución normal o gaussiana. Es adimensional.

Platicúrtica (aplanada): curtosis < 0


Mesocúrtica (como la normal): curtosis = 0
serán de especial interés las mesocúrticas y
Leptocúrtica (apuntada): curtosis > 0 simétricas (parecidas a la normal).

Aplanada Apuntada como la normal Apuntada


2.0

0.8
0.3
1.5

0.6
0.2
1.0

0.4
0.1
0.5

0.2
x s
x s x s
68 %
57 % 82 %
0.0
0.0

0.0
0.0 0.2 0.4 0.6 0.8 1.0 -3 -2 -1 0 1 2 3 -2 -1 0 1 2
Ejercicios
 Los siguientes son pesos (kg) y estaturas (cm) Pesos Estaturas
de 14 individuos de una muestra. 83.9 185
59.7 161
a) Para cada variable calcule, la media, 99 177
64.6 173
Mediana, variancia, desviación estándar y CV 63.8 174
78.8 180
b) Para cada variable, elaborar un gráfico de 71.3 168
cajas y bigotes 65.3 175
79.6 183
c) ¿Qué conjunto de mediciones tiene mayor 70.3 184
69.2 174
Variabilidad, peso o estatura? 56.4 164
66.2 169
88.7 205

También podría gustarte