SESION 11 - Correlacion Lineal 1
SESION 11 - Correlacion Lineal 1
SESION 11 - Correlacion Lineal 1
Corrrelación Lineal
Estadística Descriptiva
CORRELACIÓN LINEAL
Contenido:
190
Se correlaciona los 180
datos de dos
170
medidas.
100
60 70 80 90 100 110 120 130 140
Peso en Kg.
1. GRÁFICO DE DISPERSIÓN
160
150
140
130
120
110
100
60 70 80 90 100 110 120 130 140
Peso en Kg.
2. Coeficiente de Correlación de Pearson
El Coeficiente de Correlación de Pearson es una
medida de la relación lineal entre dos variables
aleatorias cuantitativas.
A diferencia de la covarianza, la correlación de Pearson
es independiente de la escala de medida de las
variables.
De manera menos formal, podemos definir el
coeficiente de correlación de Pearson como un índice
que puede utilizarse para medir el grado de relación de
dos variables siempre y cuando ambas sean
cuantitativas.
6
Coeficiente de Correlación de Pearson
En el caso de que se esté estudiando dos variables
aleatorias x e y sobre una población; el coeficiente de
correlación de Pearson se simboliza con la letra , siendo la
expresión que nos permite calcularlo:
7
Coeficiente R
de Pearson
Donde;
es la covarianza de (X,Y)
es la desviación típica de la variable X
es la desviación típica de la variable Y
De manera análoga podemos calcular este coeficiente sobre un
estadístico muestral, denotado como a:
8
Ventajas y Desventajas del Coeficiente de Pearson
• Ventajas
El valor del coeficiente de
correlación es independiente de
cualquier unidad usada para • Desventajas
medir variables. Requiere supuestos acerca de la
Mientras mas grande sea la naturaleza o formas de las
muestra mas exacta será la poblaciones afectadas.
estimación. Requiere que las dos variables
hayan ido medidas hasta un nivel
cuantitativo continuo y que la
distribución de ambas sea
semejante a la de la curva normal.
9
Usos del Coeficiente de Correlación de Pearson
10
Usos del Coeficiente de Correlación de Pearson
11
Características de la R de Pearson
La r de Pearson es una medida que indica hasta que punto los mismos
individuos o sucesos ocupan la misma posición relativa a 2 variables.
La r de Pearson refleja únicamente la relación lineal entre 2 variables.
Cuando la relación es perfecta positiva, cada individuo obtiene
exactamente las mismas calificaciones en ambas variables.
Un valor alto positivo alto de r de Pearson indica que cada individuo
obtiene, aproximadamente; las mismas calificaciones en ambas
variables.
12
Interpretación del Coeficiente R de Pearson
13
Correlación negativa perfecta
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Correlación positiva perfecta
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Correlación nula
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Correlación positiva fuerte
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Ejemplo:
Hipertensión en pacientes obesos
En un Centro de Salud hacen el seguimiento de la tensión arterial a
sus pacientes, y los resultados constatan que aquéllos que tienen
sobrepeso, tienen una tensión arterial superior a la media.
Vamos a quedarnos sólo con la última fila para hacer los cálculos
xi yi xi·yi xi2 yi2
964 1472 146305 96740 221910
• Media marginal de X:
• Media marginal de Y:
• Covarianza:
Gráfico de Dispersión
200
Tensión sistólica (mm Hg)
180
160
140
120
100
80
60
65 75 85 95 105 115 125 135
Peso (kg)
Procedimiento con Excell
1. En primer lugar se debe obtener el gráfico de dispersión y describir
la tendencia.
Aceptar
24
25
26
27
28
Procedimiento
2. Obtener el coeficiente de correlación de Pearson para analizar la
magnitud de asociación de las variables.
29
La correlación de Pearson entre el Peso (Kg) y la Tensión Sistólica
(mm Hg) de 0,986 que es muy alta
30
Ejercicio 1
• Juan Escobedo, presidente de la sociedad de alumnos de
la Universidad Wiener, se ocupa de estudiar el costo de
los libros de texto.
• Él cree que hay una relación entre el número de páginas
en el texto y el precio de venta del libro.
• Para proporcionar una prueba, selecciona una muestra de
ocho libros de texto actualmente en venta en la librería.
• Dibuje un diagrama de dispersión.
• Compruebe el coeficiente de correlación.
Ejercicio 1
Libro Páginas Precio (S/.)
IIntroducción a la Historia 500 84
Álgebra 700 75
Introducción a la Psicología 800 99
Introducción a la Sociología 600 72
Mercadotecnia 400 69
Introducción a la Biología 500 81
Fundamentos de Jazz 600 63
Introducción a la Enfermería 800 93
Bibliografía
Véliz Capuñay, Carlos, 2011, México. Estadística para la
administración y los negocios, Primera Edición, 2011, Prentice
Hall. Pearson
Correlación en Wikipedia (español):
http://es.wikipedia.org/wiki/Correlaci%C3%B3n Relación entre
variables cuantitativas.
http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_cuantit
ativas2.pdf Correlation en Wikipedia (inglés).
http://personal.us.es/vararey/adatos2/correlacion.pdf.
https://es.wikipedia.org/wiki/Coeficiente_de_correlaci
%C3%B3n_de_Pearson.
33