Presentacion EIE 217 3

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 106

Programa

Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Probabilidad y Estadı́stica
EST-217-3

Agustı́n Gagliardi Castro


[email protected]

Instituto de Estadı́sticas
Pontificia Universidad Católica de Valparaı́so

Primer semestre 2021

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Programa

Estadı́stca descriptiva
Regresión lineal simple
Introducción a la probabilidad
Variables aleatorias univariadas
Distribuciones de probabilidad
Inferencia estadı́stica

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Bibliografı́a

Mood, A Graybill, F. Introducción a la Teorı́a Estadı́stica. Madrid:


Aguilar S.A Ediciones, España, 1969.
Canavos, George. Probabilidad y Estadı́stica. Aplicaciones y Métodos.
Ed Mc Graw-Hill, México, 1988.
Newbold, P. Carlson,W. Thorne, B. Estadı́stica para Administración y
Economı́a. Ed. Pearson Educación, 2008.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Fechas de Evaluaciones y Ponderaciones

Pruebas cátedras (75 % de la nota de presentación):


Prueba 1: 12 de abril
Prueba 2: 17 de mayo
Prueba 3: 21 de junio
Controles (25 % de la nota de presentación):
Control 1: 5 de abril
Control 2: 10 de mayo
Control 3: 14 de junio

Examen: 7 de julio (33 % de la nota final)


Prueba pendiente: 23 de junio (Toda la materia y sólo con
juntificativo por parte de jefa de docencia)

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Consideraciones

Consideraciones de aprobación, examen y reprobación

Nota de presentación Situación


Nota ≥ 4.0 sin rojos Aprobado
Nota ≥ 4.5 con rojo Aprobado
3.5 ≤ Nota ≤ 4.5 Examen
Nota <3.5 Reprobado

Consideraciones respecto a copia y plagio


En caso de que se detecte copia o plagio en alguna evaluación, la o el
estudiante involucrado tendrá calificación mı́nima y se notificará a la
jefatura de docencia

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Estadı́stica descriptiva

¿Qué es la estadı́stica?

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

La Estadı́stica

¿Qué es la estadı́stica?

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Análisis de los datos

Figura: Metodologı́a de la recolección análisis de los datos

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Definiciones

Datos: es un valor cuantitativo o cualitativo que se asigna a la


observación de un fenómeno asociado a objeto.
Variable: es una caracterı́stica o atributo que pueden tomar los
elementos de una población.
Población: es la totalidad de objetos sobre lo que se desea obtener
información.
Muestra: es un subconjunto de la población.
Muestreo: Consiste en la observación de todos los elementos de la
muestra.
Censo: Es la observación de todos los elementos de la población.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Tipos de Variables

Variables cualitativas (valores categóricos)


Nominales: Son aquellas variables que toman valores que se
distinguen sólo por el nombre, no hay orden entre ellos.
Ordinales: Son aquellos valores que se pueden ordenar, pero no hay
distancia entre ellos.
Variables cuantitativas (valores numéricos)
Discretas: Son aquellos valores que forman un conjunto numerable,
informalmente toman valores enteros.
Continuas: Cuando sus valores forman un intervalo.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Tipos de Variables

Figura: Tipos de variables

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Actividad

Actividad
Conteste las siguientes preguntas para luego analizar los datos y las
variables.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Análisis de datos

Clase 2: Análisis de datos a través de tablas y gráficos

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Análisis de datos o variables cualitativas

Análisis de variables cualitativas


La idea es analizar este tipo de variables mediante tablas, gráficos y
proporciones, con el objetivo que ver la frecuencia de cada uno de los
niveles de la variable.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Proporción
En estadı́stica una proporción puede definirse como la relación entre casos
favorables o casos que cumplen con la cualidad, con casos totales.
n
X
xi
i=1
(1)
n
Donde xi puede definirse como: 1 si el elemento tiene o cumple con la
condición y 0 si el elemento no cumple con la condición.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Tablas
Cuando hay gran número de datos es conveniente resumirlos en una tabla,
la cual debe llevar tı́tulo, fecha, fuente, etc.

Ejemplo: Tabla 1: Distribución de contagiados por COVID-19 en la V


región según comuna, el dı́a 30 de mayo del 2020.
Sea X: Comuna de la persona contagiada

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Gráfico de barra
El gráfico de barra sirve para mostrar como se distribuye una variable
cualitativa, especialmente cuando ésta tiene muchas categorı́as o niveles.
También es de gran uso para mostrar la distribución de las variables
cualitativas ordinales.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Tablas de doble entrada


Tabla 2: No de contagiados según sexo y comuna

Comuna hombre mujer Total


Viña del Mar 30 29 59
Valparaı́so 15 14 29
Quilpué 8 15 23
San Antonio 8 9 17
Quintero 4 5 9
Los Andes 4 2 6
Concón 5 1 6
El Quisco 1 3 4
Casa Blanca 1 3 4
Cartagena 3 1 4
Quillota 1 2 3
Otras 17 14 31
Total 97 98 195

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Gráfico 2: No de contagiados según sexo y comuna, V región, 30 de mayo


2020

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Gráfico circular
El gráfico circular sirve para mostrar el comportamiento de una variable
cualitativa, especialmente cuando ésta tiene pocas categorı́as o niveles.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

En la actividad 1 Ud respondió alguna preguntas, entre ella: ¿Te ha


motivado tener clases remotas o virtuales? Donde los resultados fueron los
siguientes:

Nivel de motivación f fr % F Fr %
Nunca 4
Casi nunca 8
A veces 13
Casi siempre 9
Siempre 1
Total 35

Termine la tabla, construya el gráfico apropiado e interprete algunos


resultados.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

En la actividad 1 Ud respondió alguna preguntas, entre ella: ¿Te ha


motivado tener clases remotas o virtuales? Donde los resultados fueron los
siguientes:

Nivel de motivación f fr % F Fr %
Nunca 4 11,4 % 4 11,4 %
Casi nunca 8 22,9 % 12 34,3 %
A veces 13 37,1 % 25 71,4 %
Casi siempre 9 25,7 % 34 97,1 %
Siempre 1 2,9 % 35 100,0 %
Total 35 100,0 %

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Análisis de datos cuantitativos


Para el análisis de datos o variables cuantitativas utilizaremos diversas
herramientas, entre ellas:
Tablas frecuencias
Gráficos
Medidas de tendencia central
Medidas de distribución
Medidas de dispersión
Medidas de forma
Otras

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Tablas de frecuencia
Al igual que el análisis de las variables cualitativas, utilizaremos tablas de
frecuencia para estudiar cómo es la distribución de la variable en estudio.
Sea X: Altura en metros de los estudiantes del curso EST-217-3

Lı́mites aparentes Lı́mites reales Frecuencia absoluta


1,58 - 1,62 1,575 - 1,625 1
1,63 - 1,67 1,625 - 1,675 6
1,68 - 1,72 1,675 - 1,725 8
1,73 - 1,77 1,725 - 1,775 11
1,78 - 1,82 1,775 - 1,825 6
1,83 - 1,87 1,825 - 1,875 3

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Distribución de frecuencias

Para la construcción de tablas de frecuencias de igual longitud se utilizan


las siguientes definiciones:
n: tamaño de la muestra
k: número de intervalos: 1 + 3,3log(n), medida recomendada por
Sturgest.
Rango (Desviación máxima): es el dato mayor menos el dato menor.
Recorrido de la muestra: es el rango más una unidad de medida. (1,
0.1, 0.01, etc)
Longitud del intervalo (l): Recorrido de la muestra/k (se aprox al valor
mayor o igual a la unidad de medida).
Recorrido de la tabla: k ∗ l.
Diferencia de rango: Rec. Tabla - Rec. Muestra
Marca de clase: (Lim superior + Lim Inferior)/2.
Las tablas de frecuencias son muy útiles para la construcción de
histogramas, polı́gonos de frecuencias y ojivas.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Actividad
Complete la tabla de frecuencia y conteste las preguntas:
Sea X: Altura en metros de los estudiantes del curso EST-159-1
Lı́m aparentes Lı́m reales f fr % F Fr % Marca de clase
1,58 - 1,62 1,575 - 1,625 1
1,63 - 1,67 1,625 - 1,675 6
1,68 - 1,72 1,675 - 1,725 8
1,73 - 1,77 1,725 - 1,775 11
1,78 - 1,82 1,775 - 1,825 6
1,83 - 1,87 1,825 - 1,875 3

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Actividad
Sea X: Altura en metros de los estudiantes del curso EST-217-3

Lı́m aparentes Lı́m reales f fr % F Fr % Marca de clase


1,58 - 1,62 1,575 - 1,625 1 2,9 % 1 2,9 % 1,6
1,63 - 1,67 1,625 - 1,675 6 17,1 % 7 20,0 % 1,65
1,68 - 1,72 1,675 - 1,725 8 22,9 % 15 42,9 % 1,7
1,73 - 1,77 1,725 - 1,775 11 31,4 % 26 74,3 % 1,75
1,78 - 1,82 1,775 - 1,825 6 17,1 % 32 91,4 % 1,8
1,83 - 1,87 1,825 - 1,875 3 8,6 % 35 100,0 % 1,85

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Gráficos

Histograma

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Gráficos

Polı́gono de frecuencias

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Gráficos

Ojiva

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

clase 3

Clase 3: Medidas de tendencia central

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de tendencia central

Medidas de tendencia central


Media
Mediana
Moda

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de Tendencia central

Media Aritmética
La media aritmética o promedio se define como el cociente de la suma de
todos los valores y el número total de valores. En estadı́stica, un promedio
es una medida de tendencia central para un conjunto de valores.
N
X
xi
i=1
µ=
N
n
X
xi
i=1
x=
n

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de Tendencia central

Media Aritmética
Las fórmulas para la media de la población y de la muestra para datos
agrupados son:
k
X
mi fi
i=1
µ=
N
k
X
mi fi
i=1
x=
n

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de Tendencia central

Media Aritmética
Media ponderada: Suponga que los datos x1 , .., xn tienen pesos q1 , .., qn ,
respectivamente.
N
X
xi q i
i=1
µ= N
X
qi
i=1
n
X
xi qi
i=1
x= n
X
qi
i=1

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de Tendencia central

Media Aritmética
Algunas propiedades
Si a los datos de la variable le sumamos una constante k, es decir,
yi = xi + k, con i = 1, 2, ..., n, entonces y = x + k
Si a los datos de la variable le multiplicamos una constante k, es decir,
yi = xi × k, con i = 1, 2, ..., n, entonces y = x × k

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de Tendencia central

Media Aritmética
El promedio es sensible a valores extremos.
El promedio es un buen referente para saber el comportamiento de la
población, siempre y cuando los datos tengan un comportamiento
simétrico.
En el caso de que los datos tengan un comportamiento asimétrico, es
mejor utilizar otra medida descriptiva.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de Tendencia central

Mediana
La mediana es el valor de la variable tal que el 50 % de los datos son
menores o iguales a la mediana y el otro 50 % mayores o iguales a la
mediana.
Cuando los datos están a granel (sin tabla) se deben ordenar de mayor a
menor para determinar la mediana.
Si n es impar, la mediana ocupa el centro:
M e = X( n+1 )
2

Si n es par, la mediana es el promedio de los dos datos centrales:


1
Me = {X n + X( n +1) }
2 (2) 2

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de Tendencia central

Mediana
Si los datos se presentan en una tabla con k clases, el valor de la mediana es
el valor de la variable donde por primera vez la frecuencia acumulada es
mayor o igual al 50 %.
n l
M e = Li + ( − Fi−1 ) ∗
2 f

Li = lı́mite real inferior del intervalo que contiene la mediana.


n: tamaño de la muestra.
l: longitud del intervalo.
Fi−1 : frecuencia acumulada al intervalo anterior que contiene la
mediana.
f : frecuencia absoluta del intervalo que contiene a la mediana.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de Tendencia central

Moda
Es una medida de tendencia central, que está dada por el valor que mayor
frecuencia presenta.
Cuando dos valores no adyacentes tienen frecuencias similares, se dice que
la distribución es bimodal.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de Tendencia central

Medidas de tendencia central


La imagen corresponde a la distribución de los sueldos per cápita en Chile
en el año 2018.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de Tendencia central

Actividad
Calcule la media y mediana de la variable X: Altura en metros de los
estudiantes del curso EST-217-3, usando la siguiente tabla de frecuencia:

Lı́mites f fr % F Fr % Marca de clase


[1,58 - 1,63[ 1 2,9 % 1 2,9 % 1,61
[1,63 - 1,68[ 6 17,1 % 7 20,0 % 1,66
[1,68 - 1,73[ 8 22,9 % 15 42,9 % 1,71
[1,73 - 1,78[ 11 31,4 % 26 74,3 % 1,76
[1,78 - 1,83[ 6 17,1 % 32 91,4 % 1,81
[1,83 - 1,88[ 3 8,6 % 35 100,0 % 1,86

Deje expresado en dos decimales.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Clase 4: Medidas de posición no centrales

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Cuantiles

Cuantiles
Los cuantiles son medidas de posición que dividen los datos en grupos bajo
los cuales se encuentran una determinada proporción acumulada de éstos.
Cuartiles: Qi = X i(n+1) i = 1, 2, 3, 4
4

Quintiles: Ki = X i(n+1) i = 1, 2, 3, 4, 5
5

Deciles: Di = X i(n+1) i = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
10

Percentiles: Pi = X i(n+1) i = 1, 2, ..., 100


100

En el caso de que el factor de proporción no resulta ser un valor entero, se


saca un promedio entre los valores involucrados.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Cuantiles

La fórmula para calcular percentiles desde una tabla de frecuencia es la


siguiente:
 
n∗j l
Pj = Li + − Fi−1 ∗
100 f

Li = lı́mite real inferior del intervalo que contiene al j-ésimo percentil.


n: tamaño de la muestra.
j: es el percentil j-ésimo.
l: longitud del intervalo.
Fi−1 : frecuencia acumulada al intervalo anterior que contiene al j-ésimo
percentil.
f : frecuencia absoluta del intervalo que contiene al j-ésimo percentil.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Rango intercuartil
IQR = Q3 − Q1 (2)

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Cuantiles

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Cuantiles

Nota: Dado que los percentiles representan frecuencias relativas


acumuladas, en caso de querer calcular un percencil superior a un punto de
X debe calcular: 100 − Pi

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Actividad
Usando los datos de la tabla correspondiente a la clase anterior, responda lo
siguiente:
Si estuvieramos en cleses presenciales, el 25 % de los alumnos más
bajos deberı́an sentarse en las dos primeras corridas de asientos.
¿Hasta qué altura estos alumnos deben senterse en estos puestos?
El 30 % de los alumnos más altos deberı́an sentarse en las dos últimas
corridas de asientos. ¿Cuál es la altura mı́nima correspondiente a este
grupo de alumnos?
Siguiendo otra regla, los alumnos que midan a lo más 1.70 mts, deben
sentarse en las tres primeras filas ¿Cuál es el porcentaje
correspondiente a este grupo?

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Boxplot o Caja con bigotes

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Boxplot

Detección de puntos atı́picos


v1 =Q1 − 1,5IQR
v2 =Q3 + 1,5IQR

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Clase 5: Medidas de dispersión

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de dispersión

En los estudios descriptivos de los datos es importante tener una medida de


variabilidad y de dispersión de ellos.
Rango
Rango Intercuartil
Desviación estándar
Varianza

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Rango
El rango es una medida de dispersión que se define como el dato máximo
menos el dato mı́nimo, el rango mide la máxima variación en los datos:
Rango = M ax − M in

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de dispersión

Varianza
La varianza es una medida de dispersión que sirve para cuantificar la
variabilidad de los datos en torno a la media.
La varianza es un indicador en unidades al cuadrado.

n
X
 n
X

(xi − x)2 X n
xi )2 
(
i=1 1 i=1
s2 = x2i −
 
=   (3)
(n − 1) (n − 1)  i=1
 n 

k
X
 k
X

fi (mi − x)2 X k
fi mi )2 
(
i=1 1 i=1
s2 = fi m2i −
 
=   (4)
(n − 1) (n − 1) 
 i=1 n 

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de dispersión

Desviación estándar

s = + s2
Se utiliza con mayor frecuencia la desviación estándar, que es raı́z cuadrada
de la varianza, ya que está expresada en igual unidad de medida que los
datos originales.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de dispersión

Coeficiente de variación (CV)


El CV permite comparar la homogeneidad de dos grupos o más grupos de
datos, es muy útil cuando los datos tienen medias muy diferentes o cuando
están medidos en unidades diferentes. entre más pequeño es el CV más
homogéneos son los datos. El CV no tiene unidad de medida (gr, cm, etc).
Sx
CV =
|x|

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Coeficiente de simetrı́a
Mide el grado de simetrı́a de los valores de la muestra con respecto a la
media muestra, es decir, cuantos valores de la muestra están por encima o
por debajo de la media y cómo de alejados de esta.
k
X
f ri (mi − x)3
i=1
g1 = (5)
S3

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

clase 6

Clase 6: Medidas de asociación entre dos variables

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

Covarianza (cov(x, y))


La covarianza es una medida de variabilidad conjunta de variables
(cuantitativas), estudiando una posible relación lineal entre ellas.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

Covarianza (cov(x, y))


La covarianza es una medida de variabilidad conjunta de variables
(cuantitativas), estudiando una posible relación lineal entre ellas.
Si la covarianza es grande y positiva acusa una tendencia lineal y
significa crecen simultáneamente.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

Covarianza (cov(x, y))


La covarianza es una medida de variabilidad conjunta de variables
(cuantitativas), estudiando una posible relación lineal entre ellas.
Si la covarianza es grande y positiva acusa una tendencia lineal y
significa crecen simultáneamente.
Si la covarianza es grande y negativa acusa una tendencia lineal y
significa que cuando una variable crece la otra decrece.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

Covarianza (cov(x, y))


La covarianza es una medida de variabilidad conjunta de variables
(cuantitativas), estudiando una posible relación lineal entre ellas.
Si la covarianza es grande y positiva acusa una tendencia lineal y
significa crecen simultáneamente.
Si la covarianza es grande y negativa acusa una tendencia lineal y
significa que cuando una variable crece la otra decrece.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

Figura: Gráfico de dispersión

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

n
X n
X
n n
xi yi
X X i=1 i=1
(xi − x)(yi − y) xi yi −
i=1 i=1
n
cov(x, y) = = (6)
n−1 n−1

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

Correlación (corr(x, y))


La correlación (x, y) hace el mismo estudio que la covarianza, sin
embargo esta medida está acotada entre los valores -1 y 1.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

Correlación (corr(x, y))


La correlación (x, y) hace el mismo estudio que la covarianza, sin
embargo esta medida está acotada entre los valores -1 y 1.
Cuando la correlación es 1 existe una perfecta relación lineal directa
entre las variables.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

Correlación (corr(x, y))


La correlación (x, y) hace el mismo estudio que la covarianza, sin
embargo esta medida está acotada entre los valores -1 y 1.
Cuando la correlación es 1 existe una perfecta relación lineal directa
entre las variables.
Cuando la correlación es cercano a 1 existe una relación lineal directa
entre las variables.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

Correlación (corr(x, y))


La correlación (x, y) hace el mismo estudio que la covarianza, sin
embargo esta medida está acotada entre los valores -1 y 1.
Cuando la correlación es 1 existe una perfecta relación lineal directa
entre las variables.
Cuando la correlación es cercano a 1 existe una relación lineal directa
entre las variables.
Cuando la correlación es cero no existe relación lineal entre las
variables.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

Correlación (corr(x, y))


La correlación (x, y) hace el mismo estudio que la covarianza, sin
embargo esta medida está acotada entre los valores -1 y 1.
Cuando la correlación es 1 existe una perfecta relación lineal directa
entre las variables.
Cuando la correlación es cercano a 1 existe una relación lineal directa
entre las variables.
Cuando la correlación es cero no existe relación lineal entre las
variables.
Cuando la correlación es cercano a -1 existe una relación lineal inversa
entre las variables.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

Correlación (corr(x, y))


La correlación (x, y) hace el mismo estudio que la covarianza, sin
embargo esta medida está acotada entre los valores -1 y 1.
Cuando la correlación es 1 existe una perfecta relación lineal directa
entre las variables.
Cuando la correlación es cercano a 1 existe una relación lineal directa
entre las variables.
Cuando la correlación es cero no existe relación lineal entre las
variables.
Cuando la correlación es cercano a -1 existe una relación lineal inversa
entre las variables.
Cuando la correlación es -1 existe una perfecta relación lineal inversa
entre las variables.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

Correlación (corr(x, y))


La correlación (x, y) hace el mismo estudio que la covarianza, sin
embargo esta medida está acotada entre los valores -1 y 1.
Cuando la correlación es 1 existe una perfecta relación lineal directa
entre las variables.
Cuando la correlación es cercano a 1 existe una relación lineal directa
entre las variables.
Cuando la correlación es cero no existe relación lineal entre las
variables.
Cuando la correlación es cercano a -1 existe una relación lineal inversa
entre las variables.
Cuando la correlación es -1 existe una perfecta relación lineal inversa
entre las variables.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

Figura: Correlación

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

Figura: Gráfico de dispersión

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables

cov(x, y) cov(x, y)
corr(x, y) = ρxy = rxy = p =
Sx2 Sy2 Sx Sy

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

clase 7

Clase 7: Regresión lineal simple

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

El termino regresión fue propuesto por Francis Galton en el siglo XIX


para describir un fenómeno biológico: las alturas de los descendientes
de ancestros altos tienden a regresar a las alturas de los nietos.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

El termino regresión fue propuesto por Francis Galton en el siglo XIX


para describir un fenómeno biológico: las alturas de los descendientes
de ancestros altos tienden a regresar a las alturas de los nietos.
La idea de la regresión lineal simple, es relacionar o estimar una
variable dependiente o respuesta (y) en función de una variable
independiente o predictora (x).

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

El termino regresión fue propuesto por Francis Galton en el siglo XIX


para describir un fenómeno biológico: las alturas de los descendientes
de ancestros altos tienden a regresar a las alturas de los nietos.
La idea de la regresión lineal simple, es relacionar o estimar una
variable dependiente o respuesta (y) en función de una variable
independiente o predictora (x).
El modelo más utilizado en regresión lineal simple es el siguiente:

yi = β0 + β1 xi + εi
Donde:

εi ∼ N (0, σ 2 )iid

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

El termino regresión fue propuesto por Francis Galton en el siglo XIX


para describir un fenómeno biológico: las alturas de los descendientes
de ancestros altos tienden a regresar a las alturas de los nietos.
La idea de la regresión lineal simple, es relacionar o estimar una
variable dependiente o respuesta (y) en función de una variable
independiente o predictora (x).
El modelo más utilizado en regresión lineal simple es el siguiente:

yi = β0 + β1 xi + εi
Donde:

εi ∼ N (0, σ 2 )iid

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

Figura: Rectas de regresión

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

¿Cuál de todas las rectas de regresión es la elegida?

La que tenga, en promedio, la menor distancia entre los puntos y la


recta de regresión estimada (yi − ŷi ). Donde ŷi = β̂0 + β̂1 xi

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

¿Cuál de todas las rectas de regresión es la elegida?

La que tenga, en promedio, la menor distancia entre los puntos y la


recta de regresión estimada (yi − ŷi ). Donde ŷi = β̂0 + β̂1 xi
El método para elegir esta recta de regresión es minimizando la suma
de los cuadrados de los errores (estimación por mı́nimos cuadrados)

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

¿Cuál de todas las rectas de regresión es la elegida?

La que tenga, en promedio, la menor distancia entre los puntos y la


recta de regresión estimada (yi − ŷi ). Donde ŷi = β̂0 + β̂1 xi
El método para elegir esta recta de regresión es minimizando la suma
de los cuadrados de los errores (estimación por mı́nimos cuadrados)
Para encontrar las estimaciones de los parámetros β0 y β1 se realiza el
procedimiento de estimación por mı́nimos cuadrados.

n
X n
X
mı́n SCE = ε2i = mı́n (yi − β0 − β1 xi )2 (7)
i=1 i=1

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

¿Cuál de todas las rectas de regresión es la elegida?

La que tenga, en promedio, la menor distancia entre los puntos y la


recta de regresión estimada (yi − ŷi ). Donde ŷi = β̂0 + β̂1 xi
El método para elegir esta recta de regresión es minimizando la suma
de los cuadrados de los errores (estimación por mı́nimos cuadrados)
Para encontrar las estimaciones de los parámetros β0 y β1 se realiza el
procedimiento de estimación por mı́nimos cuadrados.

n
X n
X
mı́n SCE = ε2i = mı́n (yi − β0 − β1 xi )2 (7)
i=1 i=1

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

Estimación de β0
∂SCE
=0
∂β0

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

Estimación de β0
∂SCE
=0
∂β0
n
!
X
2 (yi − β0 − β1 xi ) (−1) = 0
i=1

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

Estimación de β0
∂SCE
=0
∂β0
n
!
X
2 (yi − β0 − β1 xi ) (−1) = 0
i=1
n
X n
X n
X
yi − βˆ0 − βˆ1 xi = 0
i=1 i=1 i=1

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

Estimación de β0
∂SCE
=0
∂β0
n
!
X
2 (yi − β0 − β1 xi ) (−1) = 0
i=1
n
X n
X n
X
yi − βˆ0 − βˆ1 xi = 0
i=1 i=1 i=1
Xn Xn
yi − nβˆ0 − βˆ1 xi = 0
i=1 i=1

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

Estimación de β0
∂SCE
=0
∂β0
n
!
X
2 (yi − β0 − β1 xi ) (−1) = 0
i=1
n
X n
X n
X
yi − βˆ0 − βˆ1 xi = 0
i=1 i=1 i=1
Xn Xn
yi − nβˆ0 − βˆ1 xi = 0
i=1 i=1
n
X n
X
yi xi
i=1 i=1
β̂0 = − βˆ1
n n

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

Estimación de β0
∂SCE
=0
∂β0
n
!
X
2 (yi − β0 − β1 xi ) (−1) = 0
i=1
n
X n
X n
X
yi − βˆ0 − βˆ1 xi = 0
i=1 i=1 i=1
Xn Xn
yi − nβˆ0 − βˆ1 xi = 0
i=1 i=1
n
X n
X
yi xi
i=1 i=1
β̂0 = − βˆ1
n n
β̂0 = y − β̂1 x

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

Estimación de β0
∂SCE
=0
∂β0
n
!
X
2 (yi − β0 − β1 xi ) (−1) = 0
i=1
n
X n
X n
X
yi − βˆ0 − βˆ1 xi = 0
i=1 i=1 i=1
Xn Xn
yi − nβˆ0 − βˆ1 xi = 0
i=1 i=1
n
X n
X
yi xi
i=1 i=1
β̂0 = − βˆ1
n n
β̂0 = y − β̂1 x

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple


∂SCE
Estimación de β1 → =0
∂β1
∂SCE
=0
∂β1

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple


∂SCE
Estimación de β1 → =0
∂β1
∂SCE
=0
∂β1
n
!
X
2 (yi − β0 − β1 xi ) (−xi ) = 0
i=1

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple


∂SCE
Estimación de β1 → =0
∂β1
∂SCE
=0
∂β1
n
!
X
2 (yi − β0 − β1 xi ) (−xi ) = 0
i=1
n
X n
X n
X
xi yi − βˆ0 xi − βˆ1 x2i = 0
i=1 i=1 i=1

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple


∂SCE
Estimación de β1 → =0
∂β1
∂SCE
=0
∂β1
n
!
X
2 (yi − β0 − β1 xi ) (−xi ) = 0
i=1
n
X n
X n
X
xi yi − βˆ0 xi − βˆ1 x2i = 0
i=1 i=1 i=1
 n
X n
X

n  yi xi  n n
X  i=1 i=1
X X
xi yi − 
 ˆ
− β1  xi − βˆ1 x2i = 0
i=1  n n 
 i=1 i=1

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple


∂SCE
Estimación de β1 → =0
∂β1
∂SCE
=0
∂β1
n
!
X
2 (yi − β0 − β1 xi ) (−xi ) = 0
i=1
n
X n
X n
X
xi yi − βˆ0 xi − βˆ1 x2i = 0
i=1 i=1 i=1
 n
X n
X

n  yi xi  n n
X  i=1 i=1
X X
xi yi − 
 ˆ
− β1  xi − βˆ1 x2i = 0
i=1  n n 
 i=1 i=1

n n n
!2
X X X
n
xi yi xi n
X i=1 i=1 i=1
X
xi yi − + β̂1 − βˆ1 x2i = 0
i=1
n n i=1

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple


∂SCE
Estimación de β1 → =0
∂β1
∂SCE
=0
∂β1
n
!
X
2 (yi − β0 − β1 xi ) (−xi ) = 0
i=1
n
X n
X n
X
xi yi − βˆ0 xi − βˆ1 x2i = 0
i=1 i=1 i=1
 n
X n
X

n  yi xi  n n
X  i=1 i=1
X X
xi yi − 
 ˆ
− β1  xi − βˆ1 x2i = 0
i=1  n n 
 i=1 i=1

n n n
!2
X X X
n
xi yi xi n
X i=1 i=1 i=1
X
xi yi − + β̂1 − βˆ1 x2i = 0
i=1
n n i=1

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

Demuestre que, por método de mı́nimos cuadrados, las estimaciones de β0 y


β1 son las siguientes:
n
X n
X
n
xi yi
X i=1 i=1
xi yi −
i=1
n Cov(x, y)
βˆ1 = !2 = (8)
n
X Sx2
n
xi
X i=1
x2i −
i=1
n

βˆ0 = y − βˆ1 x (9)

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

Coeficiente de determinación R2
El coeficiente de determinación sirve para ver la calidad del modelo o
qué tan bien se ajustaron los datos a la recta de regresión.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

Coeficiente de determinación R2
El coeficiente de determinación sirve para ver la calidad del modelo o
qué tan bien se ajustaron los datos a la recta de regresión.
Explica el porcentaje de variabilidad de la variable respuesta (y)
explicado por la ecuación de regresión.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

Coeficiente de determinación R2
El coeficiente de determinación sirve para ver la calidad del modelo o
qué tan bien se ajustaron los datos a la recta de regresión.
Explica el porcentaje de variabilidad de la variable respuesta (y)
explicado por la ecuación de regresión.
Los valores del coeficiente de determinación oscilan entre 0 y 1 o entre
0 % y 100 %.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

Coeficiente de determinación R2
El coeficiente de determinación sirve para ver la calidad del modelo o
qué tan bien se ajustaron los datos a la recta de regresión.
Explica el porcentaje de variabilidad de la variable respuesta (y)
explicado por la ecuación de regresión.
Los valores del coeficiente de determinación oscilan entre 0 y 1 o entre
0 % y 100 %.
Entre más cercano a 1 es el coeficiente de determinación, mejor es el
modelo propuesto.

R2 = ρ2xy

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

Coeficiente de determinación R2
El coeficiente de determinación sirve para ver la calidad del modelo o
qué tan bien se ajustaron los datos a la recta de regresión.
Explica el porcentaje de variabilidad de la variable respuesta (y)
explicado por la ecuación de regresión.
Los valores del coeficiente de determinación oscilan entre 0 y 1 o entre
0 % y 100 %.
Entre más cercano a 1 es el coeficiente de determinación, mejor es el
modelo propuesto.

R2 = ρ2xy

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Regresión lineal simple

Para poder hacer una predicción o una estimación de la variable respuesta


(y), en función de un valor de la variable predictora (x), se utiliza la
ecuación de regresión estimada:

ŷi = βˆ0 + βˆ1 xi

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .


Programa
Bibliografı́a
Fechas de Evaluaciones y Ponderaciones
Estadı́stica Descriptiva

Medidas de asociación entre dos variables


Los siguientes datos corresponden a la cantidad de consumo de luz (kWh) y el pago en pesos chilenos,

que una familia de la V región tuvo desde febrero de 2020 hasta febrero de 2021.

Mes Consumo (kWh) Pago ($)


Feb 177 27000
Mar 189 30500
Abr 150 24590
May 154 25245
Jun 149 24426
Jul 143 23442
Ago 144 23606
Sep 145 23800
Oct 127 20819
Nov 169 27704
Dic 72 11800
Ene 122 20372
Feb 182 29492
Realice un análisis completo, donde se ajuste un modelo donde se pueda estimar el pago del hogar en

función al consumo de energı́a eléctrica, cálculo de la correlación, calidad del modelo y predicción de

algún valor.

Agustı́n Gagliardi Castro [email protected] Probabilidad y Estadı̀stica. . .

También podría gustarte