Actividad 2 Proyecto Integrador
Actividad 2 Proyecto Integrador
Actividad 2 Proyecto Integrador
actividad #2:
Proyecto integrador Etapa 1.
Grupo: 5K2618-53XO04A1903
Matricula: 840086364.
DESARROLLO:
1
José Luis Quiroz Guitiérrez Matricula: 840086364
Considerando la información revisada a lo largo del curso, desarrollarás un Proyecto
Integrador en el que deberás resumir y describir las principales herramientas estudiadas:
regresión simple, ANOVA, series de tiempo y estadística no paramétrica.
a) Teoría
b) Ejemplo
Analisis de Datos 2
Investigar un ejemplo en el que se aplique la teoría vista, además de incluir y describir
todos los pasos para llegar a la solución y explicar claramente lo que se desea obtener y la
interpretación de los resultados.
c) Aplicaciones
d) Herramientas de apoyo
Investigar de qué manera se puede llevar a cabo la regresión lineal utilizando alguna
herramienta de software, mencionando los pasos para llevarlo a cabo. Utiliza la herramienta
con un ejemplo sencillo y realiza una captura de pantalla con el resultado obtenido.
Analisis de Datos 3
ETAPA 1:
Correlación lineal
Analisis de Datos 4
Para estudiar la relación lineal existente entre dos variables continuas es necesario
disponer de parámetros que permitan cuantificar dicha relación. Uno de estos
parámetros es la covarianza, que indica el grado de variación conjunta de dos
variables aleatorias.
Covarianza muestral
Todos ellos varían entre +1 y -1. Siendo +1 una correlación positiva perfecta y -1
una correlación negativa perfecta.
Analisis de Datos 5
menciona que sigue siendo bastante robusto a pesar de la falta de normalidad . Es
más sensible a los valores extremos que las otras dos alternativas.
La correlación lineal entre dos variables, además del valor del coeficiente de
correlación y de sus significancia, también tiene un tamaño de efecto asociado. Se
Analisis de Datos 6
conoce como coeficiente de determinación R2R2. Se interpreta como la cantidad
de varianza de YY explicada por XX. En el caso del coeficiente de Pearson y el
de Spearman, R2R2 se obtiene elevando al cuadrado el coeficiente de correlación.
En el caso de Kendall no se puede calcular de este modo.
Analisis de Datos 7
DIAGRAMA DE DISPERSION
El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos
asociados de datos que aparecen en pares (por ejemplo, (x,y), uno de cada
conjunto). El diagrama muestra estos pares como una nube de puntos.
Las relaciones entre los conjuntos asociados de datos se infieren a partir de la forma
de las nubes.
Una relación positiva entre x y y significa que los valores crecientes de x están
asociados con los valores crecientes de y.
Una relación negativa significa que los valores crecientes de x están asociados con
los valores decrecientes de y.
¿Para qué se usa un diagrama de dispersión?
Entre sus usos está descubrir y mostrar las relaciones entre dos conjuntos asociados
de datos y confirmar relaciones anticipadas entre dos conjuntos asociados de datos.
Analisis de Datos 8
ANALISIS DE REGRESION LINEAL
Para poder realizar esta investigación, se debe postular una relación funcional entre las
variables. Debido a su simplicidad analítica, la forma funcional que más se utiliza en la
práctica es la relación lineal. Cuando solo existe una variable independiente, esto se reduce
a una línea recta
En esta expresión estamos admitiendo que todos los factores o causas que influyen en la
variable respuesta Y pueden dividirse en dos grupos: el primero contiene a una variable
explicativa X y el segundo incluye un conjunto amplio de factores no controlados que
englobaremos bajo el nombre de perturbación o error aleatorio, ε, que provoca que la
dependencia entre las variables dependiente e
independiente no sea perfecta, sino que esté sujeta a incertidumbre. Por ejemplo, en el
consumo de gasolina de un vehículo (Y ) influyen la velocidad (X) y una serie de factores
como el efecto conductor, el tipo de carretera, las condiciones ambientales, etc, que
Analisis de Datos 9
quedarían englobados en el error. Lo que en primer lugar sería deseable en un modelo de
regresión es que estos errores aleatorios sean en media cero para cualquier valor x de X, es
decir,
En dicha expresión se observa que: • La media de Y, para un valor fijo x, varía linealmente
con x. • Para un valor x se predice un valor en Y dado por
COEFICIENTE DE DETERMINACION
Analisis de Datos 10
Donde la suma total es la varianza muestral de la variable endógena multiplicada por el
tamaño de la muestra; por lo tanto, mide las fluctuaciones de esta variable alrededor de su
media; y, la suma residual indica cuál es el nivel de error que se comete con el modelo
estimado al explicar la variable endógena.
Analisis de Datos 11
El R2 también se puede calcular como el cuadrado del coeficiente de correlación
COEFICIENTE DE CORRELACIÓN
El que representa el grado en el cual dos variables están relacionadas li-nealmente entre sí.
Medida estadística que analiza el grado de dependencia entre dos variables, es decir, cómo
se verá afectada una variable determinada, conociendo la variación de una
segunda variable. Este coeficiente toma valores entre -1 y 1, indicando si existe una
Analisis de Datos 12
dependencia directa (coeficiente positivo) o inversa (coeficiente negativo) siendo el 0
la independencia total. Es la raíz cuadrada del coeficiente de determinación.
Ejemplo:
Analisis de Datos 13
Analisis de Datos 14
Analisis de Datos 15
Aplicaciones:
Química
Mecánica
En esta rama se utiliza la Regresión Lineal entre otros para ajustar la recta de Paris , una
ecuación que sirve para estudiar elementos sometidos a fatiga en función del número de
ciclos a los que se somete un material. La bondad del ajuste se comprueba representando el
conjunto de valores discretos a-Nm obtenidos experimentalmente, frente a la curva
correspondiente a la recta de Paris definida por los valores “C” y “m”.2
Electricidad
Sensores
Analisis de Datos 16
Calibración de un sensor de temperatura (termopar) en función de la caída de tensión y la
temperatura. Se estudia la forma en que varía la temperatura de un líquido al calentarlo. Se
calibra el sensor y simultáneamente se mide la variación de temperaturas en un líquido para
representar los datos obtenidos posteriormente mediante Regresión Lineal.4
Física
Fabricación
Dos de los parámetros más importantes de una soldadura es la intensidad aplicada al hilo y
la velocidad de alimentación del mismo. Mediante técnicas de regresión lineal se elaboran
las rectas que relacionan estos parámetros con la separación entre el hilo y la zona a
soldar.6
Diseño de experimentos
Construcción
Analisis de Datos 17
determinada composición de un hormigón. También se puede determinar la succión capilar
a partir del volumen absorbido por una muestra y el tiempo que ha durado la succión.8
http://www.dm.uba.ar/materias/estadistica_Q/2011/1/clase%20regresion%20simple.pdf
http://www4.ujaen.es/~dmontoro/Metodos/Tema%209.pdf
http://www.eumed.net/cursecon/medir/introd.htm
http://diccionarioempresarial.wolterskluwer.es/Content/Documento.aspx?
params=H4sIAAAAAAAEAMtMSbF1jTAAASMjM0sTtbLUouLM_DxbIwMDS0NDA1
OQQGZapUt-ckhlQaptWmJOcSoAQ9XlCzUAAAA=WKE
https://www.ucm.es/data/cont/docs/518-2013-11-13-Analisis%20de%20Regresion.pdf
Analisis de Datos 18