PIF Estadística 2021-1
PIF Estadística 2021-1
PIF Estadística 2021-1
Estadística
2021-1
Este proyecto busca implementar metodologías activas y de unificación de los contenidos del curso,
además de aplicar el concepto de aprendizaje basado en proyectos. Se invita al estudiante a realizar un
trabajo en su área de interés aplicando el conocimiento de un modo que pueda tener un impacto real.
El proyecto está diseñado para grupos de dos o tres estudiantes, cuya conformación no podrá cambiar
durante el semestre.
Artículo científico:
Requerimiento
Se propone una base de datos en la cual aparece una muestra de 537.577 compras hechas en uno de los
black fridays que se realizan en Estados Unidos2. A continuación, se describen las variables:
1
González, A. (Julio 30 de 2020). ¿Cómo escribir un “artículo científico” para la universidad?. Lugar de publicación:
https://www.hotcourseslatinoamerica.com/study-abroad-info/choosing-a-university/como-escribir-un-articulo-cientifico-
o-paper-para-la-universidad/.
2
Dagdoug, M. (10 de Julio de 2019). Black Friday Sales: Analysis and Prediction. Obtenido de Kaggle:
https://www.kaggle.com/mehdidag/black-friday.
Occupation Ocupación del comprador.
Se solicita a cada grupo de estudiantes realizar entregas parciales como se indican a continuación. El
objetivo final será la construcción de un texto en formato de artículo científico.
PRIMER CORTE
Entregables:
Documento PDF con las siguientes secciones:
• Título y autores del trabajo, tipo artículo científico.
• Introducción.
• Justificación.
• Bibliografía.
SEGUNDO CORTE
En esta segunda entrega se propone hacer uso de la estadística descriptiva frente a los datos
suministrados. Todo el análisis debe ser acompañado de una discusión sobre las implicaciones más
sobresalientes que tienen los resultados. En particular, se espera que se presente lo siguiente:
Entregables
Un documento PDF que contenga:
• La primera entrega corregida y ampliada. Debe contener todas las secciones de la primera
entrega y adicionalmente:
• Análisis descriptivo.
• Conclusiones.
La primera entrega corregida y ampliada. Se debe entregar en formato de artículo la corrección de las
observaciones hechas por el docente al trabajo del primer corte. NO SECCIONE EL TRABAJO EN
ENTREGAS. Debe pensarse esta segunda entrega como una versión ampliada y mejorada de la entrega
anterior. Para eso, la introducción y justificación se deberán modificar de tal manera que introduzcan y
justifiquen los métodos y resultados del análisis descriptivo.
Análisis descriptivo. Dentro del artículo que está construyendo debe incluir lo siguiente:
- Histograma de la variable Purchase, seguido de los valores del Sesgo y Curtosis, con sus
respectivas interpretaciones.
- Tabla que contenga de la variable Purchase. Resumen de los 5 números (Mínimo, Cuartil 1, Cuartil
2, Cuartil 3, Máximo), Media y Desviación estándar. Después, justificar en una frase o dos, las
interpretaciones que se le pueden asignar a estos estadísticos.
- Filtrar la base de datos por sexo. Hacer un diagrama de caja y bigotes de la variable Purchase para
mujeres y otra para hombres. En una frase o dos comparar los dos gráficos obtenidos, dando una
conclusión.
Conclusiones. Una conclusión debe ser un resultado particular interesante que se deduce directamente
del análisis hecho. Las conclusiones son particulares a la metodología y datos utilizados. En este sentido,
no pueden ser una conclusión aspectos teóricos y enunciados generales que se pueden encontrar en un
libro texto. La teoría general justifica el razonamiento para llegar a una conclusión, pero no es una
conclusión en sí misma. Por otro lado, evite referirse como conclusiones a resultados de aprendizaje
como “en este proyecto aprendimos la relevancia de la estadística descriptiva” o afirmaciones similares.
Recuerde que el formato buscado es de artículo científico, redacte como si el público dirigido fuera un
editor o editora de revista científica. No mencione el hecho de que es un ejercicio de aprendizaje.
Por otro lado, debe buscarse cierta armonía entre la Introducción, la Justificación y las Conclusiones. En
la introducción se debe hacer un breve anticipo de los métodos y las conclusiones más relevantes. En la
justificación debe explicarse por qué dichos métodos de análisis son relevantes. En las conclusiones se
deben interpretar los resultados a la luz de las posibles implicaciones prácticas.
TERCER CORTE
En este corte debe aplicar los conocimientos y competencias adquiridas en el curso para dar respuesta
a la pregunta de investigación:
Para el almacén, ¿las compras en el Black Friday se distribuyen aproximadamente de forma normal?
Observaciones generales: Todo lo dicho sobre las correcciones, ampliaciones y las conclusiones en el
segundo corte aplica también para este corte. De nuevo, el objetivo es generar una versión aún más
completa y mejorada del artículo: en este caso será la versión final. Es posible y casi necesario que deba
ampliar su bibliografía y sus referencias. Igualmente, las secciones de Introducción, Justificación y
Conclusiones también deberán cambiar para introducir lo referente al desarrollo del tercer corte.
Desarrollo Tercer corte: Al igual que en el segundo corte, a lo desarrollado en el segundo corte con sus
respectivas correcciones y ampliaciones se debe agregar un análisis más profundo donde se justifique la
posible similitud o no de la distribución de la variable Purchase con una normal. El desarrollo del segundo
corte ayuda mucho a responder la pregunta de investigación: coméntelo y conéctelo adecuadamente.
Posterior a ello, suponga que la variable sí se distribuye de forma normal cuyo promedio y desviación
estándar vienen dados por los datos. Proponga a modo de ejemplo el cálculo de tres tipos de
probabilidades (Una usando “menor que”, otra con “mayor que” y otra con un intervalo). Compare los
resultados de esas probabilidades con los resultados de los datos. Si la distribución normal es una buena
aproximación a los datos, la probabilidad obtenida por distribución normal debe ser parecida a la
proporción de datos que están en el intervalo que define la probabilidad.
Por último, se debe generar una conclusión en donde se responda a la pregunta de investigación,
justificada en lo encontrado a lo largo del trabajo e indicando cuál puede ser una de las aplicaciones para
el almacén de dichos resultados.
Condiciones generales:
- El trabajo será presentado mínimo por dos estudiantes y máximo por tres, los grupos no pueden
modificarse durante el semestre.
- Cada entrega se realizará en formato PDF en las fechas y plazos establecidos por el docente, no se
reciben documentos fuera de fecha para ningún grupo, ni adición de integrantes después de la entrega.
- La buena redacción, ortografía, estilo y presentación son aspectos cruciales que se tendrán en cuenta
en cada una de las entregas.