Sesión 1
Sesión 1
Sesión 1
1
Agenda
PhD. Edwin Villanueva Talavera PhD. Soledad Espezúa Llerena 19 de junio de 2021 2
Definición de Data Science
• La ciencia de datos es una colección de técnicas que se utilizan para extraer valor de los datos. Se
ha convertido en una herramienta esencial para cualquier organización que recopile, almacene y
procese datos como parte de sus operaciones. Las técnicas de ciencia de datos buscan encontrar
patrones, conexiones y relaciones útiles dentro de los datos.
4
Premio Nobel 2020: Agujeros negros
Katie Bouman
https://directory.eoportal.org/web/eoportal/satellite-missions/b/black-hole 5
Tareas en Data Science
Descripción &
exploración
•Visualización
Asociación
•Patrones
6
Tareas en Data Science
Clasificación
•V. Categórica
?
Regresión o
Estimación
•V. Numérica
Si
Precio
Pronóstico ?
temporal
No
Tiempo
Tiempo
7
Metodología en Data Science
Fase de Modelado
8
Mercado Laboral
• Es fácil de aprender
10
¿Por qué usar Python?
https://insights.stackoverflow.com/trends?tags=java%2Cpython%2Cjavascript%2Cr
11
¿Por qué usar Python?
https://trends.google.es/trends/explore?date=today%205-y&q=%2Fm%2F05z1_,%2Fm%2F07sbkfb,%2Fm%2F0212jm,%2Fm%2F053_x
12
Ecosistema de Herramientas en Python
13
Anaconda (package manager)
● https://www.anaconda.com/download
14
Instalación de Python
15
Jupyter Notebook
16
JupyterLab
17
Anaconda (package manager)
Instalar librería:
> conda install scikit-learn
Desinstalar:
> conda uninstall scikit-learn
Actualizar librerías:
> conda update --all
18
Ambiente de trabajo
Iniciar jupyper:
> jupyter-notebook
19
Jupyter notebook
20
Jupyter notebook
21
Ver documentación
Shift + tab
22
Ver código fuente
23