Projet Data Science
Projet Data Science
Projet Data Science
- Utiliser SQL server integration service (SSIS) pour automatiser le processus de collecte de données.
- Mise en place de flux de données pour extraire, transformer et charger (ETL) les informations dans
la base de données.
Sprint 3 : modélisation
Les technologies: power bi, tableau, autogluon, mlflow
- création, entraînement et évaluation de modèles prédictifs basés sur les données disponibles...
-Conception et implémentation...
Livrables:
▶ Rapport de data scraping avec les données collectées
Explication de chaque sprint étape par étape pour réaliser le projet d'Analyse et Visualisation des
Accidents de la Circulation Routière.
Installez les bibliothèques nécessaires comme Selenium, Scrapy, et Beautiful Soup dans votre
environnement Python.
2. Utilisez la tâche "Script Task" pour intégrer votre code Python (utilisant Selenium, Scrapy, ou
Beautiful Soup) pour extraire les données depuis les sources web.
4. Chargez les données dans votre base de données SQL Server à l'aide de la tâche "OLE DB
Destination".
Installez les bibliothèques nécessaires comme Matplotlib, Seaborn, et Pandas dans votre
environnement Python.
2. Utilisez Matplotlib et Seaborn pour créer des visualisations telles que des histogrammes, des
diagrammes en boîte, des cartes de chaleur, etc.
Sprint 3: Modélisation
Installez les bibliothèques nécessaires comme Power BI, Tableau, AutoGluon, et MLflow dans votre
environnement Python.
Installez les bibliothèques nécessaires comme NLTK, SpaCy, et scikit-learn dans votre environnement
Python.
1. Appliquez le traitement du langage naturel (NLP) sur les données pour comprendre les
nuances émotionnelles.
2. Utilisez des techniques de classification de texte pour analyser le sentiment des rapports
d'accidents.
Installez les bibliothèques nécessaires comme Plotly Dash, Django, Flask, et Streamlit dans votre
environnement Python.
2. Conception de l'interface utilisateur en utilisant des graphiques interactifs pour présenter les
résultats de l'analyse.
Installez les bibliothèques nécessaires comme Docker, CI/CD, et Netlify dans votre environnement
Python.
2. Mettez en place un pipeline CI/CD pour automatiser le déploiement sur une plateforme
comme Netlify.
En suivant ces étapes, vous devriez être en mesure de réaliser votre projet d'Analyse et Visualisation
des Accidents de la Circulation Routière de manière méthodique.