3 Big Data
3 Big Data
3 Big Data
I. Introduction
A. Le phénomène big data
L’explosion des données numériques a obligé les chercheurs à trouver de nouvelles manières de voir et d’analyser
le monde
- Ainsi est né le « Big Data » (1997)
- Concept permettant de stocker un nombre indicible d’informations
- Pour visualiser les « grands ensembles de données »
- Apparition de nouveaux ordres de grandeur concernant la capture, la recherche, le partage, le stockage,
l’analyse et la présentation des données
Autres sources
- Assurance maladie (SNII -RAM) nouveau SNDS
- Insee
- Registres épidémiologiques
- Bases de données recherche : exemple recherche clinique
III. Big data en santé
2- Variété
8,9 milliards de feuilles de soins dans la base de données Sniram. 50 000 app santé en 2020. 450 To dans la base de
données SNDS par an. 80 milliards d’objets connectés en 2020. Des dizaines de petaoctets de données génomiques
par an. 80% des internautes français font des recherches santé.
3- Vélocité
1 000 000 000 000 000 000 000 octets soit 1 Zettaoctet d’informations numériques produites par an
B. Objectifs en santé
Identifier des facteurs de risque de maladies comme cancers ou diabète
- Mettre en place outils de prévention cohérents et plus efficaces
Le HDH permettra :
- L’appariement des bases de données à l’échelle nationale
- La mutualisation des infrastructures « Big data » sécurisées
- La valorisation du patrimoine de données à l’échelle nationale et internationale
« Mettre le patrimoine des données de santé financées par la solidarité nationale au service du patient et du système
de santé dans le respect de l’éthique et des droits fondamentaux de nos concitoyens »
Historique = Système National des Données de Santé (SNDS) (loi du 26 janvier 2016 sur la modernisation du
système de santé français)
- Collecte des données de santé provenant de différents organismes : Assurance Maladie (base SNIIRAM) et
hôpitaux (base PMSI)
- Analyse des données, les lier entre elles, et les rendre disponibles « afin de favoriser les études, recherches
ou évaluations présentant un caractère d’intérêt public »
Importance de garantir un niveau élevé de protection des personnes, de leurs données et de leurs droits
- Notamment information sur l’usage de leurs données personnelles
Missions supplémentaires d’un entrepôt de données de santé
- Information des patients et promotion / facilitation de leurs droits
- Respect des principes de limitation et de minimisation des données à caractère extrêmement sensible
Notamment face développement des techniques d’intelligence artificielle en santé
Gestion des risques liées à la concentration de données sensibles sur une plateforme technologique Big
Data, nécessitant la mise en place de mesures de sécurité appropriées
V. En bref
« Big data » en santé = Données
Hétérogènes (3V), Multi-domaines, Multi-échelles
Données sensibles ++++