0% ont trouvé ce document utile (0 vote)
49 vues4 pages

3 Big Data

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1/ 4

Big data et big data en santé

I. Introduction
A. Le phénomène big data

L’explosion des données numériques a obligé les chercheurs à trouver de nouvelles manières de voir et d’analyser
le monde
- Ainsi est né le « Big Data » (1997)
- Concept permettant de stocker un nombre indicible d’informations
- Pour visualiser les « grands ensembles de données »
- Apparition de nouveaux ordres de grandeur concernant la capture, la recherche, le partage, le stockage,
l’analyse et la présentation des données

B. Le big data, le quoi ?

Littéralement = données massives (mégadonnées)


- Ensemble très volumineux de données qu’aucun outil classique de gestion de base de données ou de gestion
de l’information ne peut vraiment travailler
- Chaque jour ~2,5 trillions d’octets de données
 Informations provenant de partout : vidéos, informations climatiques, signaux GPS, applications en
ligne et bien d’autres encore
 Définition variable selon les communautés qui s’y intéressent
- Approche transdisciplinaire nécessaire pour comprendre l’intérêt et les limites selon les disciplines, comme en
santé

II. Big Data


A. Objectif

Permettre à tous d’accéder en temps réel à des bases de données géantes


- Analyse de données en masse

- Outils spécifiques répondant à la règle des 3V (cf GAFAM)


 Volume de données considérable à traiter
 Grande Variété d’informations (venant de diverses sources, non-structurées, organisées, Open…)
 Vélocité : fréquence de création, collecte et partage de ces données
- Permettant des techniques innovantes d’Intelligence artificielle
 Traitement automatique du langage, machine learning, data lake…

B. Nouvelle place dans la société

L’arrivée du Big Data : nouvelle révolution


- Comme la découverte de la vapeur (début du 19e siècle), d
- Électricité (fin du 19e siècle)
- Et l’informatique (fin du 20e siècle)

Dans tous les cas, considéré comme un bouleversement de la société !


- En santé aussi !!!

C. Big data ou données

Dossier patients informatisé


- Données clinico – biologiques
- Données OMICS
- Signaux et images

Autres sources
- Assurance maladie (SNII -RAM) nouveau SNDS
- Insee
- Registres épidémiologiques
- Bases de données recherche : exemple  recherche clinique
III. Big data en santé

A. La règle des 3V pour Big Data en santé


1- Volume
2,3 milliards de gigaoctets de données de santé en 2020, volume des données de santé multiplié par 50 en 2020.

2- Variété
8,9 milliards de feuilles de soins dans la base de données Sniram. 50 000 app santé en 2020. 450 To dans la base de
données SNDS par an. 80 milliards d’objets connectés en 2020. Des dizaines de petaoctets de données génomiques
par an. 80% des internautes français font des recherches santé.

3- Vélocité
1 000 000 000 000 000 000 000 octets soit 1 Zettaoctet d’informations numériques produites par an

B. Objectifs en santé
Identifier des facteurs de risque de maladies comme cancers ou diabète
- Mettre en place outils de prévention cohérents et plus efficaces

Développer des systèmes d’aide au diagnostic et des outils


- Personnalisation des traitements
- Vérifier l’efficacité de certains traitements
- Identifier d’éventuelles complications récurrentes (amélioration de la pharmacovigilance)

Effectuer une veille sanitaire, ou prédire la survenue d’épidémies


Le big data est donc une aide précieuse à la conduite des politiques de santé, pour l’optimisation du système
de soins
/!\ ce sont des données ultra sensibles car données de santé. Ces données ne peuvent pas être remises à des
assurances par exemple. Elles doivent être traitées par des médecins, épidémiologistes avec déontologie. La sécurité
informatique est cruciale et complexe pour les données de santé (un dossier de santé c’est entre 10 et 100$)
C. Impact en recherche biomédicale

Outil d’appui et développement de la Recherche


Exploitation facilitée des données
- Tiers de confiance
- Exploitations respectant la protection des données
- Haute technicité
Object de recherche en bio-informatique : surveillance détection…

1- le réseau interrégional des entrepôts de données cliniques de l’ouest Ehop ®


En quelques chiffres

2- Création du Health Data Hub, un entrepôt national


L’Etat a créé en 2019 le HEALTH DATA HUB (HDH) : Une infrastructure nationale pour promouvoir le partage et
l’exploitation des données de santé pour l’innovation

Le HDH permettra :
- L’appariement des bases de données à l’échelle nationale
- La mutualisation des infrastructures « Big data » sécurisées
- La valorisation du patrimoine de données à l’échelle nationale et internationale

 Objectif Health Data Hub

« Mettre le patrimoine des données de santé financées par la solidarité nationale au service du patient et du système
de santé dans le respect de l’éthique et des droits fondamentaux de nos concitoyens »

Un grand potentiel de transformation de l’innovation


 Près de 100 cas d’usage identifiés :
- Recherche médicale : mettre eb évidebce des biomarqueurs et des prédispositions génétiques à certains
cancers, identification des états précancéreux, accélérer la recherche clinique
- Suivi et information des patients : développer pour les patients des outils d’aide à l’interprétation, par exemple
des examens biologiques ou d’imagerie médicale
- Appui aux professionnels de santé : prédire les risques de complications liés à certaines prises en charge (par
exemple la chirurgie) et adapter celle – ci aux caractéristiques du patient (par exemple pour la prise en charge
de l’obésité)
- Pilotage du système de santé : identifier les ré – hospitalisations potentiellement évitables pour améliorer
l’offre de soin : mieux identifier les effets indésirables des médicaments

 Health data hub

Historique = Système National des Données de Santé (SNDS) (loi du 26 janvier 2016 sur la modernisation du
système de santé français)
- Collecte des données de santé provenant de différents organismes : Assurance Maladie (base SNIIRAM) et
hôpitaux (base PMSI)
- Analyse des données, les lier entre elles, et les rendre disponibles « afin de favoriser les études, recherches
ou évaluations présentant un caractère d’intérêt public »

Création Health Data Hub = enrichissement du SNDS


- Par le recueil de données cliniques
- Pour faciliter l’exploitation des données de santé par différents moyens et techniques innovantes :
 Soutien aux projets innovants dans le domaine de la santé

IV. Protection des données de santé et recherche sur Big Data


Enjeux « Informatiques et Libertés » du BigData en santé, notamment nature des données traitées hautement
sensibles

Importance de garantir un niveau élevé de protection des personnes, de leurs données et de leurs droits
- Notamment information sur l’usage de leurs données personnelles
Missions supplémentaires d’un entrepôt de données de santé
- Information des patients et promotion / facilitation de leurs droits
- Respect des principes de limitation et de minimisation des données à caractère extrêmement sensible
 Notamment face développement des techniques d’intelligence artificielle en santé
 Gestion des risques liées à la concentration de données sensibles sur une plateforme technologique Big
Data, nécessitant la mise en place de mesures de sécurité appropriées

V. En bref
 « Big data » en santé = Données
 Hétérogènes (3V), Multi-domaines, Multi-échelles
 Données sensibles ++++

 Entrepôts = concentrateurs de données permettant


 Une exploitation facilitée des données mais nécessitant :
 Une technicité
 Des organisations tierces de confiance pour exploitations respectant la protection des données
 Technologies utiles dans de nombreux cas d’utilisation en recherche
 Mais aussi au-delà
 Santé connectée, outil connectée d’éducation thérapeutique, promotion de la santé..;
 Dépistage
 Contact tracing
Conclusion
Le big data en santé, même s’il cristallise les craintes et nécessite une mise en garde préalable des usagers, présente
de nombreux intérêts
- Appui précieux pour le patient et son personnel soignant, notamment suivi de pathologies chroniques (objet
connecté)
- Centralisation et volume de données permettent nouvelle ère de recherche

Se pose la question de la qualité et de la source des données, de la rigueur de la saisie…


- Une quantité de données n’est pas à opposer à la qualité ?

 Une révolution en marche

Take home message


Big data = masse de données massives
- 3V (stockage, quantité et rapidité)
 Volume de données +++
 Grande Variété d’informations
 Vélocité : rapidité de création, collecte et partage de ces données
- Permettant des techniques innovantes d’Intelligence artificielle

Nouvelle ère, incontournable, notamment en santé

Une chance pour la recherche biomédicale


- Mais attention à la protection des données des personnes
 Information des usagers sur leurs droits
 Ethique de la recherche et de la prise en charge des malades

Vous aimerez peut-être aussi