Gestion de Masses de Donn Es Au Sein de

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 19

Gestion de masses de données temps réel au sein de

bases de données capteurs


Sylvie Servigne, Thomas Devogele, Alain Bouju, Frédéric. Bertrand, Claudia
Gutierrez Rodriguez, Guillaume Noel, Cyril Ray

To cite this version:


Sylvie Servigne, Thomas Devogele, Alain Bouju, Frédéric. Bertrand, Claudia Gutierrez Rodriguez,
et al.. Gestion de masses de données temps réel au sein de bases de données capteurs. Revue In-
ternationale de Géomatique, Lavoisier, 2009, 19 (2), pp.133-150. <10.3166/geo.19.133-150>. <hal-
00447142>

HAL Id: hal-00447142


https://hal.archives-ouvertes.fr/hal-00447142
Submitted on 21 Sep 2017

HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est


archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents
entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non,
lished or not. The documents may come from émanant des établissements d’enseignement et de
teaching and research institutions in France or recherche français ou étrangers, des laboratoires
abroad, or from public or private research centers. publics ou privés.
1

Gestion de masses de données au sein de


bases de données capteurs

S. Servigne1, T. Devogele2, A. Bouju3, F. Bertrand3, C. Gutierrez1,


G. Noel1, C. Ray2
(1)
LIRIS, INSA Lyon,UMR 5205, 69621 Villeurbanne Cedex
e-mail: { prénom.nom }@insa-lyon.fr
(2)
Institut de Recherche de L’Ecole navale EA 36 34, Lanvéoc 29240 Brest
e-mail: {prenom.nom}@ecole-navale.fr
(3)
L3i, Université de La Rochelle,
Pôle Sciences et Technologie1702 La Rochelle Cedex 1,
e-mail: {prénom.nom}@univ-lr.fr

RÉSUMÉ . Les systèmes à base de capteurs sont de plus en plus fréquemment utilisés pour de
nombreuses applications comme la gestion de flottes de véhicules, la surveillance de trafic ou
encore la surveillance de phénomènes environnementaux et urbains. Les données acquises
par ces capteurs sont localisées et datées. Elles sont employées dans des applications de
nature diverse gérant de grandes masses de données spatio-temporelles en temps réel et
différé selon les besoins. L’objectif de cet article est de présenter la problématique, et de
fournir quelques éléments de réponse aux problèmes scientifiques identifiés. Après la
présentation d’applications pertinentes et exploitables, une liste des verrous scientifiques est
exposée. Des éléments de réponse sont ensuite détaillés. Ces réflexions et travaux sont issus
de membres des équipes de recherche collaborant au sein de l’axe « Réactivité, Mobilité et
Temps Réel » et du GT « Services Localisés » du GDR 2340 Sigma.
ABSTRACT. Systems based on sensor networks are more and more widespread for analysis,
monitoring and tracking systems. Data captured by sensors have attributes concerning date
and localisation and might be enriched with meta-information. Data are used in various
applications whose aim is to manage masses of spatio-temporal data either at real time or at
time differed. The objective of this article is to present the problems, and to provide some
elements of solution to the identified scientific bolts. After the presentation of relevant
applications, a list of scientific problems is exposed and some solutions are then detailed.
These reflexions and work result from members of teams of research collaborating within the
axis “Reactivity, Mobility and Real Time” and within the working group “LBS” of the French
research group sponsored by CNRS, named GDR Sigma.
MOTS-CLÉS : Objets mobiles, objets agiles, gestion temps réel, base de données, indexation,
métadonnées, suivi de mobiles,
KEYWORDS: Moving objects, agile objects, real time management, database, index, metadata,
tracking systems.
Gestion de masses de données temps réel au sein de bases de données capteurs 2

1. Introduction

Les systèmes à base de capteurs sont de plus en plus fréquemment utilisés pour
de nombreuses applications comme la gestion de flottes de véhicules, la surveillance
de trafic (Bertrand et al., 2007) ou encore la surveillance de phénomènes
environnementaux et urbains. Ces systèmes sont usuellement basés sur un ensemble
de capteurs qui constituent le système d’acquisition. Ces capteurs, organisés ou non
en réseau selon l’application, fournissent des mesures en temps réel et à fréquences
variables, vers un système mobile, centralisé ou distribué.
La prise en compte de l’évolution de la localisation des capteurs dans le temps
permet de les considérer comme pouvant être fixes, agiles ou mobiles. Les capteurs
fixes conservent ainsi une position déterminée et seules les valeurs d’intérêt du
capteur évoluent dans le temps (e.g. condition atmosphérique). Les capteurs mobiles
sont caractérisés par un changement de position qui s’effectue en continu et où la
localisation devient l’information majeure à traiter comme, par exemple, lors de la
gestion de flotte. La notion d'agilité des capteurs est définie comme leur propension
à changer de position entre deux prises de mesures. Cependant ce changement
s’effectue de façon « discrète » contrairement aux capteurs mobiles. Ces capteurs
peuvent ainsi être fixes pour de longue période puis mobiles sur des durées variables
(e.g. suivi de la tectonique des plaques). La problématique de gestion des
informations issues de capteurs agiles ou mobiles est spécifique en raison des
caractéristiques des informations collectées. En effet si les informations sont variées,
et ont des caractéristiques spatio-temporelles, elles sont fondamentalement temps-
réel. Cette dimension temps-réel induit de nouveaux besoins en termes de
structuration, d’exploitation, de visualisation de données et également en termes de
structuration architecturale, de moyen de communication, de système et de
périphériques.
L’objectif de cet article est de présenter la problématique de gestion de données
spatio-temporelles issues de réseaux de capteurs, et de fournir quelques éléments de
réponse aux verrous scientifiques identifiés. Après la présentation d’un panorama
non exhaustif des applications qui nous semblent pertinentes et exploitables comme
base de support à la problématique, une liste des verrous scientifiques est exposée.
Des éléments de réponse sont ensuite détaillés. Ces réflexions et travaux sont issus
de membres des équipes de recherche collaborant au sein de l’axe « Réactivité,
Mobilité et Temps Réel » et du groupe de travail « Services Localisés » du GDR
CNRS 2340 Sigma-Cassini CNRS.

2. Panorama d’applications

Les domaines d’application que nous avons prioritairement identifiés offrent un


panorama des problématiques liées à la gestion de données spatio-temporelles temps
réel : la surveillance environnementale, la surveillance de trafics et la gestion de
flottes captives ou non.
3

2.1. Surveillance environnementale

Les réseaux de capteurs liés à des bases de données sont de plus en plus
régulièrement utilisés dans des domaines tels que la surveillance de phénomènes
naturels. Ces capteurs hétérogènes, mesurent différents paramètres : température,
pression, clinométrie, etc. Alors que certains capteurs sont purement périodiques
(sismographes), d'autres ne transmettent des mises à jours que lorsqu'un certain seuil
de mesure est dépassé ou lorsqu'une variation de valeur est constatée. D'autres
politiques combinent ces différents modes de fonctionnement.
Historiquement les capteurs sont représentés par leur identifiant. Les données
collectées par un capteur sont ainsi aujourd'hui référencées selon ce capteur et
estampillées dans le temps. Grâce aux évolutions continues de technologies
permettant une mise à jour des informations de positionnement (notamment les
moyens de communication), il devient utile de référencer les capteurs en fonction
d'informations spatiales, déterminées via GPS ou triangulations diverses, afin de
permettre aux utilisateurs des requêtes spatiales.
Une fois que les capteurs ont effectué leurs mesures, le problème du stockage de
données se pose. Bien que certaines recherches préconisent l'utilisation de
techniques de stockage au niveau des capteurs eux-mêmes, ou au niveau de capteurs
intermédiaires, force est de constater que pour l'heure l'immense majorité des
réseaux de capteurs utilisés envoient les données vers une base de données
centralisée. Par la suite, une réplication de données peut être effectuée vers d'autres
bases ou des entrepôts de données en dehors du réseau et sur disque, comme illustré
par la Figure 1.

Figure 1. Exemple de réseau de capteurs et système central

De fait, les processus d’analyse des données collectées utilisent en priorité les
données les plus récentes. Ainsi l’analyse s’effectue prioritairement en mémoire
vive, alors que les mesures viennent d’arriver au niveau du système central. En effet,
Gestion de masses de données temps réel au sein de bases de données capteurs 4

le recours aux données sur disques, conservées dans l’entrepôt de données est réalisé
lors d’analyses sur plus long terme ou nécessitant des comparaisons avec des
mesures antérieures.
Les prises de mesures imposent à la base centrale des contraintes temps-réel. En
effet, une mesure provenant d'un capteur donné doit être intégrée à la base avant
qu'une mesure plus récente n'apparaisse dans celle-ci. De plus, il est parfois
nécessaire de consulter les données dans des délais impartis. Bien qu'il soit
souhaitable de conserver un long historique des mesures passées (afin de pouvoir
comparer, retrouver des schémas similaires ou autre), les spécialistes sont le plus
souvent intéressés par les données les plus récentes. Ainsi, au sein de la masse de
données recueillies (certains capteurs peuvent avoir des fréquences s'exprimant en
centaines de Hertz, voire plus), il est généralement souhaitable de pouvoir accélérer
l'accès aux mesures reflétant l'état actuel du système.

2.2. Surveillance de trafic et systèmes de transport intelligents

Les systèmes de surveillance de trafic et les systèmes de transport intelligents


(STI) visent à intégrer les technologies de l'information et de la communication aux
infrastructures de transport ainsi qu'aux véhicules. Leur objectif est une optimisation
de la gestion globale de différents éléments (systèmes de gestion des feux, systèmes
de gestion des conteneurs, panneaux à messages dynamiques (PMV), …). Ces
systèmes ont pour objectif l'amélioration de la sécurité, l’optimisation des flux de
transport incluant la réduction de l'usage des véhicules, des temps de transport et des
coûts en carburant. Ces systèmes s’appuient sur les communications sans fil,
l’électronique, l’informatique embarquée et les réseaux de capteurs. Parmi les
capteurs listés dans (Aubin et al., 2006), il faut notamment citer :
- Les boucles à induction placées sous ou sur la chaussée pour détecter les
véhicules qui passent. Les boucles les plus sophistiquées estiment également la
vitesse, la longueur et le poids des véhicules ainsi que la distance qui les
séparent.
- Les Floating Car Data (FCD) qui estiment à partir des positions issues de la
triangulation des téléphones cellulaires ou de capteurs GPS, les positions et les
vitesses d’un ensemble de véhicules.
- Les RADAR et les caméras vidéo pour le suivi de véhicules (Xei et al., 2006) ou
encore la lecture des plaques minéralogique.
L’ensemble des informations fournies par ces capteurs permet après
recoupement, micro et macro analyses et simulation, de répondre à de nombreuses
applications de sécurité, prévention des accidents, de gestion des congestions, de
péages.
Les STI concernent essentiellement le trafic routier urbain et autoroutier.
Cependant, des systèmes ferroviaires, aériens, maritimes coexistent mais les
systèmes d’information existant gèrent ces réseaux de transports séparément. Des
5

travaux émergent ainsi en direction de STI dont l’objectif est la conception intégrée
multimodale (Chen et al., 2008). Par exemple le suivi des conteneurs nécessite des
capteurs mobiles, des moyens de communication et des systèmes d’information qui
doivent permettre la gestion et le suivi en mer, lors de ferroutage ou de convoyage
routier et éventuellement aérien.

2.3. Gestion de flottes

Dans le domaine des transports et afin d’offrir un service aux usagers, il est
nécessaire de définir des politiques de gestion des moyens mobiles (voitures,
camions, train, avion, navires, ….). Cette gestion de flotte repose sur l’utilisation de
moyens de communication et de localisation. Dans cet article, nous nous intéressons
principalement aux problèmes de gestion de la position des objets mobiles ou agiles.
Toutefois, concernant la gestion de flotte, co-existent des problèmes de gestion de
l’entretien, de la facturation, du paiement du service, de l’optimisation des
moyens… Si la gestion la plus simple d’une flotte consiste à gérer les points
essentiels d’un trajet (départ, arrêt, arrivée), les moyens de localisation et de
communication sans fils autorisent aujourd’hui le suivi à tout instant de la position
des objets mobiles de la flotte. Les gestionnaires ont alors à leur disposition une
visualisation en temps réel de la situation leur permettant de réagir rapidement lors
de problèmes (saturation, accidents, ...). Une convergence existe entre la gestion de
flottes et le suivi du traffic. On notera par exemple l’utilisation du suivi d’une flotte
de taxis pour évaluer le trafic (région parisienne, Beijing, Singapour).

3. Problématiques scientifiques

La gestion de données spatio-temporelle issue d’objets mobiles ou agiles est un


problème récent. Pour envisager des applications plus ambitieuses qu’une simple
visualisation des valeurs collectées, nous avons identifié différents verrous
scientifiques, qui ne constituent pas à eux seuls une liste exhaustive, mais qui
permettent d’initier des problématiques de recherche.

3.1. Modélisation et formalisation

Les données issues de capteurs présentent des spécificités en partie dues au type
de capteurs (fixe, agile ou mobile) et également au mode de mesure. Pour les objets
mobiles, il est possible, par exemple, d’utiliser DynamicFeatureType du langage
GML de l’ISO/TC211, pour caractériser un objet dont la position évolue au cours du
temps. Néanmoins, ce type de données ne prend pas en compte les spécificités
propres aux capteurs comme la nature du phénomène observé ou les référentiels
utilisés pour les mesures. Nous avons donc établi un modèle générique de données
ainsi qu’une formalisation des objets gérés (voir paragraphe 4.1 et 4.2).
Gestion de masses de données temps réel au sein de bases de données capteurs 6

3.2. Intégration des données issues de différents capteurs

L’utilisation de différents types de capteurs devant transmettre leurs


informations, impose la présence de plusieurs services afin de faciliter la continuité
de la localisation des objets et l’intégration des données issues de capteurs
hétérogènes. Premièrement, un même objet pouvant être localisé par différents
capteurs, chacun à des pas de temps différents, et chacun avec des informations
complémentaires, le contrôle de la cohérence des informations doit être réalisé. La
fusion des sources d’informations est ensuite possible. Deuxièmement, un problème
d’interpolation se pose. Les données sont fournies de manière discrète. Or, pour
certaines applications, il est indispensable d’obtenir des informations de manière
quasi-continue ou avec une granularité spatio-temporelle différente de celle des
données transmises. Troisièmement, des pannes pouvant survenir sur un des
systèmes (capteurs, transmissions, relais, …), il s’avère utile d’estimer la position
des objets mobiles, au cours des interruptions de courte durée. Finalement, au sein
de zones où la communication des données est impossible (zones d’ombre), un
service d’estimation de position est alors indispensable (Redoutey et al., 2008).

3.3 Indexation de bases de données capteurs

Les systèmes de base de données capteurs sont de plus en plus fréquemment


utilisés pour la surveillance de milieux à risques ou encore pour la prévention de
catastrophes naturelles. Ces systèmes sont usuellement composés d’un ensemble de
capteurs envoyant les mesures effectuées vers une base de données centralisée en
mémoire vive (Bohannon et al, 2001 ; Song et al., 2003). La fréquence des mesures
et les besoins des utilisateurs imposent à la base des contraintes de traitement
nécessitant un stockage rapide des données tout en valorisant les données les plus
récentes. Quant au besoin semi-généralisé d’accéder aux données, non plus en
fonction d’un identifiant de capteur, mais en fonction de critères spatiaux, il impose
à son tour des caractéristiques spatio-temporelles. Il est donc nécessaire de définir
des méthodes d’indexation de données spatio-temporelles en mémoire vive sous
contraintes temps-réel. Des propositions de méthodes d’indexation ont ainsi été
élaborées pour répondre à ces problématiques pour des données issues de capteurs
fixes, dans un premier temps, puis pour des données issues de capteurs agiles (voir
paragraphe 4.3)

3.4. Communication et visualisation des informations

Actuellement, les données issues des capteurs servent essentiellement à des


systèmes de gestion et de visualisation de la situation de l’instant présent. Ces
systèmes doivent pouvoir s’adapter à des utilisateurs ayant des objectifs et des
degrés de compétence très divers, et être également dynamiques pour s’auto-
configurer lors de la détection d’événements. Ainsi, la présentation à l’écran d’une
congestion routière destinée à un décideur politique ne doit pas être la même que
celle offerte à un gestionnaire du trafic qui administre le système de synchronisation
7

de feux rouges. Cette visualisation doit également permettre de s’adapter aux


événements (accidents, congestions, etc.) afin de fournir à l’utilisateur la meilleure
représentation (représentation la plus adéquate) des phénomènes qui viennent d’être
détectés. Pour les objets mobiles en interactions, il est important de pouvoir
représenter les déplacements des objets de manière relative. Des travaux présentant
des vues basées sur la vitesse relative et la distance relative ont été proposés dans
(Noyon et al. 2007).
Au-delà des mécanismes de personnalisation proprement dit, la conception de
système d’information tend désormais vers une approche ubiquitaire contextuelle
(Viana et al., 2007). La conception de tels systèmes peut, par exemple, être abordée
par une approche dans laquelle le contexte géographique, environnemental (i.e. les
conditions d’utilisation), le contexte matériel et le contexte utilisateurs se combinent
au sein de SIG interactifs (Petit et al. 2006). Ce type d’approche permet de définir et
de contraindre la conception et les règles d’utilisation d’un service géographique en
fonction des mobilités des utilisateurs, des composants informatiques offrant le
service et de la zone géographique d’intérêt.
Un autre aspect concerne l’historique de ces données qui n’est pas mis
suffisamment en valeur. Des techniques issues de la fouille de données,
permettraient d’identifier des motifs (patterns) spatio-temporels. Par exemple, pour
les cargos, la construction de motifs de trajectoires, servirait à la détection « en
temps réel » des déplacements anormaux et d’attirer l’attention des opérateurs sur le
navire concerné. Ces motifs pourraient aussi être employés par les services
d’interpolation et d’estimation des trajectoires des objets mobiles ou pour distribuer
des informations de trafic de manière pertinente (Brilingaitė et al., 2007 ). Le
couplage de ces systèmes de gestion de données spatio-temporelles avec des
logiciels de simulation permettrait par exemple d’anticiper les futures situations
critiques et de renforcer la sécurité des systèmes en transport (Fournier et al., 2003).
En termes de visualisation, la personnalisation et l’adaptation de la visualisation des
motifs spatio-temporels en fonction du contexte d’utilisation et à un niveau de
granularité approprié reste également un problème d’actualité.

3.5. Métadonnées spatio-temporelles temps réel

Les métadonnées géographiques sont aujourd’hui définies selon des normes ISO
(ISO 19115, 2006 ; Servigne et al., 2006) et ont notamment pour vocation de
faciliter l’échange des données entre utilisateurs différents et de renseigner sur la
qualité des données. Toutefois, ces critères qualité sont définis pour des données
statiques exploitées par des applications traditionnelles. Ces critères ne prennent pas
en compte la qualification de données dynamiques notamment issues d'objets (munis
de capteurs) mobiles, agiles ou de mesures temps réel exploitées dans des
applications « en ligne ». Quelques questions se posent comme par exemple : quelles
sont les informations nécessaires à prendre en compte dans les métadonnées de
données spatio-temporelles temps-réel ? Comment différencier données et
métadonnées dans un contexte temps-réel ?
Gestion de masses de données temps réel au sein de bases de données capteurs 8

La gestion temps-réel des données spatio-temporelles issues de capteurs


nécessite donc une étude et une définition des métadonnées en temps-réel
notamment pour l’évaluation de la qualité des données intervenant dans les
processus de décision (Gutierrez et al., 2007). L’ensemble des capteurs fournissant
des données spatio-temporelles de qualité hétérogène, l’exploitation de métadonnées
s’avère indispensable.

4. Premiers éléments de contributions aux problématiques liées à la gestion de


masses de données spatio-temporelles issues de réseaux de capteurs

Après une description d’une modélisation UML des données manipulées dans un
réseau de capteurs, nous détaillons une formalisation des objets issus de capteurs.
Des méthodes d’indexation de données issues de capteurs fixes et agiles ont été
conçues et sont rapidement présentées avant de donner un exemple d’architecture
d’objets mobiles concernant une flotte de navires.

4.1. Modèle de données capteur

Un modèle générique UML de données mesures et capteurs est présenté en


Figure 2. Un réseau de capteurs est composé de capteurs. Les capteurs peuvent
effectuer plusieurs mesures de types différents. Les capteurs peuvent se différencier
suivant plusieurs catégories en fonction de leur taux de mobilité à savoir capteur
fixe, agile ou mobile.
On notera que les capteurs fixes et agiles forment traditionnellement la majeure
partie de ceux utilisés dans les systèmes de surveillance de phénomènes naturels
alors que les capteurs mobiles sont souvent dédiés au suivi ou à la gestion de flottes.
Un capteurs mobile est un capteur et donc hérite de ses propriétés. Le capteur
mobile est caractérisé par son taux de mobilité. Un capteur agile est un capteur
mobile mais avec une mobilité restreinte. Les capteurs agiles et mobiles occupent
donc diverse positions au cours du temps.

4.2. Formalisation des objets

Au sein des réseaux de capteurs, les objets principaux concernent les capteurs et
les mesures ou informations captées. Nous proposons un formalisme pour les objets
correspondant à des ensembles de mesures issus des trois types de capteurs (fixe,
mobile, agile).
9

Figure 2. Modèle de données mesures et capteurs

Nous appelons « id » l’identifiant de l’objet, il est unique et ne varie pas dans le


temps. Chaque objet représenté dans la base est identifié. Nous appelons idC,
l’identifiant du capteur. La position de ces objets est nommée « S », elle est associée
à un système de coordonnées géographiques ou cartographiques. Les positions des
objets peuvent être définies dans des systèmes différents. La plupart du temps, la
position est obtenue par un système de positionnement par satellite mais peut
également être obtenue par triangulation terrestre (e.g. via réseau GSM). Dans
certains cas, la position de l’objet (et son évolution) est relative à une location
absolue par exemple dans le cas de suivi et de navigation « indoor » (Ray et al.,
2009). À ces objets positionnés sont associés des attributs thématiques. La valeur de
ces attributs est soit figée, soit variable dans le temps. Les attributs dont la valeur
varie sont nommés « Aj ». Pour chaque attribut Aj une valeur Aij est donnée à un
instant Ti. Les instants Ti sont ordonnés (Ti < Ti+1). Les valeurs Aij sont fournies par
les capteurs à pas constants ou à pas variables. Les attributs fixes sont nommés Bk.
Leur valeur ne varie pas dans le temps. Une fois ces notations définies, les objets
issus des trois types de capteurs peuvent être formalisés.
Objet issu de capteurs fixes (OCF) :

Pour les objets issus de capteurs fixes, la position du capteur est figée, seules les
valeurs des Aj varient dans le temps. Nous pouvons donc définir ces objets à l’aide
d’un identifiant, une position, une série temporelle où pour chaque instant Ti est
communiquée une valeur pour chaque Aj ainsi que des attributs de valeur fixe.
j j
OCF : id, idC, S, {Ti, { A i }}, {Bk} avec A i : mesure de type A j à l’instant i
Gestion de masses de données temps réel au sein de bases de données capteurs 10

Objet issu de Capteurs agiles (OCA) :

Pour les objets issus de capteurs agiles, la position du capteur ne varie pas selon
la même granularité que les attributs Aj. Nous pouvons donc formaliser ces objets à
partir d’un identifiant et d’une première série temporelle des positions prises par ce
capteur. A l’intérieur de cette série temporelle, une deuxième série temporelle des
valeurs Aij pour chaque Aj, est définie. Elle contient la série de mesures réalisées à
cette position par le capteur. Des attributs de valeur fixe viennent compléter ce
formalisme.
j
OCA : id, idC, {St, {Ti, { A i }}, {Bk}
St+ ∆ t : localisation spatiale durant la période t + ∆ t
Ti : date et heure à l’instant i avec t ≤ i ≤ t + ∆t et Ti ≤ Ti+1
A ij : mesure A j de type j à l’instant i et Bk : attribut de valeur fixe

Objet issu de capteurs mobiles (OCM) :

Pour les objets issus de capteurs mobiles, la position du capteur est susceptible
de varier à chaque envoi d’information. Nous pouvons donc formaliser ces objets
comme un identifiant, une série temporelle où, pour chaque instant Ti, est
communiquée une position Si et une valeur Aij pour chaque Aj. Des attributs de
valeur fixe viennent compléter ce formalisme.
j
OCM : idO, idC, {Si, Ti, { A i }}, {Bk}

4.3. Indexation de données issues de capteurs fixes et agiles

Afin de répondre aux impératifs de l’indexation de bases de données centralisées


en mémoire vive, utilisées conjointement avec des données issues d’un réseau de
capteurs, nous avons développé une première solution, le PoTree (Noël et al.,
2005a). Cette solution vise à indexer les données d’un réseau de capteurs fixes,
référencés spatialement, tout en valorisant les données les plus récentes et les
requêtes d’indexation. Le PoTree (cf. Figure 3) propose de séparer les aspects
temporels et spatiaux (Noël, 2004). Il vise à indexer des données spatio-temporelles,
en minimisant la taille de la structure, et en valorisant les recherches de points
spatiaux et d'intervalles temporels. Il cherche également à faciliter les mises à jour
de données concernant des points spatiaux déjà connus (capteurs fixes). Le PoTree
permet ainsi de répondre à des requêtes du type : « trouver les données issues du
capteur situé à la position <X;Y> émises entre T1 et T2. » Ou bien encore :
«Trouver les données situées dans la zone définie par les points <X1;Y1>, <X2;Y2>
à l’instant T.» En utilisant d'abord des paramètres spatiaux pour restreindre le
nombre d'accès à la structure, le PoTree se distingue des autres index fondés
uniquement sur les identifiants de capteurs.
11

Nœud Spatial
Nœud
Kd-tree Temporel
Donn
Arbre Spatial ées

B+ tree
modifié Arbre
Temporel

Figure 3. Structure du PoTree


Une autre méthode d’indexation a été élaborée afin de prendre en considération
l’agilité d’un capteur. Le PasTree (Noël et al., 2005b), à l’instar du PoTree, est une
solution d’indexation pour bases de données spatio-temporelles en mémoire,
travaillant sur les données issues d’un réseau de capteurs. Cependant, il ajoute au
PoTree la gestion de l’agilité des capteurs ainsi qu’une compatibilité avec les modes
d’interrogation actuels, basés sur les identifiants des capteurs, et non pas uniquement
sur des aspects purement spatio-temporels. Enfin, une troisième méthode
d’indexation, le StH (Figure 4), a également été élaborée afin de prendre en compte
la gestion de la saturation en mémoire vive.

Figure 4. Structure générale simplifiée du StH


Gestion de masses de données temps réel au sein de bases de données capteurs 12

Le Sth reprend la structure globale du PasTree : accès multicritère aux données,


arbre spatial spatial multiversion centré sur les capteurs. Une fonction de chaleur
propre à chaque capteur a été ajoutée permettant la gestion de la saturation de la
mémoire (Servigne et al. 2008).

4.4. Vers une définition des métadonnées spatio-temporelles temps réel

Généralement, les métadonnées sont définies selon leur contexte d’utilisation et


leur contenu. Dans notre contexte, nous définissons les métadonnées spatio-
temporelles temps réel comme étant "les données sur les données qui répondent aux
besoins de l’utilisateur pendant un intervalle de temps déterminé pour une
localisation et un instant de temps (date) précis" (Gutiérrez et al., 2007 a). Nous
avons ainsi analysé les métadonnées spatio-temporelles suivant plusieurs
dimensions : généricité, dynamicité, extraction… (Gutiérrez et Servigne, 2007 b).
En raison du dynamisme des données temps réel et de leur exploitation, les
utilisateurs concèdent qu'il est souvent difficile d'établir la distinction entre une
donnée et une métadonnée. Un modèle des données STTR (Spatio-Temporelles
Temps Réel) a été élaboré afin de servir de support à l'identification des
informations relevant des données ou des métadonnées. Ce modèle est cohérent avec
les modèles issus de la norme de l’OGC. A partir de ce modèle, il est possible
d’établir des règles et des conditions d'éligibilité (données ou métadonnées) selon la
sémantique des données ou encore la dynamicité des données.
Une classification des métadonnées en métadonnées statiques et métadonnées
dynamiques a également été définie. Ces catégories correspondent à la
caractéristique de dynamicité des données qui peut être transmise aux métadonnées
selon le contexte d'exploitation des données.
Le contexte temps réel peut également conduire à la distinction de deux niveaux
de métadonnées : les métadonnées génériques et les métadonnées applicatives. Les
métadonnées génériques décrivent l’information minimum requise pour
l’identification et la définition d'un ensemble de données. Ces métadonnées
représentent le socle des éléments indispensables et communs à la documentation
d’une application STTR. Les métadonnées applicatives quant à elles décrivent
l’information particulière de chaque système, par rapport au type d’application et à
ses caractéristiques. Ces métadonnées son optionnelles et peuvent être ajoutées selon
les besoins de l’utilisateur.
Le problème de granularité des métadonnées fonction de la granularité des
données est plus sensible dans un contexte temps réel. En effet, si la granularité des
données versus granularité des métadonnées est une problématique étudiée pour des
données géographiques statiques (Devillers et al., 2005), la dynamicité des données
nécessite à nouveau une étude. Les flux étant continus dans le temps voire dans
l’espace, granularité et flux semblent être, de prime abord, difficilement
conciliables.
13

Un autre aspect important concerne l’extraction des métadonnées et


l’exploitation des métadonnées dans un contexte temps réel. En effet, un des
objectifs de l’utilisation des métadonnées est de fournir à l’utilisateur toute
information utile pour une meilleure exploitation de ses données. Ces métadonnées
doivent être actualisées et disponibles. Elles permettent d’offrir à l’utilisateur une
information de qualité à temps et avec précision. Dans le contexte temps réel, les
processus d’extraction et d’exploitation de métadonnées sont assez importants. Nous
pouvons ainsi faire une distinction entre extraction automatique et extraction à la
demande de l’utilisateur.

4.5. Un exemple d’architecture pour le suivi d’objets mobiles : les navires

Pour évaluer les problèmes de stockage et de recherche d’information pour des


objets mobiles, nous avons exploité la norme AIS (Automatic Identification System)
qui permet aux navires d’échanger en temps-réel des informations sur leurs
mobilités à la mer via des communications VHF (IMO, 2002). Les données
échangées par un navire équipé du système AIS incluent, la position GPS, la date et
l’heure associées à cette position. Le système transmet également à une échelle de
temps moins régulière des meta-informations liées au navire (identifiant
international, nom, taille) et à son déplacement (destination, date et heure prévue
d’arrivée).
Un système a été mis en place à terre pour écouter les messages permettant
d’obtenir la position et des informations sur chaque navire visible par le récepteur
radio (environ 30 km). Une architecture répartie (cf. Figure 5) a ensuite été conçue
afin de permettre la réception, le stockage et la visualisation de la situation sous
forme de carte à la demande (modèle client–serveur à données et traitement
distribuées). Cette architecture permet également d’effectuer la visualisation de
séquences temporelles choisies par l’utilisateur (Bertrand et al., 2007).
Gestion de masses de données temps réel au sein de bases de données capteurs 14

Site AIS Site AIS Client Web Client Web

Internet

Décodage
AIS Serveur Web

Gestion de la
VHF Persistance
Interrogation

Intranet

Base de
Données

Figure 5. Présentation du système de suivi de navires par AIS

4.5.1. Architecture du système AIS


Les données provenant de l’AIS sont archivées dans une base de données.
L’objectif est de faciliter des recherches de données mais également de réaliser la
séparation entre la gestion du stockage et de recherche de données. Nous effectuons
le suivi des objets mobiles en enregistrant les positions des navires à certaines dates.
Dans les systèmes AIS le nombre de positions échangées varie en fonction de la
vitesse et du comportement des bâtiments. Notre objectif dans cette étude est de
mettre en place une plateforme permettant le stockage, le filtrage et l’indexation des
positions d’objets mobiles et d’étudier les conditions qui permettent d’avoir à la fois
des mises à jour fréquentes et des requêtes pour la visualisation ou la gestion.
Le système gère les positions en provenance d’un récepteur AIS situé au
Technopole de Brest et d’un récepteur AIS situé à l’Université de La Rochelle. Les
sont recueillies en continu depuis plusieurs années. Le récepteur AIS de Brest fourni
à titre indicatif 3 million de points par an (un filtrage est réalisé pour limiter aux
positions utiles l’insertion, en base de données, des objets fixes qui transmettent
régulièrement).
Nous étudions également l'adaptation de nos travaux aux traitements
d'informations provenant d'aéronefs. Ces derniers, notamment ceux effectuant du
transport public, possèdent des équipements (transpondeur mode S) permettant de
diffuser (et d'échanger) des informations sur leurs paramètres (vitesse, altitude).
Nous pensons qu'une grande partie des composants logiciels développés dans le
15

cadre de l'AIS peuvent être utilisés pour le traitement de ce type d'information,


l'adaptation portant principalement sur la gestion de la troisième dimension. La
gestion rapide et efficace de la masse de données produite par le système de
localisation aérien engendre également un challenge (environ 15 million de point par
mois).

4.5.2. AIS et base de données


Actuellement, des bases de données relationnelles disposent d’extensions
facilitant la manipulation de données géographiques. Ces bases permettent la gestion
efficace d’un grand volume de données. Elles offrent également une bonne gestion
de la concurrence c'est-à-dire qu’il est possible d’effectuer à la fois des insertions et
d’effectuer des recherches dans la base de données. De plus, elles offrent un langage
de requête, SQL (Structured Query Language) connu et exploité depuis longtemps.
Avec les bases de données, des interfaces comme JDBC (Java DataBase
Connectivity) ou ODBC (Open Database Connectivity) sont également disponibles
facilitant l’utilisation dans des applications.
Nous avons choisi d’utiliser une base de données PostgreSQL, avec son
extension spatiale PostGIS, pour effectuer le suivi d’objets mobiles et la
visualisation de leurs déplacements. Dans un premier temps, un système permettant
le stockage des positions et la mise à jour des positions des navires a été réalisé.
Dans ce cas, il est nécessaire de mettre en œuvre un mécanisme pour réorganiser les
données de la base lors de modifications fréquentes de la base de données. Le
système conserve des informations sur les modifications et il y a des « trous » dans
l’indexation. PostgreSQL offre un mécanisme (« VACUUM ») plus ou moins
automatique selon les versions de PostgreSQL permettant la réorganisation des
données. S’il n’est pas effectué, l’utilisation de la base devient de plus en plus lente
voire impossible. Actuellement, nous mémorisons les positions successives des
objets mobiles et utilisons des index permettant de mettre à jour et d’interroger les
données stockées. Ce système permet la gestion d’un volume important de données
avec les facilités offertes par un système de gestion de bases de données.

5. Conclusion et perspectives

Dans cet article nous soulignons que le développement de moyens de


communication sans fil et de localisation suscite le développement d’applications
avec de nouvelles contraintes (gestion de données en temps réels, grand volume de
données, …). Nous proposons de considérer ces applications comme des systèmes
de gestion de capteurs pouvant être fixes, agiles ou mobiles. Cette approche
correspond aux résultats de nos travaux réalisés dans le cadre de l’axe « Réactivité,
Mobilité et Temps Réel » et du groupe de travail « Services Localisés » du GDR
Sigma-Cassini. Ces travaux portent principalement sur des applications de suivi de
navigation maritime et de gestion de sismographes.
Gestion de masses de données temps réel au sein de bases de données capteurs 16

Nous proposons trois types d’objets géolocalisés. Les OCF sont des Objets issus
de Capteurs Fixes. Les OCA sont des Objets issus de Capteurs Agiles. Les OCM
sont des Objets issu de Capteurs Mobiles. Précisons que la notion d'agilité des
capteurs est définie comme leur propension à changer de position entre deux prises
de mesures mais de façon discrète, contrairement aux capteurs mobiles dont le
changement de position s’effectue continuellement et où la localisation devient
l’information majeure à traiter. La gestion de ces données doit s’effectuer avec des
contraintes plus ou moins fortes qu’il s’agisse de gestion de risques ou de
visualisation du trafic. Nous présentons des problèmes et les solutions que nous
avons adoptées dans deux contextes applicatifs. Pour ces applications nous avons
utilisé des méthodes d’indexation en mémoire et des bases de données avec des
extensions spatiales. Les objets que nous proposons doivent nous permettre
d’évaluer, en fonction des types d’objets et des flux de données, les choix à effectuer
pour la gestion des objets. Nous devrons en particulier trouver un équilibre entre
stocker des masses importantes de données peu structurées avec des difficultés au
niveau de l’interrogation et une forte structuration de données (avec des index pour
l’interrogation) consommatrice en temps d’exécution pouvant donc entrainer des
pertes de données. Nos travaux seront également mis en regard des spécifications
proposées par l’Open Geospatial Consortium (Sensor Web, 2007) concernant les
« capteurs web ».

Bibliographie

Aubin, S., Plainchaut, P., Ieng, S.-S., Auberlet, J.-M., 2006, In Proceedings of the 6th
International Conference on ITS Telecommunications (ITS-T 2006), pages 870-873, W.
Guangun, S. Komaki, F. Pingzhi and G. Landrac (eds.), Chengdu, China, ISBN 0-7803-9586-
7
Bohannon P., McIlroy P., Rastogi R.. 2001. Main-Memory Index Structures with Fixed-Size
Partial Keys, In SIGMOD Conference.
Bertrand F., Bouju A., Claramunt C., Devogele T., Ray C., 2007, Web architectures for
monitoring and visualizing mobile objects in maritime contexts, In Proceedings of the 7th
International Symposium on Web and Wireless Geographical Information Systems (W2GIS
2007), pages 94-105, G. Taylor and M. Ware (eds.), Springer-Verlag, LN series in Computer
Science (LNCS 4857), Cardiff, UK.
Brilingaitė A., Jensen C.S., 2007, Enabling Routes of Road Network Constrained Movements
as Mobile Service Context, GeoInformatica, Springer, Volume 11, Number 1, Pages 55-102
Chen, S., Tan, J., Ray, C., Claramunt C., Sun, Q., 2008, An Integrated GIS-based Data Model
for Urban Multi-modal Public Transportation Analysis and Management, In Proceedings of
the 16th International Conference on Geoinformatics (GEOINFORMATICS' 2008), SPIE
Press, pages 255-262, Guangzhou, China
Follin J-M, Bouju A., Bertrand F. and Boursier P. 2004. Visualization of multi-resolution
spatial data in mobile system. Proceedings of 1st International Workshop on Ubiquitous GIS
(UbiGIS 2004)Gävle, Sweden, June 2004
17

Fournier, S., Devogele, T. and Claramunt C., 2003, A role-based multi-agent model for
concurrent navigation systems, Proceedings of the 6th AGILE Conference on Geographic
Information Science, Gould, M. et al. (eds.), Presses Polythechniques et Universitaires
Romandes, pp. 623-632
Gaede V., Günther O., 1998. Multidimensional access methods. ACM Computing Surveys,
vol. 30, no 2, ACM Press: 170-231.
Gutierrez Rodriguez,C., Servigne S., Laurini R., 2007 a, Towards Real Time Metadata for
Network-Based Geographic Databases. In Proceedings of ISSDQ2007, 5th International
Symposium of Spatial Data Quality, 13-15 June 2007, Enschelde, The Netherlands, 8 pages
2007
Gutierrez Rodriguez,C., Servigne S. 2007 b, Métadonnées Spatiotemporelles Temps-Réel.
Revue des sciences et technologies de l'information : Ingénierie des Systèmes d'Information
12(2):p. 97-119, Lavoisier, ISBN 978-2-7462-1913-, ISSN 1633-1311.
International Maritime Organization, 2002, Guidelines for the onboard operational use of
shipborne Automatic Identification Systems (AIS), resolution A.917(22), 14 pages
ISO/TC 211 (2004) Geography Markup Language (GML), Standart international N 005r3 du
WG 4/PT 19136
ISO19115, 2006. ISO19115 – An International Metadata Standard for Geographic
Information, http://grdc.bafg.de/servlet/is/2376 (Dernière consultation le 7 Novembre 2008).
Laucius S., Bertrand F., Stockus A. and Bouju A. 2005. Query management and spatial
indexing in mobile context. Proceedings of 8th AGILE Conference on Geographic
Information Science, pp 429-438 Lisboa, Portugal, May 2005
Noël G., Servigne S., Laurini R. 2005a. The Po-tree: a soft real-time spatiotemporal data
indexing structure. Developments in Spatial Data Handling. SDH04, 11th International
Symposium on Spatial Data Handling. Springer Verlag. ISBN: 978-3-540-22610-9. 2005.
pp259-270.
Noël G, Servigne S. 2005b. Indexation multidimensionnelle de bases de données capteur
temps-réel et spatiotemporelles. In: Revue Ingénierie des Systèmes d’information, 2005.
Vol.10, n°4. pp. 59-88
Noyon, V., Claramunt, C., and Devogele, T., 2007, A Relative Representation of Trajectories
in Geographical Spaces, Geoinformatica, Springer, vol. 4, n. 11, pp. 479-496
Sensor Web, OGC, 2007, http://www.opengeospatial.org/projects/groups/sensorweb,
(Dernière consultation le 7 Novembre 2008)
Petit M., Ray C. and Claramunt C., 2006, A contextual approach for the development of GIS:
Application to maritime navigation, in Proceedings of the 6th International Symposium of
Web and Wireless Geographical Information Systems (W2GIS), J. Carswell and T. Tezuka
(eds.), Springer-Verlag LNCS 4295, Hong Kong, December 4-5, pp 158-169.
Ray, C., Comblet, F., Bonnin, J.-M., Le Roux, Y.-M., 2009, Wireless and Information
Technologies Supporting Intelligent Location-based Services, Wireless Technologies for
Intelligent Transportation Systems, Chapitre 10, M.-T. Zhou, Y. Zhang, L.T. Yang (eds.),
Nova Science Publishers, a paraitre
Redoutey, M., Scotti, E., Jensen, C.S., Ray, C., Claramunt, C., 2008, Efficient Vessel
Tracking with Accuracy Guarantees, In Proceedings of the 8th International Symposium on
Gestion de masses de données temps réel au sein de bases de données capteurs 18

Web and Wireless Geographical Information Systems (W2GIS 2008), pages 145-157, M.
Bertolotto, C. Ray, X. Li (eds.), Springer-Verlag, LN series in Computer Science (LNCS
5373), Shanghai, China
Servigne S., Lesage N., Libourel T., 2006, Spatial data quality components, standards and
metadata. Spatial data quality: an introduction. International scientific and technical
encyclopedia, ISBN 1905209568, March. 2006. pp179-208
Servigne S., Noel G. 2008, Real time and spatiotemporal data indexing for sensor based
databases. Geo-Information Technology for Emergency response. Taylor&Francis: London,
UK. Pp. 123-142. Book with Scientific Committee. ISBN 13:978-0-415-42247-5
Song Z., Roussopoulos N., 2003, SEB-tree: An Approach to Index Continuously Moving
Objects , Mobile Data Management, 2003, pp. 340-344
Viana, W., Bringel, J., Gensel, J., Villanova-Oliver, M., Martin, H., 2007, PhotoMap:
Automatic Spatiotemporal Annotation for Mobile Photos, In Proceedings of the 7th
International Symposium on Web and Wireless Geographical Information Systems (W2GIS
2007), pages 187-201, G. Taylor and M. Ware (eds.), Springer-Verlag, LN series in Computer
Science (LNCS 4857), Cardiff, UK
Xei, L., Zhy, G., Tang, M., Xu, H., Zhang, Z., 2006, Vehicles Tracking Based on Corner
Feature in Video-based ITS, In Proceedings of the 6th International Conference on ITS
Telecommunications (ITS-T 2006), pages 163-166, W. Guangun, S. Komaki, F. Pingzhi and
G. Landrac (eds.), Chengdu, China, ISBN 0-7803-9586-7

Vous aimerez peut-être aussi