Gestion de Masses de Donn Es Au Sein de
Gestion de Masses de Donn Es Au Sein de
Gestion de Masses de Donn Es Au Sein de
RÉSUMÉ . Les systèmes à base de capteurs sont de plus en plus fréquemment utilisés pour de
nombreuses applications comme la gestion de flottes de véhicules, la surveillance de trafic ou
encore la surveillance de phénomènes environnementaux et urbains. Les données acquises
par ces capteurs sont localisées et datées. Elles sont employées dans des applications de
nature diverse gérant de grandes masses de données spatio-temporelles en temps réel et
différé selon les besoins. L’objectif de cet article est de présenter la problématique, et de
fournir quelques éléments de réponse aux problèmes scientifiques identifiés. Après la
présentation d’applications pertinentes et exploitables, une liste des verrous scientifiques est
exposée. Des éléments de réponse sont ensuite détaillés. Ces réflexions et travaux sont issus
de membres des équipes de recherche collaborant au sein de l’axe « Réactivité, Mobilité et
Temps Réel » et du GT « Services Localisés » du GDR 2340 Sigma.
ABSTRACT. Systems based on sensor networks are more and more widespread for analysis,
monitoring and tracking systems. Data captured by sensors have attributes concerning date
and localisation and might be enriched with meta-information. Data are used in various
applications whose aim is to manage masses of spatio-temporal data either at real time or at
time differed. The objective of this article is to present the problems, and to provide some
elements of solution to the identified scientific bolts. After the presentation of relevant
applications, a list of scientific problems is exposed and some solutions are then detailed.
These reflexions and work result from members of teams of research collaborating within the
axis “Reactivity, Mobility and Real Time” and within the working group “LBS” of the French
research group sponsored by CNRS, named GDR Sigma.
MOTS-CLÉS : Objets mobiles, objets agiles, gestion temps réel, base de données, indexation,
métadonnées, suivi de mobiles,
KEYWORDS: Moving objects, agile objects, real time management, database, index, metadata,
tracking systems.
Gestion de masses de données temps réel au sein de bases de données capteurs 2
1. Introduction
Les systèmes à base de capteurs sont de plus en plus fréquemment utilisés pour
de nombreuses applications comme la gestion de flottes de véhicules, la surveillance
de trafic (Bertrand et al., 2007) ou encore la surveillance de phénomènes
environnementaux et urbains. Ces systèmes sont usuellement basés sur un ensemble
de capteurs qui constituent le système d’acquisition. Ces capteurs, organisés ou non
en réseau selon l’application, fournissent des mesures en temps réel et à fréquences
variables, vers un système mobile, centralisé ou distribué.
La prise en compte de l’évolution de la localisation des capteurs dans le temps
permet de les considérer comme pouvant être fixes, agiles ou mobiles. Les capteurs
fixes conservent ainsi une position déterminée et seules les valeurs d’intérêt du
capteur évoluent dans le temps (e.g. condition atmosphérique). Les capteurs mobiles
sont caractérisés par un changement de position qui s’effectue en continu et où la
localisation devient l’information majeure à traiter comme, par exemple, lors de la
gestion de flotte. La notion d'agilité des capteurs est définie comme leur propension
à changer de position entre deux prises de mesures. Cependant ce changement
s’effectue de façon « discrète » contrairement aux capteurs mobiles. Ces capteurs
peuvent ainsi être fixes pour de longue période puis mobiles sur des durées variables
(e.g. suivi de la tectonique des plaques). La problématique de gestion des
informations issues de capteurs agiles ou mobiles est spécifique en raison des
caractéristiques des informations collectées. En effet si les informations sont variées,
et ont des caractéristiques spatio-temporelles, elles sont fondamentalement temps-
réel. Cette dimension temps-réel induit de nouveaux besoins en termes de
structuration, d’exploitation, de visualisation de données et également en termes de
structuration architecturale, de moyen de communication, de système et de
périphériques.
L’objectif de cet article est de présenter la problématique de gestion de données
spatio-temporelles issues de réseaux de capteurs, et de fournir quelques éléments de
réponse aux verrous scientifiques identifiés. Après la présentation d’un panorama
non exhaustif des applications qui nous semblent pertinentes et exploitables comme
base de support à la problématique, une liste des verrous scientifiques est exposée.
Des éléments de réponse sont ensuite détaillés. Ces réflexions et travaux sont issus
de membres des équipes de recherche collaborant au sein de l’axe « Réactivité,
Mobilité et Temps Réel » et du groupe de travail « Services Localisés » du GDR
CNRS 2340 Sigma-Cassini CNRS.
2. Panorama d’applications
Les réseaux de capteurs liés à des bases de données sont de plus en plus
régulièrement utilisés dans des domaines tels que la surveillance de phénomènes
naturels. Ces capteurs hétérogènes, mesurent différents paramètres : température,
pression, clinométrie, etc. Alors que certains capteurs sont purement périodiques
(sismographes), d'autres ne transmettent des mises à jours que lorsqu'un certain seuil
de mesure est dépassé ou lorsqu'une variation de valeur est constatée. D'autres
politiques combinent ces différents modes de fonctionnement.
Historiquement les capteurs sont représentés par leur identifiant. Les données
collectées par un capteur sont ainsi aujourd'hui référencées selon ce capteur et
estampillées dans le temps. Grâce aux évolutions continues de technologies
permettant une mise à jour des informations de positionnement (notamment les
moyens de communication), il devient utile de référencer les capteurs en fonction
d'informations spatiales, déterminées via GPS ou triangulations diverses, afin de
permettre aux utilisateurs des requêtes spatiales.
Une fois que les capteurs ont effectué leurs mesures, le problème du stockage de
données se pose. Bien que certaines recherches préconisent l'utilisation de
techniques de stockage au niveau des capteurs eux-mêmes, ou au niveau de capteurs
intermédiaires, force est de constater que pour l'heure l'immense majorité des
réseaux de capteurs utilisés envoient les données vers une base de données
centralisée. Par la suite, une réplication de données peut être effectuée vers d'autres
bases ou des entrepôts de données en dehors du réseau et sur disque, comme illustré
par la Figure 1.
De fait, les processus d’analyse des données collectées utilisent en priorité les
données les plus récentes. Ainsi l’analyse s’effectue prioritairement en mémoire
vive, alors que les mesures viennent d’arriver au niveau du système central. En effet,
Gestion de masses de données temps réel au sein de bases de données capteurs 4
le recours aux données sur disques, conservées dans l’entrepôt de données est réalisé
lors d’analyses sur plus long terme ou nécessitant des comparaisons avec des
mesures antérieures.
Les prises de mesures imposent à la base centrale des contraintes temps-réel. En
effet, une mesure provenant d'un capteur donné doit être intégrée à la base avant
qu'une mesure plus récente n'apparaisse dans celle-ci. De plus, il est parfois
nécessaire de consulter les données dans des délais impartis. Bien qu'il soit
souhaitable de conserver un long historique des mesures passées (afin de pouvoir
comparer, retrouver des schémas similaires ou autre), les spécialistes sont le plus
souvent intéressés par les données les plus récentes. Ainsi, au sein de la masse de
données recueillies (certains capteurs peuvent avoir des fréquences s'exprimant en
centaines de Hertz, voire plus), il est généralement souhaitable de pouvoir accélérer
l'accès aux mesures reflétant l'état actuel du système.
travaux émergent ainsi en direction de STI dont l’objectif est la conception intégrée
multimodale (Chen et al., 2008). Par exemple le suivi des conteneurs nécessite des
capteurs mobiles, des moyens de communication et des systèmes d’information qui
doivent permettre la gestion et le suivi en mer, lors de ferroutage ou de convoyage
routier et éventuellement aérien.
Dans le domaine des transports et afin d’offrir un service aux usagers, il est
nécessaire de définir des politiques de gestion des moyens mobiles (voitures,
camions, train, avion, navires, ….). Cette gestion de flotte repose sur l’utilisation de
moyens de communication et de localisation. Dans cet article, nous nous intéressons
principalement aux problèmes de gestion de la position des objets mobiles ou agiles.
Toutefois, concernant la gestion de flotte, co-existent des problèmes de gestion de
l’entretien, de la facturation, du paiement du service, de l’optimisation des
moyens… Si la gestion la plus simple d’une flotte consiste à gérer les points
essentiels d’un trajet (départ, arrêt, arrivée), les moyens de localisation et de
communication sans fils autorisent aujourd’hui le suivi à tout instant de la position
des objets mobiles de la flotte. Les gestionnaires ont alors à leur disposition une
visualisation en temps réel de la situation leur permettant de réagir rapidement lors
de problèmes (saturation, accidents, ...). Une convergence existe entre la gestion de
flottes et le suivi du traffic. On notera par exemple l’utilisation du suivi d’une flotte
de taxis pour évaluer le trafic (région parisienne, Beijing, Singapour).
3. Problématiques scientifiques
Les données issues de capteurs présentent des spécificités en partie dues au type
de capteurs (fixe, agile ou mobile) et également au mode de mesure. Pour les objets
mobiles, il est possible, par exemple, d’utiliser DynamicFeatureType du langage
GML de l’ISO/TC211, pour caractériser un objet dont la position évolue au cours du
temps. Néanmoins, ce type de données ne prend pas en compte les spécificités
propres aux capteurs comme la nature du phénomène observé ou les référentiels
utilisés pour les mesures. Nous avons donc établi un modèle générique de données
ainsi qu’une formalisation des objets gérés (voir paragraphe 4.1 et 4.2).
Gestion de masses de données temps réel au sein de bases de données capteurs 6
Les métadonnées géographiques sont aujourd’hui définies selon des normes ISO
(ISO 19115, 2006 ; Servigne et al., 2006) et ont notamment pour vocation de
faciliter l’échange des données entre utilisateurs différents et de renseigner sur la
qualité des données. Toutefois, ces critères qualité sont définis pour des données
statiques exploitées par des applications traditionnelles. Ces critères ne prennent pas
en compte la qualification de données dynamiques notamment issues d'objets (munis
de capteurs) mobiles, agiles ou de mesures temps réel exploitées dans des
applications « en ligne ». Quelques questions se posent comme par exemple : quelles
sont les informations nécessaires à prendre en compte dans les métadonnées de
données spatio-temporelles temps-réel ? Comment différencier données et
métadonnées dans un contexte temps-réel ?
Gestion de masses de données temps réel au sein de bases de données capteurs 8
Après une description d’une modélisation UML des données manipulées dans un
réseau de capteurs, nous détaillons une formalisation des objets issus de capteurs.
Des méthodes d’indexation de données issues de capteurs fixes et agiles ont été
conçues et sont rapidement présentées avant de donner un exemple d’architecture
d’objets mobiles concernant une flotte de navires.
Au sein des réseaux de capteurs, les objets principaux concernent les capteurs et
les mesures ou informations captées. Nous proposons un formalisme pour les objets
correspondant à des ensembles de mesures issus des trois types de capteurs (fixe,
mobile, agile).
9
Pour les objets issus de capteurs fixes, la position du capteur est figée, seules les
valeurs des Aj varient dans le temps. Nous pouvons donc définir ces objets à l’aide
d’un identifiant, une position, une série temporelle où pour chaque instant Ti est
communiquée une valeur pour chaque Aj ainsi que des attributs de valeur fixe.
j j
OCF : id, idC, S, {Ti, { A i }}, {Bk} avec A i : mesure de type A j à l’instant i
Gestion de masses de données temps réel au sein de bases de données capteurs 10
Pour les objets issus de capteurs agiles, la position du capteur ne varie pas selon
la même granularité que les attributs Aj. Nous pouvons donc formaliser ces objets à
partir d’un identifiant et d’une première série temporelle des positions prises par ce
capteur. A l’intérieur de cette série temporelle, une deuxième série temporelle des
valeurs Aij pour chaque Aj, est définie. Elle contient la série de mesures réalisées à
cette position par le capteur. Des attributs de valeur fixe viennent compléter ce
formalisme.
j
OCA : id, idC, {St, {Ti, { A i }}, {Bk}
St+ ∆ t : localisation spatiale durant la période t + ∆ t
Ti : date et heure à l’instant i avec t ≤ i ≤ t + ∆t et Ti ≤ Ti+1
A ij : mesure A j de type j à l’instant i et Bk : attribut de valeur fixe
Pour les objets issus de capteurs mobiles, la position du capteur est susceptible
de varier à chaque envoi d’information. Nous pouvons donc formaliser ces objets
comme un identifiant, une série temporelle où, pour chaque instant Ti, est
communiquée une position Si et une valeur Aij pour chaque Aj. Des attributs de
valeur fixe viennent compléter ce formalisme.
j
OCM : idO, idC, {Si, Ti, { A i }}, {Bk}
Nœud Spatial
Nœud
Kd-tree Temporel
Donn
Arbre Spatial ées
B+ tree
modifié Arbre
Temporel
Internet
Décodage
AIS Serveur Web
Gestion de la
VHF Persistance
Interrogation
Intranet
Base de
Données
5. Conclusion et perspectives
Nous proposons trois types d’objets géolocalisés. Les OCF sont des Objets issus
de Capteurs Fixes. Les OCA sont des Objets issus de Capteurs Agiles. Les OCM
sont des Objets issu de Capteurs Mobiles. Précisons que la notion d'agilité des
capteurs est définie comme leur propension à changer de position entre deux prises
de mesures mais de façon discrète, contrairement aux capteurs mobiles dont le
changement de position s’effectue continuellement et où la localisation devient
l’information majeure à traiter. La gestion de ces données doit s’effectuer avec des
contraintes plus ou moins fortes qu’il s’agisse de gestion de risques ou de
visualisation du trafic. Nous présentons des problèmes et les solutions que nous
avons adoptées dans deux contextes applicatifs. Pour ces applications nous avons
utilisé des méthodes d’indexation en mémoire et des bases de données avec des
extensions spatiales. Les objets que nous proposons doivent nous permettre
d’évaluer, en fonction des types d’objets et des flux de données, les choix à effectuer
pour la gestion des objets. Nous devrons en particulier trouver un équilibre entre
stocker des masses importantes de données peu structurées avec des difficultés au
niveau de l’interrogation et une forte structuration de données (avec des index pour
l’interrogation) consommatrice en temps d’exécution pouvant donc entrainer des
pertes de données. Nos travaux seront également mis en regard des spécifications
proposées par l’Open Geospatial Consortium (Sensor Web, 2007) concernant les
« capteurs web ».
Bibliographie
Aubin, S., Plainchaut, P., Ieng, S.-S., Auberlet, J.-M., 2006, In Proceedings of the 6th
International Conference on ITS Telecommunications (ITS-T 2006), pages 870-873, W.
Guangun, S. Komaki, F. Pingzhi and G. Landrac (eds.), Chengdu, China, ISBN 0-7803-9586-
7
Bohannon P., McIlroy P., Rastogi R.. 2001. Main-Memory Index Structures with Fixed-Size
Partial Keys, In SIGMOD Conference.
Bertrand F., Bouju A., Claramunt C., Devogele T., Ray C., 2007, Web architectures for
monitoring and visualizing mobile objects in maritime contexts, In Proceedings of the 7th
International Symposium on Web and Wireless Geographical Information Systems (W2GIS
2007), pages 94-105, G. Taylor and M. Ware (eds.), Springer-Verlag, LN series in Computer
Science (LNCS 4857), Cardiff, UK.
Brilingaitė A., Jensen C.S., 2007, Enabling Routes of Road Network Constrained Movements
as Mobile Service Context, GeoInformatica, Springer, Volume 11, Number 1, Pages 55-102
Chen, S., Tan, J., Ray, C., Claramunt C., Sun, Q., 2008, An Integrated GIS-based Data Model
for Urban Multi-modal Public Transportation Analysis and Management, In Proceedings of
the 16th International Conference on Geoinformatics (GEOINFORMATICS' 2008), SPIE
Press, pages 255-262, Guangzhou, China
Follin J-M, Bouju A., Bertrand F. and Boursier P. 2004. Visualization of multi-resolution
spatial data in mobile system. Proceedings of 1st International Workshop on Ubiquitous GIS
(UbiGIS 2004)Gävle, Sweden, June 2004
17
Fournier, S., Devogele, T. and Claramunt C., 2003, A role-based multi-agent model for
concurrent navigation systems, Proceedings of the 6th AGILE Conference on Geographic
Information Science, Gould, M. et al. (eds.), Presses Polythechniques et Universitaires
Romandes, pp. 623-632
Gaede V., Günther O., 1998. Multidimensional access methods. ACM Computing Surveys,
vol. 30, no 2, ACM Press: 170-231.
Gutierrez Rodriguez,C., Servigne S., Laurini R., 2007 a, Towards Real Time Metadata for
Network-Based Geographic Databases. In Proceedings of ISSDQ2007, 5th International
Symposium of Spatial Data Quality, 13-15 June 2007, Enschelde, The Netherlands, 8 pages
2007
Gutierrez Rodriguez,C., Servigne S. 2007 b, Métadonnées Spatiotemporelles Temps-Réel.
Revue des sciences et technologies de l'information : Ingénierie des Systèmes d'Information
12(2):p. 97-119, Lavoisier, ISBN 978-2-7462-1913-, ISSN 1633-1311.
International Maritime Organization, 2002, Guidelines for the onboard operational use of
shipborne Automatic Identification Systems (AIS), resolution A.917(22), 14 pages
ISO/TC 211 (2004) Geography Markup Language (GML), Standart international N 005r3 du
WG 4/PT 19136
ISO19115, 2006. ISO19115 – An International Metadata Standard for Geographic
Information, http://grdc.bafg.de/servlet/is/2376 (Dernière consultation le 7 Novembre 2008).
Laucius S., Bertrand F., Stockus A. and Bouju A. 2005. Query management and spatial
indexing in mobile context. Proceedings of 8th AGILE Conference on Geographic
Information Science, pp 429-438 Lisboa, Portugal, May 2005
Noël G., Servigne S., Laurini R. 2005a. The Po-tree: a soft real-time spatiotemporal data
indexing structure. Developments in Spatial Data Handling. SDH04, 11th International
Symposium on Spatial Data Handling. Springer Verlag. ISBN: 978-3-540-22610-9. 2005.
pp259-270.
Noël G, Servigne S. 2005b. Indexation multidimensionnelle de bases de données capteur
temps-réel et spatiotemporelles. In: Revue Ingénierie des Systèmes d’information, 2005.
Vol.10, n°4. pp. 59-88
Noyon, V., Claramunt, C., and Devogele, T., 2007, A Relative Representation of Trajectories
in Geographical Spaces, Geoinformatica, Springer, vol. 4, n. 11, pp. 479-496
Sensor Web, OGC, 2007, http://www.opengeospatial.org/projects/groups/sensorweb,
(Dernière consultation le 7 Novembre 2008)
Petit M., Ray C. and Claramunt C., 2006, A contextual approach for the development of GIS:
Application to maritime navigation, in Proceedings of the 6th International Symposium of
Web and Wireless Geographical Information Systems (W2GIS), J. Carswell and T. Tezuka
(eds.), Springer-Verlag LNCS 4295, Hong Kong, December 4-5, pp 158-169.
Ray, C., Comblet, F., Bonnin, J.-M., Le Roux, Y.-M., 2009, Wireless and Information
Technologies Supporting Intelligent Location-based Services, Wireless Technologies for
Intelligent Transportation Systems, Chapitre 10, M.-T. Zhou, Y. Zhang, L.T. Yang (eds.),
Nova Science Publishers, a paraitre
Redoutey, M., Scotti, E., Jensen, C.S., Ray, C., Claramunt, C., 2008, Efficient Vessel
Tracking with Accuracy Guarantees, In Proceedings of the 8th International Symposium on
Gestion de masses de données temps réel au sein de bases de données capteurs 18
Web and Wireless Geographical Information Systems (W2GIS 2008), pages 145-157, M.
Bertolotto, C. Ray, X. Li (eds.), Springer-Verlag, LN series in Computer Science (LNCS
5373), Shanghai, China
Servigne S., Lesage N., Libourel T., 2006, Spatial data quality components, standards and
metadata. Spatial data quality: an introduction. International scientific and technical
encyclopedia, ISBN 1905209568, March. 2006. pp179-208
Servigne S., Noel G. 2008, Real time and spatiotemporal data indexing for sensor based
databases. Geo-Information Technology for Emergency response. Taylor&Francis: London,
UK. Pp. 123-142. Book with Scientific Committee. ISBN 13:978-0-415-42247-5
Song Z., Roussopoulos N., 2003, SEB-tree: An Approach to Index Continuously Moving
Objects , Mobile Data Management, 2003, pp. 340-344
Viana, W., Bringel, J., Gensel, J., Villanova-Oliver, M., Martin, H., 2007, PhotoMap:
Automatic Spatiotemporal Annotation for Mobile Photos, In Proceedings of the 7th
International Symposium on Web and Wireless Geographical Information Systems (W2GIS
2007), pages 187-201, G. Taylor and M. Ware (eds.), Springer-Verlag, LN series in Computer
Science (LNCS 4857), Cardiff, UK
Xei, L., Zhy, G., Tang, M., Xu, H., Zhang, Z., 2006, Vehicles Tracking Based on Corner
Feature in Video-based ITS, In Proceedings of the 6th International Conference on ITS
Telecommunications (ITS-T 2006), pages 163-166, W. Guangun, S. Komaki, F. Pingzhi and
G. Landrac (eds.), Chengdu, China, ISBN 0-7803-9586-7