Guide Du Big Data 2013 2014
Guide Du Big Data 2013 2014
Guide Du Big Data 2013 2014
Avec une croissance annuelle du volume des donnes de 56%, Passez au Big Data avec IBM :
https://ibm.biz/BdxkwP
C opyright 2013. IBM, the IBM logo , and ibm.com are tradema rks o f IBM C orp., registered in ma ny jurisdictions w orldwide. Other product a nd ser vice names might be tradema rks o f IBM or o ther
companies. A cur rent list of IBM tr adema rks is a vailable on the web a t C opyright and tradema rk information a t www.ibm.com/legal/copytrade.shtml
Apparu il y a seulement trois ans dans la sphre dcisionnelle, le Big Data sest dj impos
comme linnovation business numro 1 de ce dbut de dcennie, la frontire entre technologie
dito
et management. Dans tous les secteurs o la gestion des donnes reprsente un actif indispensable de lentreprise, lengouement a t immdiat avec la cl la formation dun vritable
cosystme du Big Data : des fournisseurs IT, qui ont dvelopp une offre varie autour des
technologies Hadoop, aux utilisateurs finaux (grandes entreprises, start-ups), qui cherchent
construire un avantage concurrentiel sur lexploitation de leurs donnes, en passant par des
entreprises spcialises data (diteurs business intelligence, consultants Big Data),
le paysage franais sest toff et structur en lespace de deux ans.
La ministre charge de lEconomie Numrique, Fleur Pellerin, a dailleurs annonc, au cours du
premier semestre 2013, un plan de soutien la filire du Big Data : 11,5 millions deuros issus
des Investissements dAvenir seront ainsi allous des projets Big Data et un programme de
formation et de financement sera mis en place.
Pourquoi un tel engouement ? Parce que les promesses de croissance autour de lexploitation
des grands volumes de donnes sont immenses : rduction des cots, augmentation des ventes,
relance de linnovation, aide la dcision
les espoirs lis la data-driven company
tion, industrie ).
business numro 1 de
ce dbut de dcennie, la
frontire entre technologie
et management
les secteurs (tlcom, finance, grande distribuMais ce nouveau modle impose de rflchir
aux conditions de mise en uvre : le choix de la
technologie dabord, lorganisation et les comptences ensuite.
Ce Guide a pour vocation daider les professionnels dsireux dexploiter leurs donnes
apprhender lenvironnement du Big Data et
comprendre les fondamentaux dune dmarche
Big Data en entreprise. Quelles technologies
choisir ? Qui sont les acteurs du march ? Quels mtiers mettre en avant ? Et quel est le cadre
juridique ?
Nous avons recherch pour vous les informations les plus rcentes sur le phnomne Big Data,
en faisant un tat des lieux de loffre et de la demande sur lanne 2013 et en photographiant le
panorama actuel des fournisseurs, dans la deuxime partie du Guide. De nombreux experts ont
galement accept de rpondre nos questions pour tmoigner de leurs expriences et apporter leurs conseils.
Vous trouverez donc dans ce guide les rponses aux questions les plus usuelles poses par les
curieux du Big Data. Il vous permettra de mesurer limpact et lefficacit de cette dmarche pour
votre entreprise et denvisager, peut-tre, terme, un basculement vers ces technologies et la
matrise instantane de linformation.
Blandine LAFFARGUE
Directrice de publication
+33 (0)1 45 63 43 58 / [email protected]
sommaire
ParStream . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
PENTAHO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
QlikTech . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
QUARTET FS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
SAS INSTITUTE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
SEMSOFT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
SENTELIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
SINEQUA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
Sogeti High Tech . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Splunk Inc. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
SRD CONSEIL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
SYNCSORT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
TABLEAU SOFTWARE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Worldline . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
YSANCE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
Laspect organisationnel
et stratgique
Aujourdhui, cette dfinition sest amplifie
: on parle davantage de dmarche Big
Data pour signifier limportance prise
par les donnes dans lunivers de lentreprise. Celles-ci deviennent un mode de
dcision, un actif stratgique pour se diffrencier de la concurrence : cest grce
ces donnes rapidement transformes
Les 5V du
Big Data
Volume
Vitesse
Varit
Valeur
Vracit
On le voit, les dfinitions du concept sont
en pleine volution, en lien certainement avec le degr de mise en pratique
du Big Data dans les entreprises. Si les
premires exprimentations sont encore
timides en France en 2013, lintrt des
managers est bien rel et le Big Data
pourrait ds lors trs rapidement aborder son tournant conomique.
les donnes
Le data deluge
Do proviennent ces donnes et comment
expliquer cette explosion soudaine ? Il y a
bien sr la mise disposition gnralise doutils numriques de plus en plus
performants et connects, tels que les
ordinateurs et les smartphones relis
Internet en permanence. Laccs
linformation instantane sest dmocratis par les rseaux sociaux et, dans
un nombre important de pays, les administrations publiques lvent le voile sur
leurs donnes travers le mouvement
dOpen Data.
Mais au-del, on envisage de plus en
plus la multiplication de donnes issues
dobjets interconnects, de type capteurs ou puces mobiles : ce qui avait
t approch avec le RFID (par exemple
au sein des cartes de transport ou par
code-barre dans les chanes logistiques)
pourrait tre gnralis dans les annes
venir travers lInternet des Objets.
Concrtement, il est aujourdhui technologiquement possible de connecter
entre eux les objets de son quotidien,
par exemple son rveil avec son calendrier Outlook, ou bien son vhicule avec
les applications de stationnement, ou
encore son rfrigrateur avec son panier de courses en e-commerce. Des
perspectives technologiques qui restent
encore exprimentales mais pourraient
vite exploser : Ericsson a ainsi estim
le nombre dobjets connects dans le
monde 50 milliards en 2020 (12 milliards aujourdhui).
octets
40
zettaoctets
de donnes
en 2020
50
milliards
dobjets connects
la mme date
Y2K
Une rvolution
technologique
Lexplosion des donnes numriques, en tant que telle, naurait
eu aucune valeur sans accompagnement technique : toute linnovation lie au Big Data a dabord
t une innovation technologique,
porte par la mutation des outils
de stockage et de traitement.
Laugmentation des capacits de
stockage
Le stockage, dabord : avec la croissance
exponentielle des donnes, il est vite
devenu indispensable de faire voluer
les baies de stockage traditionnelles
pour les mettre en capacit dabsorber
au fur et mesure la multiplication de
ces donnes. Une problmatique dautant plus raliste que les cots de stockage taient en chute libre depuis le dbut des annes 2000, moins de 1 dollar
le gigaoctet
Technologiquement, ce besoin sest traduit par lapparition de la scalabilit ,
cest--dire lajustement progressif et
continu de loutil de stockage la masse
des donnes collectes. Une innovation
majeure permettant aux DSI de stocker
toutes sortes dinformations trs rapidement, sans arbitrage sur leur utilisation
future, et surtout sans la ncessit daccrotre (et donc changer) linfrastructure
existante. Aujourdhui, de nombreux
fournisseurs dveloppent ce type de
technologies au sein dappliances (cest-dire doutils combins de stockage et
de traitement).
Linfluence du Cloud
Mais cest particulirement avec lapparition du Cloud que le Big Data a connu
un dveloppement acclr : en mutualisant les donnes dans le nuage et en
dmocratisant ainsi laccs des entreprises au stockage et au traitement de
tous types de donnes, le Cloud a cr
les conditions pour une gnralisation
du Big Data. Petites et grandes entreprises ont pu souscrire des offres as
a service pour explorer leurs donnes
internes mais galement dautres donnes accessibles depuis le Cloud. Il est
dailleurs trs frquent de voir des offres
Big Data appuyes sur linformatique en
nuage.
Lapparition de technologies de
traitement adaptes
Enfin, le dernier facteur technologique
qui a permis au Big Data de dcoller,
probablement le plus clbre, concerne
Les usages
du Big Data
La question agite en effet de nombreux experts : le Big Data est-il
si rvolutionnaire que le laissent
entendre les journalistes et les acteurs du secteur ? Lutilisation de
donnes des fins de traitement
et danalyse est en effet inhrente
tout pilotage dentreprise, et des
outils anciens existent pour cela
(depuis lantique livre de comptes
jusquaux tableaux de Business
Intelligence, en passant par les
traditionnelles bases Excel et Access).
Beaucoup estiment donc que le Big Data
nest quun passage lchelle des traitements traditionnels : ce que lon traitait auparavant en petite quantit, on
le traitera en grande quantit avec une
fiabilit renforce. Les approches statistiques et la nature des rsultats trouvs
ne seraient en rien modifis
Cest ici que les dsaccords naissent car
le Big Data, en traitant une multiplicit
de donnes issues de sources varies et
selon un quasi-temps rel, a ouvert la
voie dautres utilisations de la donne
et de nouvelles mthodes danalyse :
Interview
Mathias Herberts
( droite) reoit le prix de
linnovation Big Data
Mathias Herberts
2) Pour vous, le Big Data correspond-il une rupture technologique majeure ? Quels sont les
lments de nouveaut ? Sont-ils
uniquement technologiques ?
Pour moi, llment de nouveaut dans
le Big Data, ce nest pas tant la technologie que le pilotage : dsormais, on a rduit les boucles de dcision, tout est plus
court dans linformation et la raction.
Cest l quil y a un tournant.
La dmarche Big
Data est forcment
transverse donc elle
implique de casser
les cloisons entre
services
Un march mondial
Bilan et perspectives
Les
chiffres
duBig
Data
> Un march de
24 milliards de $
en 2016
> Taux de croissance
annuel : 31,7%
> Pourcentage
dentreprises lanant
des projets Big Data
ou envisageant de
le faire
France : 10%
Allemagne : 18%
UK : 33%
partie des 5
secteurs cl de
la croissance
amricaine
> En France, le
(prvisions de lAFDEL)
Quelles sont les perspectives conomiques du Big Data pour les fournisseurs
et les utilisateurs ? Qui sont les acteurs qui dynamisent le march ?
Et dans quels secteurs les trouve-t-on ? Voici un petit panorama du march
du Big Data autour du monde pour lanne 2013.
Les acteurs
du Big Data
Les utilisateurs
La mise en place du Big Data est vcue
diffremment selon les secteurs : on a
coutume de dire que les principaux secteurs dapplication du Big Data sont les
telecoms, la grande distribution (online
et offline) et la finance. Ce sont en effet
les premires activits qui se sont penches sur la problmatique du Big Data
car la captation de grands volumes de
donnes pouvait rapidement leur donner
un avantage comparatif.
Pour les oprateurs tlcoms, ctait
mme une opportunit de cration de
PRODUCTIVITY
SALES
INCREASE % INCREASE $
Les fournisseurs
De nombreux acteurs se sont positionns rapidement sur la filire du Big Data,
dans plusieurs secteurs :
> Dans le secteur IT, on trouve ainsi :
Les fournisseurs historiques de
solutions IT (ex : IBM, SAP, Oracle, HP)
Les acteurs du Web (ex : Facebook,
Google)
Les spcialistes de solutions data
et Big Data (ex : Teradata, MapR,
Hortonworks, EMC)
Les intgrateurs (ex : Atos, Sopra
Group, Accenture, Cap Gemini)
RETAIL
CONSULTING
AIR TRANSPORTATION
9.68
49
5.08
39
4.38
21
CONSTRUCTION
20
FOOD PRODUCTS
20
3.48
STEEL
20
3.48
AUTOMOBILE
19
4.28
2.8
INDUSTRIAL INSTRUMENTS
18 1.28
PUBLISHING
18 0.88
TELECOMMUNICATIONS
11
17 0.48
Interview
Matteo Pacca
Partner, McKinsey&Company
Le march du big
data devrait crotre
de prs de 15 % par an,
pour rpondre aux
besoins engendrs par
une croissance estime
des donnes pouvant
aller jusqu 40 % par an
*McKinsey Global Institute, Big Data : The next frontier for innovation, competition, and productivity, mai 2011
12
promesses du
Big Data par secteur
Les
> Sant :
surplus de
230 milliards / an
> Industrie :
rduction de 50%
des cots
Europe : cration
de valeur de
250 milliards d
amlioration de la
rentabilit de 60%
> Valeur de la
golocalisation : gain
de 700 milliards d
pour les consom-
mateurs
HADOOP : emblme par excellence du Big Data, Hadoop est une architecture spcifique de bases de donnes, permettant de
traiter en grand nombre tous types de donnes (y compris les donnes non structures). On dit quelle est organise sur un mode
non-relationnel, cest--dire que les donnes ne sont pas tries en fonction de leurs relations entre elles.
Elle constitue en quelque sorte la librairie partir de laquelle on pourra effectuer des calculs parallles (via MapReduce), sachant
que ces donnes sont distribues (cest--dire quHadoop les rcupre depuis diverses sources).
Cr par la fondation Apache (voir interview dI. Frost-Dromm), Hadoop est un framework Open Source, cest--dire que son code
et ses spcifications sont disponibles en libre accs pour ceux qui cherchent limplmenter dans leur systme.
MAPREDUCE : coupl Hadoop (qui est en fait son implmentation principale), MapReduce est le mode de calcul permettant
de traiter les big data. Il prsente une fonction Map (distribution des donnes sur plusieurs clusters parallles o les calculs
intermdiaires seront effectus) et une fonction Reduce (les rsultats des calculs intermdiaires distribus sont recentraliss en
vue du calcul final). MapReduce est issu de la recherche Google et a t dvelopp au mme moment quHadoop ce qui explique
lassociation traditionnelle que lon fait des deux outils.
NOSQL : on parle de NoSQL lorsque des requtes sont effectues dans un langage de programmation qui nest pas limit au
SQL. Ce dernier est en effet le langage le plus utilis pour des traitements de donnes mais ses normes de dfinition, parfois trop
strictes, ne sont pas adaptes aux donnes massives et non-structures. Du coup, certaines requtes sont effectues indpendamment de ces normes et donc de ce langage propre, ce qui fait dire certains que lon bascule sur du NoSQL (littralement :
au-del du SQL ). Pour autant il est quasiment impossible de dfinir le NoSQL selon un corpus de rgles puisquil reprsente
prcisment laffranchissement par rapport un ordre tabli.
IN-MEMORY : on parle de traitement in-memory pour voquer les traitements qui sont effectus dans la mmoire vive de
lquipement informatique, plutt que sur des serveurs externes. Lavantage du traitement in-memory est celui de la vitesse
puisque les donnes sont immdiatement accessibles. En revanche, ces donnes ne sont pas stockes sur le long terme, ce qui
peut poser des problmes dhistorisation.
STOCKAGE
Nud 1
Nud 2
Nud 3
FILE SYSTEM
HDFS
TRAITEMENT
Map 1, 2, 3
Map 4, 5, 6
Map 7, 8, 9
Reduce 1
Reduce 2
Reduce 3
Rsultat Final
REQUETAGE
Pig
Hive
La question de la scurit
Evoque concernant le Cloud, la question de la scurit est devenue un leitmotiv avec lexplosion du Big Data : en
effet, la multiplication des donnes disponibles et leur valeur thorique sur le
march rendent encore plus prsente la
menace de cyberattaques.
Interview
Isabel Drost-Fromm
Co-Fondatrice / Contributrice, Apache Mahout. Membre
Customisation
marketing :
Monoprix et
dunnhumby
Interview
Au total, ce sont 33 millions de transactions de clients Monoprix qui ont t analyses, ce qui reprsente 350 millions
darticles achets. Ces donnes sont
donc essentiellement des donnes transactionnelles mais dunnhumby intgre
galement les donnes prfrence de
mdia , savoir le taux de retour des
coupons papier pour tablir une prfrence mdia.
Lallocation coupons/clients dure moins
dune heure.
Hannah Whittall
18
Exemples
dapplications
en entreprises
01
Monoprix
19
Optimisation
du traitement
industriel : La Poste
Le projet Orest TAE, en production depuis dcembre 2011,
collecte et restitue toutes les informations disponibles sur
un pli lors de la rception, du tri et de la distribution de
celui-ci. Il sagit dune plateforme dindexation des courriers qui traite 110 millions de documents par jour, selon
un rythme pouvant aller jusqu 4000 documents par seconde en heure de pointe ! Au total, plus de 2 milliards de
documents sont indexs sur cette plateforme.
On notera que les systmes de capteurs industriels (ex :
lecture optique des plis, flasheurs manuels, machines de
tri ou encore EDI client) sont interconnects la plateforme ce qui lui permet de croiser de multiples sources de
donnes, dont des quipements industriels lourds, ce qui
constitue une exprience originale.
Lobjectif de ce projet trs ambitieux est double :
Il sagit dobtenir une vision gnrale des flux de courriers et de pouvoir remonter ainsi des indicateurs de performance utiles au pilotage de lactivit en temps rel,
mais il permet galement aux agents oprationnels
dobtenir directement linformation sur un pli. En cas de
demande lie des anomalies, la dtection est ainsi facilite et la raction beaucoup plus rapide : la plateforme
propose en effet des outils de visualisation des anomalies
au niveau le plus fin que constitue le traitement dune enveloppe.
Les travaux ont t mens conjointement avec Dassault
Systems, Exalead et Sopra Group, et la plateforme est
aujourdhui accessible 800 utilisateurs rpartis sur les
sites de production : on considre que leur nombre moyen
de requtes journalires est de 15000, avec un temps de
rponse infrieur 3 secondes !
Avec lvolution rgulire des fonctionnalits, sur la base
des demandes concrtes des utilisateurs qui se familiarisent avec les analyses permises par ce type de technologie, le nombre dutilisateurs continue augmenter rgulirement.
Suite cette implmentation, La Poste espre ainsi remplacer ses approches statistiques historiques par une vision davantage unitaire des vnements. Avec, la cl,
une amlioration de la performance des sites et du service
client
Interview
Denis Weiss
20
Exemples
dapplications
en entreprises
02
La Poste
21
Recherche :
Projet DEUS
Men par lObservatoire de Paris, avec laide
de GENCI (Grand Equipement National de
Calcul Intensif), le projet Deus lanc en 2011
visait modliser pour la premire fois la
formation des structures cosmiques dans
tout lUnivers observable, depuis le Big
Bang jusqu nos jours.
Pour cela, trois hypothses avaient t
retenues, correspondant trois modles
dnergie noire (composante nergtique
de lunivers qui constitue un moteur de son
expansion) : il fallait comprendre ainsi quel
tait limpact de cette nergie sur lunivers et
donc en dduire sa nature.
Pour cela, un grand nombre de donnes
reprsentant 550 milliards de particules de
lunivers (issues du tlescope spatial WMAP)
ont t injectes dans le supercalculateur
CURIE de GENCI, install au TGCC du CEA,
qui prsente une capacit de traitement de
2 ptaflops par seconde (2 millions de milliards doprations par seconde). Il sagissait
doprer les traitements pour chacune des
trois simulations en utilisant toutes les capacits de calculs de la machine (76000 curs
de calcul sur 80000, 360 To de mmoire). Au
total, ce sont 150 ptaoctets de donnes
brutes qui ont t gnres, ce qui posait
une problmatique de stockage : la solution a donc consist dvelopper un outil de
post-traitement qui, en parallle du calcul,
a permis de rduire la vole ce volume de
donnes gnres, sans pnaliser les temps
de simulation.
Au final, ces traitements ont permis de
rduire ltude 1,5 ptaoctets de donnes
raffines, grce un dbit de stockage des
donnes trs important (50 Go/s) !
Le rsultat, disponible pour la communaut
scientifique internationale, est une modlisation de la distribution de matire dans tout
lUnivers observable, semblable celle qui
pourrait tre observe par les tlescopes :
cest donc un support exceptionnel dtude
pour les agences spatiales ESA et NASA, et
ces modlisations permettront dapporter
des interprtations substantielles aux observations du satellite europen Planck.
Outre la performance en cosmologie, cette
exprience, unique lchelle mondiale,
est galement une prouesse dans lunivers
du calcul haute performance : elle ouvre
le champ dautres applications du calcul
intensif (HPC), comme par exemple pour le
projet ITER ou les simulations climatiques,
selon le mme principe doptimisation des
entres et sorties et de post-traitement la
vole des rsultats.
Interview
Stphane Requena
3) Pour vous, quel est le lien entre HPC et Big Data? Parle-t-on de
la mme chose ? En quoi diffrent-ils ?
Quand on parle de Big Data, on parle du traitement de grands volumes de donnes, cest--dire une fouille dans des donnes et une interprtation des rsultats qui peut, dans le cas de donnes complexes, recourir du calcul. Le HPC
quant lui correspond du calcul scientifique, que lon applique plusieurs
Exemples
dapplications
en entreprises
03
LObservatoire
domaines scientifiques ; cest donc davantage lutilisation de modles mathmatiques sur des superordinateurs.
Forcment, ces deux domaines sont
amens converger : si lon prend
lexemple des donnes livres par les
nouveaux tlescopes, nous avons besoin
la fois de calcul haute performance
pour acclrer le traitement, et dinterprtation des donnes pour tirer de vritables informations. Le rythme de traitement est important lorsque lon gre des
gros volumes : si lon optimise un calcul
mais que le traitement des donnes est
lent, lanalyse au global ne sert rien.
de Paris
4) La France a t la manuvre
sur ce projet pouvez-vous nous
expliquer les origines ?
La France dispose du supercalculateur CURIE qui tait lpoque une des
trois machines capables dans le Monde
de raliser cette simulation DEUS (les
autres se trouvant en Chine et aux USA).
CURIE prsente de grosses capacits
la fois pour le calcul et le stockage, en
mmoire et sur les disques ; en 2012,
elle est mise disposition par GENCI
destination de la communaut scientifique europenne via linfrastructure de
recherche PRACE. Le projet DEUS manait de lObservatoire de Paris qui cherchait une machine pour pouvoir effectuer ses simulations donc nous avons pu
la leur mettre disposition.
Depuis dautres machines ont t rendues
galement accessibles dans PRACE :
en Allemagne, des chercheurs anglais
sont actuellement en train de finaliser
des simulations massives en climatologie, notamment sur la modlisation des
cyclones dans le golfe du Mexique. Si
elles aboutissent, leurs recherches auront permis grce PRACE davoir 3 ans
davance sur les travaux en cours dans
le domaine !
Exemple de
modlisation de
lunivers
Localisation :
Gomarketing
selon SFR
Mens depuis deux ans par une quipe ddie au sein de lentreprise, les travaux de
gomarketing de SFR ont vis collecter
et analyser les donnes de golocalisation
des utilisateurs rseaux, afin den tirer des
informations sur la frquentation et les flux
de populations sur certaines zones gographiques. Ainsi SFR a pu tablir que le Festival de Cannes avait runi 389 500 visiteurs
dont 16 % dtrangers !
Comment fonctionne cette infrastructure ?
En ralit, SFR a mis en place un serveur de
collecte dvelopp par Intersec qui rcupre,
via les antennes relais, toutes les donnes
relatives des vnements de consommation (ex : allumer son tlphone, appeler,
etc.), ce qui correspond un total dun milliard dvnements de mobilit par jour !
Puis ces donnes anonymises sont croises avec des donnes externes (de type
Open Data) au sein dun outil logiciel dvelopp en interne sur deux bases, une NoSQL
et une autre Hadoop. Les donnes dvnements sont galement corriges statistiquement pour correspondre aux parts de march locales de SFR.
Lintrt dune telle dmarche est de fournir une information indite aux collectivits
locales et au secteur du tourisme : les analyses menes vitent en effet laspect dclaratif des questionnaires et les donnes sont
disponibles en quasi temps rel.
Pour loprateur, cest une opportunit
unique de valoriser ses donnes en vendant
des tudes aux entits intresses. Mais
au-del, ces donnes ont galement une
utilisation interne puisquelles permettent
loprateur de suivre la consommation de
ses abonns et dintervenir plus rapidement
sur la fidlisation, la gestion des fraudes et
le service client.
Interview
Mathieu Gras
24
Exemples
dapplications
en entreprises
04
SFR
SFR
25
Agrgation
de Donnes :
Projet Ellicible
de Coface
Services
Coface Services (Ellisphere au 1er janvier
2014) est lentit de rfrence concernant
linformation dentreprises en France :
elle propose en effet une base de donnes unique sur les entreprises franaises, qui repose sur de nombreuses
sources publiques et prives.
Afin de dvelopper son offre de marketing direct et afin de la mettre en adquation avec les besoins de real-time
marketing , Coface Services a choisi
dvoluer vers une plateforme plus ractive qui permet au client de bnficier
dun service haut de gamme combinant
de multiples critres pour un rsultat
immdiat : ce service est adapt aux
besoins du client dans la mesure o
lorganisation de linformation (ciblage,
segmentation, surveillance de groupes
etc.) lui revient de faon autonome,
contrairement aux segmentations fonctionnelles observes dans les bases de
donnes traditionnelles. En effet, un effort important en matire de finesse, de
granularit et de rsolution a t ralis
au niveau de la segmentation.
La plateforme Ellicible a ainsi vu le jour
le 20 mars 2013 : elle est appuye sur
des technologies New SQL (et non Hadoop/NoSQL) intgrant le traitement
massivement parallle et dveloppes
par la socit Parstream. Ainsi des milliers de requtes trs fortes volumtries (plusieurs milliards de donnes)
peuvent tre excutes en mme temps,
avec un trs faible temps de traitement
(quelques millisecondes). La grande
avance de cette plateforme tient dans
le raccourcissement des temps daffichage des rsultats : ils sont cette fois-ci
disponibles en temps rel.
Enfin cette plateforme est volutive car
elle intgre de nouvelles sources partenaires de grand volume, en France et
linternational.
Pour les clients, Ellicible cre ainsi de
nouveaux usages dans leur recherche de
prospects et dinformations sur les entreprises : ciblage facilit, segmentation et
organisation de linformation personnalises, obtention immdiate des rsultats.
Interview
Jean-Daniel Ruegger
2) Vous avez opt pour une technologie SQL et non pour des plateformes de type Hadoop. Pour quelle raison ? Pensez-vous voluer
vers ce type de technologie lavenir ?
Coface Services a une longue histoire et toute une srie de premires dans
le traitement de linformation. Sans remonter jusquaux racines de lentreprise
avec la cration de Bottin en 1796, lactivit Solutions Data a innov avec la
tlmatique ds le dbut des annes 80, et les traitements massivement parallles au dbut des annes 90. Nous savions que nous voulions une technologie
non-intrusive tant matriellement que du point de vue des comptences ncessaires, donc nous cherchions une solution New SQL traitement parallle.
Par ailleurs Hadoop orient batch ntait pas envisageable.
3) Quels sont les retours que vous avez eus sur cette plateforme ?
Les clients se sont-ils appropri ces nouveaux usages ?
Les retours que nous avons eus sont nombreux, en interne aussi car nous
utilisons la technologie pour des oprations de segmentations cl-en-main,
vraiment as a service . Nous mesurons le degr dappropriation par deux
signes forts : dune part, nous observons que lusage de lapplication parcourt
lensemble de ses fonctionnalits, avec des retours trs positifs ; et dautre
part, nos clients (qui vont de la PME lenseigne nationale ou internationale)
nous demandent et suggrent des extensions trs innovantes, ce qui montre
leur intrt !
26
Exemples
dapplications
en entreprises
05
Coface
Services
27
Les mtiers
du Big Data
Que change le Big Data aux comptences en place ? Comment sy
adapter ? Et quels sont les modes
dorganisation privilgier pour capter toute la valeur des donnes ? Voici
un petit tour dhorizon de lentreprise en format Big Data.
Informatique
Statistique
Business
lies au Big Data. On
pourrait
galement
rajouter celles lies la
communication car la prise
de dcision appuye sur les
donnes repose bien souvent sur la capacit de reprsentation et de hirarchisation de linformation,
telle quon peut lobserver
dans la datavisualisation.
Ds lors, ces comptences
runies sont-elles disposition pour lentreprise ?
Panorama des
enseignements
dispenss au sein
du Master Gestion
et Analyse des
Donnes Massives
de Telecom Paristech
Selon Gartner,
seules 31% des
entreprises estiment
pouvoir lancer des
projets Big Data en
faisant appel leur
personnel existant
La ncessaire communication
entre les mtiers
Plusieurs dpartements sont ainsi
concerns : les mtiers IT, les mtiers
de la statistique et de la BI, et bien sr
les mtiers oprationnels, ceux qui disposent des donnes et qui cherchent
les mettre profit.
Pour toutes ces entits, le Big Data bouleverse lordre tabli dans la mesure o il
invite davantage de synergies entre les
mtiers afin de faciliter le traitement et
la communication des donnes : les services supports doivent en effet travailler
main dans la main avec les dpartements
business pour viter un aller-retour chronophage de linformation ainsi que des
lourdeurs technologiques. Les quipes
business sont donc de plus en plus impliques dans le traitement et lanalyse de
leurs propres donnes (do limportance
de leur monte en comptences) ce qui
modifie galement le rapport la dcision : en effet, par leur rapport direct et
immdiat aux donnes, les agents oprationnels disposent dun avantage comparatif indispensable qui leur confre une
position particulire dans la data-centric organization . Contrairement une
approche top-to-bottom, lentreprise en
mode Big Data fait ainsi de la remonte des
informations une cl de sa croissance.
Quant aux dpartements IT, leur rle sera
particulirement mis en avant lors de
limplmentation des outils et lors des premires exprimentations avec les quipes
mtiers ; au fur et mesure de la courbe
dapprentissage, ils pourront peu peu se
recentrer sur une mission de support et de
dveloppement, laissant aux quipes danalystes le soin de rcuprer les donnes.
Enfin les profils BI et statistiques pourront
tre soumis plusieurs types dorganisa-
La question de lorganisation-type na
pas encore t tranche
question de la rapidit du cycle de dcision, les allers-retours avec les quipes
oprationnelles tant moins intgrs.
On le voit, la question de lorganisationtype na pas encore t tranche, essentiellement parce que les entreprises
nont pas toutes les mmes besoins et
nutilisent pas les donnes de la mme
faon Cest la raison pour laquelle une
rflexion stratgique doit prcder tout
achat doutils Big Data ou toute mise en
place htive car les entreprises doivent
avant tout faire linventaire de leurs besoins et de leurs ressources. Cest dailleurs une des principales prconisations
des cabinets de conseil qui agissent en
ce sens auprs des entreprises pour
dessiner des organisations censes ragir efficacement et de faon oprationnelle la problmatique du Big Data.
Mark Headd,
CDO de
la ville de
Philadelphie
Interview
Jacques Froissant
Prsident, Altade
LOpen Data
LOpen Data est un mouvement amorc au
milieu des annes 2000 visant transmettre au grand public les donnes
numriques dtenues par les administrations publiques, dans un but de
transparence et defficacit de laction
publique.
En effet, de nombreuses informations
dmographiques, conomiques, sociales
pouvaient revtir un caractre stratgique pour les organisations prives et
le grand public (ex : rgularit des transports publics, temps dattente dans les
services publics, niveau de rmunration dans une zone gographique donne, affluence des zones touristiques,
etc.) et les rendre accessibles, libres
de droits, constituait donc une avance
conomique autant que citoyenne (linstitution publique se trouvant ainsi engage
vis--vis de ses administrs corriger les
imperfections souleves par ces donnes).
Dvelopp dans les administrations
europennes et nord-amricaines, ce
mouvement a dsormais gagn les organisations prives qui peuvent choisir
de mettre disposition du public et de
partenaires les donnes quelles tirent
de leur activit et qui concernent la collectivit.
A lheure du Big Data o les donnes
prennent une importance centrale dans
le dcisionnel de lentreprise, ces informations vhicules par lOpen Data
et croises avec les donnes internes,
constituent donc un nouvel outil prcieux
pour nourrir la vision stratgique de
Les
chiffres
du
financement
public pour
Big
Data
le
> USA
200 millions de $
> Union Europenne
81 millions d
> France
11,5 millions d
27
milliards
d
ress les pouvoirs publics qui ont propos des mesures de financement et
daccompagnement pour soutenir le
dcollage du march. Aux Etats-Unis,
le programme The Big Data Research
and Development initiative avait ainsi
t lanc au printemps 2012 pour soutenir les programmes de recherche sur
les technologies de traitement de grande
chelle : 200 millions de dollars ont t
mis disposition des grandes agences
fdrales dans la Sant, lEnergie ou la
Dfense pour trouver des applications
sectorielles immdiates. En Europe, la
Commission Europenne sest galement empare du sujet en lanant des
appels projets : le premier dbut 2012
concernant le Management de linformation intelligente (50millions deuros), le second en 2013 intitul Scalable
data analytics (31millions deuros).
Elle fait du Big Data un de ses principaux
sujets dtude : un programme de travail
sur le Big Data et la Smart Data est ainsi
prvu pour 2014 et 2015.
La France, quant elle, a commenc
sintresser au sujet en mars 2012 avec
le lancement dun premier appel projets et linscription du Big Data dans le
programme des Investissements dAvenir au sein de la section consacre
Fleur Pellerin
a annonc
en janvier 2013
la cration dune
pouvoir sopposer.
capable dattirer
les investisse-
La ministre
charge de
lconomie
numrique,
Fleur Pellerin
is
big br
e
l
ot
i
m
he
S
r
ments trangers
hing you
c
t
!
wa
*Selon la loi
constitue une donne caractre personnel
toute information relative une personne physique identifie ou qui peut tre identifie,
directement ou indirectement, par rfrence
un numro didentification ou un ou plusieurs
lments qui lui sont propres
33
Une rupture
La progression du Big Data interroge la
pertinence de ces critres car lexploitation automatique de donnes met
mal le principe de finalit, tout comme
la conservation dans le cloud conduit
des incertitudes en matire de scurit.
Lexercice du droit des personnes est,
quant lui, trs largement bafou, les
internautes ntant souvent pas informs de la rcupration de leurs donnes
de navigation.
La Commission Europenne sest donc
empare du sujet, par lentremise de la
Commissaire Viviane Reding en charge
de la Justice et des Droits Fondamentaux, qui proposait en janvier 2012 un
projet de rglement unifiant les rgimes
de protection des donnes europens
et renforant les droits des personnes
ainsi que la responsabilit des entreprises. Des outils lis au consentement
pralable des internautes (sur les cookies par exemple) ont t mis en place,
mais les discussions sur le projet de rglement restent vives, certains craignant
quun encadrement trop strict freine
linnovation et creuse un dcalage avec
les Etats-Unis, beaucoup moins contraignants sur lexploitation des donnes.
Aprs un an et demi de dbats, le projet de rglement a finalement t retoqu en juin 2013 par les ministres de la
Justice des Etats Membres, mais Viviane
Reding a dores et dj annonc quelle
comptait obtenir un accord sur le projet
en 2014. Une runion entre ministres de
la Justice sest tenue Vilnius en juillet
2013, ouvrant la porte un accord en 2014.
de confiance du
consommateur
vis--vis du
fournisseur
entranerait
automatiquement
un retour en
arrire
2012
La Commissaire Viviane
Reding annonce son projet de
rglement sur la protection
des donnes en janvier 2012
2013
34
Interview
Thierry Dor
Moins de suppositions.
Plus de certitudes.
Analytics. Delivered.**
Accenture
Coordonnes
ACCENTURE
118 avenue de France
75636 Paris Cedex 13
Tl : +33 (0) 1 53 23 55 55
Fax : +33 (0) 1 53 23 53 23
Mail : [email protected]
Contact
Xavier
CIMINO
Responsable Accenture Interactive
Digital & Analytics
A propos dAccenture
(Responsable technologique des offres Business Intelligence, Big Data & Analytics : Laurent Gaultier)
www.accenture.com
37
Dbloquez le potentiel
de vos Big Data !
Trouvez enfin un moyen efficace et facile danalyser lensemble de vos donnes
Les informations disponibles sur votre activit et votre clientle prennent des formes de plus en plus varies avec
lvolution des technologies de communication et de stockage des donnes. Elles offrent de nouvelles possibilits
et lide de les exploiter est sduisante. Mais comment faire pour que cela reste facile et accessible ?
Actuate
Coordonnes
Actuate International
Corporation
57 rue de Chteaudun
75009 Paris
Tl : +33 (0) 1 76 21 56 50
Fax : +33 (0) 1 76 21 56 56
Mail : [email protected]
Contact
Magali
CARIO
Marketing Campaigns Manager
Southern Europe
Actuate a fond et codirige le projet Open Source BIRT, qui est utilis par plus de 2,5 millions de dveloppeurs travers le monde et sert de socle la suite commerciale propose
par Actuate. Pouvant tre facilement dployes auprs de millions dutilisateurs, les applications construites avec BIRT offrent une meilleure vision mtier ainsi quune comprhension approfondie des comportements des clients. Actuate aide ainsi les entreprises tirer
pleinement parti des Big Data et de lessor des appareils tactiles.
Les solutions BIRT dActuate facilitent le dveloppement dapplications personnalises de
business analytics et de communication client bases sur BIRT. Les applications construites
avec le format unique de design BIRT peuvent accder et intgrer tous types de donnes,
y compris les donnes non structures. Elles assurent une exprience utilisateur ergonomique et homogne, quel que soit le niveau de connaissances techniques, et sont supportes pour tous les dploiements, quils soient sur site, Cloud, hybrides, web ou mobiles.
Actuate, cote au NASDAQ sous le symbole BIRT, compte plus de 5 000 clients travers le
monde dans divers secteurs dactivit, dont les services financiers, les technologies et le
secteur public. Son sige social est bas dans la Silicon Valley.
www.actuate.fr
39
Moteur de Recommandation
Afni-Tech SARL
11avenue Henri IV, 92190 Meudon
!
Tl : ! +33 (0) 6 61 88 76 71
Fax : ! +33 (0) 9 58 12 97 98
Mail : ! [email protected]
Web : ! www.afni-tech.com
Affini-Tech
Coordonnes
Affini-Tech SARL
11 avenue Henri IV
92190 Meudon
Tl : +33 (0) 6 61 88 76 71
Fax : +33 (0) 9 58 12 97 98
Mail : [email protected]
Contact
Vincent
Heuschling
Fondateur
Les outils, les pratiques du Big Data sadressent toutes les organisations, quelles que soient leurs tailles.
Affini-Tech, acteur franais du Big Data, le dmontre tous les jours chez des clients de tous
secteurs dactivit. Si le Big Data est n et a grandi chez les gants du Net, cest aujourdhui
dans les industries traditionnelles que les plus grands bnfices sont gnrs.
Le positionnement affirm et le savoir-faire dAffini-Tech est de mettre la porte de toute
entreprise, sur ses volumes de donnes, les apports du Big Data : Analyse de transactions,
Prdiction, Recommandation, Classification, Audit
Par une dmarche la conjonction entre les mtiers et llT, et par la dmonstration, lentreprise dcouvre de nouvelles opportunits pour des cots radicalement plus faibles. Le
retour sur investissement est obtenu en quelques semaines, et les cots sont maitriss.
Lutilisation de mthodes agiles permet de conserver tout moment des objectifs atteignables. Vous disposez tant du savoir faire dAffini-tech que de ses briques technologiques
prtes lemploi, dveloppes pour rpondre des besoins prcis. Affini-Tech vous permet
den comprendre les ressorts et dtre en possession dune RoadMap Big Data pour vos
acteurs cls internes.
Affini-tech ne vous accompagne pas uniquement par la technologie. Une dmarche auprs
des mtiers vous permet de bien plus grandes crations de valeur et de spectaculaires
diminutions de vos cots. Cest aussi grce la nouvelle capacit offerte par les plateformes Big Data traiter massivement de gros volumes de donnes quil devient possible,
moindres cots, de mettre en place des innovations. Le Big Data est abordable.
www.affini-tech.com
41
Bime Analytics
Coordonnes
BIME (We Are Cloud SAS)
1 place Francis Ponge
34 000 Montpellier
Tl : +33 (0) 4 67 41 60 64
Fax : N/A
Mail : [email protected]
Contact
Benoit
Parra
Responsable Commercial France
Craig Morton
Ceo of MovingData
MovingData devait rpondre 2 besoins particuliers que seul BIME pouvait satisfaire : disposer doutils permettant une analyse interactive et visuelle rapide des incidences rseaux
et pouvoir communiquer ces analyses leurs clients Telco grce des tableaux de bord
collaboratifs, disponibles en ligne, en temps rel, sur des volumtries de donnes trs importantes stockes dans Google BigQuery.
Ce projet BigData a t ralis en moins de trois mois. Trois partenaires Cloud, distants
gographiquement, ont sans jamais se rencontrer pu lorchestrer : lAmricain Google pour
la base de donnes, le Franais BIME pour lanalyse et les tableaux de bord, lAustralien
MovingData pour les indicateurs mtiers et les process dalimentation de donnes.
Pensez vos projets BigData avec lagilit et la scalabilit du Cloud.
www.bimeanalytics.com
43
Data Science
Scurit
Performance
Gouvernance de
linformation
Conformit
rglementaire
Coordonnes
CGI Business Consulting
17 place des Reflets
92 097 Paris La Dfense cedex
Contact
Frederic Brajon, Associ
T : +33 1 57 87 50 55
Email : [email protected]
Site web
www.cgi.com
CGI Business
Consulting
Coordonnes
CGI Business Consulting
17 place des Reflets
92 097 Paris La Dfense cedex
Tl : +33 (0) 1 57 87 50 55
Fax : N/A
Mail : [email protected]
Contact
Frederic
BRAJON
Associ
Mieux connatre ses clients, anticiper les changements structurels de son march, dtecter
les intentions dachat, de rsiliation, de fraude Telles sont quelques-unes des promesses
du big data.
Louverture croissante de linformation pose un vritable dfi de comptitivit aux grandes
entreprises : rendre leur offre lisible dans un catalogue chaque jour plus complexe et plus
confus.
Les entreprises qui sauront non seulement triompher de cette complexit, mais en tirer
profit en se positionnant comme dtenteurs dune information intelligible et consolide,
seront au centre de cette nouvelle conomie.
Quelle est la vritable valeur de linformation que mon entreprise dtient ? Quelle information reprsente un avantage comptitif potentiel ? Laquelle pourrait devenir un produit
ou un service potentiel ? Quelles synergies pourrions-nous trouver dans des gisements
dinformation externes ?
A lheure o une masse dinformation sans prcdent devient disponible, et o apparaissent
des dizaines doutils et de mthodes pour en tirer toute la valeur, une question essentielle
demeure :
Quels gains pouvons-nous ds aujourdhui tirer de cette rvolution encore naissante ?
Stratgique : Rconcilier les dcideurs avec la donne et faire de la matrise de linformation un enjeu stratgique (anticiper les bouleversements des cosystmes, analyser les
mouvements du march, rduire les cots, valoriser le patrimoine immatriel, )
Mtier : Analyser les leviers de performances, optimiser les processus (production,
ventes, fraude, positionnement),
Organisationnel : repenser la gouvernance, faire accoster un modle multi-informationnel (donnes, rfrences, indicateurs, donnes rglementaire, donnes externes), repenser
les accs et les stratgies darchivages, redistribuer les rles, adapter les politiques RH
Cration de valeur : combiner les expertises (informatique, mathmatique, business) au
travers dune approche de Data Science prouve pour rvler le potentiel de linformation
Pour rpondre ces enjeux, CGI Business Consulting, cabinet de conseil du groupe CGI a
cr une entit ddie au traitement et la valorisation de linformation : Digital Information Strategy
Ses consultants expriments sont votre disposition pour vous accompagner dans vos
projets de transformation
www.cgi.com
45
Le Club Dcision DSI, premier club franais ddi aux directeurs informatiques
Aujourdhui le Club Dcision DSI runit 1 100 membres directeurs Informatique &
Tlcoms de socits du secteur priv et du secteur public dont le parc informatique
est suprieur 200 pc. Il rassemble des hommes et des femmes dexprience, anims par
la volont de mener des actions qui soutiennent dautres directeurs des systmes dinformation
(DSI) dans la ralisation de leurs projets professionnels.
Le club est administr par Vronique Daval, la prsidente, le vice-prsident, ainsi que par
un conseil central compos de neuf directeurs informatiques.
Contact
Vronique
DAVAL
Prsidente du Club
HELP DSI ce sont des DSI, des groupes de DSI et des communauts de DSI qui changent en
associant leurs ides, leur exprience et leurs connaissances Afin doptimiser leurs choix
technologiques.
Le club dispose de son propre rseau social (RSE) sur lequel de nombreuses thmatiques
sont abordes qui permettent aux membres de capitaliser sur lexprience des uns et des
autres. Les ambassadeurs de Club Dcision DSI ont adopt cette solution afin damliorer
la communication entre les membres, de crer des groupes de rflexion sur des thmatiques varies, et de diffuser les comptences travers le rseau des membres au niveau
national et europen.
Ce moteur dexprience permet aux socits adhrentes de se servir des retours dexprience des projets IT mis en place par les membres.
Chaque anne les ambassadeurs identifient des thmatiques auprs des membres et dfinissent un programme annuel consultable sur le site internet du Club :
www.club-decisiondsi.com
www.clubdecisiondsi.com
47
31 rue Saint-Lazare
75 009 Paris
Tl : +33 (0) 6 22 35 14 20
Fax : N/A
Mail : [email protected]
Contact
Zouheir
GUEDRI
Associ
Data&Data Consulting est une start up spcialise sur le Big Data, qui conseille les socits
dans la valorisation de leurs donnes : nous apportons la fois des recommandations en
terme de pistes de cration de valeur, de choix de technologies, de procdures et de stratgies mettre en place.
Data&Data Consulting est une structure constitue de consultants expriments, spcialiss dans la data avec un background dingnieurs et de statisticiens.
Nous travaillons essentiellement avec des grands comptes mais galement avec quelques
start ups ayant des problmatiques Big Data ou small data. Leur besoin principal est de
savoir comment valoriser leurs donnes : nous leur proposons donc des tudes de march, des conseils en matire dorientations stratgiques et dorganisation, ainsi que des
recommandations technologiques en fonction de leur activit. Pour cela, nous disposons
de comptences de dveloppement ainsi que dun rseau de partenaires pour pouvoir lier
limplmentation oprationnelle aux recommandations stratgiques.
Nous disposons galement dun centre de R&D ddi aux problmatiques de Big Data et de
visualisation des donnes, et nous travaillons avec des chercheurs duniversits de premier
plan, Berkeley, Copenhagen Business School et Stanford University, sur la conception, le
dveloppement et lexprimentation de solutions innovantes pour nos clients.
Le Big Data, comme toute avance technologique, peut comporter des risques, quil ne
faut surtout pas ignorer : en effet, le Big Data repose sur la confiance du consommateur
et toute rupture dans cette confiance entranerait automatiquement un retour en arrire.
Ce qui sest produit avec le programme PRISM est un exemple dexcs qui peut effrayer les
citoyens et consommateurs. De la mme faon, on craint que le Cloud ne soit pas assez
protecteur, alors quil est la base de lessor du Big Data. Il est donc urgent de matriser
ces risques pour garder la confiance des consommateurs ; en cela, je crois que les projets
amorcs en Europe sur la protection des donnes vont dans le bon sens. Par contre, je juge
essentiel de ne pas opposer le modle europen au modle amricain, ce serait contreproductif et ne permettrait pas de garantir lessor du Big Data.
De la mme faon, le plan du gouvernement pour encourager la filire Big Data est un bon
signe envoy au march ; il faudra simplement lorienter davantage vers les start ups pour
les annes venir.
www.data-and-data.com
49
Ne vous laissez
pas distancer !
www.3ds.com/products/exalead/
Exalead
Coordonnes
EXALEAD
10 place de la Madeleine
75008 PARIS
Tl : +33 (0) 1 55 35 26 26
Fax : +33 (0) 1 55 35 26 27
Mail : [email protected]
Contact
Axel
BRANGER
Directeur Commercial
EXALEAD est un fournisseur de logiciels de recherche et daccs linformation en entreprise et sur le Web.
EXALEAD propose EXALEAD CloudViewTM, une technologie logicielle industrielle qui offre
agilit, fonctionnalits smantiques avances et performances uniques. CloudView permet
de concevoir des applications dexploration et danalyse de linformation pour transformer
les donnes de lentreprise en richesse exploitable et pertinente. Ces applications reposent
sur un index et rconcilient donnes structures et non structures, internes ou externes.
www.3ds.com
51
FastConnect
Coordonnes
FASTCONNECT
11, rue des Peupliers
92130 Issy-les-Moulineaux
Tl : +33 (0) 1 45 07 81 65
Fax : +33 (0) 1 45 07 90 87
Mail : [email protected]
Les solutions techniques Big Data / NoSQL sont les outils pour atteindre
ces objectifs, mais ncessitent des comptences spcifiques :
Contact
Mathias
KLUBA
Le rle du Data Scientist est de vous accompagner dans la conception et la
prsentation danalyses labores pour tirer toujours plus de valeur des donnes.
Le rle du dveloppeur - ingnieur est de savoir exploiter la puissance des
outils Big Data et maitriser les environnements distribus.
Le rle de lOps est de vous aider dans la mise en place dune plateforme Big
Data robuste et performante, dans votre DataCenter ou sur le Cloud.
Grce une mthode de projet Agile, lquipe Big Data ralise vos projets de manire
transparente et maitrise.
Il existe diffrentes solutions Big Data pour rpondre diffrents besoins et lcosystme
Hadoop est devenu une plateforme incontournable bientt omniprsente dans les SI comme
le sont devenus les bases de donnes, les serveurs dapplications et les plateformes dcisionnelles.
Nos experts sont l pour vous aider dans la mise en place de votre solution Big Data, ainsi
que dans la formation de vos quipes.
www.fastconnect.fr
53
Plus de donnes.
Meilleurs rsultats.
Vertica, la plateforme analytique temps-rel, conue pour le Big Data.
Real-time analytics
50x-1000x faster than traditional databases
Open architecture
support for Hadoop, R and wide variety of BI and ETL tools
Optimized storage
10x-30x more data per server
Massive scalability
effectively unlimited number of nodes, petabyte
(and beyond) scale
Flexibility
deployment via industry standard hardware, optimized
appliances, or private/public cloud
Hewlett-Packard France
Coordonnes
Hewlett-Packard France
20 Quai du Point du Jour
92100 Boulogne-Billancourt
Tl : 0820 211 211
Fax : N/A
Mail : [email protected]
Contact
Frdric
Lemeille
Sales Manager Vertica
Quelques clients Vertica : AOL, AT&T, Groupon, Mozilla, Twitter, Guess, Comcast,
Level3, Sprint, Verizon, First American, The Washington Post
Pour en savoir plus : Testez et dployez Vertica Community Edition, une version gra-
www.vertica.com
55
Pour moi, les datawarehouses traditionnels ne permettent pas de rpondre aux nouveaux besoins
mtier. Ils prsentent des limitations majeures et se montrent contraignants pour lutilisateur.
Tout dabord, le gros dfaut du datawarehouse est le fait quil nexploite pas lensemble des donnes disponibles dans et hors de lentreprise : ni les donnes non structures (ex : texte libre,
et au-del audio et vido) ni les donnes semi-structures provenant de logs ou de capteurs
cest donc une perte de valeur importante que les outils de Big Data ont permis de pallier en
largissant le primtre par lexploitation de ces nouvelles informations.
Ensuite, concernant leur aspect contraignant et monolithique Impossible de prendre en
compte de nouvelles demandes mtier sans bouleverser tout lentrept et en revoir le modle
! Cela implique une latence forte pour les utilisateurs, le temps ncessaire lIT pour prendre
en compte la modification du modle et son alimentation.
Le Big Data a profondment bouscul cela puisquon peut sappuyer sur une vision purement
exploratoire pour tirer parti des donnes Cest donc un vrai changement de paradigme !
2) Justement, vous parlez de la varit des donnes Est-ce un sujet nouveau chez IBM ?
Pour tout dire, cela fait longtemps que nous travaillons sur ce sujet, depuis le dbut des annes
2000. Il est apparu vident quil faudrait analyser assez rapidement les vidos, les textes, etc. qui
se dveloppaient sur les diffrents supports numriques, avec un haut niveau de granularit.
Aujourdhui, on parle beaucoup de donnes non-structures : je prfre parler dinformations multi-structures . Lavantage du Big Data est justement de pouvoir exploiter tout type
de donne et de les analyser pour les transformer en informations pertinentes pour lentreprise, et ce quelle quen soit la structure.
3) Partant de ce constat sur lintrt du Big Data et les limites des datawarehouses,
quelles technologies avez-vous mises en place pour rpondre aux dfis voqus ?
Face aux limites des entrepts, nous sommes convaincus quil faut repenser les architectures
de donnes selon 3 briques : lune permettant lanalyse dhistoriques de donnes multi-structures bas cot appele Infosphere BigInsights, une autre permettant lanalyse en temps
rel appele Infosphere Streams et nous avons depuis longtemps vu limportance denrichir les
outils danalyse par des outils plus fins lis lexploration de donnes, comme InfoSphere Data
Explorer. Et bien videmment lentre de toutes ces briques, nous nous assurons de la qualit de
lintgration des donnes et de leur gouvernance, par des outils danalyse ddis.
InfoSphere Streams traite des flux de donnes multi-structures (donnees structures, nonstructures, audio, vido) en temps rel. Au-del de sa performance sur de grandes volumtries, sa trs faible latence (microseconde) et ses capacits doptimisation dynamique des flux,
InfoSphere Streams a lnorme qualit dexcuter tout type danalyse, quelles soient prdictives tires doutils de data mining, de moteur de rgles, de fonctions de time series, etc.
Notre approche nest pas seulement technologique. Nous partons des besoins mtiers, nous
demandons nos clients quel type dinformations ils auraient besoin de mieux exploiter, et
nous leur prsentons des expriences clients dj vcues. Ce qui est galement important,
cest de faire un pilote avec lIT et les mtiers afin dapprhender les dfis technologiques avec
une vision 360 et dadapter la plateforme aux besoins spcifiques du client.
Pour IBM, les technologies sont prtes : le frein est plus souvent du ct des quipes des clients qui
manquent parfois de connaissances pour les apprhender. Il faut galement faire voluer lorganisation de lentreprise pour mettre en place ces outils, ce nest pas toujours vident Cest pourquoi
un temps de formation est ncessaire et nous le proposons au travers de nos workshops.
Pour IBM, la question du Big Data nest pas uniquement celle du volume : on peut tre une
petite entreprise avec des volumes de donnes infrieurs des traoctets, et avoir des
problmatiques de Big Data. A partir du moment o lon dcide de se dmarquer de sa
concurrence par les donnes, o lon a compris que les informations gnres lextrieur de lentreprise taient fondamentales,
o lon ralise lapport du temps rel dans son
contexte pour rduire la latence dexploitation, alors on se trouve face une dmarche
de Big Data et notre rle est daccompagner
cette dmarche.
Corinne Baragoin
Certified IT
Specialist Big Data
Beatrice Cochard
Big Data Technical
Sales Manager
IBM France
Coordonnes
IBM France
17 avenue de lEurope
92275 Bois Colombes
Tl : +33 (0) 1 58 75 00 00
Fax : N/A
Mail : [email protected]
Contact
Isabelle
LEFEVRE
Marketing Manager Big Data
www.ibm.com
Big Data permet de comprendre, avec plus de prcision que jamais, comment fonctionne
notre monde afin de produire une plus grande croissance conomique et du progrs social.
Il constitue une opportunit dobtenir des connaissances sur des types de donnes et de
contenus nouveaux, afin de rendre les entits plus agiles. Plateforme Big Data IBM IBM
seul propose une plateforme complte qui permet de rsoudre les dfis Big Data qui se
posent aux organisations. Le principal bnfice dune telle plateforme est de tirer parti de
composants pr-intgrs afin de rduire le cot et le temps dimplmentation.
DB2 10.5 with BLU Acceleration est une base de donnes en mmoire
oriente colonne. Cest une option de paramtrage du nouveau moteur de
base de donnes DB2 10.5 qui permet la fois de grer dans une mme instance de base de donnes des tables relationnelles, mais aussi des donnes
stockes plat et exploites sous forme de tableau en mmoire.
IBM
InfoSphere
Streams
IBM InfoSphere Streams est une plateforme de traitement qui permet d'analyser des donnes en mode flux trs haut dbit. Optimise pour le trafic intense, IBM InfoSphere Streams est capable dabsorber, de filtrer, danalyser et
de corrler des volumes massifs de flux de donnes structures ou non structures, tels que : les fichiers texte, fichiers de tableur, images, enregistrements vido et audio. les Emails, contenus de dialogues en ligne, SMS, trafic
web, blogs et sites de rseaux sociaux. les transactions financires, donnes
de scanner de police, rapports de systmes et dapplications. les donnes
satellite, donnes GPS, enregistrements de lecteurs de badges et daccs.
IBM
InfoSphere
BigInsights
IBM InfoSphere BigInsights est un produit qui sappuie sur la technologie Hadoop. Conu comme une solution intgre, il offre des fonctions de
gestion, de scurit et de fiabilit ncessaires un dploiement grande
chelle. Ses fonctions de recherche, de visualisation et danalyse permettent
de mettre en place rapidement des fonctions analytiques puissantes.
IBM
InfoSphere
Data Explorer
IBM
InfoSphere
Master Data
Management
& Information
Server
La bonne gouvernance des donnes mais aussi la cohrence de ces donnes sont des propositions de valeur quIBM souhaite apporter ses
clients. IBM propose des solutions compltes, qui permettent d'identifier, de nettoyer, de transformer et distribuer vos donnes sans obstacle et de manire scurise dans l'ensemble de l'entreprise. Dans le
domaine du MDM, IBM propose un plateforrme disposant dun puissant
moteur de corrlation qui rsout la fois les rapprochements entre objets et les relations entre objets.
PureData
for Analytics
57
InterSystems France
Relevez le dfi du Big Data... Tout de suite!
Coordonnes
InterSystems France
Tour Europlaza - La Dfense 4
20 avenue Andr Prothin
92400 Courbevoie
Tl : +33 (0) 1 77 49 16 00
Fax : +33 (0) 1 47 76 02 63
Mail : [email protected]
Toutes les donnes, ou ce que nous appelons le All Data, cela veut dire
principalement trois types de donnes :
Les donnes structures lintrieur de lentreprise, a priori elles sont bien maitrises et
ce depuis longtemps,
Les donnes non-structures lintrieur de lentreprise (emails, contrats, documents,
intranet) reprsentent un gisement important en fonction des mtiers, et sont peu ou
mal exploites,
Contact
Robert
BIRA
Cette notion de All Data est videmment une variante du Big Data tant toutes ces donnes
peuvent reprsenter des volumes considrables, une variabilit de sources et de formats
extrme, et enfin un besoin de traitement rapide et performant si on veut rendre tout cela
exploitable. Face ces trois sources quil faut rconcilier, les socits se retrouvent donc
confrontes aux 3 V bien exprims par les analystes du Big Data: Volume, Variabilit,
Vitesse
Ce challenge technologique, mais aussi mtier, est rsolu nativement par les solutions
InterSystems, originellement issues du MIT, qui permettent de mettre en uvre un projet
Big data sans rien sacrifier : la performance extrme est au rendez-vous sur des technologies standard (performance de niveau base mmoire tout en restant sur des technologies
disques classiques), ouverte maximale sur toutes les donnes structures et non structres qui restent ou deviennent accessible une SQL, volumes traits virtuellement illimit
de part la technologie de stockage mme.
Data Capture
Data-driven
Actions
Data Sharing
Data Analytics
Au cur de nos technologies: InterSystems Cach, base de donnes NoSQL/objet/relationnelle ultra performante, supporte tous les formats de donnes: aussi bien les structures simples que complexes, les modles relationnels, Objet ou NOSQL et est capable
dexploiter les donnes structures et non structures de manire intelligente. Grce
InterSystems DeepSee elle offre en outre le dcisionnel intgr et en temps rel sur tous
les formats de donnes. Le moteur danalyse smantique iKnow permet enfin de gnrer
de linformation pertinente partir de donnes non structures.
Au niveau projets BIG DATA, InterSystems Cach est notamment au cur du projet GAIA
de cartographie de la Voie Lacte (plusieurs centaine de To avec forte contrainte de temps
de traitement), du systme de trading du Crdit Suisse (forte contrainte de performance
temps rel hauts volumes), de solutions de Smart Metering en Europe, ainsi que de trs
nombreuses entreprises qui exploite les immenses volumes de donnes textuelles du web
pour leur enjeux mtiers (marketing, presse).
Au del du Big Data, InterSystems propose ses clients une dmarche vers le All Data, ce
que nous appelons librer les donnes.
InterSystems est, depuis plus de 30 ans, lun des principaux diteurs mondiaux de logiciels
novateurs dans le domaine des bases de donnes, du dveloppement rapide, et de lintgration dapplications.
Les technologies InterSystems sont reconnues et mises en uvre dans tous les ecteurs
dactivit, adoptes par plus de 2500 diteurs, mises en uvre par les plus grands intgrateurs et SSII, et plus de quatre millions de personnes travers le monde utilisent chaque
jour des applications stratgiques sappuyant sur lenvironnement logiciel dInterSystems.
www.intersystems.fr
59
Hadoop
NoSQL/NewSQL
Analytic DBMS
BigQuery
Jaspersoft
Coordonnes
Jaspersoft SARL
3 rue Colonel Moll
75017 Paris
Tl : +33 (0) 9 70 44 40 19
Fax : +353 1 686 5249
Mail : [email protected]
Jaspersoft permet des millions de personnes de prendre chaque jour, de meilleures dcisions plus rapidement, en leur donnant accs des donnes utiles et exploitables au cur
de leurs applications et processus mtier. Sa plateforme doutils de reporting et danalyse
intgrs offre chaque utilisateur une autonomie relle et les rponses dont il a besoin.
Elle sadapte toutes les architectures et tous les budgets afin de servir lensemble de
lentreprise. Grce une communaut forte de plusieurs centaines de milliers de membres,
les logiciels open source de Jaspersoft comptent des millions de tlchargements. Ses
solutions dcisionnelles sont intgres au cur de centaines de milliers dapplications et
de processus mtier do Jaspersoft The Intelligence Inside. Jaspersoft est une socit
prive qui possde des bureaux dans le monde entier.
Pourquoi Jaspersoft ?
Contact
Georges
CARBONNEL
Responsable Enterprise Accounts,
France
LE BIG DATA
Jaspersoft est la seule plateforme dcisionnelle capable de crer des rapports et des analyses, directement depuis des sources Big Data tels que Hadoop, MongoDB et Cassandra
ainsi que les principales bases de donnes analytiques comme HP Vertica, IBM Netezza,
EMC Greenplum et bien dautres. Jaspersoft a dj travaill sur des projets Big Data au sein
de groupes comme Groupon, Ericsson, Vimeo, Jagex et SoftServe entre autres. Pour plus
dinformations, consultez www.jaspersoft.com/bigdata.
LE CLOUD
LE MOBILE
Jaspersoft propose le seul framework open source du march pour le dcisionnel mobile
sur les appareils iOS et Android en tant quapplications natives et sur navigateur, grce la
technologie HTML 5.
Contacts: Anthony Pangnanouvong, Business Development, France
[email protected]
www.jaspersoft.com
61
Keyrus
Coordonnes
KEYRUS
155 rue Anatole France
92300 Levallois-Perret
France
Tl : +33 (0) 1 41 34 10 00
Fax : +33 (0) 1 41 34 10 10
Mail : [email protected]
Contact
Reda
GOMERY
Directeur des Oprations
www.keyrus.com
63
MapR delivers on the promise of Hadoop with a proven, enterprise-grade Big Data
platform that supports a broad set of mission-critical and real-time production uses.
MapR Technologies
Coordonnes
MAPR TECHNOLOGIES
MapR Europe du Sud & Benelux
171 bis avenue Charles de Gaulle
92200 Neuilly sur Seine
Tl : +33 (0) 1 70 91 86 49
Fax : N/A
Mail : [email protected]
Contact
Xavier
GUERIN
VP Southern Europe and Benelux
www.mapr.com
65
Si vous vous arrachez les cheveux avec de nombreuses jointures et les procdures stockes complexes, il
est fort possible que vous soyez en train de construire un graphe sans le savoir : car les graphes sont partout. Depuis les applications sociale web jusqu lanalyse dimpact sur un rseau Telecom en passant par la
recherche en Biologie, les recommandations, la scurit, et la dtection de fraude, de nombreuses organisations ont adopt la bases de donnes de graphes Neo4j pour augmenter leurs capacits et leurs performances. Cest un systme conu pour grer les donnes connectes que nous rencontrez de plus en plus au
quotidien, qui est nanmoins fortement matur avec plus de 10 ans en production.
Dcouvrez avec nous ce quapporte la puissance de Neo4j une large varit de clients tels que HP, SFR,
Cisco, Deutsche Telekom, Viadeo et Glowbl.
Neo4j
Coordonnes
Neo Technology France
Tl : +33 (0) 8 05 08 03 44
Fax : N/A
Mail : [email protected]
Contact
Cdric
FAUVET
Business development France
Neo Technology
Les chercheurs de Neo Technology sont les pionniers de la base de donnes de graphes
depuis 2000. Ils ont contribu mettre la puissance des graphes la disposition de nombreuses PME innovantes telles que Glowbl, Sodifrance ou Perigee, mais aussi dorganisations rputes mondialement telles que Cisco, HP, Deutsche Telekom, SFR, et Viadeo.
Ses 10 ans de service en production dans des environnements critiques pour le mtier,
ses partenaires Franais et globaux et ses milliers de dploiements russit on fait de Neo4j
le leader mondial de la base de donnes de graphe.
Avoir la main sur son systme et identifier en temps rel le client impact par une maintenance ou une panne.
Logistique
Construction dun rfrentiel standardis performant et sans redondance pour vos donnes
critiques hirarchises : Hirarchie dentreprise et de produit.
Droits daccs
Go-Spatial
Rduire les risques deffets secondaires des mdicaments en calculant en temps rel les
interactions entre une protine et une future molcule.,
Le modle de donnes du graphe permet lexcution des requtes complexes avec une
haute performance, inhrentes aux donnes connectes des applications daujourdhui. En
un mot le bon outil pour le bon besoin.
Modliser une base de donnes de graphes est aussi simple que dcrire sur un tableau
blanc. Les entreprises peuvent capturer rapidement toutes sortes de donnes, structures,
semi-structures et dstructures et ainsi les stocker dans Neo4j. Ceci rsultant dans une
rduction des temps de dveloppement, une rduction de cots de maintenance et de plus
hautes performances.
Trs souvent les utilisateurs et clients de Neo4j dmarrent un projet car ils nont pas pu
trouver de solution un problme bien prcis avec les bases de donnes relationnelles.
Puis ils dcouvrent, par la simplicit du modle de donnes de graphes, de nouveaux cas
dusage trs utiles dans le monde des startup ou des industries fortement concurrentielles.
www.neotechnology.com
67
ParStream
Coordonnes
ParStream
La Grande Arche - Paroi Nord
Paris La Dfense - 92044
Tl : +33 (0) 1 40 90 34 20
Fax : N/A
Mail : [email protected]
Contact
Peter
Livaudais
Sr. Director Solutions
www.parstream.com
69
Pentaho
Coordonnes
PENTAHO
Paris - France
Tl : 0800-915343
Fax : 1 407 517-4575
Mail : [email protected]
Contact
Olivier
CHARLERY
French Inside Sales
Pentaho construit le futur de lanalytique. Son hritage Open Source mne son innovation continue pour une plate-forme analytique intgre et moderne conue pour les diverses exigences
de lanalyse dentreprise de demain, notamment celles du Big Data. Lanalytique performante
moindre cot est facilement accessible grce la suite doutils de Pentaho qui permet laccs
aux donnes, la visualisation, lintgration et lanalyse de donnes ainsi que le datamining.
Pentaho permet dexploiter plus rapidement les Big Data grce sa solution danalytique pour Big Data la plus complte du march. Pentaho offre :
Lutilisation de Pentaho Business Analytics avec Hadoop offre une conception graphique hautement productive associe une analyse et une visualisation des donnes instantanes:
Une plate-forme danalyse Hadoop complte dveloppement visuel pour lingestion, la
prparation, lintgration et lorganisation des donnes Hadoop et visualisation, exploration
et prdiction interactives
Une meilleure productivit de lquipe informatique grce la rutilisation des comptences existantes facilement utilisables sans formation particulire par les informaticiens, les analystes dentreprise et les scientifiques spcialistes des donnes
Une protection contre les risques fonctionne avec toutes les principales distributions
Hadoop, ainsi que les bases de donnes NoSQL et les entrepts de donnes traditionnels,
en connectant Hadoop au reste de lentreprise
Productivit et performance : gain en productivit de dveloppement et en
performance dexcution multipli par 10 ou par 15 par rapport au codage
manuel MapReduce, grce lutilisation de lunique moteur ETL qui sexcute nativement comme une tche MapReduce travers le cluster Hadoop
www.pentaho.fr
71
Analyser des donnes issues de diffrentes sources depuis une seule et mme application;
Explorer naturellement les associations entre les donnes;
Visualiser les donnes laide de graphiques soigns et performants;
Accder vos donnes partir de priphriques mobiles pour les analyser;
Dvelopper la prise de dcisions collaboratives en temps rel et de faon scurise
Dcouvrez comment QlikView permet King.com, un acteur majeur des jeux en ligne (Candy Crush Saga)
danalyser le comportement de jeu de 40 millions de clients, grce lexploitation des donnes stockes
dans son cluster Hadoop, o deux milliards de nouvelles lignes sont cres chaque jour.
www.qlikview.fr/big-data
QlikTech France
Coordonnes
QlikTech France
93 avenue Charles de Gaulle
92220 Neuilly-sur-Seine
Tl : +33 (0) 1 55 62 06 90
Fax : N/A
Mail : [email protected]
Contact
Stphane
BRIFFOD
Director Presales
QlikTech (code NASDAQ : QLIK) est un leader en matire de Business Discovery, la Business Intelligence (BI) conduite par lutilisateur. La plate-forme QlikView de Business Discovery comble
lcart entre les solutions de BI traditionnelles et les applications inadaptes de feuilles de
calcul. QlikTech a mis au point une technologie pionnire de recherche associative en mmoire
et grce cet environnement de BI en libre-service, les utilisateurs peuvent explorer les informations librement, au lieu dtre cantonns une srie prdfinie de questions.
www.qlikview.com
73
ActivePivot
TM
Libert danalyse
Performance
Calculs en mmoire,
en mode incrmental
Rafrachissement des
donnes la vole
www.quartetfs.com
P A R I S
L O N D R E S
N E W - Y O R K
S I N G A P O U R
H O N G - K O N G
Quartet FS
Coordonnes
QUARTET FS
2 rue Jean Lantier
75001 Paris
Tl : +33 (0) 1 40 13 91 00
Fax : +33 (0) 1 40 13 84 51
Mail : [email protected]
Contact
Nina
KRAUSE
Sales Executive
Quartet FS rpond aux besoins des entreprises qui souhaitent amliorer leur
performance en mettant lanalyse des donnes en temps rel au service de la
prise de dcision oprationnelle.
ACTIVEPIVOT EN BREF
CAS DUSAGE
ActivePivot apporte de la valeur dans les processus ncessitant lagrgation de grands volumes de donnes trs volatiles, comme la supply chain, le risk management, le pricing
dynamique ou encore la gestion de trafic. Dans ces contextes, ActivePivot permet dadresser des cas dusage indits comme la gestion par exception, loptimisation de ressources,
lanalyse dimpact, la dtection danomalies ou encore le stress testing.
Un enjeu Big Data dans le monde du transport est le pilotage de la chane logistique. Pour
garantir les dlais de livraison, les oprateurs logistiques ont besoin de faire la synthse
des informations qui remontent de leur supply chain, que ce soit
des systmes de planification, de TMS ou encore de gestion des
entrepts. ActivePivot fait la synthse en continu de toutes ces
donnes pour permettre aux oprateurs logistiques davoir une
visibilit de A Z sur leur supply chain. ActivePivot permet aux
oprateurs de disposer dune vritable tour de contrle de leurs
flux oprationnels.
ActivePivot est dploy dans de nombreux tablissements financiers pour rpondre un besoin croissant danalyse et de surveillance des risques en temps rel. Chez Lloyds Banking Group, les
traders utilisent ActivePivot pour obtenir une visibilit en temps
rel sur leurs positions en pralable toute activit de trading.
Chez Nordea, les risk managers utilisent ActivePivot pour calculer la Value at Risk en temps rel, une mesure qui ncessite
lagrgation incrmentale de grands volumes de donnes non
linaires.
Un cas dusage typique pour ActivePivot dans le monde du e-commerce est la prise de dcision en mode stress ou en flux tendu, comme par exemple en priode de solde. Lorsquil
faut ajuster les prix en quasi temps rel, ActivePivot permet aux acheteurs de dterminer
les rfrences pour lesquelles une variation de prix aura leffet de levier le plus fort sur les
ventes sans pour autant dtriorer la marge de lensemble du rayon.
A PROPOS DE QUARTET FS
Cre en 2005 par un groupe de cinq entrepreneurs issus du monde applicatif, Quartet
FS est une socit capitaux privs avec des bureaux Paris (sige de la R&D), Londres,
New-York, Hong Kong et Singapour. Avec plus de 50 projets en production dans des groupes
denvergure internationale, Quartet FS a pour clients des entreprises dans de nombreux
secteurs dactivit parmi lesquels la finance, la logistique, le transport ou encore la grande
distribution.
www.quartetfs.com
75
HIGH-PERFORMANCE
SAS et les noms de produits ou services SAS sont les marques dposes de SAS Institute Inc., Cary NC, USA. Les autres noms de produits ou concepts sont des marques dposes des socits respectives. Copyright 2013. Tous droits rservs.
SAS Institute
Coordonnes
SAS INSTITUTE
Domaine de Grgy
Grgysur-Yerres
77257 BRIE COMTE ROBERT CEDEX
Tl : +33 (0) 1 60 62 11 11
Fax : +33 (0) 1 60 62 11 12
Mail : [email protected]
Contact
Serge
BOULET
Directeur Marketing
SAS vous aide rsoudre vos problmes complexes, atteindre vos objectifs cls et exploiter
plus efficacement vos donnes. Pourquoi ? Leader mondial du dcisionnel et des solutions
de business analytics, nous proposons des outils analytiques puissants, reconnus sur le
march, des solutions de pilotage de linformation et de business intelligence, pour vous
aider faire face aux challenges daujourdhui et anticiper les opportunits de demain.
Une des priorits de votre entreprise : savoir tirer parti des big data. Lanalytique va vous
aider atteindre cet objectif, vous permettre de percevoir quun dtail peut faire la diffrence ou prendre du recul pour dtecter de plus grandes opportunits, de plus fructueuses perspectives. Cest toute la puissance apporte par lanalytique.
A cet instant mme, les clients de SAS parmi lesquels 90 des 100 premires entreprises
du classement FORTUNE Global 500 de 2012, sappuient sur nos solutions analytiques pour :
Dcouvrir et saisir des opportunits de dveloppement et de performance dans de
multiples domaines.
Prendre des dcisions stratgiques, oprationnelles et tactiques en un rien de temps.
Utiliser des donnes pour des dcisions aux rsultats tangibles.
Nous nous engageons sur le succs de vos projets sur le long terme. Nos quipes de consultants, formateurs, support 24/7, vous accompagnent tout au long du cycle de vie de votre
projet. La communaut de nos clients et partenaires contribuent cet accompagnement.
Vous avez besoin dune solution spcifique adapte votre secteur ? Ou dune solution fonctionnelle transverse qui va vous
permettre de rpondre vos challenges ? Quelle que soit votre
problmatique, SAS a une rponse pour vous. Par exemple,
nous aidons combattre la fraude dans le secteur financier,
acclrer la mise sur le march de mdicaments ou identifier
des opportunits de ventes croises et additionnelles dans la
distribution.
Nous aidons aussi nos clients valoriser leur relation client,
piloter leurs risques et optimiser leurs rseaux informatiques. Nos solutions rpondent ces problmatiques complexes en sappuyant sur un socle technologique avec trois
composantes cl : la gestion des donnes, les outils danalyse
et la restitution de linformation.
Vous navez jamais pris de dcisions aussi rapidement grce
vos donnes. Avec SAS High-Performance Analytics, vous
navez plus besoin de longs processus pour analyser vos Big
Data. Obtenez des rsultats en quelques minutes ou secondes,
et consacrez le temps ainsi gagn votre business.
Nous avons aussi rendu la business analytics accessible et
simple. Changez votre manire danalyser vos donnes : avec
SAS Visual Analytics vous explorez visuellement et rapidement vos donnes. Vous pouvez crer vos rapports et partager les rsultats sur le web ou
des tablettes Android et iPad.
Tous vos collaborateurs amens prendre des dcisions, quel que soit leur mtier ou leur
niveau hirarchique, peuvent dsormais avoir accs des analyses prdictives rapides et
prcises.
Votre succs est notre succs. Et cest pourquoi nous vous aidons dployer et utiliser les
solutions SAS de la faon qui vous convient le mieux. Nous avons des offres flexibles pour
rpondre vos besoins : cloud priv, hbergement, grid ou services web dAmazon...
SAS Institute, socit prive cre en 1976. Plus de 65000 sites clients rpartis dans 135
pays, dont 2600 en France.
www.sas.com/france
77
Semsoft
Coordonnes
SEMSOFT
80, avenue des buttes de Coesmes
35700 Rennes
Tl : +33 (0) 2 99 12 19 86
Fax : N/A
Mail : [email protected]
Contact
Damien
Regnault
COO
www.semsoft-corp.com
79
smartsolutionsforsmartleaders
STRATEGIE|GOUVERNANCE|ARCHITECTURE
www.sentelis.com
Sentelis
Coordonnes
SENTELIS
31 Rue du pont
92200 Neuilly-sur-Seine
France
Tl : +33 (0) 1 75 61 34 00
Fax : N/A
Mail : [email protected]
Contact
Isabelle
REGNIER
Directeur Commercial
Nos mtiers
Nos prestations
Industrialisation du SI
Gouvernance oriente service de la DSI
Conception darchitecture nouvelle gnration
Etude et mise en uvre de socles SI industriels
Etude et activation de pratiques DSI industrielles
Marketing de la DSI
www.sentelis.com
81
Sinequa
Coordonnes
SINEQUA
12 rue dAthnes
75009 Paris
Tl : +33 (0) 1 70 08 71 71
Fax : +33 (0) 1 45 26 38 92
Mail : [email protected]
Contact
Hans-Josef
JEANROND
Directeur Marketing
Sinequa fournit une plateforme de Search & dAnalyse du Big Data en temps rel.
Sa solution sadresse aux grandes entreprises et administrations publiques pour offrir
leurs utilisateurs un point daccs unifi linformation couvrant toutes les donnes
textuelles et base de donnes. Son interface visuelle permet de dcouvrir de faon intuitive
et conversationnelle linformation pertinente.
Big Data ne serait que Big Noise (grand bruit sourd) sans des capacits danalyse
puissantes pour extraire et visualiser les informations pertinentes.
Sinequa se distingue par cette capacit danalyse approfondie pour extraire linformation
pertinente partir de toutes sortes de donnes : les donnes non structures dans des
documents , emails, sites Web et des rseaux sociaux, et les donnes structures, dans les
applications dentreprise, telles que ERP , CRM , Finance, RH, etc.
Lanalyse smantique, dveloppe pour 19 langues, permet de lever le plus grand dfi du
Big Data : traiter la masse des donnes textuelles ou donnes gnres par lhumain.
Lanalyse smantique permet la fois de mieux comprendre les questions des utilisateurs,
formules en langage naturel, et le sens des textes, allant bien au-del de la recherche
de mots cls. Il contribue galement catgoriser des informations en utilisant des filtres
spcifiques un mtier afin damliorer considrablement la dcouverte dinformation.
Sinequa offre une forte scurit daccs aux informations de lentreprise avec un contrle
strict des droits daccs de chaque utilisateur.
Plus de 120 connecteurs aux sources de donnes aident faire face la diversit inhrente
au Big Data.
Nos clients utilisent notre plateforme de Search & dAnalyse du Big Data pour crer des
applications spcifiques (Search Based Applications ou SBA) lies leur cur de mtier,
comme la cration de vues 360 (par exemple sur les clients) ou de rvler les rseaux
sociaux implicites (rseaux dexperts sur un sujet donn), gnralement avec un trs fort ROI.
Les donnes sur les clients viennent souvent dapplications dentreprises classiques
comme le CRM, ERP ou systmes financiers, des systmes de gestion de documents
contenant des contrats, des descriptions de produits et de services, de courriers lectroniques
et des changes de centre dappels.
Les donnes sur les experts et lexpertise peuvent provenir de publications internes et
externes, rapports de projets, systmes RH, RSE, etc. Sinequa ne fournit pas seulement
une liste de noms comme rsultat dune recherche, mais le degr dexpertise de chacun
ainsi que les documents relatifs cette expertise et les relations entre experts. Ceci rvle
les rseaux sociaux implicites ou la matrice organisationnelle informelle dune
entreprise, pas en fonction de la position hirarchique, mais du travail accompli et de
lexpertise dtecte grce ce travail.
Dans chaque cas, de fortes capacits smantiques sont ncessaires pour aller au-del de la
recherche simpliste par mots cls, pour dcouvrir les contenus traitant dun sujet particulier,
mme si elles ne contiennent pas les mots cls utiliss dans une requte de recherche.
blog.sinequa.com
83
Quand on a la passion...
... linnovation va plus loin.
+20
ans
dexprience
au service de lindustrie
mtiers
High Tech
Conseil
Ingnierie Systme
Ingnierie Physique
Ingnierie Logiciel
Testing
+20 000
collaborateurs
Sogeti dans 15 pays
orientations
R&D - innovation
Incubateur de solutions
Partenariats laboratoires
Proprit intellectuelle
R&D interne
www.sogeti-hightech.fr
marchs
cls
aronautique,
spatial,
dfense,
nergie,
ferroviaire,
tlcoms
Contact
Philippe
RAVIX
Directeur Innovation
www.sogeti-hightech.fr
85
Start with big data and Splunk software. End with an unfair advantage.
Splunk software collects, analyses and transforms machine-generated big data into real-time
Operational Intelligencevaluable insight that can make your business more responsive,
productive and profitable. Over half of the Fortune 100 use Splunk software and have the
business results to prove it.
Learn more at Splunk.com/listen.
Toutes vos applications, vos systmes et votre infrastructure gnrent des donnes chaque milliseconde de chaque
jour. Ces donnes machine constituent le domaine le plus complexe, avec la plus forte croissance du Big Data .
Cest aussi le domaine qui possde le plus de valeur car on peut y trouver tous les dtails des transactions effectues par les utilisateurs, le comportement des clients, lactivit des capteurs de toutes sortes, le comportement
des machines, les menaces de scurit, les activits frauduleuses pour ne citer que ces exemples.
Splunk Inc.
Coordonnes
Splunk Inc.
5, place de la Pyramide
Tour Ariane La Dfense 9
92088 Paris La Dfense Cedex
Tl : +33 (0) 1 55 68 10 43
Fax : N/A
Mail : [email protected]
Contact
Pierre
Goyeneix
Regional Sales Director, EMEA South
Les donnes machine contiennent des informations critiques, utiles pour lensemble de
lEntreprise. Par exemple :
Monitoring des transactions de bout en bout pour les business en ligne 24h/24 et 7j/7
Comprendre lexprience client, son comportement et lutilisation des services en temps rel
Respect des SLAs internes et monitoring des SLAs des Fournisseurs de Services
Identifier les tendances et analyser les sentiments sur les rseaux sociaux
Cartographier et visualiser les scenarii et schmas comportementaux pour amliorer sa
politique scurit
Lutilisation des donnes machine est un challenge. En effet, il est difficile de les traiter
et de les analyser avec les outils de management de donnes classiques, sans parler des
performances.
Les donnes machine sont gnres par une multitude de sources diffrentes : effectuer des corrlations entre des vnements significatifs provenant de ces sources est extrmement complexe
Ces donnes sont non structures et difficiles faire rentrer dans un schma prdfini
Les donnes machines atteignent rapidement des volumes importants et sont estampilles
avec une unit de temps ; elles ncessitent une nouvelle approche pour les traiter et les analyser
Les informations les plus prcieuses en retirer sont le plus souvent utiles en temps rel
Les solutions classiques de Business Intelligence, Data Warehouse ou IT Analytics ne sont
tout simplement pas conues pour ces types de donnes de trs gros volume, dynamiques
et non structures. Des solutions mergentes en Open Source peuvent fournir une partie de la rponse mais ncessitent des quipes de dveloppeurs de trs bon niveau, trs
spcialises et qui au final coutent trs cher. De plus, quand les demandes voluent, ces
solutions fragiles nont trs souvent pas lagilit ncessaire pour sadapter. Les entreprises
daujourdhui ne peuvent pas attendre. Les dcideurs, ou quils se trouvent dans lorganisation des entreprises, doivent constamment sadapter aux changements incessants et de
plus en plus rapides de leur environnement. Ils ont besoin dune technologie qui permet les
analyses temps rel, le data mining et la production de rapports a la vole : en bref, une
solution qui leur apporte des rponses aussitt quelles sont poses.
Splunk Enterprise est une solution temps rel, intgre, de bout en bout, pour les donnes
machine. Elle offre les capacits fondamentales suivantes :
Assemblage et Indexation universelle des donnes machine provenant de toute source
Langage de recherche puissant pour analyser des donnes temps rel ou historiques
Monitoring de comportements et de niveaux ; alertes en temps rel quand un ensemble
de conditions sont remplies
Production de rapports et danalyses
Tableaux de Bord personnaliss et spcifiques pour chaque fonction de lentreprise
Haute disponibilit et volutivit sur les plateformes standard du marche
Contrle daccs et scurit base sur les fonctions
Support flexible des dploiements multi-site et distribus
Connectivite avec les autres outils de donnes comme les SGBDR et une connectivit
bidirectionnelle avec Hadoop
Une plateforme robuste et flexible idale pour les applications Big Data
Hunk (Splunk Analytics on Hadoop) est une nouvelle application qui permet dexplorer, analyser et visualiser des donnes dans Hadoop. Sappuyant sur les annes dexprience de
Splunk dans le Big Data et le dploiement auprs de milliers de clients dans le monde,
Hunk permet une amlioration spectaculaire en termes de vitesse et de simplicit pour
analyser et interagir avec les donnes situes dans Hadoop. Tout cela sans programmation,
ni intgration couteuse ni migrations forces de donnes.
fr.splunk.com
87
Cette entit travaille ainsi sur les volets ddis la Data Science savoir :
Ingnierie de la donne : architecture, stockage, modlisation, optimisation, automatisation
autour des plateformes Big Data (Hadoop, Aster Data )
Transformation des donnes : modles statistiques (calculs de distances, calcul de corrlation,
clustering, classification, arbre de dcision, rseau de neurones) appliqus aussi aux
documents textes, mise en place de techniques de machine learning
Visualisation des donnes : graphiques adapts aux donnes, mise en rcit des donnes
pour une meilleure adhsion utilisateurs
Connaissance mtiers : autour de lintelligence sociale sur les clients et produits pour
fidliser, dvelopper et grer les clients
SRD Conseil
Coordonnes
SRD CONSEIL
10 rue chteau
75009 PARIS
Tl : +33 (0) 1 74 64 06 07
Fax : N/A
Mail : [email protected]
Contact
Abed
AJRAOU
Directeur Business Unit BI et Big Data
SRD Conseil, entreprise cr en 2006, a pour objectif daider les entreprises dans le cur
de leurs proccupations savoir lacquisition, la rtention et la fidlisation de leurs clients.
SRD Conseil aide organiser, optimiser et mesurer lefficience des actions marketing et
commerciales par la mise en place doutils, de mthodes et de formations adapts mtier
aux besoins des entreprises.
Rgie : Pour un besoin de renfort technique et/ou fonctionnel, sur un primtre et une
dure indfinie, un consultant SRD conseil peut intervenir en rgie, de 0,5 220 jours par an.
SRD Conseil: la slection de profil fait lobjet dune rigueur particulire (plusieurs entretiens, contrle de rfrences pouss, ventuels tests )
www.srd-conseil.com
89
The collision between traditional approaches to Data Integration and Hadoop is one of the more
interesting aspects of Big Data generally and of Hadoop specifically.
Data integration and more specifically, Extraction, Transformation and Loading (ETL), represents a natural application of Hadoop and a precedent to achieving the ultimate promise of Big
Data new insights. But perhaps most importantly at this point in the adoption curve, it represents an excellent starting point for leveraging Hadoop to tackle Big Data challenges.
On Halloween 2012, Doug Henschen published a fascinating article around the work Sears is
doing with Hadoop. Within the article, there is a section labeled, ETL Must Die. While I can
appreciate the sentiment, lets be clear: ETL as a capability in the information management
stack is not going anywhere. Data will need to be sourced (E), it will need to be related and
refined (T) and put somewhere (L). What Sears has done is a fundamental shift in architecture for delivering this capability. Sears needed a new architecture, and found one in Hadoop. As
detailed in the article, Hadoop is providing a whole range of benefits to Sears. But to say Sears
is no longer doing ETL is not accurate. In fact, the opposite would appear to be the case. Sears
is sourcing more data, the scope of the transformations has increased, and the distribution of
information has expanded. What Sears has done is to move existing workloads from various
tools and platforms into a Hadoop environment. That has shifted the reliance on specific products but not the capabilities required to maximize the value of the data.
In a recent research piece entitled Hadoop is not a Data Integration Solution, Ted Friedman
and Merv Adrian from Gartner describe the gaps between Hadoop and a proper Data Integration
Solution. But, what is it about the Hadoop infrastructure that is attracting such interest despite
these significant gaps?
In the era of Big Data, Hadoops architecture is fundamentally superior for supporting many of
the most commonly deployed data integration functions. For this reason, organizations are flocking to Hadoop even if key functional capabilities must be written by hand today. Hadoop makes
it easy to scale computing power horizontally with low cost components. More importantly, this
architecture will also support a broader range of data integration functions.
We are seeing willingness by organizations to abandon well-understood and mature features of
Data Integration products and embrace a raw, open source technology. The main problem Big
Data creates is an architectural one, not a functional one. Perhaps it is fair to say that today;
Hadoop is not a Data Integration solution. But, as Mr. Adrian and Mr. Friedman seem to agree,
it could very well be the Big Data operating system on which next-generation data integration
solutions are built. Moreover, I believe its a safe bet that the applications needed to perform
sophisticated Data Integration in Hadoop are coming quickly.
In his February 21st post entitled, Big Datas New Uses Cases: Transformation, Active Archive
and Exploration, Clouderas CTO, Amr Awadallah, provides a concise and accurate history of
the T in ETL. In the late 90s and early 2000s, the conventional wisdom was to extract data
from key source systems, cleanse and relate that data through transformations, then load it
into the warehouse. As businesses got customized views of information combined from multiple
systems, the traditional ETL approach, particularly the T, began to suffer under the weight
of growing volumes. At the same time, databases and the hardware that supported them were
evolving rapidly to support intense query load with massively parallel processing architectures.
Over time, a new approach to data integration was developed which would avoid the lack of
relative scalability in traditional data integration engines. The concept was simple: Extract the
tables from source systems and then load those tables directly into the data warehouse into a
separate staging area. Use SQL, a common and widespread skill to combine and relate those
raw tables into the tables required for reporting and analytics. This approach became known as
ELT and is, in fact, the most common approach used for data integration today.
While this approach provides the scalability required to perform the T for integrating the
growing sources and volumes of data, there are tradeoffs. Most of the logic used for data integration is expressed in SQL and it is hard to maintain. It requires constant tuning as data
changes. It is difficult to test and debug. Oh, and, very often, it fails to perform well.
ELT has become the conventional wisdom in integrating data but little focus has been put on
the impact these tradeoffs have from an expense and agility perspective. Current practitioners
would argue that it is the cost of operating a large-scale analytics and reporting environment
and that there is no other alternative that can provide the required scale to meet the insights
the business demands.
Josh Rogers
President of Data
Integration
Syncsort.
Syncsort France
Coordonnes
SYNCSORT France
Tour Ege - La Dfense
17 avenue de lArche
92671 Courbevoie Cedex
Tl : +33 (0) 1 46 67 46 10
Fax : +33 (0) 1 47 88 04 38
Mail : [email protected]
Contact
Florence
RABUEL
Regional Sales Manager
Syncsort propose aux organisations grant dnormes quantits de donnes des solutions
logicielles permettant de collecter et traiter de manire plus intelligente cette avalanche
exponentielle de donnes.
Puisant dans son exprience de milliers de dploiements sur toutes les plateformes majeures, y compris le mainframe, Syncsort aide ses clients, partout dans le monde, surmonter les limites architecturales des environnements Hadoop et ETL daujourdhui.
Les entreprises obtiennent ainsi de meilleurs rsultats en moins de temps, avec moins de
ressources pour un cot de possession rduit.
Pour en savoir plus, veuillez consulter notre site.
www.syncsort.com
91
Tableau Software
Coordonnes
TABLEAU SOFTWARE
Blue Fin Building
110 Southwark Street
London SE1 0TA - United Kingdom
Tl : +44 (0) 203 310 4500
Fax : +44 (0) 203 310 4501
Mail : [email protected]
Contact
Julien
SIGONNEY
Sales Area Manager
Tableau Software aide les utilisateurs visualiser et comprendre leurs donnes. Tableau
permet danalyser, de visualiser et de partager simplement des informations. La socit
Tableau Software propose des solutions de Business Intelligence qui aident les personnes
et les organisations travailler plus efficacement en leur permettant didentifier plus clairement les tendances. Grce lutilisation des outils de Tableau, les utilisateurs optimisent
leur temps en ayant accs aux informations qui leur sont importantes de manire trs
rapide. Plus de 12 000 entreprises font confiance Tableau pour obtenir rapidement des
rsultats, au bureau comme lors des dplacements.
Grce sa facilit dutilisation, Tableau Public est un outil qui permet de traiter un gros
volume de donnes facilement et rapidement et ensuite de les publier sur le web en un seul
clic. Cet outil aide diverses typologies dutilisateurs dont les journalistes analyser des
donnes complexes et extraire des informations pertinentes qui permettent de trs belles
visualisations de donnes et cela de manire dynamique.
Tableau Desktop utilise une technologie innovante de luniversit de Stanford qui vous permet de glisser-dposer des donnes pour les analyser. Vous pouvez accder aux donnes
en quelques clics, puis visualiser et crer facilement des tableaux de bord interactifs.
Nous avons men des recherches pendant plusieurs annes pour mettre en place un systme prenant en charge la capacit naturelle des personnes penser de manire visuelle.
Basculez facilement entre les vues, suivez votre raisonnement naturel. Vous ntes pas
coinc par des assistants dexcution ni oblig de rdiger des scripts. Vous crez simplement des visualisations de donnes riches et harmonieuses.
Cest tellement simple utiliser que cest la porte de nimporte quel utilisateur dExcel.
Obtenez plus de rsultats en fournissant moins defforts. Et cest 10 100 x plus rapide que
les solutions existantes.
www.tableausoftware.com
93
Redesigning
Worldline
Coordonnes
Worldline
River Ouest
80 quai Voltaire
95877 Bezons Cedex
Tl : +33 (0) 4 78 17 69 35
Fax : N/A
Mail : [email protected]
Contact
Gregoire
WIBAUX
Business development & Marketing
stratgique
www.worldline.com
95
www.ysance.com
Ysance
Coordonnes
YSANCE
Tour de lHorloge
4 place Louis Armand
75012 Paris
Cre en 2005 par une quipe dexperts IT, Ysance est une agence
conseil en technologie digitale forte de 100 collaborateurs.
Ysance aide les directions mtier tirer un profit des nouveaux usages du numrique en
accompagnant ses clients dans la conception, la mise en uvre et lanimation de leurs
projets digitaux.
Tl : +33 (0) 1 43 36 23 17
Fax : +33 (0) 1 73 72 97 26
Mail : [email protected]
Contact
Romain
CHAUMAIS
Directeur du Dveloppement
1. Dcouvrir et estimer la valeur dune dmarche Big Data pour son activit
Evaluer les avantages et identifier les mtiers pouvant en bnficier
Imaginer les services, les analyses et les opportunits rendus possibles
Dfinir les scnarios Big Data et les business cases associs
www.ysance.com
97
2013 / 2014