Chapitre 4 - Hbase PDF
Chapitre 4 - Hbase PDF
Chapitre 4 - Hbase PDF
Gestion et Traitement
BIG DATA
Objectifs:
• Comprendre la problématique de stockage de données
• Etude approfondie des bases de données orientées colonnes
• Présentation de HBase comme exemple d’une BD orientée colonnes
• Implémentations:
• Voldemort
• Riak
• Redis
• ……
6
• Implémentations:
• Neo4J
• AllegroGraph
• ….. 8
• Implémentations:
• HBASE (à étudier dans ce cours)
• Cassandra
9
16
Caractéristiques
Permet d'isoler des tables pour des raisons de quotas, de restrictions
géographiques, de sécurité
Deux namespace existent déjà par défaut
hbase : Contient toutes les tables des méta-données de Hbase.
default : namespace par défaut lorsque aucun namespace n'est spécifié à la
création d'une table.
19
nom_namespace : nom_table
20
Principes :
21
22
23
Organisation logique des données : Cell
Principes :
24
Organisation logique des données :
Principes :
Version
Les valeurs au sein d'une cellule sont versionnées
Les versions sont identifiées par défaut par un timestamp (de type long)
Une fois la valeur est écrite dans HBase, Elle ne peut pas être modifiée. Au lieu de cela
une autre version avec un Timestamp plus récent peut être ajoutée.
Le nombre de version que l'on peut stocker par cellule est paramétrable
25
Organisation logique des données :
Valeur
Principes :
26
Organisation logique des données
Valeur Null
• Toutes les opérations de base d’une base de données relationnelle sont aussi
supportées par HBase:
• Ajout et modification de données «PUT»
• 2) Présentation: DataLake ?
• 3) Map-Reduce de Hadoop vs Map reduce de MongoDB.
Quels sont les avantages et les inconvénients de chaque
solution ?
• 4) Présentation: MapReduce en langage R et le RHadoop