pGSUHQji1iCLbeBXVleRpfull Gerenciamento Big Data Aula-2

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 23

Gerenciamento de Big Data

Mathias Brem Garcia


GERENCIAMENTO DO BIG DATA
● Revisão
● Arquitetura Lambda
● Data Lake
● Data Warehouse

Aula 2 ●

Data Mart
Abordagens para suportar análises em
tempo real
● Abordagens de Big Data na Cloud
Computing
● LAB 2 - Hands-On Hadoop : ( Hive + Oozie )
DATA LAKE x DATA WAREHOUSE X DATA MART

Desafios do universo de dados e mercado


profissional
Arquitetura Lambda

GORELIK, A. The Enterprise Big Data Lake, O’Reilly Media, 2019.


O que é Data Lake?

● Volume
● Velocidade
● Variedade

Fonte: NIST.http://dx.doi.org/10.6028/NIST.SP.1500-1
O que é Data Lake?

● É o conceito empregado para armazenar e ou catalogar


as informações a fim de atender os princípios
estabelecidos do Big Data, sendo eles os 3’vs (
Volume, Velocidade, Variedade ) para atender a esses
requisitos podemos utilizar de diversas tecnologias e
plataformas. Veja a seguir.

GORELIK, A. The Enterprise Big Data Lake, O’Reilly Media, 2019.


Tipos de Data Lake

GORELIK, A. The Enterprise Big Data Lake, O’Reilly Media, 2019.


O que é Data Lake?

GORELIK, A. The Enterprise Big Data Lake, O’Reilly Media, 2019.


O que é Data Lake?
O que é um Data Warehouse?

GORELIK, A. The Enterprise Big Data Lake, O’Reilly Media, 2019.


O que é um Data Warehouse?

GORELIK, A. The Enterprise Big Data Lake, O’Reilly Media, 2019.


O que é um Data Warehouse?

GORELIK, A. The Enterprise Big Data Lake, O’Reilly Media, 2019.


O que é um Data Warehouse?

● Data Warehouse tem um modelo de dados bem


definido para que as entidades relacionais sejam de
fácil acesso aos seus respectivos usuários.
Possibilitando o cruzamento e agregação dessas
entidades de maneira simples e fácil.

● Data Warehouse provê a documentação e padrões


necessários aos seus usuários.
O que é Data Mart?

● Uma tabela ou view dependendo da tecnologia, que possua


todos os dados e dimensões necessárias para uma
determinada análise. Evitando assim a complexidade, tempo e
documentações necessárias para a construção de uma solução
completa de Data Warehouse ou ainda sendo parte de uma
solução de Data Warehouse como fonte de consumo imediato
dos dados já selecionados, limpos e preparados para o
consumo específico.
● O dado é disposto como o mesmo deverá ser consumido, ou
apresentado.
GORELIK, A. The Enterprise Big Data Lake, O’Reilly Media, 2019.
O que muda com a adoção do Hadoop?

GORELIK, A. The Enterprise Big Data Lake, O’Reilly Media, 2019.


O que muda com a adoção do Hadoop?

GORELIK, A. The Enterprise Big Data Lake, O’Reilly Media, 2019.


Arquitetura Lambda Novamente...
Arquitetura Lambda Novamente...
Análises em Tempo Real

GORELIK, A. The Enterprise Big Data Lake, O’Reilly Media, 2019.


Lambda na Microsoft Azure
Lambda na Google Cloud Platform
Lambda na Amazon

Você também pode gostar