O Que É Big Data?

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 3

Paulo Cosmo Jr. - paulocosmojr - bit.

ly/CosmoBenedicti

O que é Big Data?

Direito Digital
Palavras-Chave: Conjunto de dados. Volume, Velocidade e Variedade. Dados
estruturados e não estruturados.

Big data é um termo que comumente se refere a conjuntos de dados


extremamente grandes que públicos e organizações privadas coletam, portanto,
uma tradução literal seria justamente esse conjunto de dados.
Embora os humanos tenham gerado e coletado grandes volumes de dados
muito antes do termo “big data” se tornar popular, avanços recentes em
tecnologias de sistemas de armazenamento digital tornaram mais eficiente não
apenas gerenciar essas grandes e crescentes quantidades de dados, mas também
analisá-los e gerar o conhecimento de informações relevantes, padrões e
tendências.
Em uma conferência em 2010, o executivo do Google presidente, Eric
Schmidt, observou que “a quantidade de dados está sendo criada a cada dois
dias, como foi criado desde o início da civilização humana até o ano de 2003”.
Hoje criamos 2,5 quintilhões de bytes de dados todos os dias - uma tendência que
é resultado, em parte, do advento de dispositivos inteligentes habilitados para
internet, também chamados de “dispositivos IoT (Internet das Coisas)”.

1
Em 2001, o analista Doug Lancey apresentou um trabalho de pesquisa
intitulado “3D Management: Controlling Data Volume, Velocity, and Variety”.
Nele, ele definiu 3 desafios aos princípios tradicionais de gerenciamento de dados
que são, ainda hoje, um modelo aceito para descrever big data.
Os “três V’s” do modelo de Lancey foram Volume, Velocidade e Variedade:

1) Volume de dados: A quantidade cada vez maior de dados sendo gerados.

2) Velocidade de dados: Hoje, os dados são gerados quase em tempo real. Se é


humano dados gerados, como dados de vendas de cartão de crédito no ponto de
venda e mídias sociais dados de interação ou gerados por máquina, como tags
RFID e dados de sensores.

3) Variedade de dados: os dados vêm em uma ampla variedade de formatos,


incluindo numérico, texto, imagens, voz e vídeo entre outros. Esses formatos
podem ser amplamente classificados em duas categorias: dados estruturados e
não estruturados.

a) Dados estruturados podem ser pré-organizados em bancos de dados


tradicionais como linhas e colunas nas quais eles podem ser facilmente
classificados, pesquisados ​e manipulados em outras formas de análise. Por
exemplo, um designer de banco de dados pode configurar campos para números
de telefone, códigos postais e números de cartão de crédito que aceitam
determinado número de dígitos. Quaisquer dados estruturados que precisem ser
armazenados em esse banco de dados pode ser facilmente mapeado para esses
campos.

b) Dados não estruturados como documentos de texto, e-mail, vídeo, áudio,


satélite imagens, dados de cotações de ações e transações financeiras não se

2
encaixam no arquitetura tradicional de linha-coluna de bancos de dados. Em
contrapartida, é muito difícil criar tais campos predefinidos para dados não
estruturados. Dados não estruturados representam mais de 95% de todos os
dados que são gerados hoje de acordo com algumas estimativas.

GLXOJ101, N. Open Justice. 2022.

Você também pode gostar