Big Data 2
Big Data 2
Big Data 2
Material Teórico
Definições, Fontes de Dados e Exemplos de Big Data
Revisão Textual:
Prof.ª Dr.ª Selma Aparecida Cesarin
Definições, Fontes de Dados e
Exemplos de Big Data
OBJETIVO DE APRENDIZADO
· Aprofundar-se em outros conceitos sobre Big Data, bem como a ve-
racidade e o valor dos Dados;
· Saber qual é a importância de Big Data, quais são suas principais
fontes de dados e exemplos de Big Data.
Orientações de estudo
Para que o conteúdo desta Disciplina seja bem
aproveitado e haja maior aplicabilidade na sua
formação acadêmica e atuação profissional, siga
algumas recomendações básicas:
Conserve seu
material e local de
estudos sempre
organizados.
Aproveite as
Procure manter indicações
contato com seus de Material
colegas e tutores Complementar.
para trocar ideias!
Determine um Isso amplia a
horário fixo aprendizagem.
para estudar.
Mantenha o foco!
Evite se distrair com
as redes sociais.
Seja original!
Nunca plagie
trabalhos.
Não se esqueça
de se alimentar
Assim: e de se manter
Organize seus estudos de maneira que passem a fazer parte hidratado.
da sua rotina. Por exemplo, você poderá determinar um dia e
horário fixos como seu “momento do estudo”;
No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos
e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você
também encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão
sua interpretação e auxiliarão no pleno entendimento dos temas abordados;
Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus-
são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o
contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e
de aprendizagem.
UNIDADE Definições, Fontes de Dados e Exemplos de Big Data
8
Valor: Investir em Big Data me Dará Retorno?
Explor
Big data pode ter valor para uma Empresa? Procure exemplos.
Cada vez mais, os dados que são produzidos possuem uma vida útil muito curta,
por isso as Organizações devem ser capazes de analisá-los quase em tempo real, se
eles esperam encontrar ideias e oportunidades nesses Dados.
Projetos com Big Data frequentemente não obtêm sucesso quando o V de valor
é ignorado; também foi mostrado que as Empresas que investem em análise de
Dados como um ativo para a tomada de decisão são mais bem sucedidas.
Nesse contexto, o valor é qualquer aplicação de Big Data que impulsione au-
mentos de receita (como a análise de fidelidade de clientes), identifique novas
oportunidades de receita, melhore a qualidade e a satisfação do cliente (como a
manutenção preditiva), economize custos, melhores resultados (por exemplo, aten-
dimento ao paciente).
Já há novas referências que apontam que Big Data pode ter até dez Vs, nesse
caso, acrescentando:
• Variabilidade: que possui relação com as inconsistências que poderão ser
encontradas nos Dados, dada as diversas fontes de Dados e à quantidade de
dimensões que os Dados poderão possuir;
• Validade: que possui relação com a veracidade dos Dados, nesse caso, com a
correção dos Dados, uma etapa importante no dia a dia do analista de Dados;
• Vulnerabilidade: os Dados provenientes das fontes de Big Data poderão
também sofrer ataques, em especial de roubo de Dados. Sua proteção é um
grande desafio;
9
9
UNIDADE Definições, Fontes de Dados e Exemplos de Big Data
Soluções de Big Data são ideais quando todos, ou a maioria, dos Dados preci-
sam ser analisados contra uma amostragem de Dados não é tão eficaz como um
conjunto maior de Dados do que para derivar análise (confrontar as análises).
Soluções de Big Data são ideais para análise exploratória, iterativa e quando as
medidas comerciais sobre os Dados não são predeterminadas.
10
Embora existam certamente diferenças e variações entre as Indústrias, cinco
casos de uso primário surgiram em torno desses desafios:
• Grande exploração de Dados;
• Vista 360° do cliente;
• Extensões de segurança e inteligência;
• Análise de operações;
• Aumento do Data Warehouse.
11
11
UNIDADE Definições, Fontes de Dados e Exemplos de Big Data
New
Sensors Sources
producing BIG DATA EXPLORATION
readings Characteristics:
· Raw data
Internet · Structured data
· Unstrutured data
Social Media
Blogs, tweets, sites de Redes Sociais (por exemplo, LinkedIn e Facebook),
feeds de notícias, fóruns de discussão, sites de vídeos, e todos os outros abaixo des-
sa categoria, possuem APIs específicas para resgate de Dados e seus metadados.
Web Logs
Os logs de serviços WEB existem em vários semiestruturados formatos. Tipica-
mente, eles possuem informações a respeito do ambiente de execução, entradas
sobre as atividades do servidor de aplicação e, essencialmente, tudo o que acontece
no servidor. Tradicionalmente, um log contém informações transacionais de cada
conexão, a origem, o início e o fim das requisições e conexão, incluindo qualquer
erro que tenha ocorrido.
12
Observa-se que diversos sites ou Sistemas disponibilizam os dados de clima
em tempo real e em vários formatos, como numéricos ou textuais, como, por
exemplo, 26 graus celsius e com nuvens esparsas ou September 24, 2016 at
17:56, 26 degrees.
Celsius com poucas nuvens; note que para uma aplicação deverá existir um
padrão de leitura.
GPS ou Geolocalização
Dados de geolocalização se tornaram ubíquos. Temos como origens desses da-
dos, Sistemas de GPS em veículos, aviões, navios, smartphones e utilizamos esses
dados para guiar nossos movimentos ou para rastrear nossos movimentos em apli-
cações de segurança ou emergência, ou para rastreamento de nossos smartphones
em lojas e shoppings em busca de análise de comportamento.
Streaming Data
Os dados de fluxo são uma categoria especial de Big Data; ao invés de ser um
formato, é um tipo especial de processamento. A transmissão é contínua de qual-
quer tipo de Dados e quase em tempo real. Alguns exemplos de aplicações de fluxo
contínuo incluem detecção de fraude, segurança física, monitoramento de tráfego,
monitoramento veicular ou monitoramento médico.
Os tipos de origens de dados para Big Data não se limitam a esses colocados
no texto; porém, essas categorias englobam grande parte dos exemplos de fontes
de Dados em Big Data.
13
13
UNIDADE Definições, Fontes de Dados e Exemplos de Big Data
14
Material Complementar
Indicações para saber mais sobre os assuntos abordados nesta Unidade:
Sites
TDWI
Leitura na ual o autor coloca novos Vs em Big Data, com novas variações.
https://bit.ly/3Qs3ABd
Exame
Artigo com entrevista com um especialista e fundador da Empresa R18.
https://bit.ly/3C7L24P
DataFloq
Referência que ilustra as diversas fontes de dados em Big Data.
https://bit.ly/3A2KoD1
Leitura
Você realmente sabe o que é Big Data?
Artigo IBM sobre Big Data.
https://ibm.co/3w94ytS
15
15
UNIDADE Definições, Fontes de Dados e Exemplos de Big Data
Referências
BALLARD, Chuck et al. Information Governance Principles and Practices for
a Big Data Landscape. USA: Redbook IBM 2014. Disponível em: <http://www.
redbooks.ibm.com/abstracts/sg248165.html?Open>.
16