01 - DataScience
01 - DataScience
01 - DataScience
SCIENCE
Por que a
teoria?
Tal como Business Intelligence,
Data Science é muito amplo, e
costuma causar confusao
quanto aos conceitos e áreas.
a introducao se faz
necessária
para que o aluno saiba para
que área seguir.
Introducao
A DataScience
o que há em
comum nas
seguintes
empresas?
+ informacoes
+ poder
= pessoas para interpreta-las
Área em crescente
demanda
Com a importância da
Informacao, a profissao
de cientista de dados é a
que mais cresce atualmente
+ informacoes
Varejo
+ poder
= pessoas
Reconhecimento de Voz para interpreta-las
Estima-se que em
torno de 90% dos
dados
Saúde armazenados na
web tenham sido
gerados somente
Comunicacao nos últimos 2 anos.
Seguranca
O que é INSIGHT?
Planejamento nao é
certeza. Nunca.
Ciência de Dados é o processo
De diversas fontes
Em diferentes velocidades
Gerando valor
Saúde
Infra
Progra
macao
Data
Science Vendas
Banco
Industria
Agregando valor
Machine
para o negócio
Learning
Engenharia de Dados
onde nos referimos ao profissional capaz de projetar o
armazenamento de grandes quantidades de dados
Pensamento Lógico
Capacidade do profissional de analisar os dados e
aprender algo novo com ele, agregando aos negócios
Virtualizacao e
Cloud
O armzenamento de grandes massas de
dados consequentemente requer um poder
maior de processamento. Isso favorece ao
crescimento de áreas como BigData e NoSQL
e com isso, o processamento horizontal.
Big
Data
Bancos nao relacionais
P R O C E S S A M E N T O H O R I Z O N TA L
horizontal.
E afinal, o que é Machine Learning?
O conceito mais
básico de
Machine
Learning:
Robôs atuando
na linha de
producao
automotiva.
Machine Learning é uma
sub área de Inteligência
Artificial
Funcionamento Geral de Machine Learning
Programamos as máquinas para aprenderem com os dados coletados.
Aprendizagem
com algoritmos Saída produzida
Coleta de Dados de Machine para o usuário
Learning
1 2 3
Data science e Estatística
Anteriormente vimos que o aprendizado de máquina dá-se pela
coleta de dados, aprendizagem e saída de um resultado.
De uma maneira simples, podemos definir estatística da seguinte
forma:
Coleta Aplicação de
Definição de um Organização
dos métodos Saída
problema dos Dados
Dados estatísticos
Algoritmos de Machine
Learning utilizam
estatística!!
Visao Macro de Projetos de Data Science.
Definição do Entender o Conhecer os
PREPARAÇÃO
Objetivo problema Dados
Obtenção e
ENGENHARIA DE Transformação e Persistência dos
limpeza dos
DADOS
enriquecimento dados
dados
Análise
ANALYTICS
Exploratória e Modelagem e
Comunicação
Inferências Predição
PRODUÇÃO
Produtos de Operacionalizar Otimização
Dados
Roadmap de Tecnologias
Entregáveis
1 Relatórios
2 Storytelling
3 Dashboards
4 Aplicações