Tese 1
Tese 1
Tese 1
Big Data
Data mining
Web Mining
Mineração de Dados Mineração web
A mineração de dados envolve o uso de técnicas para A mineração na Web envolve a análise de registros
encontrar estrutura subjacente e relacionamentos em de servidores da Web de um site.
grandes quantidades de dados.
Aplicativos comuns de mineração de dados descobrem da mesma forma descobrir padrões em dados
padrões em dados estruturados como banco de dados. semiestruturados, como Internet
(WWW). Resumindo : Técnicas Mineração web é
Dados de mineração aplicadas ao WWW.
Ele pode lidar com grande quantidade de dados. Forma/coleta grande quantidade de dados
Ao fazer a mineração de dados de informações Para a mineração na web, os dados são públicos e
corporativas, os dados são privados e muitas vezes raramente exigem direitos de acesso.
requer direitos de acesso para ler.
Uma tarefa tradicional de mineração de dados obtém processar não estruturados ou semiestruturados
informações de um banco de dados, que fornece algum dados de páginas da Web.
nível de estrutura explícita.
Kumar et al 2015
• (“Data collect")
• AND (“Web Mining") scholar
• Cerca 51 resultados
• (“collect")
• AND (“Web Mining")
Scopus
m Clustering
Information vizualization
Web Crawler x
x x
x x
x
x
x
x
x
x
e Wrapper Generation
Page content mining
OEM x
x
x
x
x
x
x
x
Dados de texto: formulário livre, Dados semi estruturados: hiper-links e tags html
não estruturado e dados semiestruturado Tipo de dados multimídia: Texto, imagem, áudio, vídeo.
Padrões são extraídos do texto da linguagem natural em vez Os padrões são extraídos da Web e não do banco de
de banco de dados estruturado. dados estruturado.
Exclui
Termos de busca Web of S Exclui
ndo todos
(Scholar) Science copus ndo
os repetidos
"Social Life Data mining 1 3
Cycle Web Scrapping 0 0
Assessment" Text mining 0 2
OR "SLCA" OR textual mining
"S-LCA" OR 0 0
"Social LCA“ content analysis 4 7
AND Data Science 0 0
Big Data 4 6
"inventory" 36 47
E Excluind
Termos de busca
Web of Science Scopus xcluind o todos os
Titulo e aBS e Key
o repetidos
“Data collect” OR Data mining 198 254
“Collecting Data” AND Big Data 165 293
Text mining 19 21
content analysis 4 164
Data Science 24 38
Web Scraping 2 10
Web Crawler 6 14
Web Mining 2 6