Min Dados @1
Min Dados @1
Min Dados @1
MINERAÇÃO DE DADOS
Crédito: Aleutie/Shutterstock.
2
A mineração de dados, somada à área de gestão e descoberta do
conhecimento em bases de dados, se destaca na formação de uma nova área
importante e promissora. A junção dessas áreas diz respeito à quantidade elevada
de dados na atualidade e também à carência das organizações na transformação
desse volume de dados em informação útil.
4
O volume de dados estruturados e não estruturados em larga escala
encontrado hoje fornece por meio de um processo de análise informações úteis a
serem utilizadas pelas organizações. Estas, por sua vez, passam a evoluir frente
ao desenvolvimento tecnológico. Como exemplos dessas empresas utilizadoras
da tecnologia da mineração de dados, destacam-se:
5
ferramentas atuam principalmente no processo de análise de dados de maneira a
gerar informações que gerem conhecimento. O processo de gerar o conhecimento
ocorre pela mineração de dados, tornando-se vital no apoio à tomada de decisão.
A informação é um dos ativos mais importantes para os negócios das
organizações, além de ser um diferencial na competitividade. As estratégias que
assumem estão baseadas em informações factíveis, minimizando erros que
possam ser cometidos por gestores na tomada de decisão. A evolução
tecnológica possibilitou a criação de processos como o Knowledge Discovery in
Database (KDD), que possibilita a descoberta de conhecimento em banco de
dados.
2.2.1 Classificação
6
A definição dos clusters se estabelece mediante a formação de grupos de
dados fundamentados em medidas de similaridade ou em modelos
probabilísticos. O objetivo é detectar a existência de grupos diferenciados
inseridos em um conjunto de dados.
2.2.4 Sumarização
2.2.5 Dependência
Esse modelo opera pela forma como ocorrem as relações entre diferentes
campos de um banco de dados, portanto associando valores correlatos que
venham a se tornar significantes.
7
Como ambos os conceitos se distinguem, o KDD faz surgir uma nova
demanda por ferramentas e técnicas de análise de dados. Essa demanda
contempla uma série de etapas que representam melhor sua aplicação. Nelas
podemos entender melhor a forma de extração de conhecimento de dados e
entender como os elementos de dados e padrões se relacionam. Dessa maneira,
a mineração de dados pressupõe as fases do descobrimento do processo de KDD,
que visa descobrir o conhecimento em banco de dados, sendo esse processo
dividido em etapas.
9
Assim, podemos ter um conjunto de itens:
10
contínua em formato escalar. Como exemplo temos os números que podem ser
fracionados, como o diâmetro de um objeto ou sua inclinação.
Após efetuar a coleta de dados, pode-se identificar uma curva de tendência
ou medida de tendência central, além de um indicador para a variação dos dados.
Os dados em formato numérico em geral utilizam essa medida de tendência
central para o posicionamento de uma média, sendo a variação ou a variabilidade
definida como um desvio padrão, que normalmente é atribuído a variáveis do tipo
paramétrica ou contínua.
Para uma variável do tipo qualitativa para dados, é atribuído um número
limitado de valores ou de categorias. Esses valores podem ser classificados de
modo ordinal ou nominal. Para uma classificação ordinal, a escala deverá ser
determinada sempre de forma crescente entre as diversas categorias. Podemos
citar como exemplo desse tipo de classificação um índice qualquer que possua
uma escala ordinal de 0 a 4.
11
REFERÊNCIAS
WITTEN, I. H.; FRANK, E.; HALL, M. A. Practical machine learning tools and
techniques. Burlington: Morgan Kaufmann, 2005.
12