Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Data Mining: Extraindo Conhecimento de Dados Imensos, Notas de estudo de Sistemas de Informação

Data mining é um processo de explicitar o conhecimento interessante de grandes quantidades de dados, que inclui a identificação de padrões, alterações e anomalias. Aplicado em variados setores, como indústria, comércio, medicina e governo, o data mining tem ajudado a otimizar processos, reduzir custos e melhorar decisões. Neste documento, aprenda sobre o processo de data mining, knowledge discovery, diferentes tarefas e aplicações.

Tipologia: Notas de estudo

2016

Compartilhado em 18/08/2016

rodrigo-leite-duraes-11
rodrigo-leite-duraes-11 🇧🇷

4.5

(2)

20 documentos

1 / 36

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Data Mining
Rodrigo Leite Durães
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24

Pré-visualização parcial do texto

Baixe Data Mining: Extraindo Conhecimento de Dados Imensos e outras Notas de estudo em PDF para Sistemas de Informação, somente na Docsity!

Data Mining

Rodrigo Leite Durães

Introdução

 Aplicação de processos de análise

inteligentes visando manipulação automática

de quantidades imensas de dados

 Larga aplicação nos mais variados ramos da

indústria, comércio, medicina, governo,

administração, etc.

Mineração de Dados: Exemplo 2

 Bank of America

– Selecionou entre seus 36 milhões de

clientes

Aqueles com menor risco de dar calotes

Resultado: em três anos o banco lucrou

30 milhões de dólares com a carteira de

empréstimos.

Motivação

 (^) Quantidades imensas de dados  (^) Necessidade de transformar dados em informação útil  (^) Análise de Mercado  (^) Sistemas de Suporte à Decisão  (^) Gerência Empresarial  (^) Análise de tendências, etc.

Data Mining: Definição

 (^) Processo de explicitar o conhecimento interessante de uma grande massa de dados

  • (^) Padrões e relações entre os dados
  • (^) Alterações e anomalias
  • (^) Estruturas significantes
  • (^) Fenômenos periódicos ou desconhecidos
  • (^) Apresentar de forma sucinta e compreensível o conhecimento obtido  (^) É parte do processo de descoberta de conhecimento

Análise de Dados X Data Mining

 (^) Análise de dados

  • (^) Orientado a suposições
  • (^) Formula-se uma hipótese
  • (^) Esta é validada contra os dados  (^) Data mining
  • (^) Orientada a descoberta
  • (^) Padrões são automaticamente extraídos
  • (^) Usa técnicas de IA para reconhecimento e análise do que é interessante ou não
  • (^) Requer muito poder computacional

Pré - processamento

 (^) Data Cleaning

  • (^) Eliminaçao de “ruído”:
  • (^) Dados inválidos
  • (^) Dados incompletos
  • (^) Dados irrelevantes  (^) Data Integration
  • (^) Integração de dados de múltiplas fontes heterogêneas

Pré - processamento

 (^) Data Selection

  • (^) Dados relevantes à análise são recuperados  (^) Data transformation
  • (^) Transformação e consolidação dos dados em um formato apropriado para a mineração
  • (^) Operações de agregação e resumo
  • (^) Processamento analítico (OLAP)

Avaliação e Apresentação

 Avaliação de Padrões

  • (^) Padrões realmente interessantes são identificados
  • (^) Representam o conhecimento desejado
  • (^) Processo baseado em medidas de interesse

 Apresentação do conhecimento obtido

  • (^) Técnicas de visualização e representação
  • (^) O conhecimento minerado é apresentado ao

usuário de forma compreensível e concisa

Data Mining Tasks

 Class Description

  • (^) Caracterização
  • (^) Comparação ou discriminação
  • (^) Propriedades resumidas
  • (^) Quantidade, totais, médias e análise estatística  (^) Exemplo
  • (^) Comparar as vendas de uma empresa na Europa e na Ásia, identificando fatores discriminativos importantes e expondo uma visão global da situação

Data Mining Tasks

 Classificação

  • (^) Processa um conjunto de treinamento (classe)
  • (^) Constrói um modelo para cada classe
  • (^) Gera a árvore de decisão ou conjunto de regras
  • (^) Usada para compreender cada classe e

classificação posterior de novos dados

  • (^) Estatística, BD, redes neurais, aprendizado, etc.

 Ex.: Análise de crédito, modelagem de

empreendimentos, etc.

Data Mining Tasks

 (^) Previsão

  • (^) Prevê os valores possíveis ou a distribuição destes a partir de certos atributos do BD
  • (^) Encontrar os atributos relevantes para o atributo de interesse
  • (^) Previsão baseada no conjunto de dados mais similar ao escolhido
  • (^) Análise de regressão, de correlação, árvores de decisão
  • (^) Algoritmos genéticos e redes neurais
  • (^) Data mining preditivo  (^) Ex.: Previsão de qualidade

Data Mining Tasks

 (^) Análise de séries temporais

  • (^) Identifica regularidades e características temporais interessantes escondidas nos dados
  • (^) Analisa padrões seqüenciais, periódicos, tendências e desvios
  • (^) Busca seqüências similares ou subseqüências  (^) Exemplo
  • (^) Previsão da tendência de variação das quantidades em estoque de uma empresa, baseado no histórico do estoque, situação financeira, atuação da concorrência e situação do mercado

Mining Complex Data

 (^) Dados espaciais  (^) Texto  (^) Multimídia  (^) Séries temporais  (^) Dados complexos  (^) Dados heterogêneos  (^) Semi-estruturados ou desestruturados