Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
KDD - Clustering
Tipologia: Notas de estudo
1 / 57
Esta página não é visível na pré-visualização
Não perca as partes importantes!
Prof. Rodrigo Leite Durães. [email protected]
(^) Cluster: um grupo de objetos
(^) Marketing: Ajuda os marqueteiros a descobrir grupos de clientes e usa esse conhecimento para orientar as campanhas publicitárias
(^) Solo: Identificação de áreas de propriedades similares
(^) Seguro: Identificação de grupos de segurados com um custo médio elevado de reembolso
(^) Planejamento Urbano: Identificação de grupos de habitação segundo o tipo, valor e localização geográfica
(^) Um bom método de agrupamento fornece grupos de
alta qualidade com
tanto da medida de similaridade usada pelo método como da sua implementação.
(^) A qualidade de um método de agrupamento é também
medido pela sua habilidade para descobrir os padrões escondidos.
a) aquisição dos dados
c) Construção da Tabela de Dados d) Cálculo da Proximidade
(^) Variáveis de escala intervalar:
(^) Variáveis Binárias:
(^) Variáveis Nominais, Ordinais, Proporcionais:
(^) Variáveis de tipo mixto:
(^) Distancias são normalmente usadas como medida de
dissimilaridade entre objetos
onde i = ( xi1, xi2, …, xip) e j = ( xj1, xj2, …, xjp) são dois vetores p- dimensionais, e q é um inteiro positivo
d ( i , j )^ q^ (| x i 1 x j 1 | q | x i 2 x j 2 |^ q ...| x ip x j p | q )
Outros aspectos relativos aos índices de proximidade
0
1
2
3
4
5
0 1 2 3 4 5
e e
e (^) e e 1 2
(^43) 5
K P l
1
1 ) 1 , , tem- se
0
1
2
3
4
5
0 1 2 3 4 5
e e
e (^) e e 1 2
(^43) 5
Pl P m
m K então
3 ) , 1 ,, el m
Métodos de AgrupamentoMétodos de Agrupamento
Em Taxinomia Numérica distingue-se três grupos de Em Taxinomia Numérica distingue-se três grupos de métodos métodos
Técnicas de Otimização Técnicas de Otimização
Objetivo: obter uma partição. Número de grupos Objetivo: obter uma partição. Número de grupos fornecido pelo usuário fornecido pelo usuário
Técnicas hierárquicas Técnicas hierárquicas
Objetivo: obter uma hierarquia (ou uma pirâmide) Objetivo: obter uma hierarquia (ou uma pirâmide) Pode-se obter uma partição “cortando-se” a Pode-se obter uma partição “cortando-se” a hierarquia em um determinado nível. hierarquia em um determinado nível.
Métodos de AgrupamentoMétodos de Agrupamento
Técnicas de Cobertura Técnicas de Cobertura
Objetivo: obter grupos que eventualmente podem Objetivo: obter grupos que eventualmente podem partilhar indivíduos. partilhar indivíduos.
Outros Aspectos Relativos aos Métodos de Outros Aspectos Relativos aos Métodos de Agrupamento Agrupamento
Métodos Aglomerativos versus Métodos Divisivos Métodos Aglomerativos versus Métodos Divisivos
Métodos Monotéticos versus Métodos Politeticos Métodos Monotéticos versus Métodos Politeticos
(^) Métodos que fornecem uma partição: Construa várias
partições que são então avaliadas segundo algum critério
(^) Métodos Hierarquicos: Fornece uma decomposição
hierarquica dos objetos segundo um critério particular
(^) Métodos de Densidade: basedos em conectividade e
funções de densidade
(^) Grid: baseado em estruturas de níveis de granularidade
multipla
(^) Modelo: Supõe-se um modelo para cada cluster e tenta-
se achar o melhor ajustamento entre o modelo e o cluster
(^) Métodos que fornecem uma partição: Produz uma
grupos
um dado critério