Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Projeto de números de clusters, Exercícios de Mineração de Dados

Experimento feito com o Kmeans utilizando o Weka para encontrar o melhor número de clusters. Trabalho de Ciência de dados. Ano 2024.

Tipologia: Exercícios

2024

Compartilhado em 31/08/2024

thiago-almeida-off
thiago-almeida-off 🇧🇷

5 documentos

1 / 3

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Atividade 01
Utilizando como base o arquivo "A4.csv", executei o experimento com o
Kmeans no Weka, conforme solicitado, e constatei que o melhor número de
clusters para o modelo gerado é sete (07). Esta afirmação se refere aos valores
identificados com o erro RMS, como nos mostrará posteriormente o gráfico mais
abaixo. É possível verificar que a Curva do Joelho no gráfico ocorre entre o
sexto e o sétimo cluster.
A Tabela 1, colocada acima, é resultado da execução com o experimento
Kmeans com a base disponível no programa Weka. Iniciei com 1 cluster, gerando
um RMS e fui aumentando gradativamente a quantidade de clusters,
armazenando também o número de RMS.
O Gráfico 1, logo abaixo, nos mostra o ponto ideal, a Curva do Joelho,
onde podemos enxergar qual o melhor número de clusters gerado. Já o Gráfico
2 nos mostra, mais detalhadamente, a execução do gráfico 1.
Tabela 1
pf3

Pré-visualização parcial do texto

Baixe Projeto de números de clusters e outras Exercícios em PDF para Mineração de Dados, somente na Docsity!

Atividade 01

Utilizando como base o arquivo "A4.csv", executei o experimento com o Kmeans no Weka , conforme solicitado, e constatei que o melhor número de clusters para o modelo gerado é sete (07). Esta afirmação se refere aos valores identificados com o erro RMS, como nos mostrará posteriormente o gráfico mais abaixo. É possível verificar que a “Curva do Joelho” no gráfico ocorre entre o sexto e o sétimo cluster.

A Tabela 1 , colocada acima, é resultado da execução com o experimento Kmeans com a base disponível no programa Weka. Iniciei com 1 cluster, gerando um RMS e fui aumentando gradativamente a quantidade de clusters, armazenando também o número de RMS.

O Gráfico 1 , logo abaixo, nos mostra o ponto ideal, a “Curva do Joelho”, onde podemos enxergar qual o melhor número de clusters gerado. Já o Gráfico 2 nos mostra, mais detalhadamente, a execução do gráfico 1.

Tabela 1

Assim chegamos no final da primeira parte da atividade. Iniciaremos a segunda parte.

Gráfico 01

Gráfico 02