Prepare-se para as provas
Obter pontos
Guias e Dicas
Venda na Docsity
Docsity I.A.
ENEM

Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity

Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium

Guias e Dicas

Venda na Docsity

Docsity I.A.

Entrar Cadastre-se

Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity

Encontrar documentos

Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity

Encontra documentos específicos para os exames da tua universidade

Videoaulas

Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade

Quiz

Responda perguntas de provas passadas e avalie sua preparação.

Docsity AINEW

Resuma seus documentos, faça perguntas, converta-os em questionários e mapas conceituais

TCC e ENEM 2026

Estude com provas passadas, TCCs e dicas úteis

Explorar perguntas

Tire suas dúvidas lendo as respostas dadas por outros alunos como você.

Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium

Compartilhe documentos

20 Pontos

Por cada documento compartilhado

Responda às perguntas

5 Pontos

por cada resposta enviada (máx. 1 por dia)

Todas as maneiras de obter pontos grátis

Ganhe pontos imediatamente

Escolha um Plano Premium com todos os pontos que precisa

Oportunidades de estudo

Escolha seu próximo programa de estudos

Entre em contato direto com as melhores Universidades do mundo. Pesquise entre milhares de Universidades e parceiros oficiais

Comunidade

Pergunte à comunidade

Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo

Guias grátis

Os eBooks que salvam estudantes!

Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity

Trabalho machine learning, Trabalhos de Aprendizagem de Máquinas

Universidade Federal do ABC (UFABC)Aprendizagem de Máquinas

Trabalho aprendizado de maquina

Tipologia: Trabalhos

2021

Compartilhado em 11/07/2021

matheus-araujo-79 🇧🇷

2 documentos

1 / 58

Esta página não é visível na pré-visualização

Não perca as partes importantes!

Arthur Henrique Fernandes

Lara Tenore Ferreira

Matheus Eduardo dos Santos Araújo

Naími Moreira Nobre Leite

Rodrigo San Martin

Aprendizado de

Máquina

Projeto ﬁnal

Música

Classiﬁcação

Descubra Trabalhos de Aprendizagem de Máquinas Universidade Federal do ABC (UFABC)

Documentos relacionados

VOLNEI, trabalho

Machine Learning no Mundo Real

Machine Learning iniciante

Trabalho Biodiesel

Trabalho Caldeiras

seguranca do trabalho-nr17

Evolução do trabalho

Trabalho de Materiais

AS I Machine Learning

AS II Machine Learning

Trabalho SDC

Trabalho de oxigenoterapia

Pré-visualização parcial do texto

Baixe Trabalho machine learning e outras Trabalhos em PDF para Aprendizagem de Máquinas, somente na Docsity!

Arthur Henrique Fernandes

Lara Tenore Ferreira

Matheus Eduardo dos Santos Araújo

Naími Moreira Nobre Leite

Rodrigo San Martin

Aprendizado de

Máquina

Projeto final

Música

Classificação

BASE DE DADOS - SPOTIFY_SONGS

playlist_genre

track_popularity

danceability

energy

key

loudness

mode

speechiness

acousticness

instrumentalness

valence

tempo

BASE DE DADOS - SPOTIFY_SONGS

Objetivo: Classificar músicas em gêneros a

partir dos seus parâmetros sonoros

Menos influenciado por outliers Colinearidade Reduz overfitting e variância

Porém: Alto custo computacional para muitas árvores

Limites de decisão complexos Estruturas de alta dimensão Alta acurácia

Rápido Múltiplas classes Variáveis categóricas

Porém: Assume que algumas características são independentes

Naive-Bayes

Porém: Ajuste mais difícil Não lida bem com outliers

Gradient

Boosting

ALGORITMOS

Random

Forest

Limites de decisão

complexos

Estruturas de alta

dimensão

Alta acurácia

Porém: Ajuste mais difícil Não lida bem com outliers

Gradient

Boosting

Learn_rate: taxa de adaptação a cada iteração para evitar o overfitting.

Trees: número de árvores contidas no conjunto

Min_n: número mínimo de pontos de dados em um nó que é necessário para que o nó seja dividido posteriormente

Tree_depth: profundidade máxima da árvore

Parâmetros

Xgboost (padrão), C5.0, spark

Engines

Menos influenciado por

outliers

Colinearidade

Reduz overfitting e variância

Porém: Alto custo computacional para muitas árvores

Random

Forest Mtry:^ número de preditores amostrados aleatoriamente em cada iteração

Trees: número de árvores contidas no conjunto

Min_n: número mínimo de pontos de dados em um nó que é necessário para que o nó seja dividido posteriormente

Parâmetros

AJUSTE DE PARÂMETROS - Naive-Bayes

AJUSTE DE PARÂMETROS - Gradiente Boosting

MÉTRICAS DE AVALIAÇÃO

Acurácia, precisão, sensibilidade,...

Podemos ter problemas se usarmos exclusivamente essas

métricas no caso de termos uma base desbalanceada.

Queremos um classificador otimizado a detectar e ser sensível ,

sem ser impactado pelas porcentagens do conjunto de dados.

Utilizamos então o ROC (taxa de falsos positivos x taxa de

verdadeiros positivos) e consideramos a área abaixo da curva

(AUC-ROC)

Quanto mais próximo de 1 a AUC-ROC for, melhor a performance

do algoritmo.

Usamos o método Hand-Till

MELHORES PARÂMETROS APÓS TUNING

ROC_AUC - 0,

Naive-Bayes

Smoothness - 0.

● Assume que as variáveis são independentes

● Quanto maior o smoothness, mais subajustado e mais viés

MELHORES PARÂMETROS APÓS TUNING

Mtry - entre 2 e 5

ROC_AUC - entre 0, e 0,

Random

Forest

● Quanto maior o Mtry, maior a taxa de sobreajuste

● Quanto menor o Mtry, mais variância.

CONCLUSÃO

Naive-Bayes

ROC_AUC - 0.

Gradient Boosting ROC_AUC - 0.

Random Forest ROC_AUC - 0.

3º

2º

1º

Os dois algoritmos de árvore performaram acima do Naïve Bayes para o presente conjunto de dados.

XGBoost apresenta uma dificuldade de ajuste de parâmetros

Concluímos que, para este conjunto de dados, o Random Forest é o melhor algoritmo dentre os testados.

Here’s what you’ll find in this Slidesgo template:

1. A slide structure based on a consulting sales pitch, which you can easily adapt to your needs. For more info on how to edit the template, please visit Slidesgo School or read our FAQs. 2. An assortment of illustrations that are suitable for use in the presentation can be found in the alternative resources slide. 3. A thanks slide, which you must keep so that proper credits for our design are given. 4. A resources slide, where you’ll find links to all the elements used in the template. 5. Instructions for use. 6. Final slides with: ● The fonts and colors used in the template. ● More infographic resources , whose size and color can be edited. ● Sets of customizable icons of the following themes: general, business, avatar, creative process, education, help & support, medical, nature, performing arts, SEO & marketing, and teamwork.

You can delete this slide when you’re done editing the presentation.

CONTENTS OF THIS TEMPLATE

TARGET Here you could describe the topic of the section

OUR PROCESS

PROBLEM & SOLUTION Here you could describe the topic of the section

Here you could describe the topic of the section

TABLE OF CONTENTS