Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Regressão Linear e Otimização Numérica, Slides de Aprendizagem de Máquinas

Este documento aborda a revisão de regressão linear, método do gradiente, normalização de atributos e introdução à otimização numérica, incluindo problemas de otimização sem restrições, convexidade e exemplos de métodos de otimização. Além disso, é apresentado o método do gradiente para regressão linear e a escolha da taxa de aprendizado.

Tipologia: Slides

2020

Compartilhado em 17/03/2020

luccas-cg
luccas-cg 🇧🇷

5 documentos

1 / 43

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Regressão Linear (II)
Prof. Danilo Silva
EEL7514/EEL7513 - Tópico Avançado em Processamento de Sinais:
Introdução ao Aprendizado de Máquina
EEL / CTC / UFSC
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b

Pré-visualização parcial do texto

Baixe Regressão Linear e Otimização Numérica e outras Slides em PDF para Aprendizagem de Máquinas, somente na Docsity!

Regressão Linear (II)

Prof. Danilo Silva

EEL7514/EEL7513 - Tópico Avançado em Processamento de Sinais:

Introdução ao Aprendizado de Máquina

EEL / CTC / UFSC

Tópicos

I (^) Regressão linear: revisão

I (^) Método do gradiente

I (^) Normalização de atributos

Regressão Linear

I (^) Modelo de regressão linear:

ˆy = f (x) = w 0 + w 1 x 1 + · · · + wnxn = w

T x

onde

I (^) y ∈ R é o valor-alvo do qual yˆ ∈ R é uma predição

I (^) x =

[ 1 x 1 · · · xn

]T ∈ R

n+ é o vetor de atributos

I (^) w =

[ w 0 w 1 · · · wn

]T é o vetor de parâmetros

I (^) Conjunto de treinamento D = {(x(1), y(1)),... , (x(m), y(m))}

organizado em uma matriz de projeto e um vetor de rótulos

X =

— (x

(1) )

T —

. . .

— (x

(m) )

T —

 e^ y^ =

y

(1)

. . .

y

(m)

Exemplo

Exemplo

Mínimos quadrados

I (^) Função custo:

J(w) =

m

∑^ m

i=

(w

T x

(i) − y

(i) )

2

m

‖Xw − y‖

2

I (^) Gradiente:

∇J(w) =

m

X

T (Xw − y)

I (^) Solução ótima (equação normal):

w = (X

T X)

− 1 X

T y

Limitações da solução analítica

I (^) Nem todas as funções custo admitem solução analítica

I (^) Ex: regularização 1 , perda 1 (MAE), outras perdas

I (^) Calcular XT^ X pode ser computacionalmente custoso para n muito

grande: a ordem de complexidade (em número de operações) é O(mn

2 )

I (^) Solução: métodos iterativos de otimização

Introdução à Otimização

Numérica

Exemplo

Convexidade

I (^) Se J(w) é uma função convexa, então todos os pontos estacionários

são mínimos globais (i.e., a condição de 1

a ordem é suficiente)

I (^) Uma função é convexa se todo segmento de reta conectando dois

pontos no gráfico da função situa-se inteiramente acima da função

Exemplo

Exemplo

Exemplo

I (^) O gradiente indica a tangente, enquanto a hessiana indica a curvatura

I (^) Ex:

J(w) =

1 m

‖Xw − y‖

2

  • λ

1 m

‖w‖

2

∇J(w) =

2 m

XT^ (Xw − y) + λ

2 m

w

2 J(w) =

2 m

X

T X + λ

2 m

I

Exemplo

Q =

[

]

Q =

[

]

Q =

[

]

J(w) =

w

T Qw, Q = Q

T =⇒ ∇

2 J(w) = Q

I (^) Os autovalores da hessiana estão associados ao grau de curvatura