Artigo de BackPropagation - Artigo sobre BAckpropagation

An´

alise de RNAs como Aproximadores Universais

atrav´

es do Algoritmo Back-Propagation

Antonio Carlos Caldeira Pimenta, mestrando em Engenharia El´

etrica pela

Universidade Federal da Bahia

Resumo — Este artigo apresenta a construc¸˜

ao de uma rede

neural artificial do tipo multi-layer feedfoward perceptron e a

utilizac¸˜

ao da RNA como um aproximador universal assim como a

an´

alise da camada escondida atrav´

es de simulac¸ ˜

oes.

Abstract – This short presents a bulding of the multi-layer feed-

forward perceptron class of artificial neural networks (ANN),

making use of the ANN as an universal function approximation

as well as the analisis of the hidden layer through simulations.

Palavras Chave— Redes Neurais Artificiais (RNA), Back-

Propagation, Aproximador Universal, Perceptron, LMS, Regra do

Delta

I. IN TRODUC¸˜

As redes neurais s˜

ao utilizadas em muitos meios, como, por

exemplo, em sistemas rob´

oticos, mercado financeiro, astrono-

mia, f´

ısica, etc. Desde de meados do s´

eculo XX, a teoria sobre

as RNAs vem sendo desenvolvida; por´

em foi com o advento

computacional que ela cresceu com maior rapidez. Rosenblatt,

1958 [3] e [4], propˆ

os o perceptron original, onde atrav´

es de

amostras entrada-sa´

ıda ele aprenderia uma dada transformac¸˜

(−1,1)N→(−1,1). Rosenblatt comec¸ ou j´

a em 1958 a utilizar

redes neurais como aproximadores, sendo, no caso espec´

ıfico,

para a modelagem de um sistema que envolvia a retina.

O perceptron precisava de uma importante generalizac¸˜

para o treinamento de seu algoritmo. Com isso, em 1960,

Widrow e Hoff [8] propuseram a ”ADApttive LInear NEu-

ron”(ADALINE) ou LMS (least mean square) ou tamb´

em co-

nhecida como regra delta.

Esse perceptron era constitu´

ıdo de N elementos na entrada

e um elemento na sa´

ıda. Perceptrons representam uma func¸˜

discriminante linear, n˜

ao podendo aproximar problemas sim-

ples n˜

ao lineares como uma func¸˜

ao XOR.´

E dito que este tipo

de rede neural n˜

ao ´

e capaz de aprender a classificar func¸˜

oes n˜

linearmente separ´

aveis. Em 1969, Minsky e Papert [7] mostrou

que uma rede de trˆ

es camadas pode superar muitas restric¸˜

oes,

mas n˜

ao apresentou uma soluc¸˜

ao como ajustar os pesos nes-

sas unidades escondidadas. J´

a se sabia, no entanto, que o per-

ceptron de trˆ

es camadas (camada de entrada, camada escondi-

da e camada de sa´

ıda) j´

a era tamb´

em n˜

ao linear. Rumelhart,

Hinton e Williams, em 1986 [5]e [6], apresentaram um trabal-

ho respondendo esta quest˜

ao. A id´

eia central deste trabalho

era que os erros da camada escondida seriam determinados por

uma retro-propagac¸˜

ao dos erros da camada de sa´

ıda. Por es-

ta raz˜

ao, o m´

etodo ficou conhecido como ”back-propagation

learning rule”, o que n˜

ao deixa de ser uma generalizac¸˜

ao do

m´

etodo da regra do delta, de Widrow e Hoff, feito em 1960,

para perceptrons com v´

arias camadas.

Embora o ”back propagation”possa ser aplicado a redes

com muitas camadas escondidas, foi mostrado (Hornik, Stinch-

combe e White [9],1989; Funahashi [10],1989; Cybenko

[11],1989; Hartman,Keeler e Kowalski [12],1990), que ape-

nas uma camada escondida ´

e suficiente para aproximar func¸˜

oes

com precis˜

ao arbitr´

aria, utilizando-se func¸˜

oes de ativac¸˜

ao n˜

ao-

lineares nas unidades escondidas.

Este artigo visa a construc¸˜

ao de uma rede neural utilizando

o algoritmo do back propagation [13]. Atrav´

es deste algoritmo,

com simulac¸˜

oes, procurou se mostrar a propriedade de aproxi-

mador universal. Para isso, foi utilizado o Matlab 6.0.

II. FUNC¸˜

OES D E ATIVAC¸˜

As func¸˜

oes de ativac¸˜

ao utilizadas no algoritmo s˜

ao duas, ou

seja, ou utiliza uma, ou outra, neste caso.

A func¸˜

ao log´

ıstica, tamb´

em conhecida como sigmoidal,

ϕvj(n) = 1

1 + e−avj(n)∴a > 0− ∞ < vj(n)<∞(1)

ϕ0(vj(n)) = ayj(n)[1 −yj(n)] (2)

A func¸˜

ao tangente hiperb´

olica,

ϕ(vj(n)) = atanh(bvj(n)) ∴(a, b)>0(3)

ϕ0(vj(n)) = b

a[a−yj(n)][a+yj(n)] (4)

III. ALGORITMO BACK-PRO PAGATION

H´

a v´

arios m´

etodos de aprendizagem, por´

em o m´

etodo

utilizado para construc¸˜

ao deste perceptron foi o ”back-

propagation”. Podemos encontrar a func¸˜

ao energia dos erros,

chamada de func¸˜

ao objetivo (5). Cinclue todos os neurˆ

onios

na camada de sa´

ıda.

J(n) = 1

j²C

j(n)(5)

O objetivo ´

e encontrar os valores de todos os pesos que min-

imizam a func¸˜

ao J(n), sendo usado para isso o m´

etodo do gra-

diente decrescente. Poderia ser usado outros m´

etodos, como

o m´

etodo de Newton ou o m´

etodo de Gauss-Newton. Logo, a

id´

eia ´

e fazer a mudanc¸a do peso proporcional a derivada nega-

tiva de cada erro em func¸˜

ao de cada peso.

Como o algoritmo consta de trˆ

es camadas, a camada de en-

trada, a camada escondida e a camada de sa´

ıda, vamos fazer por

partes: primeiro, analisando o treinamento da camada de sa´

ıda;

depois, o da camada escondida.

A estrutura de treinamento da RNA ´

e mostrada na figura 1.

Artigo de BackPropagation, Notas de estudo de Mecatrônica

Documentos relacionados

Pré-visualização parcial do texto

Baixe Artigo de BackPropagation e outras Notas de estudo em PDF para Mecatrônica, somente na Docsity!

An´alise de RNAs como Aproximadores Universais

atrav´es do Algoritmo Back-Propagation

Antonio Carlos Caldeira Pimenta, mestrando em Engenharia El´etrica pela

Universidade Federal da Bahia

I. INTRODUC¸ ˜AO