Trabalho - Redes Bayesianas - Inteligência Artificial, Trabalhos de Engenharia Informática
eliezer-de-souza-da-silva-8
eliezer-de-souza-da-silva-8

Trabalho - Redes Bayesianas - Inteligência Artificial, Trabalhos de Engenharia Informática

5 páginas
50Números de download
1000+Número de visitas
1Número de comentários
Descrição
Trabalho sobre redes bayesianas da disciplina de inteligência artificial.
80 pontos
Pontos de download necessários para baixar
este documento
Baixar o documento
Pré-visualização3 páginas / 5
Esta é apenas uma pré-visualização
3 mostrados em 5 páginas
Esta é apenas uma pré-visualização
3 mostrados em 5 páginas
Esta é apenas uma pré-visualização
3 mostrados em 5 páginas
Esta é apenas uma pré-visualização
3 mostrados em 5 páginas
trabalho-bayesnet

Universidade Federal do Espírito Santo Centro Universitário Norte do Espírito Santo

Departamento de Engenharias e Computação Curso de Engenharia de Computação

Inteligência Artificial

prof. Luís Rigo

Redes Bayesianas Eliezer de Souza da Silva

1. Introdução Ao raciocinarmos sobre qualquer domínio real, devemos fazer algumas simplificações. Se quisermos adicionar qualquer dose de realismo ao nosso raciocínio devemos levar em conta a incerteza do conhecimento do domínio real que estamos tratando. Ou seja, um modelo determinístico do mundo real é praticamente inviável – temos sempre que lidar com a incerteza. “Incerteza origina-se de alguma deficiência da informação. A informação pode estar

incompleta, ser vaga, imprecisa ou contraditória” [1]. Para lidarmos com o problema da incerteza e incompletude nos modelos do mundo real, precisamos de uma linguagem apropriada e uma representação adequada (formalmente e computacionalmente) do modelo. A linguagem mais apropriada para lidar com a incerteza é a linguagem da probabilidade – dizemos que estamos fazendo uso do Raciocínio Probabilístico. Através do raciocínio probabilístico podemos atribuir um grau de crença às relações do domínio real. As relações de independência e independência condicional são extremamente importantes na simplificação da representação probabilística do mundo real [2]. Outra relação muito importante é a relação de causalidade entre eventos, e as respectivas probabilidades condicionais a priori e a posteriori da ocorrência de ocorrência de um certo evento. Neste contexto, as redes bayesianas aparecem como uma metodologia com a possibilidade de representar o conhecimento incerto, bem como executar raciocínios sobre este conhecimento incerto.

2. Conceitos da Teoria da Probabilidade e Teoria de Grafos. Antes de prosseguirmos com os conceitos próprios das redes bayesianas iremos resgatar alguns conceitos da teoria de probabilidade [3] e teoria dos grafos. - Espaço Amostral: é o conjunto de todas configurações possíveis do domínio considerado. - Evento: é um subconjunto do espaço amostral. - Probabilidade Condicional (a posteriori): probabilidade de um evento A acontecer dado que um evento B aconteceu.

- Eventos Independentes: E e F são independentes se o conhecimento da ocorrência de F não afeta a probabilidade de que E ocorra. Isto é, a ocorrência de E não depende da ocorrência de F.

- Variável Aleatória: É aquela que assume valores num espaço amostral e para a qual está determinada a probabilidade de ocorrência de cada um dos elementos do espaço amostral. - Teorema de Bayes: permite calcular a probabilidade a posteriori de um evento, dado a ocorrência de um outro evento.

- Distribuição de Probabilidade Conjunto: probabilidade de vários eventos acontecerem simultaneamente. - Grafo Direcionado: um grafo direcionada G=(V,E), é um conjunto V de vértices e um conjunto de arcos   , |,    . - Caminho em um Grafo Direcionado: uma sequência de nós, com que respeita as seguintes propriedade  , onde   ,     , ,  ,   . - Circuito: caminho com nós repetidos. - Grafo Direcionado Acíclico (DAG): é um grafo direcionada G=(V,E), sem nenhum circuito. Seria o equivalente de árvores para dígrafos.

3. Redes Bayesianas Redes Bayesianas são um modelo de representação do conhecimento que trabalham com o conhecimento incerto e incompleto através da Teoria da Probabilidade Bayesiana, publicada pelo matemático Thomas Bayes em 1763. Segue uma lista de marcos históricos importantes na área de redes bayesianas:

• 1763 - Rev. Thomas Bayes; • Anos 80 - Judea Pearl (Probabilistic Reasoning in Intelligent Systems); • 1980: desenvolvimento de métodos eficientes para abordar a ambiguidade ou falta de

informação

• 1993 – Microsoft contrata Eric Horvitz, David Heckerman e Jack Breese para explorar esta abordagem nos seus produtos Microsoft Office e usa esta tecnologia para fornecer ajuda ao utilizador baseado na historia passada, na forma como o mouse se movimenta e na atividade em curso.

• Se as acções mostram que o utilizador está distraído, é provável que necessite de ajuda. Se está a trabalhar num gráfico, a hipótese plausível é de que necessite de ajuda na formatação.

O conhecimento incerto é aquele que apresenta deficiências. Em algum momento, os dados podem ser uma representação não exata, parcial ou aproximada da realidade. Essa representação tem como uma das suas principais características a adaptabilidade, podendo, a partir de novas informações, e com base em informações de fundo verdadeiras, gerar alterações nas dependências e nos seus conceitos. Permite, dessa forma, que as probabilidades não sejam meros acasos, podendo confirmar e criar novos conceitos. É importante observar que o modelo baseia-se em probabilidades prévias mais algumas informações com um certo nível de incerteza, para representar o conhecimento. Um modelo totalmente incerto não seria de grande utilidade e não teria ponto de partida para a manipulação de suas situações e a geração de novas representações. A representação da Rede Bayesiana é feita através de um grafo direcionado acíclico no qual os nós representam variáveis de um domínio e os arcos representam a dependência condicional ou informativa entre as variáveis. Para representar a força da dependência, são utilizadas probabilidades, associadas a cada grupo de nós pais-filhos na rede [2].

Fig. 1 – Exemplo de Rede Bayesiana mostrando as folhas da árvore independentes entre si.

Atualmente a utilização das Redes Bayesianas tem crescido bastante para a resolução de problemas relacionados a WEB. A filtragem de SPAM, usualmente feita através da utilização de filtros que não contém inteligência, está, com projetos como o Bogofilter, se utilizando de mecanismos de Inteligência Artificial para aumentar a sua eficiência.

4. Aprendizado Com Redes Bayesianas Como vimos anteriormente, a rede bayesiana, representa a estrutura do modelo, ou seja, a rede bayesiana tem em si o conhecimento do domínio em questão. Portanto o aprendizado em redes bayesianas se trata de como construir uma rede bayesiana que modela um conjunto de dados amostrados do domínio. Basicamente temos dois tipos de aprendizado em redes Bayesianas: aprendizado de estrutura e aprendizado de parâmetros. Levando em conta os dois tipos de aprendizado anteriores, podemos dividir esta tarefa em quatro problemas de aprendizagem:

Estrutura conhecida e variáveis completamente observáveis: as tabelas de probabilidade condicionada podem ser estimadas usando o conjunto de exemplos com classificador ingênuo de Bayes.

Estrutura desconhecida e variáveis completamente observáveis: neste caso o problema é construir a topologia da rede. A solução é uma Busca no espaço de estruturas. Para esta tarefa cabe o uso de heurísticas na busca da estrutura de rede ótima.

Estrutura conhecida e variáveis escondidas: caso parecido com aprendizado em redes neurais.

Estrutura desconhecida, variáveis escondidas: não se conhece algoritmos para este tipo de problema.

5. Inferência

Uma vez que uma rede bayesiana totalmente especificada constitui um modelo probabilístico completo das variáveis em um domínio (ou seja, ela especifica a distribuição de probabilidade conjunta), a rede contem a informação necessária para responder todo tipo de consultas probabilísticas sobre estas variáveis (ou seja fazer inferências sobre estas variáveis). Estas consultas podem pedir uma interpretação de um entrada de dados específica (em termos probabilísticos), ou mesmo fazer uma tomada de decisão, caso tenha dados suficientes para isso. A interpretação requer a instanciação de um conjunto de variáveis correspondentes com a entrada de dados, calcular o impato destes valores instanciados sobre a probabilidades de um conjunto de variáveis (hipóteses) e finalmente selecionar a combinação mais adequada destas hipóteses. A princípio, uma vez que temos a distribuição de probabilidade conjunto, podemos obter esta interpretação mecanicamente. Esta é uma das principais utilidades das Redes Bayesianas, usar o conhecimento incerto aprendido para inferir sobre probabilidade de eventos futuros. Este cálculo é feito aplicando o teorema de Bayes recursivamente (propagation). Vale ressaltar que este problema no caso mais geral é NP-Completo e exponencial no número de variáveis. A boa notícia é que existem alguns casos particulares que podem ser resolvidos em tempo linear. Uma poly-tree é um grafo direcionado acíclico com a propriedade de para todo par de nós ter no máximo um caminho entre os nós. Abaixo temos exemplo de um DAG que é um poly-tree e outro que não é.

Para uma poly-tree o algoritmo de inferência é linear. Na prática são utilizados métodos aproximados para fazer esta inferências, métodos como o de Monte Carlo ou de Simulação Estocásticas.

∏ =

= n

i iin YsedecessoreyPyyP

1 1 ))(Pr/(),,( L

Rede Semântica

Bibliografia

[1] Klir,G.J. and Folger,T.A. Fuzzy Sets, Uncertainty and Information, Prentice Hall, 1998. [2] Pearl, J., Probabilistic Reasoning in Intelligent Systems, Morgan Kaufmann, San Mateo, California, 1988. [3] Ross, S. M., Introduction to Probability Models, Elsevier, San Diego, California, 2007.

I was looking for polytree concept. thanks for your post.
Esta é apenas uma pré-visualização
3 mostrados em 5 páginas