Prepare-se para as provas
Obter pontos
Guias e Dicas
Venda na Docsity
Docsity I.A.
ENEM

Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity

Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium

Guias e Dicas

Venda na Docsity

Docsity I.A.

Entrar Cadastre-se

Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity

Encontrar documentos

Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity

Encontra documentos específicos para os exames da tua universidade

Videoaulas

Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade

Quiz

Responda perguntas de provas passadas e avalie sua preparação.

Docsity AINEW

Resuma seus documentos, faça perguntas, converta-os em questionários e mapas conceituais

TCC e ENEM 2026

Estude com provas passadas, TCCs e dicas úteis

Explorar perguntas

Tire suas dúvidas lendo as respostas dadas por outros alunos como você.

Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium

Compartilhe documentos

20 Pontos

Por cada documento compartilhado

Responda às perguntas

5 Pontos

por cada resposta enviada (máx. 1 por dia)

Todas as maneiras de obter pontos grátis

Ganhe pontos imediatamente

Escolha um Plano Premium com todos os pontos que precisa

Oportunidades de estudo

Escolha seu próximo programa de estudos

Entre em contato direto com as melhores Universidades do mundo. Pesquise entre milhares de Universidades e parceiros oficiais

Comunidade

Pergunte à comunidade

Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo

Guias grátis

Os eBooks que salvam estudantes!

Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity

Programação Dinâmica, Manuais, Projetos, Pesquisas de Engenharia de Produção

Universidade Estadual de Minas Gerais (UEMG)Engenharia de Produção

Pesquisa Operacional

Tipologia: Manuais, Projetos, Pesquisas

Antes de 2010

Compartilhado em 26/03/2010

fernanda-8 🇧🇷

4.7

(28)

166 documentos

1 / 16

Esta página não é visível na pré-visualização

Não perca as partes importantes!

Pesquisa Operacional II 1

Programação Dinâmica

Pesquisa Operacional II 2

Programação Dinâmica – PD

• Programação dinâmica é uma técnica matemática útil para

tomar uma seqüência de decisões inter-relacionadas;

• Em contraste com a Programação Linear, não existe uma

formulação matemática para o Problema de Programação

Dinâmica – PD;

• Ao contrário, a PD é uma abordagem genérica para resolução

de problemas e as equações utilizadas devem ser desenvolvidas

de acordo com cada situação particular;

• Por isso, é importante conhecer os elementos básicos que

caracterizam problemas de PD.

Pesquisa Operacional II 3

O Problema da Diligência

• Esse problema foi especialmente elaborado (Prof. Harvey M.

Wagner) para introduzir os conceitos e ilustrar os elementos da

PD;

• O problema é sobre um caçador de tesouros do Missouri (região

central dos EUA) que decidiu participar da corrida do ouro na

Califórnia na metade do século 19;

• A viagem até a Califórnia seria realizada por diligência através

de território inseguro, correndo-se sérios riscos de ataque de

assaltantes.

Pesquisa Operacional II 4

O Problema da Diligência

• Apesar de seu ponto de saída e destino serem fixos, o caçador

de tesouros tinha uma liberdade considerável para escolher por

quais estados ele deveria passar até chegar ao seu destino;

A

B

C

D

E

F

G

H

I

J

Pesquisa Operacional II 5

O Problema da Diligência

A

B

C

D

E

F

G

H

I

J

1

Estágios (

Estágios (n

n):

): 2

23

34

4

Estados (

Estados (s

s)

)

Pesquisa Operacional II 6

O Problema da Diligência

• O caçador de fortuna era um homem prudente e estava preocupado

com sua segurança ao longo da viagem;

• Depois de pensar um pouco, ele teve uma brilhante idéia para

determinar a rota mais segura;

• Empresas de seguros ofereciam apólices de seguro de vida para

passageiros de diligências;

• O custo das apólices para cada trecho percorrido era calculado de

acordo com as condições de segurança daquele trecho. Quanto mais

arriscada uma rota, mais caro o seguro;

• Assim, a rota mais segura deveria ser aquela que tivesse a mais

barata apólice de seguro de vida associada.

Descubra Manuais, Projetos, Pesquisas de Engenharia de Produção Universidade Estadual de Minas Gerais (UEMG)

Documentos relacionados

Programação Linear

Introdução Pesquisa Operacional

(1)

Pesquisa Operacional

Pesquisa Operacional Aplicada à Mineração

(1)

Logistica operacional - fgv

(1)

Programação Dinamica

Multas e Medidas Cautelares no Tribunal de Contas da União

Lógica-competência: a teoria e a prática na seleção de pessoas

Pesquisa de Clima Organizacional: Melhores Empresas para Trabalhar

Prospecção Geofísica

Normas de Segurança e Medicina do Trabalho: Obrigatoriedade e Órgãos Competentes

Higiene e Segurança do Trabalho

Pré-visualização parcial do texto

Baixe Programação Dinâmica e outras Manuais, Projetos, Pesquisas em PDF para Engenharia de Produção, somente na Docsity!

Pesquisa Operacional II 1

Programação Dinâmica

Pesquisa Operacional II 2

Programação Dinâmica – PD

Programação dinâmica é uma técnica matemática útil para tomar uma seqüência de decisões inter-relacionadas;
Em contraste com a Programação Linear, não existe uma formulação matemática para o Problema de Programação Dinâmica – PD;
Ao contrário, a PD é uma abordagem genérica para resolução de problemas e as equações utilizadas devem ser desenvolvidas de acordo com cada situação particular;
Por isso, é importante conhecer os elementos básicos que caracterizam problemas de PD.

Pesquisa Operacional II 3

O Problema da Diligência

Esse problema foi especialmente elaborado (Prof. Harvey M. Wagner) para introduzir os conceitos e ilustrar os elementos da PD;
O problema é sobre um caçador de tesouros do Missouri (região central dos EUA) que decidiu participar da corrida do ouro na Califórnia na metade do século 19;
A viagem até a Califórnia seria realizada por diligência através de território inseguro, correndo-se sérios riscos de ataque de assaltantes.

Pesquisa Operacional II 4

O Problema da Diligência

Apesar de seu ponto de saída e destino serem fixos, o caçador de tesouros tinha uma liberdade considerável para escolher por quais estados ele deveria passar até chegar ao seu destino;

A

B

C

D

E

F

G

H

I

J

O Problema da Diligência

A

B

C

D

E

F

G

H

I

J

Estágios (Estágios ( nn ):): (^1122 33 )

Estados (Estados ( ss ))

O Problema da Diligência

O caçador de fortuna era um homem prudente e estava preocupado com sua segurança ao longo da viagem;
Depois de pensar um pouco, ele teve uma brilhante idéia para determinar a rota mais segura;
Empresas de seguros ofereciam apólices de seguro de vida para passageiros de diligências;
O custo das apólices para cada trecho percorrido era calculado de acordo com as condições de segurança daquele trecho. Quanto mais arriscada uma rota, mais caro o seguro;
Assim, a rota mais segura deveria ser aquela que tivesse a mais barata apólice de seguro de vida associada.

Pesquisa Operacional II 7

O Problema da Diligência

Os custos das apólices de seguros associados a cada possível trecho da viagem (do estado i para o estado j ), denotados por c ij são:

B C D A 2 4 3

E F G B 7 4 6 C 3 2 4 D 4 1 5

H I E 1 4 F 6 3 G 3 3

J H 3 I 4

c c ijij == cc ACAC = 4= 4

cc ijij == cc (^) GIGI = 3= 3

Pesquisa Operacional II 8

O Problema da Diligência

A

B

C

D

E

F

G

H

I

J

2

4

3

7 4 6 3 2 4 4 1 5 1 4 6 3 3 3

4

3

O objetivo é decidir qual a rota que minimiza o custo total.

Pesquisa Operacional II 9

O Problema da Diligência

Uma possível maneira de resolver o problema é por tentativa e erro, ou seja, verificar o custo de todas as possíveis rotas;
Contudo, o número de rotas viáveis é consideravelmente grande (18) e calcular o custo para cada uma delas não é uma tarefa atraente;
Felizmente, a programação dinâmica oferece uma solução com muito menos esforço;
A PD inicia com uma pequena porção do problema original e encontra a solução ótima para este problema menor.

Pesquisa Operacional II 10

O Problema da Diligência

Gradualmente, aumenta-se o tamanho do problema analisado, encontrando a solução ótima a partir da solução anterior, até que todo o problema tenha sido resolvido;
Para o problema da diligência, inicia-se a solução a partir do problema menor onde o caçador de tesouros quase completou sua viagem e tem apenas mais um estágio a percorrer ( n = 4 );
A solução óbvia para este problema é ir do seu estado atual (seja qual for – H ou I ) para seu destino final (estado J ).

O Problema da Diligência

A cada iteração subseqüente, o problema é ampliado aumentando-se em 1 o número de estágios restantes para completar a viagem;
Para esse último problema ampliado, a solução ótima para onde se deve ir em seguida a partir de cada estado possível pode ser encontrado relativamente fácil a partir dos resultados obtidos na iteração anterior.

Formulação

Faça as variáveis de decisão xn ( n = 1, 2, 3 e 4) ser o destino imediatamente subseqüente ao início do estágio n ;
Assim, a rota a ser selecionada é:

A → x 1 → x 2 → x 3 → x 4 (x 4 = J)

A

B

C

D

E

F

G

H

I

J

Pesquisa Operacional II 19

Procedimento de Resolução

Assim, para n = 3 tem-se o seguinte quadro:

x (^3) s H I f (^) 3 *(s) x (^) 3 * E 1 + 3 = 4 4 + 4 = 8 4 H F 6 + 3 = 9 3 + 4 = 7 7 I G 3 + 3 = 6 3 + 4 = 7 6 H

*f 3 *(s, x 3 ) = c* (^) *sx3 + f 4 *(x 3 ) n* = 3:

Pesquisa Operacional II 20

Procedimento de Resolução

Para n = 2 tem-se:

cc^ CC,E,E

cc (^) CC,G,G

ff 33 (E) = 4(E) = 4

ff 33 (G) = 6(G) = 6

CT = 3 + 4 = 7CT = 3 + 4 = 7

CT = 4 + 6 = 10CT = 4 + 6 = 10

B

C

D

E

F

G

C

E

G

3

4

F 2

ff 33 (F) = 7(F) = 7 CT = 2 + 7 = 9CT = 2 + 7 = 9

Pesquisa Operacional II 21

Procedimento de Resolução

Para n = 2 tem-se:

cc (^) B,EB,E

ccB,G (^) B,G

ff^33 _(E) = 4(E) = 4_**

ff 33 (G) = 6(G) = 6

CT = 11CT = 11

CT = 12CT = 12

B

E

G

7

6

F 4

ff 33 (F) = 7(F) = 7 CT = 11CT = 11

cc (^) D,ED,E

cc^ D,GD,G

ff^33 _(E) = 4(E) = 4_**

ff 33 (G) = 6(G) = 6

CT = 8CT = 8

CT = 11CT = 11

D

E

G

4

5

F 1

ff 33 (F) = 7(F) = 7 CT = 8CT = 8

Pesquisa Operacional II 22

Procedimento de Resolução

Assim, para n = 2 tem-se o seguinte quadro:

n = 2: x (^2) s E F G f (^) 2 *(s) x (^) 2 * B (^) 7 + 4 = 11 4 + 7 = 11 6 + 6 = 12 11 E ou F C 3 + 4 = 7 2 + 7 = 9 4 + 6 = 10 7 E D 4 + 4 = 8 1 + 7 = 8 5 + 6 = 11 8 E ou F

*f 2 *(s, x 2 ) = c* (^) *sx2 + f 3 *(x 2 )*

Procedimento de Resolução

Para n = 1 tem-se:

cc^ AA,B,B

cc (^) AA,D,D

ff 22 (B) = 11(B) = 11

ff 22 (D) = 8(D) = 8

CT = 2 + 11 = 13CT = 2 + 11 = 13

CT = 3 + 8 = 11CT = 3 + 8 = 11

A

B

D

2

3

C 4

ff 22 (C) = 7(C) = 7

A CT = 4 + 7 = 11CT = 4 + 7 = 11

B

C

D

Procedimento de Resolução

Assim, para n = 1 tem-se o seguinte quadro:

n = 1: x (^1) s B C D f (^) 1 *(s) x (^) 1 * A 2 + 11 = 13 4 + 7 = 11 3 + 8 = 11 11 C ou D

*f 1 *(s, x 1 ) = c* (^) *sx1 + f 2 *(x 1 )*

A

B

C

D

25

A

B

C

D

E

F

G

Procedimento de Resolução

n = 2: x (^2) s E F G f (^) 2 *(s) x (^) 2 * B 7 + 4 = 11 4 + 7 = 11 6 + 6 = 12 11 E ou F C 3 + 4 = 7 2 + 7 = 9 4 + 6 = 10 7 E D 4 + 4 = 8 1 + 7 = 8 5 + 6 = 11 8 E ou F

*f 2 *(s, x 2 ) = c* (^) *sx2 + f 3 *(x 2 )*

26

Procedimento de Resolução

x (^3) s H I f (^) 3 *(s) x (^) 3 * E 1 + 3 = 4 4 + 4 = 8 4 H F 6 + 3 = 9 3 + 4 = 7 7 I G 3 + 3 = 6 3 + 4 = 7 6 H

*f 3 *(s, x 3 ) = c* (^) *sx3 + f 4 *(x 3 ) n* = 3:

A

B

C

D

E

F

G

H

I

27

A

B

C

D

E

F

G

H

I

A J

B

C

D

E

F

G

H

I

J

Procedimento de Resolução

s f^ *4 (s) =^ c^ s,J x^4 ***** H 3 j I 4 j

n = 4:

Pesquisa Operacional II 28

Procedimento de Resolução

Assim, existem 3 possíveis rotas que apresentam a mesma segurança (menores custos de seguro):

A – C – E – H – J

A – D – E – H – J

A – D – F – I – J

Todas as rotas apresentam o mesmo custo total de f **1 ***^ (A) = 11.

Características de Problemas de PD

O exemplo do problema da diligência foi elaborado para oferecer, literalmente, uma interpretação física da estrutura abstrata de problemas de PD;
Uma maneira de reconhecer que uma situação pode ser formulada como um problema de PD é verificar que sua estrutura básica é análoga à daquele exemplo;
Os elementos básicos que caracterizam problemas de PD são apresentados na seqüência.

Características de Problemas de PD

1. O problema pode ser dividido em estágios , com uma decisão política atrelada a cada estágio.

O problema da diligência era dividido em 4 estágios (4 pernas da viagem);

A decisão política a ser tomada em cada estágio era qual apólice de seguro escolher, ou seja, qual o destino a ser selecionado para a próxima perna (estágio) da viagem.

Pesquisa Operacional II 37

Características de Problemas de PD

6. O procedimento de resolução inicia-se ao encontrar a política ótima para o último estágio.

A solução para esse estágio final é, geralmente, trivial, assim como no problema da diligência.

Pesquisa Operacional II 38

Características de Problemas de PD

7. Existe uma relação recorrente que identifica a política ótima para o estágio n , dada que a política ótima para o estágio n + 1 está disponível.

Para o exemplo da diligência essa relação era

{ (^) sx n ( (^) n )} n (^) x f s cn f x n

1

(^) ( ) min = + +

Pesquisa Operacional II 39

Características de Problemas de PD

O tipo de relação recorrente difere entre os problemas de PD;

Contudo a notação utilizada permanece a mesma:

N = número de estágios; n = rótulo do estágio atual ( n = 1, 2, ..., N ) s (^) n = estado atual para o estágio n ; xn = variável de decisão para o estágio n ; xn *^ = valor ótimo de xn (dado s (^) n ); f (^) n ( s (^) n , xn ) = contribuição dos estágios n , n + 1, ..., N na função objetivo dado que o sistema inicia no estado s (^) n , a decisão imediata é xn e as decisões ótimas são tomadas na seqüência.

Pesquisa Operacional II 40

Características de Problemas de PD

A relação recorrente será sempre da forma:

ou

Essa relação continua recorrendo à medida que se move para trás estágio por estágio.

*() min{ n (, n )} n (^) x f s f sx n

= *() max{ n (, n )} n (^) x f s f sx n

Características de Problemas de PD

8. O procedimento de solução inicia pelo fim do problema e retrocede estágio por estágio até encontrar a política ótima no início do primeiro estágio.

Essa política ótima imediatamente leva a uma solução ótima para todo o problema, nominalmente, x 1 *^ para o estado inicial s 1 , depois x 2 *^ para o estado seguinte s 2 , depois x 3 ^ para o próximo estado s 3 e, assim por diante, até x N^ para o estágio s N.

Esse movimento retrospectivo foi demonstrado no problema da diligência, onde a política ótima foi encontrada sucessivamente no início de cada estado nos estágios 4, 3, 2 e 1, respectivamente.

Características de Problemas de PD

Para qualquer problema de PD uma tabela como a seguinte pode ser obtida para cada estágio ( n = N , N – 1, ..., 1);

Quando chega-se à tabela para o estágio inicial ( n = 1), o problema foi solucionado. Como o estado inicial é conhecido, a decisão inicial é especificada para x 1 *^ nessa tabela. O valor ótimo das demais variáveis de decisão é especificado pelas tabelas para os próximos estágios, de acordo com o estado do sistema que resulta das decisões predecessoras.

x (^) n s (^) n f (^) *n (sn ) x (^) n *

f (^) n (s (^) n , x (^) n )

Pesquisa Operacional II 43

Programação Dinâmica Determinística

Quando o estado do próximo estágio é univocamente determinado (uma só forma de expressão) pela decisão política sobre o estado atual está-se tratando de um problema de Programação Dinâmica Determinística ;
A estrutura básica da Programação Dinâmica Determinística pode ser representada da seguinte forma:

s (^) n

Estágio n Estado: s (^) n+

xn Contribuição de xn fn ( xn , sn ) fn *+ 1 (^ sn + 1 )

Estágio n +

Valor: Pesquisa Operacional II 44

O Conselho Mundial de Saúde é dedicado à melhoria das condições de saúde em países em desenvolvimento;
Atualmente, existem cinco juntas médicas para serem alocadas em três países. Assim, o conselho deve determinar quantas juntas alocar a cada um desses países de tal forma que se maximize a utilização das cinco juntas médicas;
As juntas devem manter-se intactas. Ou seja, seus membros não podem ser separados de suas respectivas juntas. Assim, o número de juntas alocadas a cada país deve ser um valor inteiro.

Distribuindo Juntas Médicas pelo Mundo

Pesquisa Operacional II 45

A medida de desempenho utilizada é o adicional pessoa-anos de vida. Para um país em particular, essa medida é igual ao aumento da expectativa de vida em anos, multiplicado pelo tamanho de sua população;
A tabela seguinte apresenta estimativas do adicional pessoa- anos de vida (em múltiplos de 1.000) para cada país para cada possível alocação das juntas médicas;
Pergunta-se: que alocação maximiza a medida de desempenho considerada?

Distribuindo Juntas Médicas pelo Mundo

Pesquisa Operacional II 46

Distribuindo Juntas Médicas pelo Mundo

Juntas médicas 1 2 3 0 0 0 0 1 45 20 50 2 70 45 70 3 90 75 80 4 105 110 100 5 120 150 130

Adicional pessoa-anos de vida País

A formulação do problema é a seguinte:

Estágio n = n º do país ( n = 1, 2, 3); xn = número de juntas alocadas no estágio (país) n ; Estado s (^) n = número de juntas médicas ainda disponíveis para alocação nos países restantes.

Assim, no estágio 1 (país 1), onde todos os países são considerados para todas as alocações, s 1 = 5 (ainda existem 5 juntas para serem alocadas).

Todavia, nos estágios 2 e 3, s (^) n será 5 menos o número de juntas já alocadas nos estágios anteriores.

Distribuindo Juntas Médicas pelo Mundo

Assim, a seqüência de estados é a seguinte:

s 1 = 5, s 2 = 5 – x 1 , s 3 = s 2 – x 2.

Formulando o problema matematicamente, seja p i( x i) a medida de desempenho da alocação de x i juntas médicas ao país i (conforme tabela anterior);
Assim, o objetivo é escolher x 1 , x 2 , x 3 , tal que

Distribuindo Juntas Médicas pelo Mundo

∑

3 1

Maximize ( ) i

pi xi

sãointeirosnão- negativos

Sujeitoa 5

3 1

i

i i

e x

∑ x

=

Pesquisa Operacional II 55

Distribuindo Juntas Médicas pelo Mundo

**s 3 f 3 *(s 3 ) x 3 *** 0 0 0 1 50 1 2 70 2 3 80 3 4 100 4 5 130 5

x 2 s (^2) 0 1 2 3 4 5 f 2 *(s 2 ) x 2 * 0 0 0 0 1 50 20 50 0 2 70 70 45 70 0 ou 1 3 80 90 95 75 95 2 4 100 100 115 125 110 125 3 5 130 120 125 145 160 150 160 4

f (^) 2 ( s (^) 2 , x (^) 2 ) = p (^) 2 ( x (^) 2 )+ f (^) *3 ( s (^) 2 - x (^) 2 )

x (^1) s 1 0 1 2 3 4 5 f (^) 1 *(s 1 ) x (^) 1 * 5 160 170 165 160 155 120 170 1

*f 1 (s 1 , x 1 ) = p 1 (x 1 )+f 2 *(s 1 -x 1 ) País 1País 1* ÆÆ^ 11

País 2País 2 ÆÆ^ 33

País 3País 3 ÆÆ^ 11 Ganho máximo = 170.000Ganho máximo = 170.

Pesquisa Operacional II 56

Solução:

A solução ótima tem x 1 *^ = 1 (1 junta médica para o 1º país);

Com isso s 2 = 5 – 1 = 4 (juntas disponíveis para o 2º país);

O que implica (para n = 2), x 2 *^ = 3 (3 juntas médicas para o 2º país);

Assim, s 3 = 4 – 3 = 1 (juntas disponíveis para o 3º país);

Finalmente (n = 3), x 3 *^ = 1 (1 junta médica para o 3º país).

Distribuindo Juntas Médicas pelo Mundo

Pesquisa Operacional II 57

Solução:

Como f 1 *(5) = 170, a alocação (1, 3, 1) de juntas médicas para os três países incorrerá em um ganho de estimado de 170.000 no índice de desempenho considerado, o que é pelo menos 5.000 a mais do que qualquer outra alocação.

Distribuindo Juntas Médicas pelo Mundo

Pesquisa Operacional II 58

O problema anterior ilustra um problema de programação dinâmica particularmente comum denominado problema da distribuição de recursos ;
Este tipo de problema envolve um único tipo de recurso que deve ser alocado a um determinado número de atividades;
O objetivo é definir como distribuir o recurso entre as atividades que por ele competem, da forma mais eficiente;
Para o exemplo anterior, o recurso envolvido são as juntas médicas e as três atividades são os cuidados médicos aos três países.

O Problema da Distribuição de Recursos

Formulação do problema. Como sempre envolvem a alocação de um tipo de recurso dentre um determinado número de atividades, problemas de distribuição de recursos sempre apresentam a seguinte formulação:

Estágio n = atividade n ( n = 1, 2, ..., N );

xn = número de recursos alocados à atividade (estágio) n ;

Estado s (^) n = número de recursos ainda disponíveis para alocação entre as atividades restantes.

O Problema da Distribuição de Recursos

Quando o sistema inicia no estágio n no estado s n , a escolha de x n resulta que o próximo estado, no estágio n + 1, é s n+1 = s n – x n, conforme representado abaixo:

O Problema da Distribuição de Recursos

s (^) n

n

Estado: s (^) n - xn

xn

Estágio: n +

Pesquisa Operacional II 61

A programação dinâmica probabilística diferencia-se da determinística no sentido que o estado no próximo estágio não é completamente determinado pelo estado e pela decisão política no estágio atual;
Existe uma distribuição de probabilidade que determinará qual será o próximo estado;
Contudo, essa distribuição de probabilidade é completamente determinada pelo estado e pela decisão política no estágio atual.

Programação Dinâmica Probabilística

Pesquisa Operacional II 62

Programação Dinâmica Probabilística

s (^) n xn

1

2

S

fn ( s (^) n , xn )

fn *+ 1 ( 1 )

fn *+ 1 ( 2 )

f (^) n *+ 1 ( S )

p 1 p 2 p S

C 1

C 2

C S

. . .

Decisão Estado:

Estágio n

Probabilidade

Contribuição do estágio n

Estágio n + 1

Pesquisa Operacional II 63

Uma aluna de estatística acredita ter desenvolvido um sistema para vencer um jogo popular em Las Vegas.
Seus colegas não acreditam que seu sistema funcione, então fizeram uma aposta com ela que se ela começar com 3 fichas, ela não terá nem 5 fichas depois de três rodadas do jogo.
Em cada rodada do jogo aposta-se qualquer quantidade de fichas disponíveis e pode-se ganhar ou perder essa mesma quantidade.
A aluna de estatística acredita que através de seu sistema ela tem uma probabilidade de 2/3 de ganhar uma dada rodada do jogo.

Vencendo em Las Vegas

Pesquisa Operacional II 64

Assumindo que a aluna está correta, utilize a programação dinâmica para determinar a sua política ótima de jogo, com respeito a quantas fichas ela deve apostar (se alguma) em cada uma das três rodadas.
A decisão em cada rodada deve levar em consideração os resultados das rodadas anteriores.
O objetivo é maximizar a probabilidade de vencer a aposta da aluna com seus colegas.

Vencendo em Las Vegas

A formulação do problema é:

Estágio n = n º da rodada do jogo ( n = 1, 2, 3); xn = número de fichas a serem apostadas no estágio n ; Estado s (^) n = número de fichas na mão para iniciar o estágio n.

A função objetivo a ser maximizada a cada estágio deve ser a probabilidade de terminar as três rodadas com pelo menos 5 fichas. Portanto,

f (^) n ( s (^) n , xn ) = probabilidade de terminar as três rodadas com pelo menos 5 fichas, dado que a aluna começa o estágio n no estado s (^) n , toma a decisão imediata xn e toma decisões ótimas a partir de então.

Vencendo em Las Vegas

Assim,

A expressão f (^) n ( s (^) n , xn ) deve refletir o fato que ainda pode ser possível acumular 5 fichas mesmo que a aluna perca a próxima rodada;

Se ela perder, seu estado no próximo estágio será s (^) n – xn e a probabilidade de ela terminar com pelo menos 5 fichas será de

Vencendo em Las Vegas

( ) max ( , ) 0 , 1 ,...,

fn sn = xn = snfnsnx n

fn * + 1 ( sn − xn )

Pesquisa Operacional II 73

Assim, a política ótima a ser adotada é:

Com esta política de ação a aluna tem 20/27 ≈ 74% de probabilidade de vencer a aposta com seus colegas.

Vencendo em Las Vegas













 



 









= = =







= =

=



 

 = =

= = = =

=

seperder( 0), aposta perdida

2 sevencer( 4),^1 ,^2 ,^3 ,^4

seperder( 1), apostaperdida

sevencer( 3), 2 ou 3 1 seperder( 2),

seperder( 3), 2 ou 3

sevencer( 5), 0 sevencer( 4), 1

1

3

3 * 3 2

3

3 3 2 2

3 * 3

3 3 * 2 * 2

1 *

s

x s x

s

s x x s

s x

s x s x

x

Pesquisa Operacional II 74

A Programação Dinâmica é uma técnica bastante útil para tomar decisões seqüencialmente inter-relacionadas;
Para tanto, faz-se necessário formular relações recorrentes apropriadas para cada problema individual.

Conclusões

Pesquisa Operacional II 75

Deseja-se estabelecer uma rota aérea de mínimo custo entre um aeroporto de um país 0, até um aeroporto em outro país 4. Para isto, é necessário fazer escalas passando por aeroportos de outros 3 países (1,2,3 – nesta ordem), comprando-se passagens aéreas para cada vôo. A rede de possíveis vôos é ilustrada abaixo.

Exercício 1

1 2

1

3

2

1

3

2

1

3

1

País 0 País 1 País 2 País 3 País 4 Pesquisa Operacional II 76

Os preços dos bilhetes de passagens aéreas são dados pelas tabelas a seguir:

Exercício 1

1 2 3 1 153 160 181

Do País 0 ao País 1

1 2 3 1 325 338 294 2 283 349 264 3 300 318 281

Do País 1 ao País 2

1 2 3 1 143 159 147 2 131 120 109 3 172 190 207

Do País 2 ao País 3

1 1 325 2^301 3 308

Do País 3 ao País 4

Considerando esse problema como um problema de Programação Dinâmica, a partir das informações anteriores, determine a rota aérea de menor custo. Qual será o custo mínimo esperado?
Caso, em uma situação específica, ao chegar no país 2, o avião sofra um desvio e seja obrigado a pousar no aeroporto 2, qual será a melhor (menos custosa) alternativa de ação (rota) para os passageiros desse vôo que queiram chegar ao país 4?

Exercício 1

n = 4 País 4 s x4* 1 325 1 2 301 1 3 308 1

f4(s) = cs,*

n = 3 x 3 País 3 s 1 2 3 f^ 3 *(s)^ x^ 3 * 1 468 460 455 455 3 2 456 421 417 417 3 3 497 491 515 491 2

*f 3 *(s, x 3 ) = c* (^) *sx3 + f 4 *(x 3 )*

Pesquisa Operacional II 79

Exercício 1

n = 2 x^2 País 2 s 1 2 3 f (^) 2 *(s) x (^) 2 * 1 780 755 785 755 2 2 738 766 755 738 1 3 755 735 772 735 2

*f 2 *(s, x 2 ) = c* (^) *sx2 + f 3 *(x 2 )*

n = 1 x^1 País 1 s 1 2 3 f 1 *(s) x 1 * 1 908 898 916 898 2

*f 1 *(s, x 1 ) = c* (^) *sx1 + f 2 *(x 1 )*

Pesquisa Operacional II 80

Exercício 1

Rota de mínimo custo: País 0 País 1 País 2 País 3 País 4 1 2 1 3 1 Caso o avião pouse no aeroporto dois do país 2, a melhor rota seria: 1 2 2 3 1

Pesquisa Operacional II 81

O gerente de produção de uma empresa deseja distribuir 6 máquinas recentemente adquiridas entre 4 setores da empresa.
A tabela seguinte apresenta o ganho esperado para cada setor para cada possível alocação das máquinas.

Exercício 2

Máquinas A B C D 0 $0,00 $0,00 $0,00 $0, 1 $4,00 $5,00 $6,00 $4, 2 $8,00 $10,00 $11,00 $9, 3 $13,00 $14,00 $15,00 $13, 4 $17,00 $18,00 $18,00 $16, 5 $19,00 $20,00 $21,00 $18, 6 $21,00 $23,00 $24,00 $20,

Setor

Pergunta-se: que alocação maximiza o ganho da empresa? 82

Exercício 2

Formulação do problema:

Estágio n = n º do setor ( n = 1, 2, 3, 4); xn = número de máquinas alocado no estágio (setor) n ; Estado s (^) n = número de máquinas ainda disponíveis para alocação nos demais setores.

Assim, no estágio 1 (setor 1), onde todos as máquinas são consideradas para todas as alocações, s 1 = 6 (ainda existem 6 máquinas para serem alocadas).

Todavia, nos estágios 2, 3 e 4, s (^) n será 6 menos o número de máquinas já alocadas nos estágios anteriores.

Pesquisa Operacional II 83

Assim, a seqüência de estados é a seguinte:

s 1 = 6, s 2 = 6 – x 1 , s 3 = s 2 – x 2 , s 4 = s 3 – x 3

Formulando o problema matematicamente, seja p i( x i) o lucro da alocação de x i máquinas ao setor i (conforme tabela anterior);
Assim, o objetivo é escolher x 1 , x 2 , x 3 , x 4 tal que

Exercício 2

∑

4 1

Maximize ( ) i

pi xi

sãointeirosnão- negativos

Sujeitoa 6

4 1

i

i i

e x

∑ x

=

84

Exercício 2

6

0 1 2 3 4 5

6

21

5

19

4 17 3 2 13 (^18) 4

Estágio: 1

6

0

2 3 0 1 2 3 4 5

0

0 4 9 13 16 28

0

5 0 10 5 0 14 10 5 0

20 0

18

(^0) 6

0 1 2 3 4 5 0

6 0 11 6 0 15 11 6 0

0

(^0) 6

4

23

21

18

24

20

Pesquisa Operacional II 91

Solução:

Exercício 2

Ganho A B C D Esperado Máquinas Alocadas^30

Setor

0 2 2 2