Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


Programação Dinâmica, Manuais, Projetos, Pesquisas de Engenharia de Produção

Pesquisa Operacional

Tipologia: Manuais, Projetos, Pesquisas

Antes de 2010

Compartilhado em 26/03/2010

fernanda-8
fernanda-8 🇧🇷

4.7

(28)

166 documentos

1 / 16

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Pesquisa Operacional II 1
Programação Dinâmica
Pesquisa Operacional II 2
Programação Dinâmica – PD
Programação dinâmica é uma técnica matemática útil para
tomar uma seqüência de decisões inter-relacionadas;
Em contraste com a Programação Linear, não existe uma
formulação matemática para o Problema de Programação
Dinâmica – PD;
Ao contrário, a PD é uma abordagem genérica para resolução
de problemas e as equações utilizadas devem ser desenvolvidas
de acordo com cada situação particular;
Por isso, é importante conhecer os elementos básicos que
caracterizam problemas de PD.
Pesquisa Operacional II 3
O Problema da Diligência
Esse problema foi especialmente elaborado (Prof. Harvey M.
Wagner) para introduzir os conceitos e ilustrar os elementos da
PD;
O problema é sobre um caçador de tesouros do Missouri (região
central dos EUA) que decidiu participar da corrida do ouro na
Califórnia na metade do século 19;
A viagem até a Califórnia seria realizada por diligência através
de território inseguro, correndo-se sérios riscos de ataque de
assaltantes.
Pesquisa Operacional II 4
O Problema da Diligência
Apesar de seu ponto de saída e destino serem fixos, o caçador
de tesouros tinha uma liberdade considerável para escolher por
quais estados ele deveria passar até chegar ao seu destino;
A
B
C
D
E
F
G
H
I
J
Pesquisa Operacional II 5
O Problema da Diligência
A
B
C
D
E
F
G
H
I
J
1
1
Estágios (
Estágios (n
n):
): 2
23
34
4
Estados (
Estados (s
s)
)
Pesquisa Operacional II 6
O Problema da Diligência
O caçador de fortuna era um homem prudente e estava preocupado
com sua segurança ao longo da viagem;
Depois de pensar um pouco, ele teve uma brilhante idéia para
determinar a rota mais segura;
Empresas de seguros ofereciam apólices de seguro de vida para
passageiros de diligências;
O custo das apólices para cada trecho percorrido era calculado de
acordo com as condições de segurança daquele trecho. Quanto mais
arriscada uma rota, mais caro o seguro;
Assim, a rota mais segura deveria ser aquela que tivesse a mais
barata apólice de seguro de vida associada.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Pré-visualização parcial do texto

Baixe Programação Dinâmica e outras Manuais, Projetos, Pesquisas em PDF para Engenharia de Produção, somente na Docsity!

Pesquisa Operacional II 1

Programação Dinâmica

Pesquisa Operacional II 2

Programação Dinâmica – PD

  • Programação dinâmica é uma técnica matemática útil para tomar uma seqüência de decisões inter-relacionadas;
  • Em contraste com a Programação Linear, não existe uma formulação matemática para o Problema de Programação Dinâmica – PD;
  • Ao contrário, a PD é uma abordagem genérica para resolução de problemas e as equações utilizadas devem ser desenvolvidas de acordo com cada situação particular;
  • Por isso, é importante conhecer os elementos básicos que caracterizam problemas de PD.

Pesquisa Operacional II 3

O Problema da Diligência

  • Esse problema foi especialmente elaborado (Prof. Harvey M. Wagner) para introduzir os conceitos e ilustrar os elementos da PD;
  • O problema é sobre um caçador de tesouros do Missouri (região central dos EUA) que decidiu participar da corrida do ouro na Califórnia na metade do século 19;
  • A viagem até a Califórnia seria realizada por diligência através de território inseguro, correndo-se sérios riscos de ataque de assaltantes.

Pesquisa Operacional II 4

O Problema da Diligência

  • Apesar de seu ponto de saída e destino serem fixos, o caçador de tesouros tinha uma liberdade considerável para escolher por quais estados ele deveria passar até chegar ao seu destino;

A

B

C

D

E

F

G

H

I

J

O Problema da Diligência

A

B

C

D

E

F

G

H

I

J

Estágios (Estágios ( nn ):): (^1122 33 )

Estados (Estados ( ss ))

O Problema da Diligência

  • O caçador de fortuna era um homem prudente e estava preocupado com sua segurança ao longo da viagem;
  • Depois de pensar um pouco, ele teve uma brilhante idéia para determinar a rota mais segura;
  • Empresas de seguros ofereciam apólices de seguro de vida para passageiros de diligências;
  • O custo das apólices para cada trecho percorrido era calculado de acordo com as condições de segurança daquele trecho. Quanto mais arriscada uma rota, mais caro o seguro;
  • Assim, a rota mais segura deveria ser aquela que tivesse a mais barata apólice de seguro de vida associada.

Pesquisa Operacional II 7

O Problema da Diligência

  • Os custos das apólices de seguros associados a cada possível trecho da viagem (do estado i para o estado j ), denotados por c ij são:

B C D A 2 4 3

E F G B 7 4 6 C 3 2 4 D 4 1 5

H I E 1 4 F 6 3 G 3 3

J H 3 I 4

c c ijij == cc ACAC = 4= 4

cc ijij == cc (^) GIGI = 3= 3

Pesquisa Operacional II 8

O Problema da Diligência

A

B

C

D

E

F

G

H

I

J

2

4

3

7 4 6 3 2 4 4 1 5 1 4 6 3 3 3

4

3

O objetivo é decidir qual a rota que minimiza o custo total.

Pesquisa Operacional II 9

O Problema da Diligência

  • Uma possível maneira de resolver o problema é por tentativa e erro, ou seja, verificar o custo de todas as possíveis rotas;
  • Contudo, o número de rotas viáveis é consideravelmente grande (18) e calcular o custo para cada uma delas não é uma tarefa atraente;
  • Felizmente, a programação dinâmica oferece uma solução com muito menos esforço;
  • A PD inicia com uma pequena porção do problema original e encontra a solução ótima para este problema menor.

Pesquisa Operacional II 10

O Problema da Diligência

  • Gradualmente, aumenta-se o tamanho do problema analisado, encontrando a solução ótima a partir da solução anterior, até que todo o problema tenha sido resolvido;
  • Para o problema da diligência, inicia-se a solução a partir do problema menor onde o caçador de tesouros quase completou sua viagem e tem apenas mais um estágio a percorrer ( n = 4 );
  • A solução óbvia para este problema é ir do seu estado atual (seja qual for – H ou I ) para seu destino final (estado J ).

O Problema da Diligência

  • A cada iteração subseqüente, o problema é ampliado aumentando-se em 1 o número de estágios restantes para completar a viagem;
  • Para esse último problema ampliado, a solução ótima para onde se deve ir em seguida a partir de cada estado possível pode ser encontrado relativamente fácil a partir dos resultados obtidos na iteração anterior.

Formulação

  • Faça as variáveis de decisão xn ( n = 1, 2, 3 e 4) ser o destino imediatamente subseqüente ao início do estágio n ;
  • Assim, a rota a ser selecionada é:

A → x 1 → x 2 → x 3 → x 4 (x 4 = J)

A

B

C

D

E

F

G

H

I

J

Pesquisa Operacional II 19

Procedimento de Resolução

  • Assim, para n = 3 tem-se o seguinte quadro:

x (^3) s H I f (^) 3 *(s) x (^) 3 * E 1 + 3 = 4 4 + 4 = 8 4 H F 6 + 3 = 9 3 + 4 = 7 7 I G 3 + 3 = 6 3 + 4 = 7 6 H

*f 3 *(s, x 3 ) = c* (^) *sx3 + f 4 *(x 3 ) n* = 3:

Pesquisa Operacional II 20

Procedimento de Resolução

  • Para n = 2 tem-se:

cc^ CC,E,E

cc (^) CC,G,G

ff 33 (E) = 4(E) = 4

ff 33 (G) = 6(G) = 6

CT = 3 + 4 = 7CT = 3 + 4 = 7

CT = 4 + 6 = 10CT = 4 + 6 = 10

B

C

D

E

F

G

C

E

G

3

4

F 2

ff 33 (F) = 7(F) = 7 CT = 2 + 7 = 9CT = 2 + 7 = 9

Pesquisa Operacional II 21

Procedimento de Resolução

  • Para n = 2 tem-se:

cc (^) B,EB,E

ccB,G (^) B,G

ff^33 _(E) = 4(E) = 4_**

ff 33 (G) = 6(G) = 6

CT = 11CT = 11

CT = 12CT = 12

B

E

G

7

6

F 4

ff 33 (F) = 7(F) = 7 CT = 11CT = 11

cc (^) D,ED,E

cc^ D,GD,G

ff^33 _(E) = 4(E) = 4_**

ff 33 (G) = 6(G) = 6

CT = 8CT = 8

CT = 11CT = 11

D

E

G

4

5

F 1

ff 33 (F) = 7(F) = 7 CT = 8CT = 8

Pesquisa Operacional II 22

Procedimento de Resolução

  • Assim, para n = 2 tem-se o seguinte quadro:

n = 2: x (^2) s E F G f (^) 2 *(s) x (^) 2 * B (^) 7 + 4 = 11 4 + 7 = 11 6 + 6 = 12 11 E ou F C 3 + 4 = 7 2 + 7 = 9 4 + 6 = 10 7 E D 4 + 4 = 8 1 + 7 = 8 5 + 6 = 11 8 E ou F

*f 2 *(s, x 2 ) = c* (^) *sx2 + f 3 *(x 2 )*

Procedimento de Resolução

  • Para n = 1 tem-se:

cc^ AA,B,B

cc (^) AA,D,D

ff 22 (B) = 11(B) = 11

ff 22 (D) = 8(D) = 8

CT = 2 + 11 = 13CT = 2 + 11 = 13

CT = 3 + 8 = 11CT = 3 + 8 = 11

A

B

D

2

3

C 4

ff 22 (C) = 7(C) = 7

A CT = 4 + 7 = 11CT = 4 + 7 = 11

B

C

D

Procedimento de Resolução

  • Assim, para n = 1 tem-se o seguinte quadro:

n = 1: x (^1) s B C D f (^) 1 *(s) x (^) 1 * A 2 + 11 = 13 4 + 7 = 11 3 + 8 = 11 11 C ou D

*f 1 *(s, x 1 ) = c* (^) *sx1 + f 2 *(x 1 )*

A

B

C

D

25

A

B

C

D

E

F

G

Procedimento de Resolução

n = 2: x (^2) s E F G f (^) 2 *(s) x (^) 2 * B 7 + 4 = 11 4 + 7 = 11 6 + 6 = 12 11 E ou F C 3 + 4 = 7 2 + 7 = 9 4 + 6 = 10 7 E D 4 + 4 = 8 1 + 7 = 8 5 + 6 = 11 8 E ou F

*f 2 *(s, x 2 ) = c* (^) *sx2 + f 3 *(x 2 )*

26

Procedimento de Resolução

x (^3) s H I f (^) 3 *(s) x (^) 3 * E 1 + 3 = 4 4 + 4 = 8 4 H F 6 + 3 = 9 3 + 4 = 7 7 I G 3 + 3 = 6 3 + 4 = 7 6 H

*f 3 *(s, x 3 ) = c* (^) *sx3 + f 4 *(x 3 ) n* = 3:

A

B

C

D

E

F

G

H

I

27

A

B

C

D

E

F

G

H

I

A J

B

C

D

E

F

G

H

I

J

Procedimento de Resolução

s f^ *4 (s) =^ c^ s,J x^4 ***** H 3 j I 4 j

n = 4:

Pesquisa Operacional II 28

Procedimento de Resolução

  • Assim, existem 3 possíveis rotas que apresentam a mesma segurança (menores custos de seguro):

A – C – E – H – J

A – D – E – H – J

A – D – F – I – J

  • Todas as rotas apresentam o mesmo custo total de f **1 ***^ (A) = 11.

Características de Problemas de PD

  • O exemplo do problema da diligência foi elaborado para oferecer, literalmente, uma interpretação física da estrutura abstrata de problemas de PD;
  • Uma maneira de reconhecer que uma situação pode ser formulada como um problema de PD é verificar que sua estrutura básica é análoga à daquele exemplo;
  • Os elementos básicos que caracterizam problemas de PD são apresentados na seqüência.

Características de Problemas de PD

1. O problema pode ser dividido em estágios , com uma decisão política atrelada a cada estágio.

O problema da diligência era dividido em 4 estágios (4 pernas da viagem);

A decisão política a ser tomada em cada estágio era qual apólice de seguro escolher, ou seja, qual o destino a ser selecionado para a próxima perna (estágio) da viagem.

Pesquisa Operacional II 37

Características de Problemas de PD

6. O procedimento de resolução inicia-se ao encontrar a política ótima para o último estágio.

A solução para esse estágio final é, geralmente, trivial, assim como no problema da diligência.

Pesquisa Operacional II 38

Características de Problemas de PD

7. Existe uma relação recorrente que identifica a política ótima para o estágio n , dada que a política ótima para o estágio n + 1 está disponível.

Para o exemplo da diligência essa relação era

{ (^) sx n ( (^) n )} n (^) x f s cn f x n

1

  • (^) ( ) min = + +

Pesquisa Operacional II 39

Características de Problemas de PD

O tipo de relação recorrente difere entre os problemas de PD;

Contudo a notação utilizada permanece a mesma:

N = número de estágios; n = rótulo do estágio atual ( n = 1, 2, ..., N ) s (^) n = estado atual para o estágio n ; xn = variável de decisão para o estágio n ; xn *^ = valor ótimo de xn (dado s (^) n ); f (^) n ( s (^) n , xn ) = contribuição dos estágios n , n + 1, ..., N na função objetivo dado que o sistema inicia no estado s (^) n , a decisão imediata é xn e as decisões ótimas são tomadas na seqüência.

Pesquisa Operacional II 40

Características de Problemas de PD

A relação recorrente será sempre da forma:

ou

Essa relação continua recorrendo à medida que se move para trás estágio por estágio.

*() min{ n (, n )} n (^) x f s f sx n

= *() max{ n (, n )} n (^) x f s f sx n

Características de Problemas de PD

8. O procedimento de solução inicia pelo fim do problema e retrocede estágio por estágio até encontrar a política ótima no início do primeiro estágio.

Essa política ótima imediatamente leva a uma solução ótima para todo o problema, nominalmente, x 1 *^ para o estado inicial s 1 , depois x 2 *^ para o estado seguinte s 2 , depois x 3 ^ para o próximo estado s 3 e, assim por diante, até x N^ para o estágio s N.

Esse movimento retrospectivo foi demonstrado no problema da diligência, onde a política ótima foi encontrada sucessivamente no início de cada estado nos estágios 4, 3, 2 e 1, respectivamente.

Características de Problemas de PD

Para qualquer problema de PD uma tabela como a seguinte pode ser obtida para cada estágio ( n = N , N – 1, ..., 1);

Quando chega-se à tabela para o estágio inicial ( n = 1), o problema foi solucionado. Como o estado inicial é conhecido, a decisão inicial é especificada para x 1 *^ nessa tabela. O valor ótimo das demais variáveis de decisão é especificado pelas tabelas para os próximos estágios, de acordo com o estado do sistema que resulta das decisões predecessoras.

x (^) n s (^) n f (^) *n (sn ) x (^) n *

f (^) n (s (^) n , x (^) n )

Pesquisa Operacional II 43

Programação Dinâmica Determinística

  • Quando o estado do próximo estágio é univocamente determinado (uma só forma de expressão) pela decisão política sobre o estado atual está-se tratando de um problema de Programação Dinâmica Determinística ;
  • A estrutura básica da Programação Dinâmica Determinística pode ser representada da seguinte forma:

s (^) n

Estágio n Estado: s (^) n+

xn Contribuição de xn fn ( xn , sn ) fn *+ 1 (^ sn + 1 )

Estágio n +

Valor: Pesquisa Operacional II 44

  • O Conselho Mundial de Saúde é dedicado à melhoria das condições de saúde em países em desenvolvimento;
  • Atualmente, existem cinco juntas médicas para serem alocadas em três países. Assim, o conselho deve determinar quantas juntas alocar a cada um desses países de tal forma que se maximize a utilização das cinco juntas médicas;
  • As juntas devem manter-se intactas. Ou seja, seus membros não podem ser separados de suas respectivas juntas. Assim, o número de juntas alocadas a cada país deve ser um valor inteiro.

Distribuindo Juntas Médicas pelo Mundo

Pesquisa Operacional II 45

  • A medida de desempenho utilizada é o adicional pessoa-anos de vida. Para um país em particular, essa medida é igual ao aumento da expectativa de vida em anos, multiplicado pelo tamanho de sua população;
  • A tabela seguinte apresenta estimativas do adicional pessoa- anos de vida (em múltiplos de 1.000) para cada país para cada possível alocação das juntas médicas;
  • Pergunta-se: que alocação maximiza a medida de desempenho considerada?

Distribuindo Juntas Médicas pelo Mundo

Pesquisa Operacional II 46

Distribuindo Juntas Médicas pelo Mundo

Juntas médicas 1 2 3 0 0 0 0 1 45 20 50 2 70 45 70 3 90 75 80 4 105 110 100 5 120 150 130

Adicional pessoa-anos de vida País

  • A formulação do problema é a seguinte:

Estágio n = n º do país ( n = 1, 2, 3); xn = número de juntas alocadas no estágio (país) n ; Estado s (^) n = número de juntas médicas ainda disponíveis para alocação nos países restantes.

Assim, no estágio 1 (país 1), onde todos os países são considerados para todas as alocações, s 1 = 5 (ainda existem 5 juntas para serem alocadas).

Todavia, nos estágios 2 e 3, s (^) n será 5 menos o número de juntas já alocadas nos estágios anteriores.

Distribuindo Juntas Médicas pelo Mundo

  • Assim, a seqüência de estados é a seguinte:

s 1 = 5, s 2 = 5 – x 1 , s 3 = s 2 – x 2.

  • Formulando o problema matematicamente, seja p i( x i) a medida de desempenho da alocação de x i juntas médicas ao país i (conforme tabela anterior);
  • Assim, o objetivo é escolher x 1 , x 2 , x 3 , tal que

Distribuindo Juntas Médicas pelo Mundo

3 1

Maximize ( ) i

pi xi

sãointeirosnão- negativos

Sujeitoa 5

3 1

i

i i

e x

x

=

Pesquisa Operacional II 55

Distribuindo Juntas Médicas pelo Mundo

**s 3 f 3 *(s 3 ) x 3 *** 0 0 0 1 50 1 2 70 2 3 80 3 4 100 4 5 130 5

x 2 s (^2) 0 1 2 3 4 5 f 2 *(s 2 ) x 2 * 0 0 0 0 1 50 20 50 0 2 70 70 45 70 0 ou 1 3 80 90 95 75 95 2 4 100 100 115 125 110 125 3 5 130 120 125 145 160 150 160 4

f (^) 2 ( s (^) 2 , x (^) 2 ) = p (^) 2 ( x (^) 2 )+ f (^) *3 ( s (^) 2 - x (^) 2 )

x (^1) s 1 0 1 2 3 4 5 f (^) 1 *(s 1 ) x (^) 1 * 5 160 170 165 160 155 120 170 1

*f 1 (s 1 , x 1 ) = p 1 (x 1 )+f 2 *(s 1 -x 1 ) País 1País 1* ÆÆ^ 11

País 2País 2 ÆÆ^ 33

País 3País 3 ÆÆ^ 11 Ganho máximo = 170.000Ganho máximo = 170.

Pesquisa Operacional II 56

  • Solução:

A solução ótima tem x 1 *^ = 1 (1 junta médica para o 1º país);

Com isso s 2 = 5 – 1 = 4 (juntas disponíveis para o 2º país);

O que implica (para n = 2), x 2 *^ = 3 (3 juntas médicas para o 2º país);

Assim, s 3 = 4 – 3 = 1 (juntas disponíveis para o 3º país);

Finalmente (n = 3), x 3 *^ = 1 (1 junta médica para o 3º país).

Distribuindo Juntas Médicas pelo Mundo

Pesquisa Operacional II 57

  • Solução:

Como f 1 *(5) = 170, a alocação (1, 3, 1) de juntas médicas para os três países incorrerá em um ganho de estimado de 170.000 no índice de desempenho considerado, o que é pelo menos 5.000 a mais do que qualquer outra alocação.

Distribuindo Juntas Médicas pelo Mundo

Pesquisa Operacional II 58

  • O problema anterior ilustra um problema de programação dinâmica particularmente comum denominado problema da distribuição de recursos ;
  • Este tipo de problema envolve um único tipo de recurso que deve ser alocado a um determinado número de atividades;
  • O objetivo é definir como distribuir o recurso entre as atividades que por ele competem, da forma mais eficiente;
  • Para o exemplo anterior, o recurso envolvido são as juntas médicas e as três atividades são os cuidados médicos aos três países.

O Problema da Distribuição de Recursos

  • Formulação do problema. Como sempre envolvem a alocação de um tipo de recurso dentre um determinado número de atividades, problemas de distribuição de recursos sempre apresentam a seguinte formulação:

Estágio n = atividade n ( n = 1, 2, ..., N );

xn = número de recursos alocados à atividade (estágio) n ;

Estado s (^) n = número de recursos ainda disponíveis para alocação entre as atividades restantes.

O Problema da Distribuição de Recursos

  • Quando o sistema inicia no estágio n no estado s n , a escolha de x n resulta que o próximo estado, no estágio n + 1, é s n+1 = s n – x n, conforme representado abaixo:

O Problema da Distribuição de Recursos

s (^) n

n

Estado: s (^) n - xn

xn

Estágio: n +

Pesquisa Operacional II 61

  • A programação dinâmica probabilística diferencia-se da determinística no sentido que o estado no próximo estágio não é completamente determinado pelo estado e pela decisão política no estágio atual;
  • Existe uma distribuição de probabilidade que determinará qual será o próximo estado;
  • Contudo, essa distribuição de probabilidade é completamente determinada pelo estado e pela decisão política no estágio atual.

Programação Dinâmica Probabilística

Pesquisa Operacional II 62

Programação Dinâmica Probabilística

s (^) n xn

1

2

S

fn ( s (^) n , xn )

fn *+ 1 ( 1 )

fn *+ 1 ( 2 )

f (^) n *+ 1 ( S )

p 1 p 2 p S

C 1

C 2

C S

. . .

Decisão Estado:

Estágio n

Probabilidade

Contribuição do estágio n

Estágio n + 1

Pesquisa Operacional II 63

  • Uma aluna de estatística acredita ter desenvolvido um sistema para vencer um jogo popular em Las Vegas.
  • Seus colegas não acreditam que seu sistema funcione, então fizeram uma aposta com ela que se ela começar com 3 fichas, ela não terá nem 5 fichas depois de três rodadas do jogo.
  • Em cada rodada do jogo aposta-se qualquer quantidade de fichas disponíveis e pode-se ganhar ou perder essa mesma quantidade.
  • A aluna de estatística acredita que através de seu sistema ela tem uma probabilidade de 2/3 de ganhar uma dada rodada do jogo.

Vencendo em Las Vegas

Pesquisa Operacional II 64

  • Assumindo que a aluna está correta, utilize a programação dinâmica para determinar a sua política ótima de jogo, com respeito a quantas fichas ela deve apostar (se alguma) em cada uma das três rodadas.
  • A decisão em cada rodada deve levar em consideração os resultados das rodadas anteriores.
  • O objetivo é maximizar a probabilidade de vencer a aposta da aluna com seus colegas.

Vencendo em Las Vegas

  • A formulação do problema é:

Estágio n = n º da rodada do jogo ( n = 1, 2, 3); xn = número de fichas a serem apostadas no estágio n ; Estado s (^) n = número de fichas na mão para iniciar o estágio n.

A função objetivo a ser maximizada a cada estágio deve ser a probabilidade de terminar as três rodadas com pelo menos 5 fichas. Portanto,

f (^) n ( s (^) n , xn ) = probabilidade de terminar as três rodadas com pelo menos 5 fichas, dado que a aluna começa o estágio n no estado s (^) n , toma a decisão imediata xn e toma decisões ótimas a partir de então.

Vencendo em Las Vegas

Assim,

A expressão f (^) n ( s (^) n , xn ) deve refletir o fato que ainda pode ser possível acumular 5 fichas mesmo que a aluna perca a próxima rodada;

Se ela perder, seu estado no próximo estágio será s (^) nxn e a probabilidade de ela terminar com pelo menos 5 fichas será de

Vencendo em Las Vegas

( ) max ( , ) 0 , 1 ,...,

fn sn = xn = snfnsnx n

fn * + 1 ( snxn )

Pesquisa Operacional II 73

Assim, a política ótima a ser adotada é:

Com esta política de ação a aluna tem 20/27 ≈ 74% de probabilidade de vencer a aposta com seus colegas.

Vencendo em Las Vegas

 

 

= = =

= =

=



 

 = =

= = = =

=

seperder( 0), aposta perdida

2 sevencer( 4),^1 ,^2 ,^3 ,^4

seperder( 1), apostaperdida

sevencer( 3), 2 ou 3 1 seperder( 2),

seperder( 3), 2 ou 3

sevencer( 5), 0 sevencer( 4), 1

1

3

  • 3 * 3 2

3

  • 3 3 2 2

3 * 3

3 3 * 2 * 2

1 *

s

x s x

s

s x x s

s x

s x s x

x

Pesquisa Operacional II 74

  • A Programação Dinâmica é uma técnica bastante útil para tomar decisões seqüencialmente inter-relacionadas;
  • Para tanto, faz-se necessário formular relações recorrentes apropriadas para cada problema individual.

Conclusões

Pesquisa Operacional II 75

  • Deseja-se estabelecer uma rota aérea de mínimo custo entre um aeroporto de um país 0, até um aeroporto em outro país 4. Para isto, é necessário fazer escalas passando por aeroportos de outros 3 países (1,2,3 – nesta ordem), comprando-se passagens aéreas para cada vôo. A rede de possíveis vôos é ilustrada abaixo.

Exercício 1

1 2

1

3

2

1

3

2

1

3

1

País 0 País 1 País 2 País 3 País 4 Pesquisa Operacional II 76

  • Os preços dos bilhetes de passagens aéreas são dados pelas tabelas a seguir:

Exercício 1

1 2 3 1 153 160 181

Do País 0 ao País 1

1 2 3 1 325 338 294 2 283 349 264 3 300 318 281

Do País 1 ao País 2

1 2 3 1 143 159 147 2 131 120 109 3 172 190 207

Do País 2 ao País 3

1 1 325 2^301 3 308

Do País 3 ao País 4

  • Considerando esse problema como um problema de Programação Dinâmica, a partir das informações anteriores, determine a rota aérea de menor custo. Qual será o custo mínimo esperado?
  • Caso, em uma situação específica, ao chegar no país 2, o avião sofra um desvio e seja obrigado a pousar no aeroporto 2, qual será a melhor (menos custosa) alternativa de ação (rota) para os passageiros desse vôo que queiram chegar ao país 4?

Exercício 1

Exercício 1

n = 4 País 4 s x4* 1 325 1 2 301 1 3 308 1

f4(s) = cs,*

n = 3 x 3 País 3 s 1 2 3 f^ 3 *(s)^ x^ 3 * 1 468 460 455 455 3 2 456 421 417 417 3 3 497 491 515 491 2

*f 3 *(s, x 3 ) = c* (^) *sx3 + f 4 *(x 3 )*

Pesquisa Operacional II 79

Exercício 1

n = 2 x^2 País 2 s 1 2 3 f (^) 2 *(s) x (^) 2 * 1 780 755 785 755 2 2 738 766 755 738 1 3 755 735 772 735 2

*f 2 *(s, x 2 ) = c* (^) *sx2 + f 3 *(x 2 )*

n = 1 x^1 País 1 s 1 2 3 f 1 *(s) x 1 * 1 908 898 916 898 2

*f 1 *(s, x 1 ) = c* (^) *sx1 + f 2 *(x 1 )*

Pesquisa Operacional II 80

Exercício 1

Rota de mínimo custo: País 0 País 1 País 2 País 3 País 4 1 2 1 3 1 Caso o avião pouse no aeroporto dois do país 2, a melhor rota seria: 1 2 2 3 1

Pesquisa Operacional II 81

  • O gerente de produção de uma empresa deseja distribuir 6 máquinas recentemente adquiridas entre 4 setores da empresa.
  • A tabela seguinte apresenta o ganho esperado para cada setor para cada possível alocação das máquinas.

Exercício 2

Máquinas A B C D 0 $0,00 $0,00 $0,00 $0, 1 $4,00 $5,00 $6,00 $4, 2 $8,00 $10,00 $11,00 $9, 3 $13,00 $14,00 $15,00 $13, 4 $17,00 $18,00 $18,00 $16, 5 $19,00 $20,00 $21,00 $18, 6 $21,00 $23,00 $24,00 $20,

Setor

  • Pergunta-se: que alocação maximiza o ganho da empresa? 82

Exercício 2

Formulação do problema:

Estágio n = n º do setor ( n = 1, 2, 3, 4); xn = número de máquinas alocado no estágio (setor) n ; Estado s (^) n = número de máquinas ainda disponíveis para alocação nos demais setores.

Assim, no estágio 1 (setor 1), onde todos as máquinas são consideradas para todas as alocações, s 1 = 6 (ainda existem 6 máquinas para serem alocadas).

Todavia, nos estágios 2, 3 e 4, s (^) n será 6 menos o número de máquinas já alocadas nos estágios anteriores.

Pesquisa Operacional II 83

  • Assim, a seqüência de estados é a seguinte:

s 1 = 6, s 2 = 6 – x 1 , s 3 = s 2 – x 2 , s 4 = s 3 – x 3

  • Formulando o problema matematicamente, seja p i( x i) o lucro da alocação de x i máquinas ao setor i (conforme tabela anterior);
  • Assim, o objetivo é escolher x 1 , x 2 , x 3 , x 4 tal que

Exercício 2

4 1

Maximize ( ) i

pi xi

sãointeirosnão- negativos

Sujeitoa 6

4 1

i

i i

e x

x

=

84

Exercício 2

6

0 1 2 3 4 5

6

21

5

19

4 17 3 2 13 (^18) 4

Estágio: 1

6

0

0

2 3 0 1 2 3 4 5

0

0 4 9 13 16 28

0

5 0 10 5 0 14 10 5 0

20 0

18

(^0) 6

0 1 2 3 4 5 0

6 0 11 6 0 15 11 6 0

0

(^0) 6

4

23

21

18

24

20

Pesquisa Operacional II 91

  • Solução:

Exercício 2

Ganho A B C D Esperado Máquinas Alocadas^30

Setor

0 2 2 2