Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


desigualdade de Markov Chebchev, Resumos de Probabilidades e Processos Estocásticos

prova de probabilidades distribuições regra de Bayes

Tipologia: Resumos

2021

Compartilhado em 20/10/2021

marcos-cordeiro
marcos-cordeiro 🇧🇷

8 documentos

1 / 78

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
NESTOR CATICHA
PROBABILIDADES
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e

Pré-visualização parcial do texto

Baixe desigualdade de Markov Chebchev e outras Resumos em PDF para Probabilidades e Processos Estocásticos, somente na Docsity!

N E S T O R C AT I C H A

P R O B A B I L I D A D E S

4 nestor caticha

neutra, onde todos tem mérito e direito a ser ouvidos. O século XX ficou para trás e somente poucos frequentistas restarão no futuro. O objetivo destas notas é apresentar aos estudantes de Física uma visão que tem se mostrado frutífera e tem conquistado cada vez mais adeptos. Aqueles que estão interessados em aplicações e análise de dados terão acesso aos métodos atuais. O uso de técnicas numéricas e do computador não podem ser deixadas de lado e mesmo que não seja o objetivo principal, um pouco desse universo será explorado. O nível do curso é introdutório e a parte formal de Probabilidades como uma parte da Matemática, um ramo da análise funcional e teoria de medida não será explorada. A idéia de apresentar uma forma de pensar que tem aplicações em uma vasta gama de assuntos, pode levar o leitor a pensar que está na presença de alguém que com um martelo, pensa que todos os pro- blemas são pregos. Ou que estamos apresentado dogmas, dos quais não abriremos mão. No fim talvez não saiba como me defender de tais acusações, exceto alegando que o único ponto sobre o qual serei inflexível será que só podemos acreditar naquilo que a informação e evidência permitem, e só enquanto não surgir informação contradi- tória. 1 Não faz sentido acreditar em algo que não seja respaldado 1 Há outras formas de pensar, por exemplo acreditar em algo porque isso me deixa mais feliz. Mas eu não saberia dar um curso so- bre isso. "I have a lot of beliefs, and I live by none of them - that’s just the way I am... they make me feel good about who I am.” – Louis CK

por informação.

Sumário

  • 1 Teoremas de Regraduação de Cox
  • 2 Outras definições de probabilidade
  • 3 Uso elementar de Probabilidades
  • 4 Frequência e Probabilidade

Teoremas de Regraduação de Cox

Alea jacta est Júlio César

1. 1 Introdução: Determinismo Newtoniano ou aleatório?

Júlio César ao cruzar com seu exército o Rio Rubicom quebrou uma regra na República Romana. Não havia volta. Ou conseguia o poder ou perdia tudo. Qual seria o desenlace da sua ação? Nem ele sabia e segundo Suetônio teria dito: Alea jacta est. A sorte está lançada. Sa- ber estimar as consequências de uma ação é aconselhável para poder decidir que curso tomar. César talvez tenha procedido da seguinte forma. Primeiro fez uma lista das possibilidades à sua frente. Uma decisão é tomada e uma das possibilidades seguidas. Estas poderiam incluir: (Ação I) Continuar na Gália. (Ação II) Fazer uma aliança com Pompeu , (Ação III) Fugir de Pompeu, (Ação IV) Se aposentar, (Ação V) Voltar a Roma com seu exército e lutar contra Pompeu. Historia- dores certamente poderiam incluir outras. Como decidir? Supomos que uma escolha foi feita. Quais as consequências? Para cada curso de ação ele deve ter feito uma lista de possibilidades. Suponha que considere tomada a Ação V. Então as consequências poderiam ser (Consequência 1 da Ação V) Vitória total, com a formação do Im- pério e ele como Imperador. (Consequência 2 da Ação V) Derrota total levando à sua morte. (Consequência 3 da Ação V) Guerra Ci- víl interminável ...etc. Mas não devia acreditar que cada uma das possiblidades teria a mesma chance de ocorrer. A cada consequên- cia de cada Ação, César poderia ter associado um valor numérico indicando sua crença na chance de ocorrer. Veremos que isto será codificado em probabilidades de ocorrência. Mas também poderia ter associado um valor numérico de quão feliz ele seria se efetiva- mente essa consequência ocorresse. Estes números descrevem o que se chama de utilidade, de cada possibilidade, para o agente Júlio Ce- sar. Parece óbvio que as utilidades dependem do agente, mas talvez não seja óbvio que as probabilidades também dependam do agente, ou melhor do que este sabe. Resumindo, Júlio César decidiu o seu curso de ação após identificar as possibilidades de ação, das con- sequências de cada ação, das chances de cada consequência ocorrer, e da utilidade ou felicidade que cada consequência teria. Neste curso

8 nestor caticha

não falaremos sobre decisão a partir das utilidades. Atualmente, em geral, este tópico não cabe em cursos de Física. Faremos um estudo sistemático sobre a chances de algo ocorrer sem importar quão feliz você fique com cada possibilidade. O ponto central será definir com cuidado o que queremos dizer com chances, como atribuir números e como mudá-los quando recebemos informação. Teria Júlio César dúvidas sobre sua sorte ou saberia mais que os outros atores do drama? Se soubesse mais talvez estaria jogando um jogo de cartas marcadas enquanto os outros jogariam a cegas. A frase também implica num certo determinismo. Não há nada a fazer. O curso natural das coisas conduzirá os atores. Como observadores verão simplesmente o desenrolar da história. Há alguma inconsistência em pensar que a as consequências são inevitáveis por um lado, e por outro ficar torcendo para ter sorte? Seria como torcer ao ver a gravação de um jogo de futebol que já foi jogado, mas não sabemos o resultado. Talvez seja um exercício interessante ver grandes jogos do passado sem saber qual jogo é, torcendo para seu time ganhar com direito a ficar tão feliz como quando o jogo é assistido ao vivo.

Figura 1.1: Integração numérica das equa- ções de movimento de um modelo Newtoni- ano de uma "moeda"feita de massas (m) e molas (k). A figura mostra um espaço res- trito de condições iniciais. H é a altura da moeda ao ser lançada e θ o ângulo com a horizontal, a moeda é solta do repouso. Nesta figura a altura é "grande"(em relação a mg/k). A estrutura é formada por qua- tro massas nos vértices do que seria em re- pouso um retângulo, ligadas por seis molas nas arestas e diagonais. O sistema está restrito a duas dimensões e a cada batida mesa há dissipação de energia. É um mo- delo de uma moeda ou um cubo simplifi- cado. As simulações foram feitas por Gui- lherme Galanti e Osame Kinouchi, que gen- tilmente autorizaram o uso destas figuras.

Figura 1.2: Igual à anterior, mas a moeda é solta de uma altura menor, para diferentes ângulos.

Todas estas situações são complexas. Comecemos por algo mais simples. Uma das maiores revoluções intelectuais da história da hu- manidade foi a introdução da Mecânica por Newton. Sabemos que caso fosse necessário temos o formalismo da Mecânica para poder calcular a trajetória de uma moeda. O determinismo Newtoniano permite fazer predições sobre o futuro a partir do estado atual. Por outro lado, os casos mais associados à sorte são o jogo de dados ou um jogo de cara ou coroa com uma moeda. Não é por acaso que a frase de César que teria sido dita em grego menciona κυβ o σ , o cubo ou dado. Estes jogos deram origem a o estudo matemático das probabilidades. Como podemos associar a uma moeda simultaneamente as pro- priedades de ser um sistema determinista, governado pelas leis de Newton e a condição de exemplo mais usado ao falar de sistemas aleatórios? É necessário ter cuidado com as palavras. O que significa aleatório? Teremos todo este curso para atribuir-lhe significado. Em geral, ao ser usado coloquialmente, significa que não é totalmente determinado a priori por eventos passados. As possibilidades do estado da moeda são determinados ao espe- cificar 12 números. 3 dizem respeito à sua posição, por exemplo do centro de massa. Sua orientação é determinada por 3 ângulos.Veja, num livro de Mecânica a definição de ângulos de Euler. Ou senão, simplesmente considere 2 eixos no plano da moeda e um terceiro perpendicular ao plano e as rotações em torno deles.Esse número é duplicado ao levar em conta as suas derivadas temporais (velo- cidades). A dinâmica em 12 dimensões é dada pelas equações de Newton 1. É óbvio que as equações não são suficientes para deter- 1 Nem a dedução destas equações e muito menos a sua solução, serão necessárias minar como cairá a moeda. Há muitas maneiras de jogar a moeda, aqui, mas cabem num curso de Mecânica. mas só um conjunto de equações. As mesmas equações devem ser complementadas com diferentes conjuntos de condições iniciais que

10 nestor caticha

1. 2 Informação completa ou incompleta

Há muitas definições matemáticas possíveis que poderiam ser usa- das na tentativa de formalizar o conceito coloquial de informação. Uma forma de avançar, que é bastante comum em ciência, começa por definir matematicamente algo e depois tentar interpretar as fór- mulas matemáticas para mostrar que esta interpretação esta de acordo com algumas das características que podemos atribuir ao conceito coloquial de informação que temos. Em lugar de começar por uma estrutura matemática pré-escolhida para servir de ferramenta de análise, começamos por uma interpre- tação e depois encontramos a estrutura matemática que se adapte à interpretação. A interpretação passa por estabelecer em alguns ca- sos particulares suficientemente simples, tais que haja algum tipo de consenso, o quê deveria resultar da teoria. É possível que este procedimento pareça novo ao leitor e será surpreendente quantos re- sultados serão extraidos deste método e do rigor matemático com que a teoria se vestirá. Como este procedimento permite saber mais claramente do que estamos falando e do que não estamos, achamos que esta é atualmente a melhor maneira de introduzir a teoria de informação. Pode parecer estranho para o estudante de Física que o elemento principal a seguir seja a idéia de asserção, isto é, uma frase que em princípio é uma proposição que se apresenta como verdadeira. Mas a matemática é um tipo de linguagem que tem a vantagem de permir a quem a usa ser muito cuidadoso com o que diz. Denotaremos as- serções por letras A, B, C...a, b, c... Uma frase pode ser julgada correta ou não de várias maneiras. Podemos pensar se é correta do ponto de vista da sua estrutura gramatical ou sintática. Não é isto que que- remos fazer e consideraremos as asserções a seguir suficientemente bem formadas 2. Queremos analisar seu conteúdo informacional, 2 Embora o formalismo a ser introduzido também possa ser usado nesta direção, se realmente a podemos creer verdadeira. Mas quando se diz ” a mas não agora. massa de Saturno está entre m 1 e m 2 ” ou ”... entre m 3 e m 4 ” estamos usando asserções diferentes e a tarefa é determinar quanto acredita- mos que uma ou a outra sejam verdade e aqui o estudante reconhece a linguagem científica. Consideremos a asserção ”Existem zumbies”. Isto é verdade? Se o contexto for o de filmes gravados em Pittsburgh na década de oitenta, a resposta será uma. Se for no mundo real, outra. Nenhuma asser- ção sozinha pode ser analisada, no que diz respeito a ser verdadeira ou não, de forma independente do resto do universo conceitual. Ela será julgada verdadeira ou não quando analisada dentro de um con- texto. A informação trazida por uma asserção C, será usada para atribuir um grau de verdade à asserção A, ou seja dentro do contexto C. Poderiamos chamar esse grau de, por exemplo, probabilidade de que A seja verdade se C for dada. Mas fazendo isto estariamos de- finindo de antemão que a ferramenta matemática apropriada para descrever informação é a teoria de probabilidades. Isto parece bem razoável mas não escapa às críticas acima e permite que outra ferra-

probabilidades 11

menta matemática seja usada por simplesmente expressar o gosto de outras pessoas ou a facilidade de uso em determinados problemas práticos com a mesma justificativa: parece razoável, eu gosto, funciona, é prático. Não descartamos o uso de outras ferramentas matemáticas, mas queremos deixar claro que estas poderão ser vistas como apro- ximações mais ou menos adequadas de uma estrutura que unifica e tem um posição diferente. O objetivo deste capítulo é mostrar que a escolha da teoria de probabilidades como a ferramenta matemática adequada para tratar informação é muito mais do que simplesmente conveniente. A teoria de probabilidades segue porque é a extensão da lógica a situações de informação incompleta. Mas até aqui não sabemos o que é lógica, informação nem incompleta. A análise da lógica remonta a Aristóteles e passa por Boole no sé- culo XIX, que contribuiu para que a lógica pudesse ser representada em linguagem matemática. 3. Uma lógica envolve (i) um conjunto de 3 Veja para uma comparação: Aristo- tle’s Prior Analytics and Boole’s Laws of Thought,John Corcoran, History and Philo- sophy of Logics 2003

proposições supostas verdadeiras, (ii) um método de dedução para estabelecer a validade de argumentos e (iii) um método para estabe- lecer invalidades. Um argumento lógico é composto por duas partes. Um conjunto de asserções, chamadas as premissas e uma única asserção chamada de conclusão. Um argumento é válido se a conclusão pode ser obtida aplicando as regras (ii) e (iii). Se a informação em C não permite a certeza sobre a verdade de A então diremos que a crença que temos sobre A esta baseada em informação incompleta. Em casos particulares poderá ocorrer que dado C como verdade, possa ser concluido com certeza que a asser- ção A é verdadeira ou ainda em outros casos que é falsa. Quando não há alternativa para a conclusão, quando ela segue por força da informação disponível, dizemos que a conclusão é racional ou lógica. Dizemos que estamos frente a casos de raciocínio dedutivo. Nestes casos a informação disponível é completa pois nada falta para ter cer- teza. Exemplos de informação completa são dados pelos silogismos Aristotélicos: suponha que recebemos a informação contida em C = “A → B′′, isto é, A implica B. Traduzindo, isto significa “se souber que A é certamente verdade, segue que a proposição B também o é.” Dado isso, o que podemos dizer sobre B? Nada com certeza, mas se também recebemos a informação adicional A, isto é, que ”A é Verdade”, então segue B, ou seja “B é Verdade”. Outro caso de informação completa, novamente no contexto C, ocorre quando é dado como verdade a negação B ou seja “B é Falso”. Segue A, isto é, que “A é Falso” como conclusão inescapável. Note que se A não fosse falso, B não poderia sé-lo. Nas condições que C = “A → B′′^ e “A é Falso”, o quê pode ser concluido? Do ponto de vista lógico clássico nada podemos concluir sobre B. Da mesma forma se for dada a informação “B é Verdade”, nada podemos concluir sobre A. Estamos frente a casos de infor- mação incompleta e a lógica clássica não serve para chegar a uma conclusão. Não é possível deduzir nada. A indução, o que quer

probabilidades 13

que ao analisar um número de casos particulares sejam reveladas as inconsistências entre eles, nesse caso não poderemos chegar a uma teoria geral. Mas pode ser que os casos particulares sirvam para res- tringir e determinar a teoria geral. 11 Isto é o que mostraremos a 11 Este comentário parece trivial, mas o uso que será dado a seguir é totalmente não tri- vial. Neste contexto de probabilidades foi colocado primeiro por J.Skilling, mas não de forma explicita. O destaque a este procedi- mento apareceu por primeira vez no livro de A. Caticha que o chamou de indução elimi- nativa. Usaremos novamente este estilo de fazer teoria ao introduzir o conceito de en- tropia.

seguir. Em primeiro lugar queremos falar sobre uma asserção A no caso de informação incompleta. Nos referimos então à crença ou plausi- bilidade de A ser verdade dado B e a denotamos pelo símbolo A|B que lemos ”a plausibilidade A dado B” ou ainda de ”... de A con- dicionada a B”. Por que não à probabilidade de A dado B? Porque já existe uma teoria matemática de probabilidade e não sabemos se será a estrutura matemática que emergirá desta análise. Poderiamos usar outras palavras, mas crença ou plausibilidade são conhecidas o suficiente para serem úteis neste contexto e não tem por agora o pro- blema de ser definidas formalmente. A Desiderata que segue tem cinco desejos denotados DP 1 ...DP 5 e é um bom exercício tentar mos- trar que não fazem sentido. Se você conseguir e convencer outros terá feito uma grande contribuição, se não terá mais respeito pelas conclusões que seguem.

1. 2. 2 DP 1 Representação de crenças e transitividade

Queremos analisar o primeiro caso simples que lida com o conceito de mais plausível. Se A dado B é mais plausível do que A dado C escrevemos A|B  A|C. Suponha ainda que A|C  A|D. Queremos, para seguir o uso cotidiano da linguagem impor que A dado B seja mais plausível que A dado D Temos assim nosso primeiro desejo, a plausiblidade deverá satis- fazer a transitividade:

  • DP 1 : Se A|B  A|C e A|C  A|D então deve ser o caso que A|B  A|D

Além disso, dadas duas crenças podemos imaginar que há outra asserção intermediária. Isto é fácil de satisfazer se impusermos:

  • A plausibilidade A|B deverá ser representada por um número real.

Podemos satisfazer este tipo de ordenamento representado crenças com números racionais. A escolha de números reais permite usar integrais, o que não é pouco, pois fazer somas é difícil. Nota que sempre usamos integrais em fisica, mesmo que o espaço tenha uma estrutura subjacente (e.g 10−^31 m). Não sabemos se tem, mas nos modelos para o mundo usados em Mecânica, os pontos do espaço e tempo vivem numa variedade real. Dados A|B > A|C

e A|C > A|D,

14 nestor caticha

segue imediatamente, uma vez que são números reais, que

A|B > A|D,

de acordo com o desejo DP 1. Dizer que alguma coisa é um número real nos dá imediatamente a transitividade, mas não diz nada sobre que número deve ser atribuido, nem sobre como mudá-lo se a infor- mação passa de B para C. Também não diz que a representação das crenças seja única. Uma mudança dos números estritamente mono- tonica crescente não mudará a ordem. Isto levará a que há familias de atribuições de números que representam a ordem da mesma forma.

1. 2. 3 DP 2 Asserções compostas:

Através de certas operações e de diferentes asserções podemos criar asserções compostas. Exemplos de operadores são a negação, o pro- duto e a soma lógicos.

  • A negação de A é denotada por A.
  • O produto ou conjunção de duas asserções é uma terceira asser- ção, há diferentes notações equivalentes possíveis: AB, A ∧ B ou ainda A e B.
  • A soma ou disjunção de duas asserções é uma terceira asserção, que constuma ser denotada por A + B ou A ∨ B, ou ainda A ou B. A tabela 1. 1 mostra a tabela verdade para as operações de soma e produto lógico, onde V = Verdade e F = Falso. Note que as últimas duas colunas, colocadas aqui para futura referência, mostram que A + B e A B são iguais.
A A B A + B AB A + B A B
V F V V V F F
V F F V F F F
F V V V F F F
F V F F F V V

Tabela 1. 1 Tabela verdade para a negação e algumas asserções compostas.

Isso significa que A + B = A B portanto o conjunto de operações negação e conjunção permite construir a disjunção de asserções. Ao falar de silogísmos introduzimos a operação ⇒ que significa implicação. Se é verdade que A ⇒ B, significa que se A é verdade segue B. Isto não é um novo operador pois é equivalente dizer que C é verdade para C = A ∧ B. Suponha que haja um método, usando a teoria geral que procura- mos e ainda não temos, de analisar a plausibilidade de uma asserção

16 nestor caticha

dade y = a ∨ b|c. Há 4 plausibilidades que serão interessantes para esta análise:

x 1 = a|c, x 2 = b|c, x 3 = b|ac, x 4 = a|bc. ( 1. 1 )

É importante notar que todas estas plausibilidades são condiciona- das a c, a informação que por hipótese é suposta verdadeira. Além disso podem ser condicionadas a outras asserções relevantes e as úni- cas disponíveis são a e b por separado. Não tem sentido considerar ab como parte do condicionante. Deve haver uma dependência entre a ∨ b|c e algum subconjunto de {xi} = {x 1 , x 2 , x 3 , x 4 }, então

  • DP 4 : Regra da Soma: Deve existir uma função F que relaciona a ∨ b|c e algum subconjunto de {xi} e não deve tomar um valor constante, independente dos valores de {xi}.

É claro que trocando soma por produto parece razoável desejar:

  • DP 5 : Regra do Produto. Deve existir uma função G que relaci- ona ab|c e algum subconjunto de {xi} e não deve tomar um valor constante, independente dos valores de {xi}.

Como F e G representam a plausibilidade de asserções (compostas), também devem tomar valores reais. Além disso não impomos nada além de que dependam em algumas, se não todas, as variáveis {xi}. Parece natural exigir que não tenham valores constantes, pois senão a todas as asserções compostas lhes seria atribuido o mesmo número. Para facilitar as deduções também imporemos diferenciabilidade até segunda ordem com repeito a quaisquer dois argumentos. Isto não é necessário, mas as provas ficam mais longas e no fim o resultado vem na forma de funções diferenciáveis. Porque um subconjunto? Qual subconjunto? Todos? Como deci- dir? Há 11 subconjuntos de dois ou mais membros: Seis ( (^) 2!2!4! ) pares (xi, xj), quatro ( (^) 3!1!4! ) triplas (xi, xj, xk) e o conjunto inteiro (x 1 , x 2 , x 3 , x 4 ). Analisaremos casos particulares em que é fácil ver que alguns sub- conjuntos levam a resultados absurdos. Do ponto de vista axiomático poderiamos adicionar stes casos particulares à lista de desejos.

1. 3 Consequências da Lista de Desejos

Parece difícil que desta lista DP 1 ...DP 5 surja uma estrutura matemá- tica, quanto mais única. Ou como veremos, essencialmente única a menos de regraduações montônicas que não alteram a ordem das crenças. Talvez o que será surpreendente para o leitor, é que seja a teoria de probabilidades. A estrutura matemática aparecerá anali- sando as restrições nas funções F e G impostas pelos desejos.

1. 3. 1 A regra da soma

Começamos com a disjunção a ∨ b|c e a função F. Primeiro consi- deramos a e b mutuamente exclusivos, mas depois veremos que isto

probabilidades 17

permitirá analisar o caso geral. Sob esta restrição a|bc = b|ac = v (^) f para qualquer c por DP 3. Logo

a ∨ b|c = F(a|c, b|c, a|bc, b|ac) = F(a|c, b|c, v (^) f , v (^) f ),

mas esta é uma função de apenas duas variáveis, e da constante desconhecida v (^) f :

a ∨ b|c = f (a|c, b|c).

Para avançar olhamos para asserções compostas mais complexas, que podem ser analisadas de mais de uma maneira, que pelo desejo DP 2 , devem dar o mesmo resultado. Para três asserções a, b e c mutua- mente excludentes nas condições d, duas maneiras equivalentes de escrever a disjunção das três são (a ∨ b) ∨ c|d = a ∨ (b ∨ c)|d o que permite usar a função f duas vezes

a ∨ (b ∨ c)|d = f ( f (a|d, b|d), c|d) (a ∨ b) ∨ c|d = f (a|d, f (b|d, c|d))

ou em notação óbvia, f satisfaz

f ( f (x, y), z) = f (x, f (y, z)) ( 1. 2 )

chamada equação da associatividade, primeiramente estudada por Abel no contexto de teoria de grupos. Pode se provar 13 que para 13 Para condições em f ver Aequationes mathematicae 1989, Volume 37, Issue 2-3, pp 306-312 The associativity equation revi- sited R. Craigen, Z. Páles, ou o livro Aczél, J. (1966), Lectures on functional equations and their applications, Mathematics in Sci- ence and Engineering 19, New York: Acade- mic Press,

toda solução de 1. 2 , existe um bijeção φ , dos reais nos reais, que tomaremos como crescente, e portanto será estritamente monotonica crescente, tal que

f (x, y) = φ −^1 ( φ (x) + φ (y)). ( 1. 3 )

Para o leitor bastará mostrar neste ponto, que a expressão 1. 3 é uma solução da equação 1. 2. Agora um ponto central: podemos regraduar, usando φ , as atribui- ções de plausibilidade e não mais falar dos números do tipo a|d mas de números φ (a|d). Por ser uma bijeção, resulta que a ordem de pre- ferências não se altera, se antes as crenças sobre as asserções tinham uma certa ordem, depois da regraduação, o ordenamento da repre- sentação numérica das crenças é o mesmo. É importante ver que a função φ é estritamente monotonica: se x > y segue que φ (x) > φ (y), sem poder haver igualdade. Isto significa que asserções com crenças diferentes são mapeadas em valores φ diferentes. Caso ocorresse a possibilidade de igualdade, antes da regraduação teriamos uma separação de preferências e depois da regraduação poderiamos ter confusão entre asserções mapeadas no mesmo valor de φ. 14 Conti- 14 Veja A. Patriota onde as condições so- bre f são relaxadas e as consequências de aceitar soluções não estritamente monotoni- cas são consideradas.

nuamos sem saber que números são esses, mas avançamos a ponto de poder dizer que para quaisquer eventos mutuamente exclusivos a crença da disjunção, uma asserção composta pode ser expressa em termos das crenças nas asserções mais simples:

φ (a ∨ b|d) = φ (a|d) + φ (b|d). ( 1. 4 )

probabilidades 19

1. 3. 2 Regra do produto: quais as variáveis relevantes?

Queremos expressar y = φ (ab|c) ( 1. 10 )

em termos da função ainda por determinar G e de algum dos subconjuntos de {xi}. Lembramos a notação x 1 = a|c, x 2 = b|c, x 3 = b|ac, x 4 = a|bc. Tribus sugeriu a análise das 11 possibilidades para verificar que só há duas que sobrevivem a casos extremos. Seguimos A. Caticha, pois corrige vários erros anteriores. Os dois conjuntos sobreviventes são (x 1 , x 3 ) e (x 2 , x 4 ). Note que se o primeiro deles fosse um dos sobreviventes, o segundo também deveria ser pela simetria trazida pela comutatividade do produto lógico. Cox já parte da conclusão de que estes dois subconjuntos são os adequados. O exercício que segue mostra que ele tinha razão, mas retira a arbitrariedade aparente, de fazer a escolha sem analisar outros candidatos. Vejamos como chegar a esta conclusão (novamente seguimos AC) Os 11 casos são reduzidos a 7 por simetria:

  1. y = G( φ (a|I), φ (b|I)) ( 1 possibilidade)

  2. y = G( φ (a|I), φ (a|bI)) ( 2 possibilidades a ↔ b)

  3. y = G( φ (a|I), φ (b|aI)) ( 2 possibilidades a ↔ b)

  4. y = G( φ (a|bI), φ (b|aI)) ( 1 possibilidade )

  5. y = G( φ (a|I), φ (b|I), φ (a|bI)) ( 2 possibilidades a ↔ b)

  6. y = G( φ (a|I), φ (a|bI), φ (b|aI)) ( 2 possibilidades a ↔ b)

  7. y = G( φ (a|I), φ (b|I), φ (a|bI), φ (b|aI)) ( 1 possibilidade)

Caso 1 Mostraremos que y = a ∧ b|I = G( φ (a|I), φ (b|c)) = G(x 1 , x 2 ) não funciona pois nao satisfaz o esperado em um caso simples. Porque não serve o subconjunto mais óbvio (x 1 , x 2 )? Primeiro vejamos que não segue o bom senso. Seja a= ’Helena usa um tenis esquerdo vermelho’ enquanto que b= ’ Helena usa um tenis direito preto’. A plausibilidade dessas duas asserções será julgada dada a seguinte informação c= ’Helena gosta de tenis pretos e de tenis vermelhos’, e talvez seja possível concluir que as duas asserções são bastante plausíveis. Mas se tivessemos y = G(x 1 , x 2 ) poderiamos ser levados a pensar que ‘Helena usa um tenis esquerdo vermelho e um tenis direito preto’ é bastante plausível. Posso acreditar bastante nas duas asserções, mas não que seja muito plausível que use um tenis de cada cor ao mesmo tempo. Devemos rejeitar esta forma para G. Para convencer os incrédulos no exposto acima, um argumento mais formal: Suponha que a|d = a′|d′^ e b|d = b′|d′, mas que embora a e b sejam mutuamente exclusivos, a′^ e b′^ não o sejam. Neste caso teriamos que

φ (a′b′|d′) = G( φ (a′|d′), φ (b′|d′)) = G( φ (a|d), φ (b|d)) = φ (ab|d) = φ F = 0.

20 nestor caticha

E isto ocorreria para qualquer par de asserções não mutuamente exclusivas (a′, b′), pois sempre poderiamos supor um caso auxiliar (a, b) adequado e portanto teria um valor constante, independende das asserções sob consideração. Insistindo, suponha que Bruno joga uma moeda contra o teto, bate no ventilador e cai. A Helena pega outra moeda e faz o mesmo. Temos a mesma crença que saia cara ou coroa nas duas situações. Chamamos cB a asserção que saiu cara no primeiro experimento e cH no segundo. Achamos razoável escrever

φ (cB|I) = φ (cH |I) e φ (cB|I) = φ (cH |I)

E também achamos impossível que cBcB|I seja verdade, não pode ser verdade que Bruno obteve cara e coroa nessa única jogada. Mas seriamos levados a pensar que

φ (cBcH |I) = G( φ (cB|I), φ (cH |I)) = G( φ (cB|I), φ (cB|I)) = φ (cBcB|I) = 0 ( 1. 11 )

que significaria que se Bruno obteve cara, Helena não poderia ter obtido coroa. Caso 2 Para qualquer asserção b|I, sob quaisquer condições teriamos

φ (b|I) = φ (Ib|I) = G( φ (I|I), φ (I|bI)) = G( φ V , φ V ) = constante.

Um método que atribui o mesmo valor numérico a todas as asserções não pode ser aceitável. Caso 3 Para o caso y = G( φ (a|I), φ (b|aI)) e a alternativa G( φ (b|I), φ (a|bI)) ninguém tem encontrado casos que se oponham ao bom senso. Este será o único candidato a sobreviver e será a pedra de sustentação a toda a teoria que segue. Não analisaremos as consequências disto agora. Ainda falta eliminar os outros candidatos e posteriormente encontrar a forma específica de G. Caso 4 Se y = G( φ (a|bI), φ (b|aI)) somos levados a algo inaceitável considerando que para qualquer asserção b teriamos

φ (b|I) = φ (bb|I) = G( φ (b|bI), φ (b|bI)) = G( φ v, φ v) = constante

independente de b. Novamente a crença sobre a plausibilidade de uma asserção seria independente da asserção. Caso 5 y = G( φ (a|I), φ (b|I), φ (a|bI)). Este caso é mais complicado de analisar. Mostraremos, no entanto que se reduz a algum dos casos anteriores. Ainda consideraremos a conjunção de mais de duas asserções , abc|I, que pode ser escrito de duas formas diferentes (ab)c|I = a(bc)|I, portanto, considerando a primeira forma obtemos

φ ((ab)c|I) = G( φ (ab|I), φ (c|I), φ (ab|cI))

= G(G( φ (a|I), φ (b|I), φ (a|bI)), φ (c|I), G( φ (a|cI), φ (b|cI), φ (a|bcI)) = G(G(x, y, z), u, G(v, w, s)). ( 1. 12 )