







Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Apresentação diferenciada das variáveis aleatórias discretas
Tipologia: Notas de estudo
1 / 13
Esta página não é visível na pré-visualização
Não perca as partes importantes!








Considere um experimento com espa¸co amostral Ω. Uma fun¸c˜ao definida no espa¸co Ω ´e uma vari´avel aleat´oria. Em outras palavras, imagine que s ∈ Ω seja um evento simples (um resultado em um expermento aleat´orio), uma vari´avel aleat´oria X ´e uma fun¸c˜ao que atribui um valor X(s) a este evento simples. Os valores que X assume podem ser tanto discretos quanto cont´ınuos, implicando em vari´aveis, respectivamente discretas ou cont´ınuas. Neste cap´ıtulo apenas nos preocuparemos com o caso discreto. Exemplo. Arremesso de uma Moeda Dez Vezes. Considere um experi- mento no qual arremessamos uma moeda dez vezes. O espa¸co amostral Ω deste experimento consiste em 2^10 = 1024 pontos (por exemplo, HHHHHHHHHH, HTHTHTHTHT, etc.... Lembrando que H=Cara e T=Coroa). Uma poss´ıvel vari´avel aleat´oria seria o n´umero de caras NH assim se s = HHHHT HT T T T , ent˜ao NH (s) = 5. Note que a fun¸c˜ao NH toma apenas valores discretos (por exemplo, 0, 1 , 2 , ...).
Lembremos que um modelo probabil´ıstico ´e determinado pela terna 〈Ω, F, P 〉, onde Ω ´e espa¸co amostral que representa o conjunto de poss´ıveis resultados para um experimento aleat´orio, F ´e a σ-´algebra que representa todos os poss´ıveis eventos compostos e P ´e a medida de probabilidade que atribui um valor entre 0 e 1 para cada evento, representado a chance de ocorrˆencia deste particular evento. A defini¸c˜ao da medida de probabilidade sobre o espa¸co amostral e, por conseq¨uˆencia, sobre todos os eventos compostos (por que?)^1 permite que
(^1) Revise a defini¸c˜ao a σ-´algebra. D´a para ver que todos eventos compostos s˜ao combina¸c˜oes de pontos do espa¸co amostral. Se vocˆe souber o valor das probabilidades para todos eventos simples, vocˆe tamb´em saber´a, pela simples aplica¸c˜ao das propriedades da probabildiade, seu
calculemos a fun¸c˜ao discreta de probabilidade para qualquer vari´avel aleat´oria X. Assim P (X = x) = P ({s : X(s) = x}). Em palavras, a probabilidade da vari´avel aleat´oria X possuir valor x ´e a probabilidade do evento composto de- scrito por {s : X(s) = x}, ou seja, ´e a probabilidade dos pontos do espa¸co amostral s nos quais a fun¸c˜ao X(s), que define a vari´avel aleat´oria, tem valor x. Para economizar s´ımbolos utilizaremos tamb´em P (x) significando a mesma coisa (note que estamos reservando letras ma´ıusculas para representar vari´aveis aleat´orias). Exemplo. Arremesso de uma Moeda Dez Vezes. Retornamos para o ex- emplo do experimento de arremesso de moeda dez vezes. Qual ´e a fun¸c˜ao de probabilidade para o n´umero de Caras em uma execu¸c˜ao do experimento? Os eventos de interesse s˜ao, porntanto, da forma {s : NH (s) = n}. Supondo que utilizamos uma moeda honesta e que os arremessos s˜ao independentes, temos que cada ponto do espa¸co amostral tem probabildidade de 1/ 210. Podemos usar an´alise combinat´oria para contarmos quantos pontos do espa¸co amostral correspondem a cada evento de interesse. Dado n, temos que escolher, n˜ao importando a ordem, n entre dez posi¸c˜oes na seq¨uˆencia de arremessos para in- serirmos Caras. Isso equivale a combina¸c˜oes de 10 elementos n a n, ou seja (^2) :
P (n) =
n
para n = 0, 1 , 2 , 3 , 4 ....
A rigor, uma distribui¸c˜ao de probabilidades ´e uma fun¸c˜ao crescente definida como F (x) = P (X ≤ x) para −∞ < x < ∞. Para o caso discreto utilizaremos o mesmo termo para se referir tamb´em a fun¸c˜ao discreta de probabilidade. Quando falarmos de vari´aveis aleat´orias cont´ınuas ficar´a mais clara a necessidade da no¸c˜ao de distribui¸c˜ao de probabilidade. Os modelos probabil´ısticos discretos s˜ao comumente definidos em termos de distribui¸c˜oes de probabilidade (aqui j´a estamos nos referindoas fun¸c˜oes discre- tas de probabilidade), nas pr´oximas se¸c˜oes introduziremos v´arios deles e suas aplica¸c˜oes.
3.2 Modelo Uniforme
Suponha que desejamos descrever o simples experimento de lan¸camento de um dado honesto. A vari´avel aleat´oria de interesse ´e simplesmente o resultado do arremesso que chamaremos de X. Qual a distribui¸c˜ao de probabilidade apropri- ada para descrever este experiemnto? O espa¸co amostral ´e Ω = { 1 , 2 , 3 , 4 , 5 , 6 },
valor para qualquer evento composto. (^2) Se n˜ao lembra an´alise combinat´oria, recomendo fortemente, Iezzi, G. Matem´atica Ele- mentar, Vol. 5 - Combinat´oria.
(^0100 200 300 400 )
n
P(n)
Figura 3.2: Fun¸c˜ao de probabilidade geom´etrica com p = 0, 01.
amostral tem infinitos pontos, visto que h´a a possibilidade, infinitamente im- prov´avel, de que uma falha nunca ocorra. Probabilidades podem ser atribu´ıdas a cada seq¨uˆencia da seguinte forma: a cada utiliza¸c˜ao do sistema a probabili- dade de uma falha ´e p e a de funcionamento ´e 1 − p, assim, a probabilidade a ser atribu´ıda ao ponto do espa¸co amostral n ´e P (n) = (1 − p)n−^1 p (por que?)^3 , que ´e chamada distribui¸c˜ao geom´etrica. Distribui¸c˜ao geom´etrica.
P (n) = (1 − p)n−^1 p, (3.2)
onde n = 1, 2 , 3 , ....
3.4 Modelo Binomial
Suponha agora que queremos avaliar a probabilidade de em n lan¸camentos de uma moeda obtermos, n˜ao importando a ordem, k Caras. O espa¸co amostral ´e composto por todas as seq¨uˆencias poss´ıveis de comprimento n (por exemplo, se n = 4, Ω = {HHHH, HT HT, T T HH, ...}. Suponhamos que a probabilidade de obtermos uma Cara em um lan¸camento seja q (a moeda n˜ao precisa neces- sariamente ser honesta). Considerado os lan¸camentos independentes, podemos atribuir probabilidades para cada ponto do espa¸co amostral apenas contando o n´umero de Caras e Coroas. Procedendo dessa forma encontramos: qk(1 −q)n−k. Como a ordem n˜ao importa temos que utilizar an´alise combinat´oria para con- (^3) P (n) significa a probabilidade da primeira falha ocorrer na n-´esima utiliza¸c˜ao, ou seja, primeiro ocorrem n − 1 funcionamentos normais at´e que a seq¨uˆencia ´e encerrada com uma falha.
(^00 5 10 15 )
n
P(n)
Figura 3.3: Distribui¸c˜ao Binomial com q = 0, 5, n = 10 (tracejado) e n = 20. Note a simetria e a posi¸c˜ao da m´edia em p × n.
tarmos o n´umero de seq¨uˆencias equivalentes (com o mesmo n´umero de Caras, s´o que em outra ordem). No final obtemos: Distribui¸c˜ao Binomial.
P (k|n, p) =
n k
qk(1 − q)n−k^ (3.3)
para k = 0, 1 , 2 , 3 , 4 .... Qualquer evento independente cujo resultado possa ser classificado de apenas duas maneiras (erro ou acerto, sucesso ou falha, etc...) ´e denominado tentativa de Bernoulli. A distribui¸c˜ao do n´umero k de ocorrˆencias de uma das duas maneiras com probabilidade q em uma seq¨uˆencia de n tentativas de Bernoulli ´e Binomial P (k|n, p). Exemplo. Fornecimento de Energia. Suponha que n = 10 trabalhadores est˜ao utilizando energia el´etrica de forma intermitente. Estamos interessados em estimar a demanda total esperada. Como uma primeira aproxima¸c˜ao imagine que a qualquer momento cada trabalhador tem exatamente a mesma probabili- dade p de requerer uma unidade de potˆencia. Se considerarmos que os trabal- hadores atuam de forma independente teremos que a probabilidade de k deles demandarem energia simultaneamente ser´a binomial P (k|n, p). Se, em m´edia, um trabalhador utilizar energia 12 minutos por hora teremos que p = 1/5. Assim, a probabilidade de sete ou mais trabalhadores demandarem energia si- multˆaneamente ser´a P (7|10; 0, 2) + P (8|10; 0, 2) + P (9|10; 0, 2) + P (10|10; 0, 2) = 0 , 000864. Em outras palavras, se a potˆencia fornecida for suficiente para co- brir 6 trabalhadores simultaneamenente, haver´a sobrecarga com probabilidade 0 , 08%, ou seja em 1 minuto em 1157, ou ainda 1 minuto em 24 horas. Exemplo. Teste de Efic´acia de Medicamentos. A taxa normal de infec¸c˜ao
(^00 5 10 15 )
k
P(k|
λ)
Figura 3.5: Distribui¸c˜ao de Poisson com λ = 5 (tracejado) e λ = 10.
Distribui¸c˜ao de Poisson.
P (k|λ) =
λk k!
e−λ. (3.4)
Exemplo.Anivers´arios. Qual ´e achance que em um grupo de 500 pessoas 2 fa¸cam anivers´ario no dia 7 de setembro. Se as 500 pessoas forem escolhidas ao acaso podemos imaginar 500 tentativas de Bernoulli cada uma com probabili- dade q = 1/365. Pela defini¸c˜ao λ = nq = 500/365 = 1, 3699 ... A probabilidade que k pessoas fa¸cam anivers´ario exatamente no dia 7 de Setembro (ou em qual- quer dia escolhido) ´e P (k| 1 , 3699). Por exemplo, se k = 2, P (2| 1 , 3699) = 0, 24. Exemplo.Centen´arios. Ao nascer qualquer pessoa tem uma pequena chance de chegar aos 100 anos. Em uma comunidade grande o n´umero de nascimentos em um ano ´e grande. Devido a guerras, doen¸cas, etc... as dura¸c˜oes das vidas de uma mesma gera¸c˜ao n˜ao s˜ao independentes. No entanto, podemos comparar n nascimentos a n tentativas de Bernoulli com a vida ap´os os 100 anos como sucesso. Assim a probabilidade de k pessoas chegarem a 100 anos ´e P (k|λ), com λ dependendo do tamanho da popula¸c˜ao e das condi¸c˜oes de sa´ude.
Considere agora uma seq¨uˆencia de eventos aleat´orios ocorrendo no tempo, tais como desintegra¸c˜ao radioativa ou acessos a um web server. Suponha que os pontos sejam distribuidos em uma linha do tempo e que estejamos preocupados com sua distribui¸c˜ao (n´umero de pontos em um intervalo de tempo definido). Suponha adicionalmente que:
Quando estudarmos vari´aveis aleat´orias no cont´ınuo poderemos tratar este caso diretamente, por hora utilizaremos a id´eia de limite. Come¸camos por dividir uma unidade de tempo em um n´umero grande de intervalos n cada um com dura¸c˜ao 1/n. Cada intervalo ou est´a vazio (falha) ou cont´em no m´ınimo um ponto (sucesso). A probabilidade de sucesso pn ´e a mesma para qualquer um dos intervalos. A distribui¸c˜ao de probabilidade de k sucessos em n intervalos ´e, portanto, binomial P (k|n, pn). Note que o n´umero de sucessos n˜ao ´e o mesmo que o n´umero de pontos em um dado intervalo, visto que um sucesso pode representar mais de um ponto em um intervalo. Suponhamos ent˜ao adicional- mente que a probabilidade de dois pontos ou mais ocuparem o mesmo intervalo de tempo seja desprez´ıvel conforme n → ∞. Se fixarmos o n´umero m´edio de sucessos por unidade de tempo como λ = npn teremos que a probabilidade de k sucessos em uma unidade de tempo ter´a distribui¸c˜ao de Poisson P (k|λ). Nesta categoria se encaixam: n´umero de carros passando por um ped´agio por unidade de tempo; n´umero de erros de digita¸c˜ao em uma p´agina; n´umero de chamadas em um callcenter por unidade de tempo; etc...
3.6 Modelo Hipergeom´etrico
Suponha que em uma caixa h´a n bolas, n 1 vermelhas e n 2 = n − n 1 pretas. Retiramos da caixa r elementos sem reposi¸c˜ao. Qual ´e a probabilidade de que exatamente k deles sejam bolas vermelhas? O n´umero total de maneiras de
escolhermos r elementos dentre n ´e
n r
. Notemos que o grupo escolhido
tem k bolas vermelhas e r − k bolas pretas. As k bolas vermelhas podem ser
escolhidas de
n 1 k
formas. As r − k bolas pretas podem ser escolhidas de ( n − n 1 r − k
formas. Para cada escolha de bolas vermelhas pode-se escolher
uma das formas equivalentes de escolha das bolas pretas, assim multiplicamos as quantidades. Finalmente obtemos: Distribui¸c˜ao Hipergeom´etrica:
P (k|n, n 1 , r) =
n 1 k
n − n 1 r − k
n r
com k = 0, 1 , ..., min(r, n 1 ). Exemplo. Controle de Qualidade. Uma f´abrica produz pe¸cas que s˜ao em- baladas em caixas com 25 unidades. Para aceitar o lote enviado por essa f´abrica, o controle de qualidade de uma empresa procede da seguinte forma. Sorteia uma caixa do lote e, em seguida, sorteia cinco pe¸cas, sem reposi¸c˜ao, dessa mesma
(^00 10 20 30 40 )
Numero de fosforos no outro bolso (r)
ur
Figura 3.7: Caixa de F´osforos de Banach. Distribui¸c˜ao de f´osforos na caixa que ainda n˜ao est´a vazia. Cada caixa no come¸co tem exatos 50 f´osforos. Quando aquela que foi sorteada (bolso esquerdo ou bolso direito) se esvazia h´a exatos r f´osforos na outra caixa. Note que o mais prov´avel ´e que haja poucos f´osforos tamb´em na outra caixa. A probabilidade de haver at´e 15 f´osforos no outro bolso ´e de 92% (como calculo isso?)
para k = 0, 1 , 2 , 3 , 4 .... Exemplo. Caixa de F´osforos de Banach. Um matem´atico sempre carrega consigo uma caixa de f´osforos em seu bolso direito e uma em seu bolso esquerdo. Quando ele quer um f´osforo, ele escolhe um bolso ao acaso. A seq¨uˆencia de bol- sos ´e, portanto, uma seq¨uˆencia de tentativas de Bernoulli com p = 1/2. Suponha que cada caixa inicialmente contenha N f´osforos e considere o momento no qual nosso matem´atico descobre que uma das caixas est´a vazia. Neste mesmo mo- mento a outra caixa cont´em 0, 1 , 2 , ..., N f´osforos com probabilidade ur. Qual ´e essa probabilidade? Digamos que “sucesso”signifique escolher o bolso esquerdo. O bolso esquerdo estar´a vazio no momento em que o bolso direito contiver ex- atamente r f´osforos se, e somente se, exatametne N − r falhas (bolso direito) precederem o sucesso de n´umero N + 1. A probabilidade disso acontecer ser´a P (N − r|N + 1, 1 /2). A mesma coisa vale para o outro bolso assim:
ur = 2P (N − r|N + 1, 1 /2) =
2 N − r N
2 −^2 N^ +r.
3.8 Modelo Multinomial
A distribui¸c˜ao binomial pode ser generalizada para o caso de n tentativas inde- pendentes onde cada tentativa pode resultar em r diferentes resultados. Cada resultado Ei ocorre com probabilidade pi. Assim p 1 + p 2 + ... + pr = 1. A
(^10100 101 102 103 104 105 106 107 ) 0
101
102
103
104
105
106
107
108
Subroutines ordered by use frequency (n)
Number of uses
Linux reuse data SunOS reuse data Mac OS X reuse data
Figura 3.8: Distribui¸c˜ao de Zipf para reutiliza¸c˜ao de c´odigo nos sistemas Linux, MacOS e SunOS (referˆencias versus ranking). Esta figura foi extra´ıda de Veld- huizen,T.L., Software Libraries and Their Reuse: Entropy, Kolmogorov Com- plexit and Zipf’s Law, cs.SE/0508023.
probabilidade de que em n tentativas E 1 ocorra k 1 vezes, E 2 ocorra k 2 vezes e assim por diante ´e: Distribui¸c˜ao Multinomial.
P (k 1 , k 2 , ..., kr |p 1 , p 2 , ..., pr) =
n! k 1 !k 2 !...kr!
pk 11 pk 2 2 ...pk rr. (3.7)
com k 1 + k 2 + ... + kr = n. Exemplo.Jogando Doze Dados. Se jogarmos 12 dados, qual ´e a probabil- idade de obtermos cada face 2 vezes? Aqui E 1 ,...E 6 representam as seis faces dos dados. Queremos saber P (2, 2 , 2 , 2 , 2 , 2 | 1 / 6 , ..., 1 /6). Utilizando o modelo multinomial teremos (12!)(2)−^6 (6)−^12 = 0, 0034.
3.9 Distribui¸c˜ao de Zipf
A distribui¸c˜ao de Zipf ´e definida como: Distribui¸c˜ao de Zipf.
P (k|s, N ) =
k−s ∑N n=1 n −s
A distribui¸c˜ao de Zipf (tamb´em conhecida como lei de potˆencia) aparece nos lugares mais variados: nas palavras em uma l´ıngua, nas seq¨uˆencias de DNA,
a CPU ´e descrito por um modelo de Poisson com 4 requisi¸c˜oes a cada segundo. Essas requisi¸c˜oes podem ser de v´arias naturezas tais como: imprimir um arquivo, efetuar um c´alculo ou enviar uma mensagem pela internet, entre outras. (a) Escolhendo-se ao acaso um intervalo de 1 segundo, qual ´e a probabilidade de haver mais de 2 acessos A CPU? E do n´ umero de acessos ultrapassar 5? (b) considerando agora o intervalo de 10 segundos, tamb´em escolhido ao acaso, qual ´e a probabilidade de haver 50 acessos?3.11 Referˆencias
Se quiser fazer mais exerc´ıcios procure por (todos os exerc´ıcios do texto foram extra´ıdos de l´a):
Exemplos foram extra´ıdos de:
Livros de divulga¸c˜ao cient´ıfica relacionados `a lei de Zipf: