Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


estadística, Apuntes de Estadística

Asignatura: Estadística, Profesor: , Carrera: Biologia, Universidad: UdG

Tipo: Apuntes

2014/2015

Subido el 25/11/2015

telmalaxuleta
telmalaxuleta 🇪🇸

3.8

(18)

14 documentos

1 / 197

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ESTAD
´
ISTICA MATEM`
ATICA II
APUNTS
`
Alex anchez Pla Francesc Carmona
Departament d’Estad´ıstica
Barcelona, 23 de febrer de 2005
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Vista previa parcial del texto

¡Descarga estadística y más Apuntes en PDF de Estadística solo en Docsity!

ESTAD´ISTICA MATEM`ATICA II

APUNTS

Alex S´^ ` anchez Pla Francesc Carmona

Departament d’Estad´ıstica

Barcelona, 23 de febrer de 2005

Presentaci´o

El material que es presenta a continuaci´o s’ha originat en les notes de classe de l’assignatura Estad´ıstica Matematica que hem impartit a la Diplomatura d’Estad´ıstica des del seu inici a la Universitat de Barcelona. L’objectiu d’aquests apunts no ´es substituir els llibres citats a la bibliografia sin´o, m´es aviat, servir com a guia d’estudi per tal que els estudiants puguin repassar els raonaments i els calculs fets a classe i assegurar-se de que ho entenen tot correctament. Aquest document ´es una versi´o preliminar i, com a tal, pot contenir algunes errates. Si ens hem animat a publicar-ho de forma electr`onica, ha estat amb la idea que pugui resultar d’utilitat a aquells a qui va destinat, no en un futur incert sin´o des d’ara mateix. Ens agradaria que ens f´essiu arribar qualsevol errada, errata o comentari.

Barcelona, 23 de febrer de 2005

Alex S´` anchez Pla ([email protected]) Francesc Carmona ([email protected]) Departament d’Estad´ıstica Universitat de Barcelona

Cap´ıtol 1

INFER`ENCIA, MOSTRATGE

I DISTRIBUCIONS

MOSTRALS

1.1 Infer`encia estad´ıstica

Per comen¸car anem a definir quin ´es l’ambit d’estudi de la inferencia es- tad´ıstica des de la seva relaci´o amb el calcul de probabilitats. El calcul de probabilitats proporciona una teoria matematica que permet analitzar (o modelitzar) les propietats dels fenomens on interv´e l’atzar. El calcul de probabilitats utilitza com a model basic per a qualsevol situaci´o aleatoria el concepte d’espai de probabilitats (Ω, A, P ) i una variable aleatoria X : Ω → R definida sobre ell. El coneixement de la distribuci´o de la variable aleat`oria permet:

  1. An`alisis deductiva de situacions. Per exemple: si assumim que el pes dels nadons es distribueix segons una distribuci´o N (μ = 3 kg, σ = 0.25 kg) ens pot interessar calcular la probabilitat que un nad´o pesi entre 2. 9 i 3 .1 kg, o trobar uns valors centrats en la mitjana entre els quals esperem que es trobin el 10% (25%, 50%, 95%,... ) dels nadons.
  2. Modelitzaci´o de situacions aleat`ories. Per exemple: si assumim que el temps, en anys, fins que s’espatlla una component d’un ordinador es distribueix segons una distribuci´o exponencial T ∼ ξ(λ = 0.3) ens pot interessar calcular la probabilitat que una component donada duri m´es de 4 anys.

En els casos anteriors ens trobem en una situaci´o molt usual, on ja disposem d’un model sobre el qual efectuem els calculs, pero del qual desconeixem

El cas m´es senzill amb el que ens trobem ´es quan ens interessa una certa variable X amb una funci´o de distribuci´o F desconeguda en major o menor grau. La distribuci´o que teoricament segueix la variable d’interes X en la poblaci´o rep el nom de distribuci´o teorica o distribuci´o de la poblaci´o. La distribuci´o de la poblaci´o ´es important ja que sovint es fa servir per determinar la distribuci´o d’alguna caracter´ıstica dels individus d’una poblaci´o. En els models de la inferencia estad´ıstica indiquem el relatiu grau de de- sconeixement sobre la distribuci´o F en funci´o de la seva pertinen¸ca a una fam´ılia F de distribucions. Per aixo, enlloc d’explicar que X ∼ F = F 0 indicarem que X ∼ F ∈ F, on F pot ser un conjunt m´es o menys extens de distribucions de probabilitat com totes les distribucions normals o les distribucions simetriques o les distribucions discretes sobre N. Moltes vegades la distribuci´o poblacional F esta completament especificada excepte pel valor d’algun parametre o par`ametres. En aquest cas podem concretar m´es la forma de la fam´ılia de distribucions:

X ∼ F ∈ F =

Fθ : θ ∈ Θ ⊂ Rk

on Θ ´es l’espai dels k parametres. La fam´ılia de possibles distribucions de probabilitat per a X s’anomena, genericament, model estad´ıstic i s’indica com: {X ∼ Fθ : θ ∈ Θ}. Veiem alguns exemples.

Exemple 1.3.1 Suposem que X representa la durada d’un component elec- tronic que no envelleix, nom´es s’espatlla. Es a dir, si en un instant´ t esta funcionant el seu estat ´es el mateix que en qualsevol moment del passat i la distribuci´o del temps fins que s’espatlli ´es la mateixa que al principi. Aquesta propietat s’anomena manca de mem`oria. Un model raonable per aquesta situaci´o el d´ona la distribuci´o de Weibull que, en aquest cas, podem definir a trav´es de la seg¨uent funci´o de densitat:

fθ(x) =

αβxβ−^1 e−αx β si x ≥ 0 0 si x < 0

La fam´ılia de distribucions associada ´es

F = {Fθ : θ = (α, β) ∈ (0, ∞) × (0, ∞)}

Exemple 1.3.2 Suposem que volem determinar la massa d’un cert tipus de part´ıcules elementals a partir de les observacions en una cambra de bom- bolles. En cada observaci´o obtenim una dada de la massa de la part´ıcula

xi i associada amb ella un cert error de mesura ε. Si la massa comuna de cadascuna d’elles ´es μ llavors podem escriure:

xi = μ + εi i = 1, ..., n

on la distribuci´o εi ∼ F ´es desconeguda. El nostre objectiu ´es obtenir infor- maci´o sobre F. Si admetem que P (εi < 0) = P (εi > 0), segons el grau d’exig`encia que volem tenir, podem suposar:

  • Amb un enfocament d’ inferencia parametrica: X ∼ F ∈ F = {N (0, σ) : σ ∈ R+}
  • Amb un enfocament d’ inferencia no parametrica: X ∼ F ∈ F = {Distribucions sim`etriques}

1.4 Mostra aleat`oria simple

1.4.1 Definici´o

Per estudiar un problema d’infer`encia estad´ıstica analitzem una mostra de mida n. Es tracta d’escollir n individus o elements de la poblaci´o Ω

ω 1 , ω 2 ,... , ωn

que siguin representatius. El valor de n i la forma d’elecci´o dels individus de la mostra ´es una materia d’Estad´ıstica anomenada Mostratge estad´ıstic. Per ara i per simplificar, nom´es cal dir que l’elecci´o es fa de forma que tots els individus tenen la mateixa probabilitat de ser presents a la mostra, si cal amb reempla¸cament, i que el valor de n esta donat. En realitat, el que ens interessa veritablement, no s´on els individus de la mostra sin´o les mesures d’una caracter´ıstica X sobre ells. Es a dir, els valors´ d’una variable aleatoria X sobre aquests individus

X(ω 1 ) = x 1 , X(ω 2 ) = x 2 ,... , X(ωn) = xn

Tamb´e podem pensar que els valors mostrals x 1 , x 2 ,... , xn s´on generats di- rectament des de la variable aleatoria. En tot cas, els valors mostrals no s´on ´unics i podem generar varies mostres

x^11 x^12 x^13... x^1 n x^21 x^22 x^23... x^2 n .. .

xs 1 xs 2 xs 3... xsn

  • Per a variables absolutament cont´ınues:

g(x 1 , x 2 ,... , xn) =

∏^ n

i=

f (xi)

Exemple 1.4.1 Una moneda t´e una probabilitat θ de sortir cara. Volem estudiar la variable aleat`oria:

X =

1 si surt cara 0 si surt creu

amb densitat P {X = 1} = θ, P {X = 0} = 1 − θ. Es a dir´

X ∼ Fθ ∈ F = {Fθ = B(1, θ) : θ ∈ (0, 1)}

Suposem que fem tres llan¸caments. Les possibles mostres s´on:

X 1 X 2 X 3 Probabilitat 1 1 1 θ^3 1 0 0 θ (1 − θ)^2 0 1 0 θ (1 − θ)^2 0 0 1 θ (1 − θ)^2 1 0 1 θ^2 (1 − θ) 1 1 0 θ^2 (1 − θ) 0 1 1 θ^2 (1 − θ) 0 0 0 (1 − θ)^3

El mostratge ha especificat la distribuci´o conjunta de la mostra a trav´es de la distribuci´o desconeguda Fθ. Si escrivim la funci´o de probabilitats de la variable aleat`oria com fθ(x) = θx(1 − θ)^1 −x, llavors la funci´o de probabilitats de la mostra la podem expressar com:

gθ(x 1 , x 2 , x 3 ) = θx^1 +x^2 +x^3 (1 − θ)^3 −(x^1 +x^2 +x^3 )

1.5 Estad´ıstics

1.5.1 Definici´o

Per aconseguir l’objectiu de realitzar inferencies sobre la poblaci´o a partir de la mostra ens solem basar en la realitzaci´o de calculs sobre la mostra per mirar d’obtenir la informaci´o que desitgem. En aquest proc´es apareixen els conceptes d’estad´ıstic i el cas particular, que m´es ens interessa a nosaltres, d’estimador. Un estad´ıstic ´es una funci´o de la mostra que no depen del valor del parametre.

Definici´o 1.4 Donada una mostra aleatoria simple X 1 , X 2 ,... , Xn i una funci´o mesurable T : Rn^ −→ Rk, llavors T (X 1 , X 2 ,... , Xn) ´es un vector aleatori (variable aleatoria quan k = 1). Si T no depen de θ (on θ ´es un parametre a especificar en Fθ), llavors T rep el nom d’estad´ıstic.

Nom´es pel seu nom, sembla evident que un estimador d’un parametre θ sera alguna funci´o de la mostra que serveixi per aproximar, en algun sentit, el valor desconegut de θ. Si afegim la condici´o raonable que un estimador no pugui prendre valors que no pot prendre el par`ametre podem donar la seg¨uent definici´o.

Definici´o 1.5 Un estimador d’un parametre θ ´es un estad´ıstic T el recor- regut del qual ´es l’espai dels parametres, ´es a dir:

T : Rn^ −→ Rk (x 1 , x 2 ,... , xn) −→ (t 1 ,... , tk) ∈ Θ ⊂ Rk

1.5.2 Distribuci´o en el mostratge d’un estad´ıstic

Donat un estad´ıstic T (X 1 , X 2 ,... , Xn) ens interessa coneixer la seva distribu- ci´o de probabilitat, ja que per fer inferencia ens caldra fer calculs del tipus

P [T (X 1 , X 2 ,... , Xn) > t 0 ]

La distribuci´o de probabilitat de l’estad´ıstic s’anomena distribuci´o mostral o distribuci´o en el mostratge de l’estad´ıstic. Trobar-la ´es un problema que pot ser des de bastant senzill fins a extremadament complicat. Algunes de les t`ecniques utilitzades per mirar de resoldre’l s´on les seg¨uents:

  • Us de la t`´ ecnica de canvi de variable.
  • Us de la funci´´ o generatriu de moments.
  • Aplicaci´o del Teorema Central del L´ımit.

Exemple 1.5.1 Sigui X ∼ Fθ una variable aleat`oria absolutament cont´ınua amb densitat fθ(x) = e−(x−θ)e−e −(x−θ) θ ∈ R

i considerem l’estad´ıstic

T (X 1 , X 2 ,... , Xn) =

∑^ n

i=

e−Xi

Si apliquem el teorema de canvi de variable unidimensional, s’obt´e facilment que la variable aleatoria Y = e−X^ segueix una distribuci´o exponencial de parametre e−θ, d’on la suma seguira una distribuci´o gamma T ∼ Γ(e−θ, n).

que ´es la funci´o generatriu de moments d’una variable N (μ, σ/

n).

1.6 La distribuci´o emp´ırica

1.6.1 Definici´o

En l’apartat anterior hem vist que a partir d’una mostra X 1 , X 2 ,... , Xn t´e inter`es considerar la distribuci´o mostral com la distribuci´o conjunta del vector aleatori (X 1 , X 2 ,... , Xn), sense que intervingui una realitzaci´o concre- ta de la mostra x 1 , x 2 ,... , xn. Un enfocament diferent consisteix en associar una distribuci´o particular directament a les observacions x 1 , x 2 ,... , xn amb la pretensi´o que, en tant que la mostra “representa” la v.a. X, aquesta distribu- ci´o associada a la mostra Fn(x) emuli la distribuci´o de la poblaci´o. Aquesta distribuci´o s’anomena distribuci´o emp´ırica o distribuci´o mostral i es defineix aix´ı:

Fn(x) =

k(x) n on k(x) ´es el nombre de dades mostrals menors o iguals que x. A la pr`actica es construeix per ordenaci´o de la mostra

x 1 , x 2 ,... , xn −→ x(1) ≤ x(2) ≤ · · · ≤ x(n)

i amb la seg¨uent definici´o:

Fn(x) =

0 si x < x(1) k n si^ x(k)^ ≤^ x < x(k+1) 1 si x(n) ≤ x

Exemple 1.6.1 Extra¨ıem una mostra i obtenim:

x 1 x 2 x 3 x 4 x 5 x 6 x 7

  1. 1 3. 4 1. 2 17. 6 2. 1 16. 4 4. 3

Un cop ordenada ens queda:

x(1) x(2) x(3) x(4) x(5) x(6) x(7) x 3 x 5 x 2 x 7 x 1 x 6 x 4

  1. 2 2. 1 3. 4 4. 3 5. 1 16. 4 17. 6

i si fem la representaci´o gr`afica:

La distribuci´o emp´ırica reflecteix exclusivament els valors observats a la mostra i per tant no es relaciona directament ni amb la distribuci´o conjunta de la mostra G(x 1 , x 2 ,... , xn) ni amb la distribuci´o de la poblaci´o F. Malgrat aix`o, com ´es raonable esperar, Fn(x) proporciona una imatge aproximada de la distribuci´o de la poblaci´o d’on s’ha extret la mostra.

Funció de distribució empírica

0%

20%

40%

60%

80%

100%

0 5 10 15 20

Figura 1.1: Funci´o de distribuci´o emp´ırica amb les dades de l’exemple

1.6.2 Relaci´o entre la distribuci´o emp´ırica i la pobla-

cional

L’estudi de la relaci´o entre Fn(x) i F (x) es pot fer des de diversos punts de vista. Podem considerar Fn(x) com un estad´ıstic o com una distribuci´o. Si considerem que Fn(x) representa la freq¨uencia relativa en la mostra de l’esdeveniment [X ≤ x] que t´e probabilitat F (x), llavors ´es un estad´ıstic. Aleshores, t´e sentit que considerem la seva distribuci´o en el mostratge, P [Fn(x) ≤ z] i que estudiem els moments d’aquesta distribuci´o. En aquest cas tamb´e t´e sentit aplicar les lleis dels grans nombres i determinar sota quines condicions es verifica que Fn(x) −→ F (x) en probabilitat o quasi-segurament. Si considerem que Fn(x) representa directament una distribuci´o de proba- bilitat, definida sobre el conjunt {(x 1 , x 2 ,... , xn)} t´e sentit que estudiem els seus moments, ´es a dir, els de la variable que la t´e per distribuci´o. Si la tractem com una distribuci´o de probabilitat tamb´e t´e sentit estudiar la seva convergencia en distribuci´o.

Es demostra^1 (Teorema de Glivenko-Cantelli) que Fn(x) convergeix a F (x) quasi segurament i uniformement en x, ´es a dir

P [lim Dn = 0] = 1

Pel que fa a la converg`encia en distribuci´o de Fn(x) podem enunciar la seg¨uent propietat.

Proposici´o 1 Sigui x 1 , x 2 ,... , xn una realitzaci´o d’una mostra aleatoria sim- ple de la distribuci´o F i sigui Fn(x) la seva funci´o de distribuci´o emp´ırica. L’estad´ıstic Fn(x) t´e una distribuci´o de probabilitat asimptoticament normal

Fn(x) ∼ AN

F (x),

F (x) · (1 − F (x)) n

La demostraci´o ´es immediata si considerem la representaci´o de Fn(x) com suma de variables aleat`ories i.i.d. i apliquem el Teorema Central del L´ımit.

La distribuci´o de probabilitat Fn(x)

Si considerem Fn(x) com una distribuci´o de probabilitat, t´e sentit estudi- ar els moments de la variable que t´e a Fn(x) per funci´o de distribuci´o, aix´ı com la seva convergencia en distribuci´o. Com a conseq¨uencia d’alguns dels resultats anteriors, Fn(x) convergeix en distribuci´o cap a la distribuci´o pobla- cional. Es pot justificar simplement tenint en compte que la convergencia en probabilitat implica la convergencia en distribuci´o. Pel que fa als moments de la distribuci´o emp´ırica la seg¨uent secci´o estudia els moments mostrals que s´on, de fet, els moments d’una variable aleat`oria que tingui a Fn(x) com funci´o de distribuci´o.

1.7 Els moments mostrals

1.7.1 Definici´o

Sigui Fn la v.a. que t´e Fn(x) per distribuci´o. La funci´o de densitat de probabilitat de Fn ´es una densitat discreta que assigna probabilitats 1/n a cadascuna de les observacions mostrals x 1 , x 2 ,... , xn. Aix´ı doncs, t´e sentit

(^1) Veieu: Estad´ıstica. Fortiana, J. i Nualart, D. Publicacions U.B.

que calculem els seus moments que es coneixen com a moments mostrals ak i tamb´e els seus moments mostrals centrats respecte la mitjana bk.

ak = E(F (^) nk ) =

∑^ n

i=

xki · P (Fn = xi) =

∑^ n

i=

xki ·

n

n

∑^ n

i=

xki

bk =

n

∑^ n

i=

(xi − x¯)k

Observem que dues mesures conegudes de l’estad´ıstica descriptiva adquireix- en un significat diferent:

  • Mitjana mostral = Mitjana de la distribuci´o mostral

a 1 =

n

∑^ n

i=

xi

  • Variancia mostral = Variancia de la distribuci´o mostral

b 2 =

n

∑^ n

i=

(xi − x¯)^2

1.7.2 Distribuci´o en el mostratge dels moments mostrals

Donada una m.a.s. X 1 , X 2 ,... , Xn, els moments mostrals s´on estad´ıstics i, com a tals, tenen la seva distribuci´o en el mostratge. Per exemple, ak = 1 n

∑n i=1X

k i. La distribuci´o en cada cas pot ser complexa i dependre de la distribuci´o poblacional subjacent. El que s´ı ´es possible calcular s´on els moments dels moments mostrals o, m´es ben dit, els moments de les distribucions en el mostratge dels moments mostrals.

  1. Si considerem ak = (^) n^1

∑n i=1 X k i i escrivim^ αk^ =^ E(X k) com el moment poblacional d’ordre k, tenim:

E(ak) = E

n

∑^ n

i=

Xki

n

· n · αk = αk

var(ak) = var

n

∑^ n

i=

Xik

n^2

∑^ n

i=

var

Xik

n

var(Xk)

n

[

E(X^2 k) − (E(Xk))^2

]

α 2 k − α^2 k n