Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Unitats 3,4 i 5, Apuntes de Estadística

Asignatura: Estadistica, Profesor: Joan Guardia, Carrera: Psicologia, Universidad: UB

Tipo: Apuntes

2013/2014

Subido el 18/11/2014

bertamartinez31
bertamartinez31 🇪🇸

4.3

(336)

34 documentos

1 / 5

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
UNITATS 3, 4 i 5: INTERVALS DE PROBABILITAT, DE
CONFIANÇA i CÀLCUL DE LA GRANDÀRIA MOSTRAL
Una INFERÈNCIA ESTADÍSTICA és el procediment on es generalitza una estimació, obtinguda a partir
d’una mostra a la totalitat de la població.
Un ESTIMADOR (^) és un valor estimat que representa el paràmetre desconegut. Un bon estimador ha de
proporcionar seguretat i precisió en la mesura a fi de reduir l’error mostral a 0 .
Per aconseguir-ho ha de presentar les característiques següents:
1. No biaix, que l’esperança matemàtica de l’estadístic (θ) sigui igual al paràmetre.
2. Consistència, que a mesura que incrementa la mostra, la seva probabilitat de l’estadístic tendeix a
la del paràmetre i és igual a 1.
3. Eficiència, un estimador θ1 és més eficient que θ2 quan la variància del primer és menor que la del
segon.
4. Suficiència, que no sigui necessari un altre estimador per millorar l’estimació del paràmetre.
Per complementar el procés d’estimació, s’usen dues perspectives complementàries:
Estimació puntual, permet inferir de l’estadístic al paràmetre ! Interval de Probabilitat o IP
Estimació per interval, permet inferir del paràmetre a l’estadístic ! Interval de Confiança o IC
Per poder realitzar una ESTIMACIÓ PER INTERVAL, ja sigui de probabilitat o de confiança, és
necessari conèixer la distribució que segueix un estadístic a estimar, el que es denomina com a
distribució mostral d’un estadístic (𝛉).
DETERIMINACIÓ DE L’INTERVAL
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Unitats 3,4 i 5 y más Apuntes en PDF de Estadística solo en Docsity!

UNITATS 3, 4 i 5: INTERVALS DE PROBABILITAT, DE

CONFIANÇA i CÀLCUL DE LA GRANDÀRIA MOSTRAL

Una INFERÈNCIA ESTADÍSTICA és el procediment on es generalitza una estimació, obtinguda a partir d’una mostra a la totalitat de la població. Un ESTIMADOR (^) és un valor estimat que representa el paràmetre desconegut. Un bon estimador ha de proporcionar seguretat i precisió en la mesura a fi de reduir l’error mostral a 0. Per aconseguir-ho ha de presentar les característiques següents:

  1. No biaix , que l’esperança matemàtica de l’estadístic (θ) sigui igual al paràmetre.
  2. Consistència, que a mesura que incrementa la mostra, la seva probabilitat de l’estadístic tendeix a la del paràmetre i és igual a 1.
  3. Eficiència, un estimador θ 1 és més eficient que θ 2 quan la variància del primer és menor que la del segon.
  4. Suficiència, que no sigui necessari un altre estimador per millorar l’estimació del paràmetre. Per complementar el procés d’estimació, s’usen dues perspectives complementàries :
  • Estimació puntual, permet inferir de l’estadístic al paràmetre! Interval de Probabilitat o IP
  • Estimació per interval, permet inferir del paràmetre a l’estadístic! Interval de Confiança o IC Per poder realitzar una ESTIMACIÓ PER INTERVAL, ja bé sigui de probabilitat o de confiança, és necessari conèixer la distribució que segueix un estadístic a estimar, el que es denomina com a distribució mostral d’un estadístic ( 𝛉 ). DETERIMINACIÓ DE L’INTERVAL

INTERVALS DE PROBABILITAT o IP (N! n) Permet estimar el valor de l’estadístic a partir del paràmetre, tant en el cas de proporcions o mitjanes, perquè ambdues segueixen la llei normal. Un interval de probabilitat determina entre quins valors oscil·la l’estadístic estimat. A l’hora de construir un interval de probabilitat s’assumeix un risc a equivocar-se, aquest risc és una probabilitat i s’anomena ∝. Dit d’una altre manera, és l’error mostral que tu et permets com a investigador i que per tant el que has fixat prèviament, amb un valor màxim de 0’05 o 5% del total de la corba. Un cop s’ha fixat ∝, el seu complementari, el nivell de confiança , també queda fixat amb una probabilitat associada de 1 - ∝. Ara bé, un cop disposem dels valors z es procedeix a l’obtenció del límit inferior i superior de l’interval [ - zα/2 i +zα/2 respectivament]. Per tant s’utilitza la fórmula de puntuació estandarditzada. ± zα/2 = " θ = θ± zα/2 · σ ± zα/2 = !!! !/! " X = ± zα/2 · σ/ 2 Interval de probabilitat de PROPORCIONS Treballa amb variables quantitatives. ± zα/2 = p−π !p

" IP! p = π ± zα/2 · σp on σp =

! (!!! ) ! σp = ! (!!! ) !

!!! !!! Previ al càlcul de l’interval, s’ha de comprovar que compleixi els supòsits o condicions d’aplicació per tal de verificar la garantia del resultat. En cas contrari-hi, aquest no seria representatiu: n· π ≥ 5 i n·(1 - π ) ≥ 5 En el cas que no compleixi aquestes condicions, alguns autors proposen utilitzar el model de la Llei Binomial. Interval de probabilitat de MITJANES Treballa amb variables qualitatives. Aquests interval “assumeix que la variable d’estudi segueix sempre la llei normal en la població”. ± zα/2 = !!! !x

" IP! p = π ± zα/2 · σx on σx =

! ! σx = ! !

!!! !!! Primer, s’ha de comprovar que compleixi els supòsits o condicions d’aplicació de n ≥ 30.

  • La proporció de persones majors de 65 anys que tenen depressió en la població és de 0,15. Entre quins valors seria aquesta proporció en un centre geriàtric que tenen 40 habitants? (Nivell de confiança = 95%)
  • És un interval de probabilitat perquè tenim informació de la població i necessitem informació de la mostra: π = 0’10 i p?
  • CA: 40 · 0,15 = 6 & 40 · (1-0,15) = 34 à Sí
  • PI: 0’15 ± 1’96! !!!"·!"#$ !" =^ 0’039 / 0’261^ CL = 95%

Interval de confiança de MITJANES

En el cas de l’estimació d’una mitjana poblacional (μμ), seguim el mateix procediment que en l’estimació

d’una proporció (π). Ara bé, els supòsits o condicions d’aplicació varien en funció de dos factors

  1. la grandària mostral: gran (n > 30) o petita (n < 30)
  2. si coneixem o no el valor real de la variància de la població (σ^2 és coneguda o desconeguda)
  • Mostra gran (n > 30) i Variància poblacional coneguda: IC! x ± zα/ σ n
  • Mostra gran (n > 30) i Variància poblacional desconeguda: IC! x ± zα/ S n
  • Mostra petita (n ≤ 30 ) i Variància poblacional coneguda: IC! x ± zα/ σ n
  • Mostra petita (n ≤ 30 ) i Variància poblacional desconeguda: IC! x ± t (^) (α/2 , n-1) S n *** Igual que en l’IP, aquets interval “assumeix que la variable d’estudi segueix sempre la llei normal”. *** S’observa que en l’última condició (mostra petita i σ^2 desconeguda =situació molt freqüent) s’usa el model de probabilitat t de Student-Fisher. Aquesta manté una semblança amb la llei normal, però és exclusiu per mostres petites. Es tracta d’una funció simètrica, asimptòtica per les dues cues i que el seu domini oscil·la entre + ∞ i − ∞. La distribució obté els valors extraient-los la seva taula corresponent. Es caracteritza per tenir graus de llibertat (n-1), de manera, que a mesura que assoleix més graus de llibertat tendeix a la corba normal. DETERMINACIÓ DEL TAMANY DE MOSTRA A PARTIR DE LA PRECISIÓ Quanta grandària mostral necessitem? La quantitat que sumem o restem en un interval de confiança rep el nom d’ error mostral ( e ) , i està clar que, quan menor sigui, més precisa serà l’estimació que determina aquest interval. El valor de “ e ” depèn del nivell de confiança o dit d’una altra manera del valor de ∝ fixat (prèviament) i de l’error estàndard ( σ e ). És necessari saber la grandària de la mostra necessària d’acord amb els nostres propòsits i pressupostos, per això, necessitem conèixer:
  • Valor fixat de ∝
  • Error estàndard, que a la vegada depèn de: - Variància poblacional o mostral (segons el cas)
  • Grandària mostral La variància ens ve determinada per les pròpies mesures, per tant, l’única manera d’aconseguir més o menys precisió és modificant la grandària de la mostra:

$ mostra % error estàndard i mostral = $ precisió

% mostra $ error estàndard i mostral = % precisió

  • En una mostra de 20 persones amb demència inicial (Reisberg 2) la mitjana en el MEC de Lobo té 24 anys i la desviació estàndard és de 4,3. Entre quins valors serien la mitjana de la població? (Nivell de confiança = 95%).
  • És un IC de la mitjana, tenim la mitjana de la mostra (24) i volem conèixer la mitjana poblacional?
  • Assumim que els valors en MEC estan distribuïts normal.
  • Petita mostra i la població variància desconeguda.
  • 24± 2’ !"# √!"^

= 21’99 / 26’01 CL = 95%

Si fixem el valor ∝, podem aïllar el valor de la mostra amb el que hauríem de treballar per arribar a tenir una precisió determinada fixada també a priori. És a dir, si assumim un valor de confiança i fixem el valor de l’error mostral màxim ( e ) que volem assumir, podem podrem aïllar el valor << n >> que caracteritza aquests valors.

  • Valor ∝, te un màxim de 0’
  • Valor e , depèn del posició quan assumim que un error és massa gran perquè la nostre estimació no perdi sentit i el resultat sigui satisfactori. Proporcions
  • N coneguda: n = !· !! ! ! (^) · π 1 −π !!· !!! + !! ! ! (^) ·[π· 1 −π ]
  • N desconeguda: n = !! ! ! (^) ·[π· 1 −π ] !! Mitjanes
  • N coneguda: n = !· !! ! ! (^) · σ 2 !!· !!! + !! ! ! (^) · σ 2
  • N desconeguda: n = Zα 2 (^2) · σ 2 𝑒^2

!!/ 2 · σ 𝑒 2 Quan no conec el valor de la grandària de la mostra i ni del paràmetre, recorro a l’estratègia de la grandària de la mostra en la màxima indeterminació, on utilitzem les fórmules de les proporcions (i no de

les mostres) amb π = 1, i π · ( 1 − π ) = 0’

És el màxim valor que pot prendre π i per tant, ens donarà la major mostra possible.

  • Trobi la mida de mostra per estimar la proporció de persones d'edat que se senten sols. Treballi amb un ∝ del 5% i una precisió del 3%. n = !"#$!^ · !!!·(!!!!!) !"!#!^

Hem sabut que la grandària de la població és de 250.000 habitants. n = !"#.!!!·!"#$!^ · !!!·(!!!!!) !"!#!^ !"#.!!!!!! !"#$!^ · !!!·(!!!!!)

  • Trobi la mida de mostra per estimar la mitjana d'edat de les persones que viuen en centres residencials. Treballi amb un ∝ del 5% i una precisió de 1,6 (s = 6). n = !"#$!^ · !! !"#!^

Hem sabut que la grandària de la població és de 90.000 habitants. n = !".!!!·!"#$!^ · !! !"#!· !".!!!!!! !"#$!^ · !!^

  • Com que el denominador està regulat per la grandària de la mostra (n) a mesura que aquesta augmenta, es redueix l’error estàndard i per tant, l’error mostral, i viceversa. Per tant ens aporta precisió en el nostre càlcul i tendeix a una corba leptocúrtica : cada pegada els valors se situen més a prop de la mitjana.
  • Mentre que l’augment del valor ∝, comporta un augment de confiança i la corba tendeix a una mesocúrtica.