























Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Bloque 1 de Estadística Inferencial, Udl
Tipo: Apuntes
1 / 31
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
























En aquest punt de l’assignatura ens situem en un Escenari :
Con<nuem amb l’exemple anterior: Com comparo la Probabilitat observada del 82% amb les altres que en conjunt tenen una P=67%?
Com podem passar d’afirmar que en el grup de 82% passa alguna cosa que el fa diferent, a dir que la culpa és l’estructura social del territori on viuen els alumnes del grup del 82% que és diferent a la dels altres territoris? Havent fet un disseny d’estudi que permeI fer aquesta afirmació, és a dir, sorInt fora del camp de l’EstadísIca! Qui em diu quina és la distribució de la variable estudiada?
Interpretar les probabilitats que apareixen en una taula estadís<ca descrip<va d’una variable aleatòria dona a entendre que les proporcions són fonamentals per treballar en estadís<ca. Tot i això, cal veure en base a que es plantegen les hipòtesis, tal i com ho fa l’Estadís<ca Inferencial. Nosaltres generem o observem experiments aleatoris, llençar un dau i observar un 5 en la cara superior del dau, però això no ens serveix per establir el comportament del dau. Necessitem repe<r molts cops l’esdeveniment per entendre que la probabilitat de les 6 cares acaba igualant-se a 1/6, o que la probabilitat de cara i creu en una moneda acaba igualant-se (1/2). Així doncs, la visió freqüen<sta planteja que la probabilitat d’un esdeveniment és l’es<mació de la freqüència rela<va quan el nombre d’observacions tendeix a infinit. A la imatge, Distribució de Probabilitats de la suma de 2 daus:
La visió Bayesiana de la probabilitat, anomenada sovint visió subjec<vista, ha estat una visió minoritària entre estadís<cs però està guanyant terreny durant les úl<mes dècades. Hi ha moltes definicions bàsiques, cosa que fa digcil dir exactament què és la “visió bayesiana”. La manera més u<litzada és pensar que la probabilitat subjec<va és el grau de creença que una persona intel·ligent i racional assignaria a un esdeveniment. Per tant, cal opera<vitzar el terme "grau de creença". Suposem que crec que demà hi ha un 60% de probabilitat de pluja. Si algú m’ofereix una aposta que si plou demà, guanyo 5€, i si no plou, perdo 5€, des de la meva perspec<va, aquesta és una bona aposta. D'altra banda, si penso que la probabilitat de pluja és només del 40%, és una mala aposta. De manera que podem operar la noció de "probabilitat subjec<va" en termes de les apostes que es<c disposat a acceptar. (De fet és molt més complicat, cal el compliment dels axiomes de probabilitat de Kolmogorov). Avantatge de l’aproximació Bayesiana: Permet assignar probabilitats a qualsevol esdeveniment que es desitgi ( A Priori , encara que no <nguem moltes observacions). Desavantatge (per a moltes persones) de l’aproximació Bayesiana: No podem ser purament objec<us. Especificar una probabilitat “A priori” es basa en una “creença”. Quina visió uIlitzarem: Raonament pragmà<c! si volem entendre les eines estadís<ques u<litzades majoritàriament en Ciències de la Salut, cal una bona comprensió dels Mètodes FreqüenIstes.
L‘Estadís<ca Inferencial proporciona aquestes eines que necessitem per entendre bé el que ens diuen els números. I la teoria de la inferència estadís<ca es basa sobre la teoria de la probabilitat. Tot i les discrepàncies entre visions Freqüen<sta i Bayesiana, s’està d’acord en les regles de probabilitat a seguir. I com con<nuem amb una visió pragmà<ca, aquí ens centrarem en el concepte clau per avançar en el nostre raonament i argument, el concepte de Variable Aleatòria. A par<r d’un experiment aleatori , ens podem plantejar moltes hipòtesis que impliquen una interpretació dels resultats. Per exemple, si hi ha apostes, em puc preguntar quan ha guanyat un jugador que apostava al 27 en una ruleta, quan ha tardat a sor<r el primer número més gran de 24, o quan han sor<t dos cops seguits el mateix número. Així, cada cop, ens fixarem en un sol aspecte dels molFssims que es donen en conjunt en acabar un experiment aleatori. Si voleu veure algun exemple de quan<tat impensable de resultats dels qual es calcula i analitza la probabilitat associada, aneu a alguna web de Beisbol, NBA, NFL, o altres lligues americanes. Per exemple, quant val la probabilitat que un equip hagi remuntat un 3 a 1 en dos play-offs de final de conferència, en dues temporades seguides. Volia posar un exemple d’apostes clàssiques, les angleses, però m’ha fet por que m’acusessin d’apologia de la ludopa<a. De fet, el sector de les apostes ja és el principal patrocinador del futbol europeu. Exercici 1 Suposem que fem un experiment aleatori que consisteix a observar quantes persones s’han contagiat per COVID-19 entre els 25 joves que resideixen en un mateix edifici. Quines hipòtesis podríem fer sobre alguna de les caracterís<ques de les persones i el resultat a la prova PCR aplicada als 25 alumnes. Podríem plantejar-nos infinites preguntes, per exemple registrar la variable aleatòria:
Pandèmia 19% Pronòs<c temps 9% Evidentment, alguns de vosaltres haureu anat a comprovar un principi bàsic de la teoria de probabilitats, la suma ha de donar 100% (molts cops treballarem amb proporcions, llavors cal sumar 1). Això s’anomena Llei de probabilitat total. I el que tenim a la taula és una Distribució de probabilitat de la variable <pus d’informació, on es mostra cada esdeveniment elemental que pot donar-se (o valor que la variable aleatòria pot prendre). Preguntes:
Aquesta presentació només vol ser un exercici de recuperar els termes clau del curs passat per poder començar a presentar l’Estadís<ca Inferencial. Els con<nguts pròpiament de Teoria de Probabilitat pertanyen al temari d’Estadís<ca Descrip<va, que ja se us suposen i que heu de repassar si creieu que cal. Fins aquí, el Con<ngut 1 del Bolc 1. A par<r d’ara, funcionant en base a la metodologia de classe inversa, presentarem una ac<vitat inicial per introduir el següent tema. Recordeu que a Internet hi ha molt material per recuperar conceptes com ara simulacions: hsp://digitalfirst.bfwpub.com/stats_applet/stats_applet_10_prob.html I no només els directes de l’AuronPlay, Rubius, Willyrex, Wismichu, Stephen Hawking, ...
L’exercici, triat expressament per ser de l’es<l que més rellevància té per un professional de la Psicologia ja que parla de l’elecció d’un o altre <pus d’intervenció, podria incloure una sèrie de preguntes sobre Disseny i Bibliometria per assegurar que hem entès aspectes de Metodologia. Tot i això, les obviarem per anar directament a l’objec<u específic de fer l’exercici en aquest apartat. Pregunta 1 :Quines són i amb quina escala de mesura s’han registrat les principals variables de l’estudi? Variable Dependent principal:
Com us podeu imaginar, les distribucions de probabilitat varien enormement. Poc tenen a veure la distribució de la variable )pus de no,cia que puc sen)r en una emissora de radio i la variable resposta dels subjectes al test Pa)ent Health Ques)onnaire-9 (PHQ-9). Hi ha un gran ventall de distribucions, però no totes són igual d’importants. De fet, la gran majoria dels escenaris que tractarem aquí es basen en una de cinc distribucions: la distribució Binomial , la distribució Normal , la distribució t , la distribució χ^2 (Khi-quadrat) i la distribució F. A les properes seccions farem una breu introducció a totes cinc, centrant-nos primerament en la Binomial i la Normal. Quan han decidit que l’eficàcia, per exemple, segueix una distribució Normal, fet que deduïm de que ens donen els paràmetres de la funció de densitat d’aquesta distribució? Com us podeu imaginar, de distribucions de probabilitat n’hi ha d’haver de formes molt diverses. Ja que poc tenen a veure la distribució de la variable <pus de noFcia que puc sen<r en una emissora de radio i la variable resposta dels subjectes al test Pa<ent Health Ques<onnaire-9 (PHQ-9). Hi ha un gran ventall de distribucions, però no totes són igual d’importants. De fet, la gran majoria dels escenaris que tractarem aquí es basen en cinc distribucions:
Només farem càlculs de Probabilitat Binomial amb una calculadora estadís<ca web. Tema ja vist! Experiment binomial Un experiment binomial és un experiment estadís<c que té les següents propietats:
És la probabilitat que la variable aleatòria es<gui dins d'un rang de valors. Per exemple: més gran d’un límit inferior, o menor o igual a un límit superior. Exercici 2. Calcular la probabilitat binomial acumulada d'obtenir 45 o menys creus en 100 llançaments d'una moneda. Solució: Suma de totes les probabilitats binomials individuals incloses en el rang de 0 a 45: b(x ≤ 45; 100, 0,5) = b(x = 0; 100, 0,5) + b(x = 1; 100, 0,5) + ... + b(x = 44; 100, 0,5) + b(x = 45; 100, 0,5) b(x ≤ 45; 100, 0,5) = 0. Exercici 3. La probabilitat que un estudiant sigui acceptat en una Universitat de pres<gi és 0,3. Si hi apliquen 5 estudiants de la mateixa escola, quina és P(x ≤ 2)?
Exercici 1. Suposem que <rem una moneda repe<dament i comptem el nombre de cares (èxits). Si con<nuem <rant la moneda fins que sur<n 2 cares, estem realitzant un experiment Binomial Nega<u. La variable aleatòria binomial nega<va és la quan<tat de monedes <rades fins aconseguir 2 cares. En aquest exemple, el nombre de <rades de moneda és una variable aleatòria que pot assumir qualsevol valor entre 2 i més infinit. A con<nuació es presenta la distribució de probabilitat binomial nega<va d'aquest exemple.
Exercici 2. Suposem que tenim una probabilitat de contagi de COVID de 0.4 entre els nostres pacients i que només en podem confinar 3, ja que al 4rt ens tanquen la consulta segons una llei. Portem 10 visites a pacients i en visitar el 10è, l’hem hagut de confinat i és el tercer. Quina probabilitat tenim que en arribar al 10è pacient sigui el tercer a confinar? Algú se li ocorre una conclusió a treure si ens passa el resultat d’aquest exercici?
Una distribució hipergeomètrica és una distribució de probabilitat que té les caracterís<ques principals:
finita.
Exercici 1. Suposem que seleccionem aleatòriament 5 alumnes d'una classe de 52 matriculats. I ens preguntem: Quina és la probabilitat de que totes 5 persones hagin fet una prova PCR?
Sabem que la meitat dels individus de la classe (considerada població i no mostra) han passat per una PCR. En aquest exemple, la selecció d'una persona que si ha fet una PCR (26 de 52 alumnes) es classificarà com a èxit. Les probabilitats associades a cada resultat possible són un exemple d'una distribució hipergeomètrica, com es mostra a con<nuació.
Un experiment de Poisson té les següents propietats:
La distribució Normal estàndard és un cas especial de la distribució Normal. Exactament quan té una mitjana de zero i una desviació estàndard d'1. S’anomena puntuació estàndard o puntuació z. Cada variable aleatòria X normal es pot transformar en una puntuació z a través de la següent equació: Cas 1. Probabilitat acumulada d'una puntuació P (Z< 1,31) = 0,9049. Cas 2. Probabilitat acumulada d'una puntuació nega<va. Per exemple, z = -1.31, anirem a l’encreuament entre la fila 1.3 i la columna que conté 0,01. La taula mostra que la probabilitat que una variable aleatòria normal estàndard serà menor que 1,31 és 0.9049, però com que volem l’acumulada de z= -1.31, aquesta és igual a 1 menys l’acumulada de z=1.31= -9049=0,0951; és a dir, P (Z <-1,31) = 0, Cas 3. Probabilitat P(Z>a). Com la taula mostra P(Z<a). P(Z>a)=1- P(Z<a).Per exemple, que volem calcular P(z>3,00). A par<r de la taula, ens trobem amb que P (Z <3,00) = 0,9987. Per tant, P(Z>3,00) = 1-P(Z <3,00) = 1-0,9987 = 0.0013. Cas 4. Probabilitat que z es trobi entre dos valors. P(a <Z <b) = P (Z <b) - P (Z <a). Per exemple, suposem que volem saber la probabilitat que una puntuació z sigui més gran que -1.40 i menor de -1.20. A par<r de la taula, trobem que P (Z <-1.20) = 0,1151; i P (Z <-1.40) = 0,0808. Per tant, P(-1,40<Z<-1,20) = P(Z<-1,20) - P(Z<-1,40) = 0,1151- 0,0808 = 0,
La distribució t d’Student és una distribució de probabilitat que s'u<litza per es<mar els paràmetres de població quan la mida de la mostra és pe<ta i/o quan la variància de la població és desconeguda. D'acord amb el teorema del límit central, la distribució mostral d'un estadís<c (com ara mitjana de la mostra) seguirà una distribució Normal, sempre que la mida de la mostra sigui prou gran. Per tant, si sabem la desviació estàndard de la població, podem calcular una puntuació z, i u<litzarem la distribució Normal per avaluar les probabilitats juntament amb la mitjana de la mostra. Tot i això, pot passar dues coses:
Per trobar la probabilitat associada amb un estadís<c t en par<cular, u<litzarem la calculadora de la distribució t. U<litzarem t(1-α) per denotar el valor de t del qual volem saber-ne la probabilitat associada. Exercici 1. IKEA fabricant de bombetes, afirma que una bombeta té una durada mitjana de 300 dies. Un inves<gador selecciona a l'atzar a 15 bombetes per fer una prova. I observa que les bombetes de la mostra tenen una durada mitjana de 290 dies, amb una desviació estàndard de 50 dies. Si l'afirmació d’IKEA és certa, quina és la probabilitat que 15 bombetes a l'atzar <nguin una vida mitjana de 290 dies o menys? Hi ha dues maneres de resoldre aquest problema. Solució A: Calculant primer l'estadís<c t, d'acord amb la següent equació (t score): Solució B: Treballant directament amb les dades brutes del problema (Sample mean). Seleccionar "Sample mean" al quadre desplegable i entrem les següents dades:
Suposem que duem a terme el següent experiment estadís<c. Seleccionem una mostra aleatòria de grandària n d'una població Normal, amb desviació estàndard σ, on observem una desviació estàndard mostral S. Tenint en compte aquestes dades, podem definir un estadís<c, anomenat Khi-quadrat, u<litzant la següent equació: A la següent figura, la corba vermella mostra la Funció de Densitat de la distribució dels valors de 𝜒𝜒2 calculat a par<r de totes les mostres possibles de mida 3, on els graus de llibertat són n-1=3-1=2. De manera similar, la corba verda mostra la distribució de mostres de mida 5 (graus de llibertat =4); i la corba blava, per a mostres de mida 11. La distribució 𝜒2 té les següents propietats:
Si us heu fixat en la fórmula, F és un quocient de Variàncies mostrals i poblacionals. I de matemà<ques de 1er d’ESO sabem que un quocient = 1, significa que numerador i denominador són idèn<cs. Llavors la lògica de la probabilitat de la funció F té a veure amb la probabilitat de que les variàncies de numerador i denominador siguin iguals. Aquesta funció distribució té aplicació directa a càlcul de probabilitats estadís<ques, no de valors observats d’una variable o valors d’estadís<cs calculats en una mostra, com totes les anteriors. Solució a l’exercici (numerador dades dons): Pas 1 càlcul Pas 2 calculadora Conclusió: un 0.78 de Probabilitat d’observar valors com 1,68 o menors.
El propòsit de l’Estadís<ca Inferencial és treure conclusions sobre el que no sabem d’una població a par<r del que estudiem en una mostra. Per fer-ho necessitem:
La primera assumpció cal prendre per arribar a fer es<macions de paràmetres té a veure amb la mostra. No podem fer un estudi amb tota la població, fins i tot perquè, molts cops, només implica una definició teòrica.
Exemple : el concepte estudiant universitari, si jo vaig a secretaria i demano que m'imprimeixin el llistat de matriculats avui, tenim una definició clara. Però imagineu que l’estudi implica seguiment. Com he de respondre als següents dubtes per definir la població estudiant universitari català entre 2020 i 2022?
**1. ImpredicIble
n=5! En defini<va al llibre de jamovi hi ha més exemples per acabar-vos de convèncer però suposem que ho estem... Aprofitem doncs per entendre 2 coses més:
Aprofitant totes aquests propietats que hem vist de les distribucions mostrals d’estadís<cs, sobretot com la SEM va fent-se pe<ta, o com esdevenen Normals en augmentar la n i les rèpliques. Hem u<litzat l’exemple d’IQ perquè té trampa i, a més, hem fet trampa. L’IQ té M=100 i SD=15, perquè algú va jugar fins aconseguir-ho (ja ho veureu) i l’escenari habitual de treball estadís<c implica desconèixer els valors d’M i d’SD. Fins i tot si els sabéssim, la recerca implica estudiar normalment mostres no representa<ves de la població. Estudiem si els professionals sanitaris (Frontline Healthcare Workers) tenen més problemes de son durant la pandèmia, i això no és representa<u de cap població! Un estadís<c mostral és una descripció de les dades, mentre que l'es<mació és una conjectura sobre la població. Però acabem de veure que podem demostrar que la mitjana de la mostra (representats indis<ntament per M o ) té el mateix valor que (paràmetre poblacional) si es compleixen unes condicions mínimes. Llavors, podem esImar a parIr d’ i dir: Però diríem, segurament, AL VOLTANT de 98.3 , si acabéssim de fer un estudi sobre IQ en una mostra n=50 i M=98.3. Per tant, sembla ser que falta alguna manera millor d’acabar de polir la resposta: EsImació per Interval
Anem a veure com s’ha acordat de presentar l’es<mació d’un paràmetre a par<r d’un estadís<c mostral.