Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Test di confronto tra proporzioni: un esempio pratico - Prof. Palumbo, Dispense di Statistica

Appunti e integrazioni delle lezioni del professore Palumbo

Tipologia: Dispense

2020/2021

Caricato il 23/04/2022

annarita-d-alessio-1
annarita-d-alessio-1 🇮🇹

1 documento

1 / 20

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Noi abbiamo visto diciamo Due tipologie di studi classificarle abbiamo visto gli studi ad una
popolazione ok e sugli studi Ha una popolazione l'abbiamo visto praticamente i test su tre
parametri Ok che sono la proporzione ok E nel caso del test della proporzione Noi abbiamo
detto Andiamo usare un test Z ok perché abbiamo detto che la proporzione campionaria
pure avendo una distribuzione esatta che può essere ottenuta la partita la variabile
binomiale è più agevolmente trattata attraverso il teorema del limite centrale con il test Z Ok
Nel senso che possiamo approssimare la colla normale poi abbiamo visto il caso del e qui ci
sono due possibilità diciamo diciamo la prima che più teorica Che pratica però le abbiamo
presentato in questo modo abbiamo detto semplicemente l'estate a fare un test sulla media
Ok Nel senso che abbiamo detto il caso più semplicepossiamo distinguere il caso in cui la
varianza della popolazione sia nota dal caso in cui la varianza della popolazione sia
incognita ok e nel primo caso usiamo ancora un test Z statistica media campionaria
standardizzata si distribuisce Con una z viceversa nel caso in cui questa incognita dobbiamo
sostituire alla varianza la stima per cui la statistica campionaria che otteniamo facendo
insegnato meno la media sotto l'ipotesi nulla fratto Esse su Radical n c vale a dire la stima
della varianza ci comporta un test ci porta l'utilizzo di un testa ti conviene meno 1 gradi di
libertà ok E poi ancora l'ultima cosa che abbiamo visto su una popolazione sono i test su
una varianza una singola varianza e in questa situazione Qua abbiamo visto il test diciamo
con la distribuzione del chi quadro Questo è per quanto riguarda una popolazione poi di
testa due popolazioni andiamo più o meno uno schema analogo chiaramente è un po' più
articolato le statistiche sono un po' più articolato le statistiche vengono fuori però noi
abbiamo da un lato Ok il caso in cui siamo interessati alle proporzioni che non è una cosa
che avevo lasciato Però magari lo guardiamo un attimo velocemente adesso nel caso in cui
c'ho il test del confronto tra proporzioni confronto tra proporzioni Ok Anche in questo caso
andremo ad utilizzare un test Z Quindi quando lavoriamo sulle proporzioni sia con una
popolazione che colazioni lavoriamo con il test Z Ok poi abbiamo visto il caso del confronto
tra medie e qui nel caso di confronto che a differenza del caso di una sola popolazione che
sta qua In realtà noi abbiamo viste trygg Ok Nel senso che abbiamo detto il caso più
semplice più teorico che pratico è quello in cui Quadro con 1 e Sigma quadro con due che
sarebbero le varianze delle due popolazioni Ok da cui su cui siamo interessati a studiare le
nostre medie sono note e come succedeva nello schema precedente quando diciamo la
varianza È nota anche in questa situazione qui andiamo a usare il test Z poi il caso che noi
invece usiamo normalmente è quello in cui Sigma quadro con uno è uguale noi facciamo
un'ipotesi l'assunzione che siccome quadro con una uguale a Simona quadro con 2 kg è
uguale a un sigma quadro generico che incognito però abbiamo detto per semplificarci la
vita in questo modo noi facciamo l'ipotesi di uno Skater siccità che ci permette di usare un
test di Ok che ha un numero di gradi di libertà che possiamo calcolare tranquillamente
diciamo manualmente perché è pari alla somma delle due ampiezze campionarie Meno 2 e
poi più accennato anche se appunto non lo facciamo da un punto di vista operativo perché è
molto caldo di mio complesso da calcolare rispetto e libertà la situazione più comune in cui
abbiamo una quadro 1 e Sigma quadro due incognite ma non necessariamente supposte
uguali come questa situazione qua Allora anche qua abbiamo un test di ali di libertà si
calcola con un'approssimazione che si chiama prossimazione di quercia di cui ti ho detto
che ci vedere la pagina Se ricordo bene su Wikipedia Praticamente ci vuole è più grande la
formula dei gradi di libertà di cura della statistica per cui questo qui è solo diciamo una nota
dal punto di vista però dico nel senso dobbiamo andare a preoccupare Come si calcola ok E
poi Infine abbiamo visto che non c'entri in questa pagina non è stata sulla pagina successiva
sempre nel resto a due popolazioni il confronto tra varianze e qui si usa la statistica F Quindi
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14

Anteprima parziale del testo

Scarica Test di confronto tra proporzioni: un esempio pratico - Prof. Palumbo e più Dispense in PDF di Statistica solo su Docsity!

Noi abbiamo visto diciamo Due tipologie di studi classificarle abbiamo visto gli studi ad una popolazione ok e sugli studi Ha una popolazione l'abbiamo visto praticamente i test su tre parametri Ok che sono la proporzione ok E nel caso del test della proporzione Noi abbiamo detto Andiamo usare un test Z ok perché abbiamo detto che la proporzione campionaria pure avendo una distribuzione esatta che può essere ottenuta la partita la variabile binomiale è più agevolmente trattata attraverso il teorema del limite centrale con il test Z Ok Nel senso che possiamo approssimare la colla normale poi abbiamo visto il caso del e qui ci sono due possibilità diciamo diciamo la prima che più teorica Che pratica però le abbiamo presentato in questo modo abbiamo detto semplicemente l'estate a fare un test sulla media Ok Nel senso che abbiamo detto il caso più semplicepossiamo distinguere il caso in cui la varianza della popolazione sia nota dal caso in cui la varianza della popolazione sia incognita ok e nel primo caso usiamo ancora un test Z statistica media campionaria standardizzata si distribuisce Con una z viceversa nel caso in cui questa incognita dobbiamo sostituire alla varianza la stima per cui la statistica campionaria che otteniamo facendo insegnato meno la media sotto l'ipotesi nulla fratto Esse su Radical n c vale a dire la stima della varianza ci comporta un test ci porta l'utilizzo di un testa ti conviene meno 1 gradi di libertà ok E poi ancora l'ultima cosa che abbiamo visto su una popolazione sono i test su una varianza una singola varianza e in questa situazione Qua abbiamo visto il test diciamo con la distribuzione del chi quadro Questo è per quanto riguarda una popolazione poi di testa due popolazioni andiamo più o meno uno schema analogo chiaramente è un po' più articolato le statistiche sono un po' più articolato le statistiche vengono fuori però noi abbiamo da un lato Ok il caso in cui siamo interessati alle proporzioni che non è una cosa che avevo lasciato Però magari lo guardiamo un attimo velocemente adesso nel caso in cui c'ho il test del confronto tra proporzioni confronto tra proporzioni Ok Anche in questo caso andremo ad utilizzare un test Z Quindi quando lavoriamo sulle proporzioni sia con una popolazione che colazioni lavoriamo con il test Z Ok poi abbiamo visto il caso del confronto tra medie e qui nel caso di confronto che a differenza del caso di una sola popolazione che sta qua In realtà noi abbiamo viste trygg Ok Nel senso che abbiamo detto il caso più semplice più teorico che pratico è quello in cui Quadro con 1 e Sigma quadro con due che sarebbero le varianze delle due popolazioni Ok da cui su cui siamo interessati a studiare le nostre medie sono note e come succedeva nello schema precedente quando diciamo la varianza È nota anche in questa situazione qui andiamo a usare il test Z poi il caso che noi invece usiamo normalmente è quello in cui Sigma quadro con uno è uguale noi facciamo un'ipotesi l'assunzione che siccome quadro con una uguale a Simona quadro con 2 kg è uguale a un sigma quadro generico che incognito però abbiamo detto per semplificarci la vita in questo modo noi facciamo l'ipotesi di uno Skater siccità che ci permette di usare un test di Ok che ha un numero di gradi di libertà che possiamo calcolare tranquillamente diciamo manualmente perché è pari alla somma delle due ampiezze campionarie Meno 2 e poi più accennato anche se appunto non lo facciamo da un punto di vista operativo perché è molto caldo di mio complesso da calcolare rispetto e libertà la situazione più comune in cui abbiamo una quadro 1 e Sigma quadro due incognite ma non necessariamente supposte uguali come questa situazione qua Allora anche qua abbiamo un test di ali di libertà si calcola con un'approssimazione che si chiama prossimazione di quercia di cui ti ho detto che ci vedere la pagina Se ricordo bene su Wikipedia Praticamente ci vuole è più grande la formula dei gradi di libertà di cura della statistica per cui questo qui è solo diciamo una nota dal punto di vista però dico nel senso dobbiamo andare a preoccupare Come si calcola ok E poi Infine abbiamo visto che non c'entri in questa pagina non è stata sulla pagina successiva sempre nel resto a due popolazioni il confronto tra varianze e qui si usa la statistica F Quindi

se io vado a fare il confronto tra due varianze le popolazioni mi interessa sapere se una varianza La variabilità di una maggiore minore diversa dall'altra parte seconda del tipo diciamo di testa in questa situazione qui si usa un test F di Fisher Ok forse stavamo pure questa pagina sono tutte davanti se riesco a spostare questo oggetto bene Avevo mandarmi qui forse diciamo Si sono perse nei vari tavole non discorso una chat qua li metto qui sotto vedete sostituisce Sabri della chat questi sono diciamo al momento quelli che noi abbiamo visto in realtà diciamo questo qui l'unico che non avevo visto Magari ci litighiamo giusto 10 minuti veloci qua è questo il confronto tra proporzioni che era l'esercizio è esercizi che erano rimasti in sospeso questi sono diciamo la carrellata dei testi che abbiamo visto gli diciamo a questo punto nella giornata di oggi volevo farvi vedere i test che riguardavano lo studio che del legame tra due variabili Ok nel legame tra due variabili in realtà è successo distanza Diciamo quello che gli argomenti che riusciamo a venire anche quest'anno non siamo riusciti a trattare tutto però diciamo almeno le volevo far vedere linea di base così è più semplice per me andava a leggere diciamo di 123 testa perché ancora che mi richiama gli esercizi di oggi e poi in realtà sono test Il primo è molto molto semplice nel senso che non c'è nulla di nuovo e partiamo da questo qua che sarebbe il test anova che sarebbe il test f cosa che abbiamo già visto per questo non lo facciamo velocissimo l'estensione della la proprietà di decomposizione della devianza decomposizione della devianza partiamo velocemente così riusciamo tutti quanti siamo correre troppo però E poi ce ne sono altri due chiamarti mi scusi volevo chiederle ma saranno nell'esame Partiamo Un secondo velocemente da questo esercizio che era quello che avevo lasciato in sospeso mi sembra che fosse il No è vero non l'abbiamo fatto lì ce l'hanno fatto Mi sembra di ricordare che dicevamo fatto sì perché era questo qui della livello di attenzione degli adolescenti in sospeso ricordo bene È vero mi ricordo bene si ricorda bene Praticamente un confronto tra proporzioni diciamo non mette non toglie niente da un punto di vista operativo è abbastanza semplice e che proviamo come al solito a leggerlo e evidenziare un attimo di che cosa si tratta Allora lo psicologo del Lavoro interessato a valutare gli effetti della pensione lavorativa ricoperta sulla gestione strade nel lettone malissimo psicologo del Lavoro interessato a valutare gli effetti della mansione lavorativa ricoperta sulla gestione del tempo libero in particolare i ricercatori analizzano gli svaghi di due gruppi di operai nei quali luna è composto da operai specializzati addetti alle una catena di montaggio smontaggio l'altro di persona il cui lavoro non è ripetitivo e ritmato dalle macchine e sospetto che gli svaghi provi degli addetti alla catena di montaggio siano con Maggiore frequenza di tipo passivo cioè svaghi cui soggetti partecipano solo come spettatori in un campione casuale di 150 siamo in colore rosso e scrivere cose non si vede niente di 150 operai addetti alla catena di montaggio 86 dichiarano che lo svago e di tipo passivo Rocco Praticamente ci abbiamo un campione NX Ok di 150 e sono operai appunto dalla catena di montaggio di questi operai 86 dicano che lo svago e di tipo passivo Ok quindi questo sarebbe il numero di successi se possiamo così chiamarlo per questi operai ok Cosa significa significa che si vado a fare 86 su 150 Ok mi viene 6 su 150 dolcemente che ce l'abbiamo anche non calcoli 86 / 150 viene 0,57 3057 Ok Che cos'è questo 057 è la proporzione campionaria Sarebbe Pi greco cappello con uno della primo gruppo possiamo chiamarla anche X segnato abbiamo detto che la proporzione campionaria una particolare media del serbatoio osservazioni 01 invece la statistica media campionaria proporzione campionaria sul primo campione che le fate 057 gianduia particolarità che la traccia non me la dà Ma la dovete calcolare facendo 86650 mentre la seconda traccia velada venite qua mi dice qual è la seconda Scusatemi proporzione me la dice perché mi dice c'è un campione invece di 120 operai di secondo tipo quindi questo 120 sarebbe n y Ok = 120 e il 46% di

meno pigreco che sarebbe questa comune fratto uno su nxt1 su N Y Ok adesso il punto Qual è che sebbene questa vacanza sia Comune noi non la conosciamo e non ci interessa neanche conoscere non ci interessa solo capire se sono uguali o diverse o in questo caso maggiori Allora che cosa facciamo questo Pi greco che sta qua lo andiamo a stimare Y cappello diciamo proprio per fare vedere che uno stimatore che in qualche modo sfrutta le informazioni dei tuoi campioni ma in realtà Ok li tratta come se fossero se provenissero da noi la popolazione anche in questo caso siamo questo Pi greco conti per puledri congiunto Ok e questo diciamo statistica converge sempre per il teorema del limite Centrale a una normale standardizzata quindi anche in questo caso come vi avevo già anticipato si tratta di un test Z statistica in realtà è molto semplice perché non fa nient'altro che sommare il numero di successi complessivo ok Quindi mette tutti gli operai insieme Quanti sono gli operai sono abbiamo detto nel nostro esempio Giusto per essere pratici 150 e 120 quindi è come se ti dicessi Ok Io c'ho 150 qua 120 e qua ok e Voglio sapere quanti sono quelli che fanno svaghi di tipo passivo i successi OK e quindi faccio la somma di X con i più la somma degli angoli questo già me la particolarità na l'unica particolarità diciamo di questo test rispetto agli altri devi ripetere il tecnicismo della statistica poi il resto è sempre lo stesso andiamo anche a calcolare questo diciamo per quanto riguarda la il passo trecce Qual è la statistica campionaria Qual era la sua distribuzione ed è quella che è specificato qua il pasto 4 la regola di decisione è molto semplice regola di recessione in realtà anche in questa situazione io dovrei sostanzialmente guardare il rifiuto sulla destra perché la mia ipotesi alternativa venite in maggiore ok questa soglia Ok In realtà poiché non ho l'Alfa ma meglio che ho lavorato diciamo sull'approccio del pilerio anche questo qua posso evitarlo questo passaggio Ok per cui lui sa cosa che devo andare a fare che chiaramente so che quanto più sto su valori alti la mia statistica vero compiva diciamo bassi tanto più quello è un segnale verso il rifiuto Ok andiamo a fare i calcoli calcoli sono buonissimi cioè semplici perché noi che cosa abbiamo Vabbè non ci risulta neanche a calcolare questo cappello con il denominatore è semplice perché abbiamo 150 qua e 120 qua poi abbiamo 86 erano quelli che stavano Se ricordo bene gli operai del primo gruppo e poi devo andare a calcolare il 46% 320 per capire quanti sono gli operai del secondo gruppo quindi se faccio 046 per 120 Ok ottengo i operai nel secondo gruppo quindi sei andata a fare a fare questo In realtà è possibile facciamo 0, 46 X 120055,2 Ok è possibile questo 46 sia un'approssimazione 458 qualcosa del genere per cui possiamo tranquillamente usare 55 Ok in questo caso se volete mettetelo direttamente nella forma tutti insieme mi ripeto cambia ben poco quindi ragionevolmente diciamo questo qui sono 55 operai che cosa 46% Grazie Scusatemi questo qua Sì ok grazie allora che cosa ho se voi ci ragionate un secondo Avevamo 46% qua e se non ricordo male 57% il primo gruppo che ti ho detto C'è una differenza di 11 perché allora se questa qui non è nient'altro che una sorta di media tra le due Ok calcolando la proporzione di tutti insieme a questo punto io devo andare a fare la differenza che era 057 che sarebbe il Pi greco che appena rompi meno 046 che sarebbe sicuramente cappello con X Ok Questa sarebbe la possiamo scrivere come ho in casa segnato meno y segnato la stessa cosa o appunto Y cappello con X et Y cappello con y Ok fratto la radice quadrata di questo 052 che sta qua 048 in sarebbe 1052 per un 150o più un 120 mesi ok Prova a scriverlo Se fosse Allora abbiamo detto che dobbiamo fare 52 per 048 che sarebbe il complemento la parentesi centocinquantesimo q120 poi mi vado a fare la radice quadrata E questo dovrebbe essere il denominatore e poi sopra mi vado a fare te l'ho detto 057 meno 046 e mi viene 179 la statistica qua a z La statistica qua AZ mi viene 17979 andare a capire dove si Dove cade questo mese 79 ma non per avere diciamo non abbiamo scelto la soglia Voglio sapere Ti vedi che cos'è significa che io sto qui ok La mia statistica per trovare la Z

che formula avete usato per descriverlo anche con le lettere che mi ha preparato che dopo vieni carico diciamo se uno schema di tutte le formule anche due campioni così ce l'avete tutti quanti Davanti più o meno come scritte a mano come queste qua però sono un po' più ordinate ok Quindi dopo vieni ti carico diciamo sempre lì che Pino quelle statistiche sia un campione che ha due campioni e mi dicevo quando vado qua io Questo è il mio Zero a me mi viene 179 E quindi che cosa devo andare a fare Vado a prendere le mie tavole statistiche Ok sono a studiare direttamente queste qua e vado a cercare il valore Z 1.70 essere l'ultima colonna della riga 1.7 che è 0966 9633 9633 dall'area sinistra quindi io so che a sinistra qua dalle tavole leggo le tavole c'è 0.96 33 ok Questo è quello che vedo dalle tavole della Z Ok Che significa zio calcio 1 meno 0.96 330 37 quindi questo sarebbe il primerio 0037 adesso me ne faccio di Questo esercizio finisce qua Però chiaramente io che cosa succede se scegliessi un Alfa = 0 1 ok con questo stipendio diciamo rifiuto Il pivello e minore dell'Alfa se scendo Però un'altra 00.05 ok 0.05 sia ancora vado a rifiutare perché ti vedi è più piccola Se invece scegliessi un Alfa = 0.01 non rifiuto Ok quindi diciamo che come se fosse una quantità che poi io posso diciamo andare a comunicare al decisore e poi lui in base al livello di rischio che vuole Diciamo che vuole correre per l'ipotesi nulla Ok per lunedì primo tipo Scusatemi decidete Qual è il suo la sua decisione finale Ok come potete notare questo test non è molto diverso dagli altri e non per Questa statistica particolare che sta qua allora volevo farvi vedere velocemente lo faccio vedere anche tra virgolette da un punto di vista teorico ma sempre attraverso l'esercizio esercizio 1 e poi magari andiamo a prendere il successivo e successivo che ci interessa e i file sono troppi le tavole che ci servono dopo esercizio 11 ok Questo esercizio 11 1 1 esercizio particolare nel senso che è una cosa tra virgolette non vuole stare Bellano vai in realtà dico che noi questa perfettamente l'abbiamo già fatta perché voi vi ricordate quando abbiamo fatto la decomposizione della devianza Io ho fatto calcolare Cioè entro tutto tue statistiche una statistica retta quadro ok E l'altra statistica nella statistica F si chiama saresti Perché usiamo la F di Fisher adesso diciamo è un po' più devi ricordare qual era l'obiettivo Quando ne abbiamo introdotto la decomposizione della devianza noi avevamo dei gruppi ok cioè avevamo le nostre unità divise in gruppi e questa divisione in gruppi avveniva di solito attraverso i livelli di una variabile qualitativa Ok Che cosa succedeva noi calcolavamo le medie dei gruppiCi interessava Graziella Nuova grazie alla nuova grazie alla Lega quadro ok o al test la statistica F andare a capire quale fosse la differenza in media tra questi gruppi Ok vi richiamo un attimo aspettate preparato qua così è più semplice vederlo e poi andiamo da applicare da finire ce l'avevo aperto finora Allora abbiamo tutto puoi anche questi qua che mi sta organizzando l'incarico la nuova questa diciamo un promemoria di quello che abbiamo visto adesso grande non ci conviene rientrare nella spiegazione diciamo completa però è una cosa che noi abbiamo già visto allora anova analisi della varianza analysis of variance ok E in realtà diciamo possiamo venire la nuova in tanti modi diversi in modo più semplice per lui è una generalizzazione del test del confronto tra due medie al caso di più medie ok Quindi c'ho per esempio 34 diciamo medie e mi interessa capire come andarli a confrontare in realtà questo appunto è lo studio della dipendenza in media che noi abbiamo già introdotto ricordare che avevamo visto in precedenza il caso in cui i nostri dati erano divisi in gruppi Ok per ciascun gruppo potevamo calcolare le nostre medie potevamo calcolare le devianze di ciascun gruppo e le varianze di ciascuno in un gruppo e poi avevamo detto che in realtà la varianza complessiva si poteva Considerando la componente della varianza devianza interna e quella esterna ok E qua praticamente sono le formule che però già abbiamo introdotto alla fine diciamo della storia arrivavamo praticamente a calcolare due quantità erano l'età quadro Ok tiene il rapporto tra la devianza esterna o quella tra i gruppi

consigliato utilizzare diciamo visto il quadro teorico su cui si costruisce questo testa però troverete anche magari situazioni in cui queste numerosità sono diverse Allora noi che cosa abbiamo qua in questa tabella non mi vengono dati gli otto topi di ogni diciamo dei quattro Ceppi che leggende su questa colonna mi vengono a dare direttamente le statistiche di sintesi Ok detto In altre parole questo qua è X segnato con uno questo qua è X segnato con due questo qua è X segnato con tre questo qua è X segnato con quattro Quindi avete le 4 medie e poi avete anche le 4 deviazioni standard ok Quindi qua avete essequadro con uno di questi otto topi sono stati calcolati rispetto la media campionaria 41 di abilità attraverso S con uno che fa 35 la stessa cosa con S quadro con due, esse quadro con 3 e s quadro con 4Ok adesso l'ultimo che ho cancellato l'ho visto non ci interessa Ok lavoriamo solo sul primo Cioè mi viene chiesto da questi dati è possibile usando un Alfa 001 affermare che c'è una differenza complessiva nella prestazione mi trovi tra i quattro Ceppi Ok Cioè praticamente il test anova differenza degli altri test alle ipotesi nulla e ipotesi alternativa sempre fisse ok e qui non devo andare a controllare il mio cosa ti vuole controllare la traccia Quindi se proviamo a svolgerlo con i nostri passaggi da quest'altro lato abbiamo detto di protesi non quella ok e che la media dei 4 ceppi di con uno mi con due V con 3 hemi con quattro se volete possiamo chiamarli mi consigli Ok siano tutti uguali contro l'ipotesi Alternativa OK che almeno una delle sia diversa dalle altre Ok questa è l'ipotesi Sì diciamo il primo passaggio secondo passaggio e abbiamo detto l'Alfa che in questo caso hai la 01001 Ok l'aspetto tecnico è la formula che quella che vi scrivevo prima che andiamo a scrivere qua sarebbe la devianza Ok tra i gruppi quella spiegata tratto il numero di gruppi in questo caso sarebbe 4 perché abbiamo 3:59 su la devianza residua Ok quella interna fratto n Mino G Ok nel nostro esempio abbiamo abbiamo detto 4 * 832 Mino 4 Ok quindi In altre parole questo qua sarebbe Tri e questo qua sarebbe 28 ok Quindi praticamente noi che cosa trappiamo sappiamo che Questa statistica F segue una distribuzione F di Fisher con 3 gradi di libertà al numeratore e 28 gradi di libertà al denominatore ok E poi sta diciamo l'unica particolarità il testa Diciamo che poi appunto sarebbe il quarto punto qui le mie regole di decisione nel test F quello che guardiamo subito dopo il chi quadro è un test è una regola Sempre unidirezionale destra in questo test non avete nessun problema sul sistema di ipotesi perché è sempre lo stesso e neanche diciamo nel regola di decisione perché è sempre diciamo orientata a destra noi che ti abbiamo detto che la statistica F se vuoi ragionare su quello che hanno già introdotto era ottenuta facendo un confronto tra La devianza spiegata e quella residua ok e avevano detto che quando più la varianza spiegata cresci va Tanto più Questo è un segnale che c'era una differenza tra le medie o meglio le medie tra i singoli gruppi diverse tra loro e siccome quando le medie dai singoli gruppi sono diverse tra loro Io ho un segnale contro questa ipotesi nulla avrò che sta sempre a destra e viceversa quanto più la devianza tra i gruppi si abbassa ma verso 00:00 tanto più io vado a sinistra Ok e questo diciamo è una statistica dove non posso recarmi in testa dov'è questa è questa sono sempre gli stessi sono sempre fissi avere lo stesso anche diciamo con L'altro esercizio che mi introduco dopo Ok allora andiamo a fare i calcoli quando io la particolarità forse riguarda i calcoli su questo esercizio facciamoli piano piano a mano insieme perché adesso noi che cosa abbiamo qua ok La devianza spiegata Ok Noi abbiamo praticamente io qua non ci andiamo e né con uno uguale e né con 2 = n con 3 = n con 4 = Quindi abbiamo vistoAuto quindi abbiamo visto che sarebbe la somma diciamo di questi abbiamo detto in 32 poi abbiamo visto che ha segnato con 1 è uguale a 41 Ok la media del primo gruppo insegnato con 2 è uguale a 38 x segnato con 3 è uguale a 14 e X segnato con 4 è uguale a 37 senza sapere come si dice né leggere né scrivere se guardo questi dati mi sembrano le medie ragionevolmente Allineate recensione di questa vedete questa qua dove sto ma mi sembra

che si allontani e quindi diciamo Probabilmente se dovessimo rifiutare è questa quella di strano che comporta diciamo l'allontanamento però questa ho dato io in realtà lo devo andare a considerare anche tenendo conto della variabilità qua Ok allora come faccio a calcolarmi le devianze spiegate e quelle residue Allora quelle spiegate Noi già sappiamo fare perché la devianza spiegata di ricordarle che cos'è sarebbe qua vieni tu a riguardare gli appunti al punto di quello che abbiamo già visto sarebbe la distanza tra le medie di gruppo e la media complessiva al quadrato Ok per e Nicolino Quadrato per N con i . Il primo passaggio che dobbiamo dare a fare energia calcolare X segnata Ma quanto vale X segnato Qua noi sappiamo della proprietà di associatività della media in questo X segnato lo possiamo andare a calcolare come 41 * 8 + 38 * 8 + 14 * 8 + 37 * 8 / 32 Ma siccome appunto che numerosità sono tutte uguali cioè io dovrei scrivere X segnato me lo scrivo proprio perché vi potrebbe capitare un esempio in cui non ci sono tutte le stesse numerosità ok Quindi io potrei fare la somma dovrei fare la sommatoria di X con i terreni agricoli trattori Nel nostro caso Nel nostro caso solo nel nostro caso perché gliene conisello tutti uguali questo diventa la sommatoria delle x con i Ok fratto 4 Pro le n con i sono tutte uguali altrimenti dovrei usare la media ponderata ma chiaramente diviene esattamente la stessa cosa per cui se vuoi prendete queste medie facciamo l'altro lato Noi abbiamo detto i tuoi dati così ci guardiamo un attimo Questi calcoli Aspettate un secondo allora qua ci mettiamo sul gruppo 245 abbiamo detto c'abbiamo 88888 la somma di questi fa 32 poi c'abbiamo le medie Ok che sono abbiamo detto ops 4138 1437 4138 14:37 Ok abbiamo detto che se io andassi a fare la media aritmetica di semplice di questi quattro numeri mi verrebbe 30 2: ok ma mi viene da 2 e mezzo anche se vado a fare 41 * 8 + 38 * 8 + 14 * 8 + 37 * 8 diviso 32 verificare che la proprietà associativa già conosciamo funziona la media generale X segnato generale che cosa devo fare per calcolare la devianza spiegata io devo andare a fare ok gli scarti al quadrato dalla media per N con i cioè io tutto ok Quindi io dovrei andare a fare uguale 41 meno 32 e mezzo al quadrato questo qua viene 7225 lo scarto Ok non ponderato perenne però se io vado qua e gli dico Moltiplica me lo per 8578 Ok adesso se faccio la stessa cosa per le altre quattro Celle questa somma la somma di questi quattro numeretti vediamoci questo qua che cosa ho fatto 37 meno 32 e mezzo al quadrato per 8 ok La somma di tutti questi quattro numeri sarebbe la devianza sfigata Ok s3720 usare il primo pezzo del numeratore Ok il rischio di vedere un attimo la statistica che dobbiamo calcolare dobbiamo fare quella spiegata Sutri Ok per cui se io a questo punto mi vado a fare il numeratore il numeratore è pronto perché sarebbe uguale a La devianza spiegata 3720 / di numero di gruppi meno 1 c'ho quattro gruppi / 3 e mi viene 1240 adesso dobbiamo andare a fare il denominatore denominatore La devianza residua ok questa devianza residua diciamo sarebbe la somma delle devianze all'interno di ciascun gruppo ok in questo vi invito di nuovo a riguardare gli appunti tutto qua vado veloce perché abbiamo già viste cioè io che cosa devo fare la devianza interna o residua sarebbe sommatoria Ok Allora io dovrei fare xdj-rx con disegnato ok per i che va da 1 a n Questa sarebbe la variabilità all'interno del gruppo e poi devo andare a sommare questa per tutti i gruppi Ok Zitti un attimo se avessi 8 Doppi che mi danno questa media di 41 dovrei sapere questi otto Topi come si muovono rispetto a 41 In realtà io l'ho qui nella traccia c'ho essequadro con uno Cioè se quadro con due esse quadro con tre e sei occupato con 4 ok E io che cosa sono i S IV S4 sarebbe la devianza e nemmeno uno Ok In generale essequadro sarebbe la devianza la somma degli scarti al quadrato fratto n minuto Questa è la nostra definizione della devianza della varianza ok Per cui se voglio trovare la devianza degli esimo gruppo devo moltiplicare semplicemente lesse Quale opera è nemmeno uno Ok Che significa che se prendo questa tabellina che sta qua

chiamano confronti multipli proprio perché faccio più di uno per cercare di capire quale se ce ne sono ce n'è una solo se ce ne sono anche più di uno Quale di queste mi ha raccontato a rifiutare l'ipotesi nulla mi aspetto che in queste case tutti i confronti in cui c'è X con te diciamo sono confronti Cioè mi aspetterei non ci dobbiamo mettere le mani sfogo e che poi dipende un po' dai comportamenti La variabilità però mi aspetterei che questi tre teste rifiutare l'ipotesi nulla ok chiaro quindi si tratta di un'applicazione inferenziale di Diciamo dello studio dell' Indipendenza in media che noi abbiamo introdotto in termini descrittivi diciamo qualche bel po' di lezioni fa ok Si vedo ancora Allora diciamo a questo punto ne avremo altri due diciamo potrebbero poi essere utili ai fini Diciamo che cerco di evitare di mettere nella prova di mercoledì ma per la prova di esame di più tempo per andare a guardare pureCerto con Palumbo discuterlo Diciamo che gli esercizi dell'esame invece i due che dovremmo andare a guardare uno solamente qua è un altro poi ce ne andiamo a prendere da un altro esercizio perché non c'è in questo blocco l'ultimo aspettare dov'è andato a finire esercitazione 2 questo qui Ok abbiamo uno studio di variato tra due variabili qualitative quale circo dentro Diciamo tra virgolette velocemente l'idea di andarlo a leggere dal libro in maniera un po' più dettagliata Praticamente il nostro problema qui è un problema in cui noi abbiamo due variabili qualitative nonché in questo caso ciò in particolare questa è una variabile numerica Ok però è come se la trattassimo come quanti-qualitativa senso che come se fossero te ne vendi non sono basso medio-basso medio-alto Altissimo Ok Chiaramente in realtà volendo qua o anche diciamo i numeretti mi potrei fare anche un'analisi indifferente Però quello che mi viene chiesto qua io c'ho una variabile qualitativa del punteggio una scala di punteggio sul test della memoria ecc variabile qualitativa in cui ciò Ok due livelli che sono due tipologie di patologia bambini disgrafici ok cioè bambini si bambini e bambini dislessici ok e quello che io sto cercando di capire il cui potete immaginare E se c'è associazione tra quello che avviene in termini di punteggio sul test della memoria e tipologia di patologia Ok la traccia me ne accorgono psicologo dello sviluppo sta studiando i legami tra alcune patologie la memoria a breve termine la seguente tabella riporta la distribuzione di frequenza di un insieme di 240 bambini che stanno qua Ok affetti da disgrafia di quelli da disgrafici sono 80 e dislessia che sono 160 Ok sono classificati appunto in base al livello di patologia se mi guardia e in base al ponteggio Ok conseguito sul test se noi guardiamo sulle righe per fare una tabella a doppia entrata non abbiamo cenato molto velocemente all'inizio diciamo delle lezioni quando noi andiamo a incrociare una X con una Y questi numeri negli incroci rappresentano le frequenze Quindi quando io vado a leggere quattro Qua ci sono quattro bambini disgrafici che hanno danneggiato un punteggio da 0 a 5 14 sono i dislessici nella stessa classe di punteggio è in generale Se faccio 4 più 14 o 18 che sarebbero i bambini Ok del gruppo 1 Ok vi ricordate questo Noi l'abbiamo visto sarebbero quelli che abbiamo chiamato frequenze Ok marginali queste cose sarebbero le che mi l'ultima colonna mi permette di studiare la variabile in riga Ok che mi permette la distribuzione di frequenza della variabile riga e L'ultima riga Ok mi dà tribuzione di frequenza della variabile in colonna Ok Questa sarebbe la nostra X Scusatemi tanto la lettera al contrario Vabbè ma non fa nulla senza libera rossa Questa sarebbe la nostra X E questa sarebbe la nostra Y Ok gioia iniziamo questa annotazione usato per le frequenze la dicitura n 11 per indicare la prima riga la seconda colonna n 12 per la prima sulla prima riga e prima colonna prima riga seconda colonna in questo caso ce ne sono dieci avrò n seconda riga prima colonna n seconda riga seconda colonna e in terza riga terza colonna e domani terza riga e prima colonna e Colonna sono sempre due terza riga seconda colonna quarta riga prima colonna quarta riga seconda colonna ci siamo quasi quinta riga e prima colonna e quinta riga. i marginali sono n.1 n.1 significa che io sto neutralizzando NV 1.

neutralizzante gli indici di riga Nel senso che sto sommando tutto e mi interessa il risultato totale della prima colonna n 2 e il marginale che descrive il totale della seconda colonna da quest'altro lavato quello che noi andiamo a neutralizzare e l'indice di colonna mi descriveremo n.nni 2.in 3 eccetera finali 5.1 tale si indica con N O A volte Luciano troverete sono andata a leggere seconda del libro che sta usando n e la stessa cosa ok Sarebbe il totale complessiva siamo interessati a studiare confrontare tra loro colonne in questo caso questo è abbastanza semplice queste qua la colonna diciamo dei disgrafici contiene la metà dei bambini della colonna dei dislessici c'ho una possibilità anche a occhio di capire se cambia qualcosa però il punto Qual è che normalmente quando noi facciamo un confronto tra colonne abbiamo introdotto l'idea di profili ti do profili colonna Cioè dobbiamo fare in modo che questi marginale sumino tutti a 1 o posso farlo sui profili colonna in maniera che divido tutto per 80 tutto per 160 tutto per 240 in maniera da avere delle distribuzioni comparabili o sulle righe in maniera che la prima riga la divido per 18 la seconda * 73 così via scalare Ok qual è che se non ci fosse associazione Ok se non ci fosse nessun legame io mi aspetto che una volta che io vado a neutralizzare l'effetto della differenza e numerosità e Nintendo comparability che cosa succede Mi aspetto che la distribuzione in questa colonna sia esattamente uguale funzione in questa Colonna chiaramente se la distribuzione in questa colonna ha la stessa andamento di seconda anche quella marginale ha lo stesso andamento Ok allora si può mostrare e Questo esercizio Diciamo tra virgolette e laborioso e senso di conti perché la tabella in questo caso non è piccolissima mi devo fare qualche conto è se lo facciamo in Excel in un attimo insieme però il passaggio logico è molto semplice praticamente noi Da un lato abbiamo la tabella delle frequenze osservate Ok Questa sarebbe la nostra tabella Ok delle frequenze che effettivamente descrivono il modo in cui il punteggio della test sulla memoria si è manifestato su questi 240 bambini divisi in disgrafici e dislessici Ok dall'altro lato andiamo a calcolare molto velocemente una tabella che in cappelletti nj Star sempre Di solito ogni libro c'è la sua notazione Ma questi sono a volte viene anche indicato con eiji dove è stabile expedited che sono invece le frequenze attese tecnicamente sono le frequenze attese o teoriche sotto l'ipotesi di indipendenza Cioè se ci fosse Indipendenza ok Se ci fosse Indipendenza che cosa mi dovrei aspettare allora è possibile mostrare per avere profili mi dovrei aspettare che tutti i profili che siano uguali tra loro o tutti i profili colonna se non vuole tra loro posso ragionare in maniera identica e questo diciamo Sì diciamo torta a un calcolo abbastanza semplice che si ottiene andando a considerare il prodotto dei marginali Ok frate il gran totale Allora è più facile a dirsi che a raccontare così adesso In questa prima cella io ho salvato una frequenza diciamo coloriamo no vabbè vado a fare Non c'era nulla Ho trovato una frequenza osservata pari a 4 se ci fosse Indipendenza la corrispondente frequenza attesa io lo tengo andando a fare ok Il prodotto del marginale della riga Della riga Quindi vado a fare 18 molto semplice e Monica mente e facili da ricordare per 80 fratto 160 Quindi io c'ho da un lato 11 osservato che vale 4 dal lato dall'altro mi vado a fare n11 teorico che varrà 18 x 80 su 240 il numero ok e devo andare a fare quest'operazione per ogni cella quindi per esempio questa cella qua due osservato 43 se ci fosse Indipendenza dovrei osservare 73 x 160 fratto 240 che questo viene fuori aspettate Ve lo scrivo a questo punto maniera pulita qua Ok quindi noi abbiamo le nostre energie che sono le frequenze osservate i numeretti che abbiamo nella nostra tabella Ok Dall'altro le frequenze teoriche nj Cappelletto si possono calcolare facendo il prodotto del marginale di riga per il marginale di colonna su un gran totale Queste sono le frequenze teoriche o attese sotto le ipotesi di indipendenza ok sotto l'ipotesi Indipendenza a questo punto noi dobbiamo andare a calcolare una distanza tra queste due frequenze Questa distanza che c'è tra noi l'abbiamo già fatta perché è la stessa che abbiamo utilizzata

queste frequenze la caratteristica è che se vuoi andare a fare il profilo colonna ho chiaramente il profilo di a queste sono uguali Cioè se andassi a fare 6 che succede spegnere il microfono Se andassi a fare 680 issimi che mi viene 0075 ma questo Zero 70075 lo stesso che hanno ottenuto per fare 12 fratto 160 ed è lo stesso che andasse a fare 18 su 240 Ok il punto Qual è il punto che voi state costruendo una tabella che ha il vincolo che i profili sono tu siano tutti uguali tra loro ok Questo che cosa comporta comporta che se io vado a fare appunto diciamo operazione per 1 2 3 4 e 5 Ok vedi te questi profili sono tutti uguali e se vado a fare la somma mi accorgo che non ho fatto e lui questa è la tabella dei profili che praticamente se ci fosse Indipendenza io dovrei avere una situazione in cui le distribuzioni condizionate eDistribuzioni condizionate è quella marginale una volta eliminato l'effetto della numerosità i nostri profili colonna sono uguali perché se sono uguali significa che sapere la patologia disgrafico dislessici non mi dice nulla sul punteggio invece io qua c'ho una differenza perché notate che questo è quello che ho è quello quello che io dovrei diciamo aspettarmi sotto un indipendenza allora che cosa faccio Mi vado a fare l'indice chi quadro che mi dice di quanto queste due tabelle sono diverse ok Sono diverse e per fare Devo andare a fare devo fare tra parentesi osservata meno teorica al quadrato fratto teorica tutto quanto / la teoria cioè sto facendo 4 meno 6 al quadrato che fa meno 2 elevato al quadrato fa meno tra 4 fatto sei e mi viene 0,67 ok questa operazione la vado a fare per tutte le 10 Celle in questione di sto di nuovo costruendo una stessa tabellina dove qua solo lo spostamento è il contributo del chi quadro per ciascuna quindi questa è sempre la stessa struttura di questa qui piccola qua se io vado a fare la somma di queste quantità se non ho fatto errori mi viene esattamente quello che avevo già fornito nella traccia In questa traccia vedi te c'è scritto sapendo che l'indice E chi quadro 573 Ma questo 573 che sta qua non decimale Ok Che cos'è questo 5/73 me lo riscrivo qua sempre ok Noi abbiamo detto Cancelliamo tutto Ripetiamo il procedimento le frequenze osservate le nostre n.i.g. Queste sarebbero le n.i.g. una tabella uguale delle frequenze teoriche Energy cappello ricordandomi delle frequenze teoriche hanno come formula n i.ter n fratto n Questa è la singola generica frequenza teorica Ok mi vado a fare la tabella delle differenze quello che mi serve per il tipo adoro l'acqua in ogni cella vado a fare n.i.g. frequenza osservata meno n.i.g. cappello corrispondente frequenza teorica al quadrato fratto la frequenza teorica Che è invece il cappello la somma di tutte queste mi danno indice chi quadro Questo è il chi quadro Ok che lo stesso che voi avete ottenuto Luciano quando avete fatto lo studio dell'adattamento perché questo test quello potresti anche utilizzare per vedere se l'indice del chi quadro che andiamo a calcolare per vedere se un istogramma osservato si adatta bene ben descritto la distribuzione del male lo potrei usare anche lì Ok allora il passaggio una volta che questo è il test anche questo è molto veloce velocissimo mezz'ora 20 minuti perché riassunto Un po' tutto lo studio che spero di realtà un dire anche utile puoi leggerlo il testo Probabilmente questo quello della nuova il più secco più veloce Perché non dovete preoccuparvi del verso delle ipotesi alternativa conseguenza avete sempre una sola regola possibile decisione ed è come succede nella nuova Allora quali sono le ipotesi diciamo del test di ipotesi è l'ipotesi di indipendenza possiamo scrivere già l'ho scritto io Cioè Cioè significa che non c'è Indipendenza assoluta tra X e Y Ok veramente tra le due variabili tra X l'ipotesi Alternativa OK associazione connessione sono sinonimi perché a volte si parla anche di correlazione in termini generici anche se la correlazione sarebbe l'equivalente delle variabili numeriche Ok quindi sarebbe associazione in maniera più secca cioè quello che io sto assumendo e che il chi quadro Ok sulla popolazione perché sulla popolazione perché i bambini che sono in questa che sono 240 Io li vedo come se fosse un campione di tutti i bambini che hanno questo tipo di patologia E voglio vedere diciamo se c'è un legame per questi bambini sul

comportamento rispetto a questa memoria al test sulla memoria Ok Allora nulla Il quadro è uguale a zero perché noi abbiamo detto che se ci fossi indipendenza le due tabelle quelle teoriche e quelle osservate Dovrei dovrebbero essere uguali però questo a livello di popolazione quello che io faccio misuro l'indicatore sul campione e chiaramente l'indicatore sul campione è un segnale di quello che avviene sulla popolazione della media campionaria a un numero io vedo quel numero come segnale della metà della popolazione quella stessa cosa se l'indicatore più quadro mi dà un segnale Io lo interpreto Come se quel insieme di dati fosse estratto da una popolazione più ampia Ok allora l'ipotesi alternativa per chi perché è sempre lumi direzionale perché chi quadro una somma di quadrati per cui l'indice può essere solo maggiore di 0 e quindi l'ipotesi alternativa è che il chi quadro Io non scrivo diverso da zero perché diverso significherebbe nel nostro sistema di ipotesi che io mi posso aspettare ma lui più bassi piccoli Ma in questo caso l'unico segnale che io possa avere è che ci sia un'associazione quindi il chi quadro sia positivo ok poi questo è il primo passaggio il secondo passaggio è sempre il fissare il nostro Alfa adesso qua mi pare che in questa traccia non me lo dava ok Quindi significa che lo dobbiamo fissare Noi stiamo la soglia 005 Ma possiamo uscire una qualunque il terzo passaggio è la statistica test la saresti la testa sarebbe arrivato quello che io ho calcolato sulla tabella che abbiamo detto segue una distribuzione del chi quadro con un numero di gradi di Libertà Bari a r il numero di Linkem in 1 per il numero di colonne meno uno nel nostro esempio le righe sono cinque Ok meno 1 fa 4 le colonne sono 2 meno 1 fa 1 e quindi praticamente i gradi di libertà alla fine sono 4 sarebbero 4 x 1 quindi quello che io devo andare a usare come riferimento è una tavola che sarebbe appunto il quarto passaggio il quarto passaggio io vado abbiamo detto rifiuta a destra accetto a sinistra diciamo avere un'alternativa la mia soia è un quadro il valore di un quadro con 4 gradi di libertà è un Alfa fissato di uscire 2005 significa che si parla di nuovo sulle mie tavole statistiche e vado sulla tavola del chi quadro che se non erro la seconda dopo la normale Sì devo scegliere Alfa 005 quindi la mia colonna e questa i gradi di libertà sono quattro ed è 949 Quindi significa che questa soglia e 949 quindi la regola di decisione se il mio chi quadro osservato ok È più piccolo non supera questo 949 Allora Interpreta i risultati in tabella come sottrazioni casuali come se diciamo la differenza osservata dipenda da particolari campione c'è un segnale forte a questo livello Alfa fissato contro l'indipendenza adesso Nel nostro caso quando ci veniva 5 Ok perché il quinto passaggio il calcolo della statistica testa traccia mi veniva proprio dato che era 5,73 ok significa che praticamente io cado abbondantemente dentro la regione di accettazione e quindi il segnale finale e di Non rifiutare Jaca con Zeno su questo ci siamo proprio solo una domanda non ho trovato sulle tavole Numero di gradi di libertà pari a 4 perché abbiamo scelto quattro perché è il prodotto tra il numero di righe mi è venuto uno per il numero di colonne menù No siccome la nostra tabella avevamo 5 righe e Due Colonne dobbiamo fare il prodotto tra 4 x 1 che fa 4 ok Quindi io vado nelle tavole qua Giusto circolari da 4 Ok che indica diciamo la mia distribuzione per l'Alfa fissato l'Alfa 0051 scelto questo veramente avremmo potuto scegliere anche 001 Ok Se avessi scelto guardare 001 chiaramente mi sarei messo ancora più a destra ma anche se avessi scelto 01 per 100 non è che cambiava molto che ti con 4 gradi di libertà la soglia diventava 778 quindi il punto Qual è che diciamo se vogliamo avere un'idea anche nel sempre in maniera Diciamo che non precisa perché io c'ho 573 la mia statistica osservate 573 e io se vado qua se prendessi Alfa 01 vedete 573 diciamo anche abbondantemente una demente sarà anche a sinistra di questo ok Così come per le altre tavole non posso avere il più Esatto Non posso calcolare sempre sul sullo tavole Z già che ci siamo vi abbiamo fatti tutti quanti in realtà ci sarebbe un altro esercizio che a questo punto non lo so se avete un altro po' di pazienza Però nostro che stavi bene quello relativo alla

interpretazione è la posso fare anche in maniera asimmetrica conoscendo leggiamo il fenomeno perché è chiaro che non mi aspetto che la reazione sia funzione della Come si dice del tempo di guida e non viceversa Ok così come dagli nell'esempio di prima non mi aspetto che modo sia funzione della fatica che si è dedicata a preparare e non al contrario che la fatica sia funzione del voto Ok quindi una cosa è il legame logico tra le variabili che viene anche dalla conoscenza del fenomeno è un altro è quello diciamo che l'indicatore mi porta a poter interpretare cioè io da un punto di vista proprio meramente tecnico la presenza di un legame non sto dicendo che Y in funzione di x o viceversa però poi conoscendo Insomma più il fenomeno non posso anche spingermi un po' o l'interpretazione Allora come come funziona diciamo questo studio per catturare Ok per catturare se la nuvola c'è l'orientamento della nuvola praticamente si ricostruisce un indicatore è il coefficiente di correlazione lineare Ok che in qualche modo resto va bene Non scriviamo ce l'ho prima si indica con r di XY Ok quello campionario errori XY e rho di xy quello che riguarda invece la popolazioneLa popolazione questo coefficiente di correlazione lineare ha un senso Vale sia per quello diciamo della popolazione anche per quello campionario quindi questo è quello del campione e questo è quello della popolazione Come al solito ti aspettiamo che noi non misuriamo sul campione cerchiamo di avere un segnale per quello della popolazione Allora questo indicatore adesso vediamo come si costruisce lo spiego non preoccupare È possibile Mostrare che si trova tra meno è più uno e in particolare vale almeno uno quando i punti hanno una perfetta relazione lineare inversa cioè devo fare il mio diagramma i punti si mettono su una retta la cui pendenza e negativa ok Quindi c'ho una perfetta relazione lineare inversa indipendentemente da quando Il pendente la retta diciamo da quando inclinata da questa invece Il caso opposto è il caso invece di perfetta relazione lineare diretta significa che se io facessi un grafico e per questa configurazione di punti che già non mi disegnano esattamente una retta l'indice di correlazione assume il suo Massimo e vai a più uno Ok quando è negativo o un segnale verso una correlazione inversa Quanto cresce un segnale verso la correlazione diretta Chiaramente si avvicina meno 1 più diciamo è forte la relazione giusto per fare un esempio se io avessi per esempio una nuvola dei punti che fa così ok ci sono così è un'altra paura dei punti che più o meno fa la stessa cosa ma è più stretta non sanno proprio su una retta Questo qua potrebbe essere un caso in cui la correlazione mi viene 07 questo qua è un caso in cui la colazione viene 085 si stringe la retta che mi dà una relazione lineare tanto più cresce chiaramente cresce verso più uno se la relazione diretta cresce verso la relazione inversa che cosa succede nel caso invece di indice Ok = 0 i punti sembrano disposti a caso Cioè mi sembra che appunto ci sia una presente una in una sfera potrebbe esserci che ne so un ellisse orientale in questo modo significa che al crescere della X la y si muove Tronto a Casal mente non c'è più nessun legame riesce a cogliere sono i legami lineari ok Per cui dobbiamo stare attenti a volte potrebbe capitare che c'è un legame e diciamo non lineare tipo questo qua e se vado a misurare la correlazione mi viene €0 però qua effettivamente non c'è nessun legame perché vedo che i punti sono a caso qua non c'è nessun legame Mentre qua c'è un legame quadratico Perfetto Quindi in questa situazione e Cuba la correlazione mi viene sempre uguale a zero in tutte queste tre configurazioni però è chiaro che qua sbaglia perché vedete qua c'è un legame quadratico se io conoscessi l'equazione della parabola qua riuscirei a partire dal da X a ottenere il corrispondente valore della Y e viceversa partita da Y riuscire a ottenere il corrispondente valore della X Allora quello che dobbiamo ricordare che se la correlazione = 0 questo implica solo un assenza di legame lineare non assenza di legame Cioè nel senso che relazione che punto sia indice di correlazione lineare è capace di cogliere solo legami lineari Ok adesso questo più o meno diciamo una carrellata Veloce però

spero ti sia utile per andare a rileggere se vado a prendere l'esempio l'esercizio e mi vado a prendere le Due Colonne X Y tempo di Guido e tempo di reazione andiamo a mettere un attimo e vediamo che cosa viene fuori abbiamo fatto spesa pomeriggio ok Questo è il tempo di invitare acquista il tempo di reazione presentazione grafica di questi due lo scatter plot interpretarlo anche Inserisci grafici di discussione dove sei vabbè Vabbè facciamola manualmente Speravo di pensavo di farlo più velocemente Allora Inserisci grafico Sessione dove sei XY l'effetto diciamo non è proprio quello che mi aspettava quindi diciamo così d'esempio devi vedere un attimo esercizio inventato Non è forse il modo migliore di presentarlo perché ho in questa situazione qua mi sa se guardo il pattern è orientato positivamente però mi aspetterei + guida + si abbassa diciamo la reazione Ok quindi diciamo non è proprio un esempio logico Però tu fa niente Tanto noi adesso dobbiamo guardare la parte tecnica Spero che la parte logica un poco Sia intuita come si fa a fare la pittura la misura della correlazione questo indicatore di correlazione qualcosa messaggia con ogni tanto non riesco a controllarmi Allora il passaggio e diciamo di calcolo è semplice perché io che cosa devo fare io sotto la mia serie della x e c'è la mia serie delle y su X con 1 y x e y x con N y-con in quello che devo andare a fare Mi devo andare a fare gli scarti x meno X segnato della x e gli scatti della Ypsilon ok e chiaramente Fammi gli scarti la prima cosa che mi devo andare a fare solo la media della x è la media della Y ok Quindi se io vado qua e vado a fare un altro esempio un po' più agevole questo non hai sbagliato nel senso che facciamo l'esercizio funziona però non è quello che mi aspetterei per queste due variabili se ne troviamo un altro che banale per esempio correlazione devo Dati reali in cui voi avete sulla X il livello di ansia Ok misurato tipo quelli che abbiamo fatto fare anche prima diciamo delle prove del mercoledì il rendimento all'esame non divento l'esame normalizzato su una scala da 0 a 100 Ok allora Io qua diciamo che cosa vedo che non è sempre scontato hai visto diciamo la situazione che mi sono mi fa scrivere ogni tanto costano le cose Scusatemi non sono impazzito io nel computer che quando vuoi scrivimi Ok Praticamente qua che cosa avete Cancelliamo tutto tutto ok Hai bisogno che praticamente se è vero che ci sta qualche valore che si discosta però non direttamente un po' più Diciamo verso un caso di una correlazione negativa Cioè più cresce il livello di ansia sembra che livello di ansia incida negativamente sul rendimento dell'esame perché poi magari anche situazioni in cui il livello di ansia incide positivamente perché livello di ansia fingesse diciamo il candidato a lavorare di più e quindi diciamo che è un'influenza positiva in diretta con questa situazione qua su questi dati è stato rivelato Invece quello che più o meno in modo che di solito l'ansia È un fattore negativo rispetto al rendimento ok Questo è il motivo per cui spesso si cerca di cercando di abbassare gli anti ansia diciamo tutti i problemi legati al punto al tentativo di creare gli ambienti di lavoro Diciamo in questo caso di esami confortevoli in maniera che diciamo da abbassare la tensione eventuali errori legati alla tensione Adesso io prima erano i punti Ok Quelli erano Prima i puntini qua adesso sono diventati Ok segni più significa degli scarti positivi cioè Hanno un Anzi tra più alta della media e tutti quelli che stanno a sinistra non sia più bassa della media Ok né più nemmeno Adesso noi facciamo la stesso ragionamento sull'altro lato cioè tutti gli studenti che cadono sopra questa Linea Blu che il livello di rendimento medio dell'esame Y medio avuto un rendimento Maggiore della media quindi diventano più e tutti quelli che stanno sotto diventano meno non sembra veramente è quello che io mi dicevo prima se vado qua quello che dobbiamo andare a fare e andarci a calcolare gli scatti della x e gli scarti della Ypsilon della Ypsilon che cosa mi dicono mi dicono rispetto a ciascuna delle due variabili 6 in punto ok Katia a destra o a sinistra rispetto all'asse verticale OA sopra o sotto rispetto a questa asse orizzontale che sarebbero i livelli medi adesso Che cosa succede se lo vado a mettere insieme queste informazioni noi che

semplicemente questo per questo ok e vedo che in questo caso chiaramente l'unico negativo come vi dicevo è quello che hanno fatto in verde al contrario e questo mentre tutti gli altri sono positivi e ce n'è uno neutro perché questo qua essendo uguale alla media diciamo si annulla con la compensazione chiamo che ci interessa si ottiene praticamente facendo il rapporto quindi l'indice di correlazione che poi quello che ci interessa e abbiamo 10 minuti abbiamo finito però così abbiamo approfittato sono diciamo anche più sereno stare più tranquilli che abbiamo poi visto tutti gli argomenti che vuoi possiamo costruire diciamo gli esercizi ve lo ripeto non andiamo a considerare nell'esame Allora il rapporto tra la somma della colonna del prodotto degli scatti X con X segnato X Y Y segnato la somma delle devianze quindi io devo farmi la colonna la somma delle x con i forse così non si vede sarebbe xi meno x segnato al quadrato Istante della X al quadrato gli stessi che faccio per misurare la variabilità devo fare la somma degli scarti di y&y segnato al quadrato e tutto questo la struttura dici questo è l'indice di correlazione l'indice di correlazione praticamente sintetizza questa colonna se i verdi sono più forti dei Rossi per il segno dipende unicamente dal numeratore se i segnali Verdi sono più forti dei segnali Lucy sommando significa che il numeratore e positivo dell'indice positivo poi questa divisione per la radice del prodotto delle devianze perché queste sono le piante Questa l'abbiamo già visto questa la devianza della X1 della varianza è questa e deve La devianza della Ypsilon giusto per inciso il la somma si chiama codevianza Ok però questo è solo un nome non mettere non toglie niente Abbiamo Allora questo indicatore qua come va Allora abbiamo detto se mi faccio la somma della colonna questa già lo vedo che il segnale Positivo positivo contrariamente a quello che mi aveva detto solo la traccia Vabbè ma non fa nulla Poi mi devo andare a fare le devianze e quindi significa che io devo andare a fare gli scarti come potete notare l'unica particolarità è un po' laborioso ok la somma di più visti Questa è la devian Allora diciamo questa qua è la il numeratore sarebbe la codevianza somma del prodotto degli scarti Ok mi sta qua la devianza della x è qua sulla devianza della Y avevano già sapevamo già calcolare Ok adesso che devo andare a fare Devo andare a fare per fare la correlazione mi devo andare a fare il denominatore a che cosa è uguale il denominatore della correlazione è uguale al prodotto delle due devianze 1002* 1248 Però sotto radice quadrata quindi mi vado a fare la radice quadrata del prodotto delle devianze e mi viene 3861 Ok per cui il coefficiente di correlazione osservato su questo campione di 10 persone hanno fatto questo esperimento è uguale a 2800 33861 e mi viene 0,7 che era quello che poi vedevo dal grafico no se il resto l'ho cancellato Non c'è una tendenza così ti anche abbastanza marcata azione in questo esempio viene 073 e questo diciamo l'esercizio Per quanto riguarda il calcolo se dovessi fare un testa Ok poi mi metto diciamo la statistica anche di questo suo Federica Il test è che ci sia l'ipotesi nulla è che ci sia un assenza di correlazione ok Quindi praticamente è come se noi stessimo vivendo in Ro che misura la colazione però a livello di popolazione non del campione di 10 osservazioni dovrebbe essere uguale a zero Ok l'ipotesi alternativa in questo caso potrebbe essere che invece ci sia qua potremmo fare di XY diverso da zero Ok che forse quello diciamo più comune però io potevi dire Ok ma giovedì 0 o minore di zero quello che cambia Come al solito è sempre che se faccio diverso di Fiuto fiuto Accetto se Maggiore Ok rifiuto qua se minore dicendo da quest'altro lato ok Il testa che viene diciamo utilizzato è un test di corrente Meno 2 gradi di libertà per cui queste soglie che stanno qua abbiamo visto praticamente il test è un test con e nemmeno due gradi di libertà statistica t ha una forma abbastanza strana Strana che te lo diciamo non è molto articolata sarebbe tutto a posto tra il coefficiente di correlazione ok Il la radice del coefficiente del complemento a 1 per N meno due s avanti associazione Acqui Sono già su Federica Diciamo in maniera un po' più estesa se vado il quadro è la correlazione la loro relazione dove si trova non sono

messo la testa la radice di n meno due prima sarebbe questo ancora di coefficiente dovete fare la statistica statistica La radice di n meno due prima sarebbe questo ancora di coefficiente dovete fare la statistica statistica Ok Io c'ho 073 lo devo andare a moltiplicare per la radice di 10 che sarebbe il numero delle osservazioni Meno 2 devo fare uguale Zero 73 per radice quadrata di 8 per la radice quadrata di meno acqua scritto tavole statistiche e la terza tavola e la 8 gradi di libertà ce l'ho qua 200 500 1000 05-06 abbiamo fatto quello direzionale Ok allora se noi avessimo fatto scelto l'ipotesi alternativa bidirezionale diverso avrei rifiuto qua è rifiutato qua Ok per cui avessi scelto un Alfa pari a 0.01 per esempio avrei alfa mezzi = 0.005 Quindi con 8 gradi di libertà le mie soglie sarebbero viste Quindi avrei meno 3.3 5 5S + 3 + 35 50 9 in questo caso con questo livello non rifiuterei Se però invece di prendere Alfa 001 usassi quello più comune 005 avrei alfa mezzi Lo devo andare a considerare 0025 e quindi in questo caso rifiuterei perché le nuove soglie sono più dentro sarebbero meno 2.3 e più Ok va bene Sono stata un po' più lunga del previsto però spero Diciamo che in questo modo siamo riusciti a venire tutto quello che era Diciamo che Massimo sospeso.