




Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
argomenti richiesti secondo modulo statistica Prof. De Battisti
Tipologia: Appunti
1 / 8
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!





Esistono due tipi di errore, a seconda di quale delle due ipotesi è vera:
TEST SIGNIFICATIVITA’ La significatività e la possibilità rilevante che compaia un determinato valore. il livello di significatività di un test e dato solitamente da una verifica del test di ipotesi. nel caso più semplice definita come la polita di accettare o rigettare l'ipotesi nulla.
Fissando il valore di 𝛼 = … si ha pertanto che: “ se p-value < 𝛼 e quindi SI RIFIUTA H 0 “se p-value > 𝛼 e quindi NON SI RIFIUTA H 0 Interpretazione p-value → p-value (è il valore dell’area alla sinistra di z/t sotto la curva normale e si trova sulle tavole, cercando l’area alla destra di <
se i due caratteri sono statisticamente indipendenti allora ciò significa che cov=0 e quindi p=0, ma se p= non e detto che X e Y siano statisticamente indipendenti
La regressione è quella tecnica statistica utilizzata per studiare le relazioni che intercorrono tra due o più caratteri (variabili) statistici. in statistica la regressione lineare rappresenta un metodo di stima del valore atteso condizionato di una variabile dipendente (Y), dati i valori di altre variabili indipendenti. nella teoria della regressione semplice si suppone che una variabile X assuma valori determinati il si cerca la relazione che la Lega la seconda variabile Y alla prima. si ipotizza quindi che la variabile indipendente “influenzi” la variabile dipendente, in quanto nell'analisi della regressione semplice (o bivariata) abbiamo una sola variabile indipendente sulla quale “regredisce” la variabile dipendente. In altre parole si cerca di stabilire un legame funzionale tra le due variabili. l'analisi della regressione lineare semplice individua quella retta che consente di prevedere al meglio i punteggi nella variabile dipendente a partire da quelli della variabile indipendente. per concludere, si tratta di individuare quella retta che “interpola” meglio la nuvola di punti (o scatter plot, grafico a dispersione) definita dalla distribuzione congiunta delle tue variabili y = a + bx + e a= intercetta della retta con l'asse delle ordinate (Y), corrisponde al valore atteso di y quando x= b = coefficiente angolare (o di regressione), misura l'inclinazione della retta di regressione di y su x ovvero la pendenza, e indica di quanto varia y al variare di un'unità di x e= errore di predizione (errore residuo) ossia tutti quei fattori di y non presi esplicitamente in considerazione dal modello. È = 0 solitamente y = a + bx --------------------→ b = cov(x,y) / var x a = m(y) – b(m(x)) x = a + by -------------------- b = cov(x,y) / var y a = m(x) – b(m(y)) INTERPRETAZIONE A = la retta ai minimi quadrati prevede per (anno di x=0) valore di circa x B= la rete ai minimi quadrati prevede un aumento / diminuzione di circa <
→ il risultato indica che il …….. relativo all'anno osservato è aumentato / diminuito di (100-nibm) % rispetto all'anno precedente (…) INTERVALLO DI CONFIDENZA IC → confido che questo intervallo di confidenza sia uno dei << (LIV. DI FIDUCIA) >> intervalli su 100 cifra che contengono il vero valore di …..(MU/P)
H0 → ipotesi nulla, e l'ipotesi sulla base della quale si elabora la distribuzione nulla della statistica utilizzata per il test H1 → ipotesi alternativa, e l'ipotesi che generalmente viene formulata prima di fare un test l'idea cioè che ha avuto il ricercatore, e rappresenta tutte le altre ipotesi riguarda il parametro non specificate dall'ipotesi nulla Se RIFIUTO H0 → statisticamente dipendenti Se NON RIFIUTO H0 → statisticamente indipendenti Se media < mediana → assimetria negativa Se media = mediana → simmetria Se media > mediana → assimetria positiva arrivo adesso si ma tre minuti si adesso mi connetto ma più CONTINGENZE CIJ > 0 - → c'è attrazione tra le modalità ….. delle classi ….. CIJ < 0 → c'e repulsione tra le modalità ….. delle classi……
SE P2= 1 allora tra x e y vi è massima connessione Se p2=0 allora via ma minima connessione 0=<x2n<=1 e non può assumere valori negativi Misura la forza di associazione fra due variabili Se = 0 → le 2 variabili sono indipendenti X2n= 0 – p(x,y)= - 1 X2n= 0 – p(x,y) = 0, Non sono possibili perché quando x2n= 0 significa che non c'è associazione tra le variabili, e quindi di conseguenza nemmeno un legame lineare, perciò se x2n=0 allora p sarà sempre uguale zero = P(x,y) = - 1 x2n= - 1 non può verificarsi perché x2n non può assumere valori negativi P(x,y) = 0 x2n= 1 corretta L’unica situazione plausibile è la A) quella in cui Ρ = 0 E X2N = 0.3, che si verifica quando c’è un legame debole fra due variabili ma non di tipo lineare. La situazione b) Ρ = - 0.3 E X2N= 0 non può verificarsi perché se non c’è un legame fra le variabili non può esserci un legame di tipo lineare. La situazione c) p=0 e x2n= - 0,3 non può verificarsi perché il 𝑋 2 n non può assumere valori negativi. Infine la situazione d) Ρ = 1 E 𝑋 2 N= 0.3 non può verificarsi perché se c’è un legame lineare perfetto fra le variabili allora c’è un legame perfetto (e anche 𝑋 2 n deve valere 1). INDIPENDENZA CON FREQ. CONDIZIONATE REL Le due distribuzioni sono diverse, quindi le due variabili non risultano essere indipendenti. In alternativa, si sarebbero potute calcolare le distribuzioni delle frequenze relative condizionate del carattere Tipologia di nucleo familiare (X) dato il carattere Spese di noleggio (Y).