























































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Appunti e slide delle lezioni.
Tipologia: Dispense
1 / 63
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!
























































1. Dalla statistica descrittiva all’inferenza Aree della statistica A) Statistica descrittiva: Descrive fenomeni osservati su un insieme di unità (popolazione di riferimento) e che costituisce la “parte dell’universo che ci interessa”. B) Statistica probabilistica: Studia i fenomeni aleatori. Svolge un ruolo fondamentale nella statistica inferenziale. C) Statistica inferenziale: campione e parametro. Popolazione e campione La popolazione di riferimento può essere di due tipi: - Popolazione finita: un insieme finito di N unità su cui si può osservare un certo carattere (es: gli investimenti annui di tutte le aziende di un paese; il numero di figli di ogni famiglia italiana); - Popolazione infinita o virtuale: composta da tutte le unità potenzialmente osservabili e non necessariamente già esistenti fisicamente. Il carattere d’interesse può essere rappresentato da una variabile casuale X con una certa distribuzione di probabilità. Per la raccolta delle informazioni sui caratteri della popolazione si possono usare due tipi di indagine. § Indagine totale o censuaria: quando si esaminano tutte le unità statistiche che compongono la popolazione oggetto di studio. § Indagine campionaria: quando ci si limita a studiare un sottoinsieme della popolazione di riferimento detto campione. Pregi e difetti delle due tipologie di indagini
Quando si effettua un’indagine campionaria la statistica inferenziale consente, avvalendosi di metodi probabilistici, di trarre conclusioni generali sulla popolazione a partire dall’esame del campione di osservazioni.
2. Popolazione e Campionamento Le indagini campionarie si basano sull’analisi di un campione di osservazioni, dunque, su un sottoinsieme di unità dell’universo di riferimento. Se l’obiettivo però non è descrivere quel sottoinsieme ma avere informazioni sull’intero universo, ci chiediamo: - Il campione va scelto seguendo un qualche criterio? - Bastano gli strumenti della statistica descrittiva per analizzare i dati e generalizzare alla popolazione i risultati? Caratteristiche del campione Per poter fare inferenza nel modo corretto il campione deve essere: 1) RAPPRESENTATIVO: cioè una miniatura della popolazione ovvero molto simile alla popolazione rispetto alle caratteristiche salienti per la ricerca 2) CASUALE: tutte le unità hanno una probabilità non nulla di entrare a far parte del campione. Attenzione: solo per i campionamenti di tipo probabilistico è possibile calcolare la precisione della stima e fare inferenza sulla popolazione.
Per esempio, Media della popolazione: θ = μ = E[X] Esempio Potremmo voler conoscere:
Stima Ogni particolare valore assunto da uno stimatore è una STIMA (è un numero). t = t(x 1 , x 2 , …, xn) Esempio Lo stimatore T è una variabile casuale. Di conseguenza è caratterizzato da una distribuzione di probabilità chiamata Distribuzione Campionaria. Proprietà stimatore Ogni parametro θ possiede più di uno stimatore possibile. Per la media aritmetica, per esempio, si possono usare anche la moda campionaria o la mediana campionaria. Per scegliere lo stimatore è utile studiarne le proprietà ottimali (correttezza, consistenza, efficienza). Noi ne vedremo una sola. Correttezza Lo stimatore T è uno stimatore corretto di θ se la sua media coincide con il parametro da stimare. M(T)=E(T) = θ Se lo stimatore non è corretto si chiama distorsione (bias) di uno stimatore la quantità: B(T) = E(T) – θ
per n sufficientemente grande (n > 30). Esempio Un dirigente deve scegliere tra 3 dipendenti i 2 componenti di un gruppo di lavoro. Gli anni di esperienza dei dipendenti sono: {3,5,9} (popolazione) Il numero medio di anni di esperienza per la popolazione e la sua varianza sono: Si estrae CON REINSERIMENTO un campione di n = 2 dipendenti. Le possibili coppie sono 9: Per ogni campione facciamo la media campionaria: La distribuzione della v.c. media campionaria è: Se si calcolano media e varianza si ottiene:
Se si estrae SENZA REINSERIMENTO un campione di n = 2 cosa succede? Le possibili coppie sono 6 : Le possibili medie campionarie ora sono: E la distribuzione è: Stimatore della varianza
Si vuole determinare un intervallo [ L 1 , L 2 ] intorno alla stima di θ :
Fissato 1 – α : dove z α /2 è il percentile di ordine (1 – α /2) della N (0,1). Ricaviamo il paramento μ: da cui: 1 – α è il grado di fiducia nel fatto che l’intervallo contenga il parametro μ. Esempio In una popolazione il reddito pro-capite è distribuito secondo una Normale di media incognita e σ=56,3. Da un campione casuale di numerosità 20 estratto dalla popolazione risulta un reddito medio pro-capite pari a 980,5. Calcolare l’intervallo di confidenza al 95% per il reddito medio pro-capite.
dove S^2 è lo stimatore di 𝜎^2 e T è una t di Student con gdl n- 1. tn - 1; α/ 2 è il percentile di ordine (1 – α /2) della tn - 1. Esempio In una popolazione il reddito pro-capite è distribuito secondo una Normale di media e varianza incognita. Da un campione casuale di numerosità 20 estratto dalla popolazione risulta un reddito medio pro-capite pari a 980,5 e s= 56,3. Calcolare l’intervallo di confidenza al 95% per il reddito medio pro-capite.
Gli estremi dell’intervallo stimato sono: Osservazioni In generale: tn - 1; α/ 2 > z α / à a parità di numerosità campionaria n l’intervallo di confidenza per la media con 𝜎^2 non nota è più ampio di quello con 𝜎^2 nota. Asintoticamente si ha che: per n > 30 l’utilizzo della distribuzione Normale porta a differenze nell’ampiezza praticamente trascurabili. Esempio (grande campione) Una casa editrice è interessata a sapere quanto spendono in libri gli studenti della scuola secondaria. Per un campione casuale di n=400 la spesa media è risultata 101 e la varianza campionaria 44,47. Assumendo che la spesa si distribuisca come una Normale si calcoli l’intervallo di confidenza (asintotico) al 95% per la spesa media. Intervallo per la proporzione Consideriamo una popolazione riferita a un carattere che assume due modalità (popolazione Bernoulliana), siamo interessati all’intervallo di confidenza per la proporzione π.
Dato il livello di probabilità, si può ricavare il percentile z α / 2 o t α /2 e, esplicitando rispetto ad n, si può ricavare il valore minimo di n. Se il valore ottenuto non è un numero intero si prenderà come dimensione campionaria il primo intero superiore a tale valore. NB: Per l’intervallo sulla proporzione la stima p è chiaramente incognita. Quando non si hanno informazioni sul parametro incognito, si suggerisce di adottare il valore «prudenziale» p = 0.5 a cui corrisponde il valore massimo di p(1-p) = 0.25 (situazione più sfavorevole, per la quale la stima della varianza è massima). Esempio Si vuole studiare la percentuale di giovani (15-25 anni) che posseggono un tablet, calcolare il numero minimo di soggetti da intervistare in modo che l’intervallo di confidenza di π al 90% abbia semi- ampiezza pari all’1%. I dati ci dicono solo che la semi-ampiezza dell’intervallo deve essere 0.01: Osservazione: soluzione di problemi inversi Dato l’intervallo di confidenza, si possono determinare:
Ipotesi statistica e sistema di ipotesi Ipotesi statistica : una congettura riguardante un parametro della popolazione. Si distinguono due ipotesi contrapposte:
Un’ipotesi può essere: