






Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Come calcolare stime puntuali e intervalli di confidenza per parametri ignoti in statistica, utilizzando campionamenti. Il test d'ipotesi e i livelli di significatività vengono anche introdotti.
Tipologia: Dispense
1 / 10
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!







In molti casi siamo interessati a conoscere alcune caratteristiche della popolazione (media, varianza ecc.) ossia i parametri caratterizzanti la distribuzione. Quando non è possibile osservare tutte le unità della popolazione, tali parametri sono in genere incogniti. In tal caso, il ricercatore potrà ottenere informazioni circa il valore del parametro analizzando i dati provenienti da campioni.
Il problema consiste, allora, nel trovare una funzione dei dati campionari che fornisca una buona approssimazione del parametro ignoto. Quando un parametro della popolazione è stimato attraverso un singolo valore, tale valore viene chiamato stima puntuale del parametro. Tale parametro deve godere di tre proprietà, deve cioè essere:
_1. corretto
In molti casi si preferisce considerare, un intervallo di stime plausibili al quale sia associato un fissato livello di “affidabilità”. In sostanza si vuole determinare un intervallo di valori intorno al valore che ci aspettiamo contenga, con un certo livello di fiducia, il valore del parametro incognito. Nell’inferenza statistica si fa invece un ragionamento induttivo: ci basiamo infatti sui risultati di un solo campione per trarre conclusioni sull’intera popolazione. Nel caso in cui si voglia stimare la media della popolazione e la varianza sia nota ogni stima per intervallo viene calcolata valutando anche la percentuale dei campioni che dà luogo a conclusioni corrette, ossia il grado di fiducia. Si consideri una popolazione avente una distribuzione con varianza nota σ^2 e media incognita μ, si estragga da questa popolazione un campione di ampiezza n. Per grandi valori di n, la statistica
ha approssimativamente la distribuzione normale standardizzata.
Se l’area sottesa dalla distribuzione normale a destra di , allora L’area compresa tra perciò
Esempio Sia dato un campione di ampiezza n = 100 estratto da una popolazione avente scarto quadratico medio σ = 5.1; la media campionaria sia = 21.6. Costruire l’intervallo di confidenza al 95% per la media μ della popolazione.
Per il grado di fiducia del 95% con α al 5% ossia α = 0,05 e = 0,05 =0, 2 il valore critico è
Applicando la formula si ottiene l’intervallo di
confidenza
Esempio Si vuole stimare il numero medio di battiti cardiaci al minuto per una certa popolazione. Il numero medio di battiti al minuto per un campione di 49 soggetti è risultato uguale a 90. La popolazione è distribuita in modo normale con uno scarto quadratico medio σ = 10.
Trovare gli intervalli di confidenza per la media della popolazione con i gradi di fiducia del 90%, 95% e 99%.
a − Per il grado di fiducia del 90% il valore critico è
si ottiene l’intervallo di confidenza
b − Per il grado di fiducia del 95% il valore critico è
si ottiene l’intervallo di confidenza
c − Per il grado di fiducia del 99% il valore critico è
si ottiene l’intervallo di confidenza
Si osservi come, restando invariata l’ampiezza del campione, all’aumentare del grado di fiducia cresce l’ampiezza dell’intervallo di confidenza, ossia la stima diventa meno precisa.
I test di ipotesi possono essere classificati in due gruppi: test a una coda (o test unilaterale) e test a due code (o test bilaterale).
1° caso Test a una coda Ipotesi nulla H 0 : μ ≤ μ 0. Ipotesi alternativa H 1 : μ > μ 0. Regione di rifiuto Z > zα Regione di accettazione Z < zα
2° caso Test a una coda Ipotesi nulla H 0 : μ ≥ μ 0. Ipotesi alternativa H 1 : μ < μ 0. Regione di rifiuto Z < −zα Regione di accettazione Z > −zα
3° caso Test a due code Ipotesi nulla H0: μ = μ0. Ipotesi alternativa H1: μ ≠ μ0. Regione di rifiuto Z < −z oppure Z > z
Regione di accettazione − z < Z < z
Se l’ipotesi H 0 è vera, ma viene erroneamente rifiutata, si commette un errore del I tipo; la probabilità di commettere tale errore è indicata con α. Se l’ipotesi H 0 è falsa, ma erroneamente non viene rifiutata, si commette un errore del II tipo; la probabilità di commettere questo tipo di errore è indicata con β.
A seconda della decisione presa, si può verificare uno dei due tipi di errore
Quando si usa una statistica campionaria per prendere una decisione sul parametro della popolazione si corre sempre il rischio di giungere a una conclusione sbagliata. Questo dipende dal fatto che un’informazione parziale, ottenuta da un campione, è usata per trarre conclusioni sull’intera popolazione. Nella verifica di ipotesi si individuano due tipi di errore
a) Ipotesi nulla H 0 : μ ≥ 1600 Ipotesi alternativa H 1 : μ < 1600 Livello di significatività α = 0. Il test è a una coda; il valore critico per questo livello di significatività è zα = −1. La regola di decisione consiste nel rifiutare l’ipotesi se il valore della statistica Z ottenuto dai dati del campione è minore di −1.645. Il campione ha le seguenti caratteristiche n = 100 = 1570 Il valore della statistica test è sostituendo
Dato che il valore trovato Z = −2.50 è minore del valore critico zα = −1.645 , si rifiuta l’ipotesi nulla al livello di significatività α = 0.05, ossia del 5%. Livello di significatività α = 0. Il test è a una coda; il valore critico per questo livello di significatività è zα = −2. . Anche in questo caso il valore Z = −2.50 è minore del valore critico zα = −2.326 , perciò si rifiuta l’ipotesi nulla al livello di significatività α = 0.01, ossia dell’1%.
b) Ipotesi nulla H0: μ = 1600 Ipotesi alternativa H1: μ ≠ 1600 Livello di significatività α = 0. Il test è a due code; i valori critici per questo livello di significatività sono
Il valore Z = −2.50 cade al di fuori dell’intervallo avente come estremi i valori critici, cioè appartiene alla regione di rifiuto, perciò si rifiuta l’ipotesi nulla al livello di significatività α = 0.05, ossia del 5%. Livello di significatività α = 0.01. I valori critici per questo livello di significatività sono
Il valore Z = −2.50 cade fra questi estremi, perciò non si rifiuta l’ipotesi nulla al livello di significatività α = 0.01, ossia dell’1%.