STATISTICA – II

PARTE

INFERENZA INDUTTIVA Ripercorriamo il metodo statistico con un esempio: all’interno di una fabbrica

vengono prodotti pezzi che possono essere più o meno difettosi

1. Studio del carattere Y all’interno della popolazione ρ 2. Dati indagine: scelta tra indagine

censuaria o campionaria; N rappresenta la numerosità della popolazione, mentre n (=200) la

numerosità del campione. Il carattere Y può assumere infatti due modalità y1 = 0 (pezzo senza

difetti) y2= 1 (pezzo difettato). 3. Utilizzo dei modelli (sintesi dei dati): se l’insieme osservato è solo

un campione della popolazione

come si possono estendere i risultati ? 4. Inferenza induttiva: costituisce quel passaggio del

processo statistico che consente di conoscere il

comportamento del carattere in popolazione sulla base di informazioni

campionarie. Tornando all’esempio: si è rilevata la frequenza relativa dei pezzi

difettosi del campione:

f(C) = 8200 → frequenza relativa campionaria Le conclusioni circa il

comportamento del carattere in popolazione possono essere tratte in termini di probabilità: f(C) =

8200 → P(ρ) = YN → frequenza relativa sulla popolazione → H:P < 0,03 → ipotesi statistica

• La statistica inferenziale si concentra su problemi di stima (può essere intervallare o puntuale) e di

controllo di ipotesi. L’inferenza è un “ragionamento che parte da premesse per arrivare a

conclusioni”; essa può essere deduttiva (ρ → C con P =1) o induttiva (ρ → C con P = (0;1) ).

VALIDITA’ DEL CAMPIONE Non si può basare la validità del campione sul suo “rispettare” le

proprietà della popolazione. Lo scarto tra il valore medio calcolato sulla popolazione (μ) e il valore

medio calcolato sul campione (y

), ad esempio, può essere dovuto ad un errore casuale o ad un errore

sistematico:

• Errore casuale: la differenza è dovuta all’operazione di campionamento casuale; sono errori che

tendono a bilanciarsi e che decrescono al crescere della numerosità del campione (in popolazione

gli errori casuali spariscono). L’errore casuale è ineliminabile nell’operazione di campionamento

• Errore sistematico: distorsione sistematica nella fase di campionamento. Differenza tra quantità

campionaria e di popolazione dovuta a distorsione sistematiche, cioè errori che vanno sempre nella

stessa direzione (=> non si bilanciano) non decrescono all’aumentare della numerosità campionaria.

Un campione viene definito rappresentativo della popolazione se la differenza tra quantità

campionaria e di popolazione è dovuta esclusivamente ad un errore casuale di campionamento.

COME OTTENERE UN CAMPIONE RAPPRESENTATIVO Casualità: Un campione è rappresentativo se è

casuale, cioè quando le unità che lo compongono sono identificate senza effettuare nessuna

operazione di scelta. Esistono due tipi di campioni casuali:

o Campione probabilistico → è un sottoinsieme della popolazione tale che: a) ogni unità della

Introduzione alla Probabilità e Statistica: Esercizi e Quiz, Appunti di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica Introduzione alla Probabilità e Statistica: Esercizi e Quiz e più Appunti in PDF di Statistica solo su Docsity!

→ frequenza relativa campionaria

→ P

→ frequenza relativa sulla popolazione → H:P < 0,03 → ipotesi statistica

• CAMPIONE IN EQUILIBRIO

POSTULATO EMPIRICO DEL CASO Esempio: lancio di una moneta n = 4 lanci → 3 C e 1 T n = 40

lanci → 30 C e 10 T n = 400 lanci → 300 C e 100 T f (C) → = Lo

n

n Vincoli per l’uti

per applicare il criterio classico è necessario che gli elementi dello

n

n Vincoli u

frequentista: l’esperimento deve essere ripetibile e il numero di prove

P(Ω) = 1

E ∩ F = ∅ ⇒ P(E ∪ F) = P(E) + P(F)

P(E|F) =

P(E ∩ F)

P(F)

Indipendenza: nb

INCOMPATIBILITÀ : E ed F si dicono incompatibili se la loro intersezione è un insieme vuoto, ciò significa che il rea

INDIPENDENZA : E ed F sono indipendenti quando il realizzarsi di uno dei due non influenza il realizzarsi dell’altro

X P(X)

Funzione di probabilità:

n

)p

(P(X=3) = ?)

) → n° di sequenze costituite da “x” successi e “n-x” insuccessi

P(X ≥ 2) = P(X = 2) + P(X = 3) + P(X = 4) = 1 − P(X ≤ 1) = 1 − [P(X = 0) + P(X = 1)] = 1 − (

e

= 0,224 → la probabilità che 1 minuto entrino esattamente due clienti è del 22,4%

e

− e

− e

Le medie nelle due popolazioni possono essere: Hcampionamento

→ nel campione si è rilevata una differenza che è dovuta all’errore casuale di

H

→ le cause che hanno determinato la differenza a livello campionario sono dovute non solo all’error

Il TEST STATISTICO indaga elabora le conseguenze di H

z

→ valore realizzato da una variabile normale standard = valore concreto della statistica test

sia iniziale probabile si devono che si stabilire realizzi il delle valore soglie z

genere si fissano valori come: α = 0,05 ; 0,01 ; 0,1 Questo rischio massimo viene diviso equamente tra le

. Questo rappresenta un valore

In questo caso si dice che il test è statisticamente

PRINCIPIO DI SEMPLICE DISGIUNZIONE (Fisher) :

s

→ H