Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


slides campionamento, Slide di Statistica

slides del corso svic sul campionamento statistico

Tipologia: Slide

2019/2020

Caricato il 09/07/2020

luna_ledi_prestint
luna_ledi_prestint 🇮🇹

4.5

(5)

15 documenti

1 / 20

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Campionamento e distribuzioni
campionarie
Dott.ssa Laura Anderlucci
Elementi di Statistica
CdL Sviluppo e Cooperazione Internazionale
Università di Bologna
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14

Anteprima parziale del testo

Scarica slides campionamento e più Slide in PDF di Statistica solo su Docsity!

Campionamento e distribuzioni

campionarie

Dott.ssa Laura Anderlucci

[email protected]

Elementi di Statistica

CdL Sviluppo e Cooperazione Internazionale

Università di Bologna

Introduzione

Ogni indagine statistica è riferita a una certa

popolazione che può essere finita o infinita e

che costituisce il principale oggetto d’interesse

(ad es. uno studio finalizzato alla misurazione del

tasso di disoccupazione: la popolazione – finita –

di riferimento è costituita da tutti gli abitanti del

paese in una certa fascia d’età).

Quali sono i passi da seguire?

Indagini campionarie

Più frequentemente si osserva solo una parte

della popolazione, ossia un campione.

Il campione viene estratto dalla popolazione

seguendo alcune regole probabilistiche (piano

di campionamento).

Dall’analisi dei dati campionari si ottengono,

tramite procedure inferenziali, informazioni sulle

caratteristiche (o parametri) riguardanti l’intera

popolazione.

Popolazione finita e suoi parametri

 Una popolazione finita è un insieme di N unità su

cui si può osservare un certo carattere (es: gli

investimenti annui di tutte le aziende di un paese; il

numero di figli di ogni famiglia italiana).

 Dato un carattere X osservato su tutta la

popolazione con valori x 1

, …, x N

, si possono

calcolare i parametri della popolazione: cioè, delle

costanti che descrivono aspetti caratteristici della

distribuzione del carattere nella popolazione stessa.

Notazione

Nel seguito, la media e la varianza avranno notazione

diversa a seconda che si riferiscano alla popolazione

o al campione. In particolare:

Inoltre:

N indicherà il numero di unità della popolazione

n indicherà il numero di unità del campione.

Popolazione Campione

Media 𝜇

ത 𝑋

Varianza 𝜎

2

𝑆

2

Popolazione infinita e suoi parametri

 Una popolazione infinita è composta da tutte

le unità potenzialmente osservabili e non

necessariamente già esistenti fisicamente.

 Il carattere d’interesse può essere

rappresentato da una variabile casuale con

una certa distribuzione di probabilità. I due

parametri principali sono la media e la

varianza.

Campionamento da Popolazioni finite

n = dimensione campionaria

n/N = frazione di campionamento

Popolazione

Campione

1

2

𝑁

1

2

𝑛

Campionamento da Popolazioni finite

Se la regola di selezione del campione è di tipo

probabilistico, l’estrazione del campione avviene

in accordo con qualche specifica distribuzione di

probabilità.

Campioni casuali

I campioni possono essere estratti casualmente dalla

popolazione:

con ripetizione : una volta estratta un’unità viene

rimessa dentro la popolazione e quindi potrebbe

essere nuovamente estratta;

senza ripetizione : una volta estratta un’unità questa

viene messa da parte e quindi non può essere

estratta più di una volta.

Campionamento da Popolazioni Infinite

In una popolazione infinita, la n - pla di variabili casuali:

( X 1

, X 2

,…, X n

)

che compongono il campione casuale di dimensione n

presenta le seguenti proprietà:

X 1

, X 2

,…, X n

sono variabili casuali indipendenti.

 ogni v.c. X i

possiede la stessa distribuzione di

probabilità della popolazione_._

Nelle popolazioni finite in cui la dimensione campionaria

è molto più piccola della numerosità della popolazione,

si può applicare la teoria del campionamento da

popolazioni infinite.

Statistiche campionarie e distribuzioni campionarie In generale, una statistica t ( X 1 , X 2 ,…, X n ) assume valori diversi a seconda del particolare campione estratto, quindi la probabilità che una statistica assuma un certo valore è pari alla probabilità complessiva di tutti i campioni per i quali si ottiene tale valore. La statistica campionaria è una v.c. a cui è associata una distribuzione di probabilità detta distribuzione campionaria.

Statistiche campionarie e distribuzioni campionarie

Esempio 10.5.1, p.

Consideriamo una popolazione finita composta dalle seguenti

5 unità:

X 1

=8 x 2

=4 X 3

=2 X 4

=11 X 5

=

Si consideri l’estrazione senza ripetizione di campioni di

dimensione n = 2 e per ognuno di essi si calcoli la statistica

media campionaria.

I possibili campioni sono 20 e ognuno di essi ha probabilità

1 / 20 = 0 , 05 di essere osservato. La distribuzione di probabilità

della media campionaria è data da:

𝑋 1

8 8 8 8 4 4 4 4 2 2 2 2 11 11 11 11 6 6 6 6

𝑋 2

4 2 11 6 8 2 11 6 8 4 11 6 8 4 2 6 8 4 2 11

6 5 9,5 7 6 3 7,5 5 5 3 6,5 4 9,5 7,5 6,5 8,5 7 5 4 8,

3 4 5 6 6,5 7 7,5 8,5 9,

𝑃(

ത 𝑋) 0,1^ 0,1^ 0,2^ 0,1^ 0,1^ 0,1^ 0,1^ 0,1^ 0,

Distribuzione della media campionaria nelle popolazioni infinite Sia 𝑋 1 , 𝑋 2 , … , 𝑋 𝑛 un campione casuale di dimensione 𝑛 estratto dalla popolazione 𝑋,costituito da 𝑛 v.c. indipendenti e identicamente distribuite con 𝐸(𝑋 𝑖 ) = 𝜇 e 𝑉(𝑋 𝑖 ) = 𝜎 2 per ogni 𝑖 = 1 , … , 𝑛. Proprietà della media aritmetica campionaria  Il valore atteso 𝐸

 La varianza 𝑉

𝜎 2 𝑛  Se X ~ Be π →

1 𝑛

 Se X ~ N 𝜇; 𝜎 2 →

𝑋~N 𝜇;

𝜎 2 𝑛 La media campionaria nelle popolazioni infinite La distribuzione della media campionaria è meno variabile della distribuzione della popolazione; la riduzione è tanto più forte quanto maggiore è la dimensione campionaria

Distribuzione della media campionaria nelle popolazioni infinite Qualunque sia la popolazione, per il Teorema del Limite Centrale lim 𝑛→∞ 𝑃 ത 𝑋 − 𝜇 𝜎^ Τ 𝑛 ≤ 𝑧 = 𝑃 𝑍 ≤ 𝑧 dove 𝑍 è una v.c. Normale standardizzata. Quindi, per 𝑛 abbastanza grande, ത 𝑋 si distribuisce approssimativamente come una variabile Normale, con media 𝜇 e varianza Τ 𝜎 2 𝑛 . In pratica, per raggiungere un sufficiente grado di approssimazione, sarà necessario disporre di un campione formato da almeno 𝑛 = 30 unità.

Teorema del Limite Centrale