Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica - 10. CAMPIONAMENTO, Slide di Statistica

Statistica - 10. CAMPIONAMENTO

Tipologia: Slide

2010/2011

Caricato il 05/07/2011

alicepani
alicepani 🇮🇹

4.5

(52)

11 documenti

1 / 32

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1
Campionamento
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20

Anteprima parziale del testo

Scarica Statistica - 10. CAMPIONAMENTO e più Slide in PDF di Statistica solo su Docsity!

Campionamento

Statistica Descrittiva e Statistica Inferenziale

Statistica descrittiva Complesso di metodi che comprendono la raccolta, la presentazione e la sintesi di un insieme di dati allo scopo di descriverne le varie caratteristiche in maniera appropriata. Statistica Inferenziale Complesso di metodi che consentono di stimare una caratteristica di una popolazione, oppure di prendere una decisione che concerne l’intera popolazione, sulla base dei soli risultati campionari. Si osserva tutta la popolazione Si osserva solo un campione della popolazione

Indagine sulla popolazione Non si può attuare in caso di:

I motivi principali per utilizzare un Campione

  • L’indagine su un campione richiede meno tempo dell’indagine su tutta la popolazione (censimento)
  • Una indagine campionaria è meno costosa di un censimento
  • È indispensabile quando per esaminare l’unità statistica dobbiamo distruggerla (test di qualità): ad esempio per misurare la durata di una lampadina dobbiamo tenerla accesa fino a quando si brucia.
  • È indispensabili quando l’intera popolazione è infinita o non è osservabile: in archeologia, in paleontologia, nello studio di popolazioni animali e vegetali
  • Un’indagine campionaria viene di solito condotta con l’ausilio di personale qualificato, mentre per il censimento della popolazione si ricorre a rilevatori non professionisti

Popolazione infinita e suoi parametri

Una Popolazione infinita è composta da tutte le unità
potenzialmente osservabili e non necessariamente già esistenti
fisicamente (ad es. tutti gli esemplari di una data specie vegetale o tutti i pezzi che

hanno origine da un determinato processo produttivo).

Il carattere d’interesse può essere rappresentato da una variabile
casuale con una certa distribuzione di probabilità. In questo caso si
indicherà con “popolazione X” la variabile casuale X.

Esempio:

media della popolazione μ = E(X)

Varianza della popolazione σ

2

= E[X – μ ]

2

Campionamento da Popolazioni finite

Criteri per la selezione del campione

Idealmente si vorrebbe che il campione rispecchiasse il più
fedelmente possibile le caratteristiche della popolazione che ci
interessano, al fine di ottenere da esso informazioni precise e
affidabili sulla popolazione.
Un campione di questo tipo viene detto rappresentativo.
Sfortunatamente, in pratica, non si potrà mai sapere se il
campione da noi estratto è rappresentativo oppure no!
L’unico modo di saperlo sarebbe quello di confrontarlo con
l’intera popolazione, che però non possiamo osservare.

11 Criteri per la selezione del campione Per sperare (senza però esserne certi) che il campione sia abbastanza rappresentativo della popolazione da cui proviene ci possiamo solo affidare alla “bontà” del metodo di campionamento scelto a priori. La classificazione fondamentale dei metodi di campionamento è la seguente: Campionamento probabilistico o casuale Campionamento non probabilistico Si basa sulla conoscenza della probabilità di ciascuna unità o soggetto di essere estratto Le Unità Statistiche o Soggetti sono selezionati senza tener conto delle loro probabilità di entrare a far parte del campione. La probabilità di estrazione di ciascun soggetto è ignota o non viene considerata

Campionamento casuale

  • Nel campionamento casuale è nota a priori la probabilità

di ciascuna unità statistica di entrare a far parte del

campione.

  • È l’unica tecnica che permette di ricondurre i risultati

ottenuti dal campione alla popolazione, misurando

l’entità dell’errore che si può commettere.

  • In questo corso di base ci occupiamo esclusivamente del

campionamento casuale semplice;

  • gli altri metodi di campionamento casuale sono oggetto

di corsi di statistica più avanzati.

N.B. Dire che un campione casuale è un campione

“estratto a caso” non è una definizione corretta.

Campionamento casuale semplice (CCS)

Per il campionamento casuale semplice (CCS) è necessario
disporre di una lista completa di tutte le unità appartenenti a
popolazione.
Schema di urna  la procedura per estrarre un campione
casuale semplice è assimilabile all’estrazione di palline da
un’urna:
  • a ciascuna unità della popolazione (presente nella nostra
lista) viene associato uno ed un solo numero (ad es. il numero
d’ordine con cui compare nella lista);
  • si prepara un’urna con N palline uguali, ognuna delle quali
contiene un numero da 1 a N ;
  • dall’urna si estraggono n palline e si includono nel campione
le n unità statistiche i cui numeri di lista corrispondono a quelli
contenuti nelle palline astratte.

Campionamento casuale semplice (CCS)

Definizione:

il campionamento casuale semplice (con o senza

ripetizione) si ha per definizione quando ogni unità della

popolazione ha la stessa probabilità di essere inclusa nel

campione. (1)

In alternativa si può dire che i campioni casuali semplici di

uguale numerosità n hanno tutti la stessa probabilità di

essere estratti. (2)

Dalla (1) consegue la (2) e viceversa.

N.B. Dire che un campione casuale semplice è un

campione “estratto a caso” non è una definizione

corretta.

Nella Statistica Descrittiva si osserva una popolazione nota e si sintetizzano le informazioni relative da un certo carattere X. Se X è quantitativo la sua distribuzione può essere sintetizzata (pur perdendo alcune informazioni) in due sole misure: la media aritmetica e la varianza: 2 1 2 1 1 1 μ = (^) #! = #( " μ) = = N i i N i i x N x N Nella Statistica Inferenziale si estrae un campione di n elementi da una popolazione ignota e, sulla base di questo, si stimano alcune caratteristiche (ignote) della popolazione, come ad esempio la media

μ e la varianza σ

2

31 Errore di stima In generale, le stime ottenute su un campione non coincidono con i parametri incogniti della popolazione. In altri termini, una stima campionaria è sempre affetta da errore*: Ad es. E l’entità di questo errore varia da campione a campione. L’errore di stima è la risultante di due componenti: Errore di stima

  • l’errore potrebbe essere anche nullo e la stima coincidere perfettamente con il parametro ignoto. Tuttavia questo evento è estremamente improbabile e non c’è modo di verificarlo x! μ Errore campionario : è dovuto esclusivamente al fatto di osservare solo un sottoinsieme della popolazione scelto a caso. Errore non campionario : comprende tutti gli altri tipi di errore (diversi da quello campionario) che si possono commettere in un’indagine (sia campionaria che censuaria)

Errore campionario Per fare un esempio di errore di campionamento, riconsideriamo la popolazione composta da 4 grandi aziende con X = “Fatturato annuo”

x 1 = 52, x 2 = 49, x 3 = 65, x 4 = 74 μ = 60

Vediamo quale errore campionario si commetterebbe stimando μ su ciascuno dei possibili campioni non ordinati di dimensione 3: (74, 52, 49) 58,33 -1, (65, 74, 52) 63,67 3, (49, 65, 74) 62,67 2, (52, 49, 65) 55,33 -4, Errore campione campionario x

x! μ

Questo esempio è puramente didattico. Nel concreto: i) non capita mai di conoscere l’intera popolazione (altrimenti non ci sarebbe bisogno del campione); ii) si estrae un solo campione; iii) non si può sapere a quanto ammonta l’errore campionario.