Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Introduzione alla Statistica: Popolazione, Campione, Parametro e Statistica, Slide di Statistica

Questo testo introduttivo spiega cosa è la Statistica e presenta concetti fondamentali come popolazione, campione, parametro e statistica. Viene inoltre discusso il concetto di casualizzazione per garantire una buona rappresentatività del campione.

Tipologia: Slide

2019/2020

Caricato il 23/01/2020

Utente sconosciuto
Utente sconosciuto 🇮🇹

4.3

(3)

19 documenti

1 / 28

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Introduzione all’inferenza statistica
SA Gattone
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c

Anteprima parziale del testo

Scarica Introduzione alla Statistica: Popolazione, Campione, Parametro e Statistica e più Slide in PDF di Statistica solo su Docsity!

Introduzione all’inferenza statistica

SA Gattone

Un passo indietro... che cos’è la Statistica?

La Statistica può essere definita come l’insieme di tecniche finalizzate alla raccolta e all’analisi dei dati con l’obiettivo di studiare in termini quantitativi un fenomeno collettivo. I (^) La Statistica descrittiva si occupa di descrivere e sintetizzare i dati (tabelle, grafici e indici di sintesi) I (^) La Statistica inferenziale si occupa di formulare previsioni e consente di trasformare le informazioni in conoscenza.

Per spiegarci meglio allora è utile introdurre alcuni concetti e termini di base, come quello di popolazione, di campione, di parametro e di statistica.

Il campione

Tuttavia, poiché a ogni osservazione è legato un costo di rilevazione, spesso è necessario limitarsi a osservare un sottoinsieme della popolazione di interesse. I (^) Un campione è un sottoinsieme della popolazione di riferimento.

Ad esempio: I (^) in un sondaggio elettorale si intervistano 500 elettori, i cosiddetti exit polls I (^) si intervistano a caso 100 studenti nel corso di un’indagine sulla soddisfazione dei servizi offerti da una università.

Parametro e statistica (1)

I (^) Qualora le informazioni riguardanti il fenomeno siano relative ad un campione estratto dalla popolazione, occorre un intervento induttivo che permetta di fare congetture sull’intera popolazione assegnando un grado di precisione e di attendibilità ai risultati numerici ottenuti. I (^) Il parametro è una sintesi numerica della popolazione. I (^) La Statistica è una sintesi dei dati campionari.

I (^) Nelle elezioni della California del 2006, un sondaggio condotto su 2705 individui scelti a caso tra i 7 milioni di votanti previse la vittoria del candidato Repubblicano Arnold Schwarzenegger con il 56_._ 5 %. Tra i 7 milioni di votanti, il 55_._ 9 % votò per Schwarzenegger.

  1. Qual è la popolazione?
  2. Qual è il campione?
  3. Qual è la Statistica?
  4. Qual è il Parametro?
  1. Qual è la popolazione? I 7 milioni di votanti: l’insieme delle unità statistiche di interesse.
  2. Qual è il campione? I 2705 intervistati: il sottoinsieme della popolazione su cui si osservano i dati.
  3. Qual è la Statistica? 56_._ 5 %: è il risultato di una funzione numerica applicata ai dati campionari.
  4. Qual è il Parametro? 55_._ 9 %: caratteristica numerica della popolazione, generalmente ignota.

Dati campionari

I (^) Se invece si hanno dati solo su una parte della popolazione, ovvero su un campione allora:

  1. Gli strumenti della statistica descrittiva vengono utilizzati per descrivere i dati campionari.
  2. La statistica inferenziale viene impiegata per ottenere previsioni su una popolazione sulla base di informazioni raccolte su un campione selezionato da essa.

I (^) Le tecniche statistiche inferenziali sono in grado di prevedere valori caratteristici di grandi popolazioni attraverso analisi condotte su campioni di dimensioni relativamente ridotte.

Inferenza: il procedimento induttivo

I (^) Nel calcolo delle probabilità il problema si pone come segue: data un’urna che contiene 100 palline di cui 30 bianche e 70 rosse, estraggo 10 palline casualmente e ci chiediamo qual è la probabilità di estrarre 4 bianche? I (^) Problema inverso : se conosco l’esito dell’estrazione, ossia il numero di palline bianche, cosa posso dire circa la composizione dell’urna?

Nel primo caso il problema è diretto : riguarda la deduzione dall’universale al particolare. Il secondo problema è di tipo statistico e riguarda l’inferenza dal particolare all’ universale

The German Tank problem link

Durante la seconda guerra mondiale le forze alleate avevano bisogno di sapere quanti carri armati potevano schierare i tedeschi (parametro) Le informazioni disponibili erano i numeri seriali dei carri armati tedeschi “catturati” in battaglia (dati campionari)

Campione rappresentativo

I (^) Il risultato dell’inferenza dipende in maniera cruciale da quanto bene il campione rappresenta la popolazione

La CASUALIZZAZIONE è il meccanismo chiave per conseguire una buona rappresentatività : tutte le unità statistiche che fanno parte della popolazione devono avere la stessa probabilità di entrare nel campione cioè il campione deve essere casuale I (^) L’equiprobabilità riduce la probabilità di selezionare campioni con caratteristiche tali da distorcere i risultati

Elezioni presidenziali americane del 1936

Alf London (Repubblicano) vs Roosevelt (Democratico)

La rivista Literary Digest inviò oltre 10 milioni di questionari postali per prevedere il risultato delle elezioni presidenziali.

Elezioni presidenziali americane del 1936

Alf London (Repubblicano) vs Roosevelt (Democratico)

La rivista Literary Digest inviò oltre 10 milioni di questionari postali per prevedere il risultato delle elezioni presidenziali. Sulla base delle due milioni di lettere ricevute si pronosticò una vittoria schiacciante di Alf London con il 55% dei voti contro il 41% di Roosevelt.

Secondo voi chi vinse?

Quale fu il problema delle previsioni fatte dalla rivista Literary

Digest?

Quale fu il problema delle previsioni fatte dalla rivista Literary

Digest?

Il problema del campione è che la mailing list utilizzata fu presa da due registri:

  1. Registro automobilistico
  2. Elenchi telefonici