Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Inferenza Statistica: Introduzione e Concetti Fondamentali, Appunti di Matematica

Appunti sull'inferenza statistica

Tipologia: Appunti

2020/2021

Caricato il 28/01/2021

annauni33
annauni33 🇮🇹

5

(2)

5 documenti

1 / 3

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
INFERENZA STATISTICA - ARIANNA TESAURO
L’inferenza statistica o statistica inferenziale è una disciplina che utilizza i dati ottenuti da un
campione per poi generalizzare i risultati all’intera popolazione da cui il campione è stato tratto.
È possibile fare ciò grazie allo studio di parametri di una popolazione.
L’inferenza statistica è diversa da quella descrittiva in quanto quest’ultima prende in
considerazione tutta la popolazione senza tener conto di un campione.
I parametri vengono definiti come indici che caratterizzano la popolazione in modo sintetico.
La popolazione statistica (P) è un insieme generico finito o infinito, oggetto di studio formato da
tutte le unità statistiche. Un esempio di popolazione può essere l’insieme di persone aventi diritto
di voto in Italia.
Il campione è un sottoinsieme rappresentativo della popolazione formato da una parte delle unità
statistiche.
L’obbiettivo principale dell’inferenza statistica è di estendere i risultati ottenuti tramite calcoli
esatti dei campioni alla popolazione.
Bisogna tener conto di un margine d’errore dato che il campionamento viene effettuato con criteri
casuali. Per rendere minimo l’errore è necessario effettuare una buona inferenza statistica e di
conseguenza il campione deve essere al quanto più rappresentativo alla popolazione perché poi i
risultati devono essere riportati ad essa. Il concetto di rappresentatività significa che il campione
deve essere un’immagine in scala ridotta della popolazione di provenienza; per esempio se nella
popolazione di riferimento il 40% delle unità statistiche è di sesso maschile e il 60% rappresenta il
senno femminile, il campione dovrà avere la stessa proporzione.
I diversi vantaggi dell’inferenza statistica sono:
-è meno costosa rispetto alla statistica descrittiva
- è più facile
- impiega meno tempo nell’ottenere risultati.
Invece gli svantaggi:
-è imprecisa in quanto il campione potrebbe non rappresentare la popolazione al 100%
- può presentare errori (margine d’errore).
Il parametro come detto prima è un elemento caratterizzante della popolazione e per questo deve
essere stimato in modo da potersi riferire all’intera popolazione; quindi possiamo definire il
termine stima come un’approssimazione statistica del risultato dell’indagine campionaria riferita
all’intera popolazione.
I parametri più importanti sono:
-Media campionaria = è la media dei campioni che si possono costituire sulla popolazione.
Si calcola dividendo la somma dei valori osservati per il numero totale di osservazioni.
-Varianza campionaria = è il valore medio del quadrato degli scarti.
-Scarto quadratico medio = è la radice quadrata della varianza.
-Moda campionaria = rappresenta il valore più frequente in un insieme di dati.
-Mediana campionaria = è il valore centrale in un insieme di dati ordinati dal valore più
piccolo al più grande.
pf3

Anteprima parziale del testo

Scarica Inferenza Statistica: Introduzione e Concetti Fondamentali e più Appunti in PDF di Matematica solo su Docsity!

INFERENZA STATISTICA - ARIANNA TESAURO

L’ inferenza statistica o statistica inferenziale è una disciplina che utilizza i dati ottenuti da un campione per poi generalizzare i risultati all’intera popolazione da cui il campione è stato tratto. È possibile fare ciò grazie allo studio di parametri di una popolazione. L’inferenza statistica è diversa da quella descrittiva in quanto quest’ultima prende in considerazione tutta la popolazione senza tener conto di un campione. I parametri vengono definiti come indici che caratterizzano la popolazione in modo sintetico. La popolazione statistica (P) è un insieme generico finito o infinito, oggetto di studio formato da tutte le unità statistiche. Un esempio di popolazione può essere l’insieme di persone aventi diritto di voto in Italia. Il campione è un sottoinsieme rappresentativo della popolazione formato da una parte delle unità statistiche. L’ obbiettivo principale dell’inferenza statistica è di estendere i risultati ottenuti tramite calcoli esatti dei campioni alla popolazione. Bisogna tener conto di un margine d’errore dato che il campionamento viene effettuato con criteri casuali. Per rendere minimo l’errore è necessario effettuare una buona inferenza statistica e di conseguenza il campione deve essere al quanto più rappresentativo alla popolazione perché poi i risultati devono essere riportati ad essa. Il concetto di rappresentatività significa che il campione deve essere un’immagine in scala ridotta della popolazione di provenienza; per esempio se nella popolazione di riferimento il 40% delle unità statistiche è di sesso maschile e il 60% rappresenta il senno femminile, il campione dovrà avere la stessa proporzione. I diversi vantaggi dell’inferenza statistica sono:

  • è meno costosa rispetto alla statistica descrittiva
  • è più facile
  • impiega meno tempo nell’ottenere risultati. Invece gli svantaggi :
  • è imprecisa in quanto il campione potrebbe non rappresentare la popolazione al 100%
  • può presentare errori (margine d’errore). Il parametro come detto prima è un elemento caratterizzante della popolazione e per questo deve essere stimato in modo da potersi riferire all’intera popolazione; quindi possiamo definire il termine stima come un’approssimazione statistica del risultato dell’indagine campionaria riferita all’intera popolazione. I parametri più importanti sono: - Media campionaria = è la media dei campioni che si possono costituire sulla popolazione. Si calcola dividendo la somma dei valori osservati per il numero totale di osservazioni. - Varianza campionaria = è il valore medio del quadrato degli scarti. - Scarto quadratico medio = è la radice quadrata della varianza. - Moda campionaria = rappresenta il valore più frequente in un insieme di dati. - Mediana campionaria = è il valore centrale in un insieme di dati ordinati dal valore più piccolo al più grande.

Il parametro viene stimato grazie all’utilizzo di strumenti detti stimatori. Lo stimatore è una funzione cioè l’insieme di tutte le variabili casuali che si possono estrarre da una popolazione. Uno stimatore efficace deve essere:

- Corretto = se il suo valore medio è uguale al valore del parametro da stimare nella popolazione. - Efficiente = Uno stimatore si dice efficiente se la sua varianza, a parità di altre condizioni, è minore della varianza ottenibile con altri stimatori - Consistente = se al crescere di n i valori stimati tendono, con probabilità tendente ad 1, al valore del parametro della popolazione Il processo dell’inferenza statistica è costituito da diverse fasi: definizione del problema, individuazione di un modello teorico, estrazione del campione, raccolta e analisi dei dati, generalizzazione. Il primo passo da fare per intraprendere una indagine campionaria è decidere quanto il campione deve essere ampio quindi da quante unità statistiche esso deve essere formato. In seguito dobbiamo estrarre le unità campionarie dalla popolazione attraverso una tecnica di campionamento che vogliamo utilizzare per formare il nostro campione. Le due principali tecniche di campionamento sono:

  • Campionamento causale : si effettua quando la popolazione di riferimento è: - Nota - Finita (composta da un numero finito di unità come per esempio tutti gli studenti della nostra scuola. Al contrario un esempio di popolazione infinita potrebbe essere l’insieme delle stelle e quindi la numerosità non è numerabile.) - Identificabile (si ha a disposizione una lista di tutte le unità che possono essere oggetto da studio e che sono contraddistinte da un codice univoco) Tra i campionamenti casuali quelli più diffusi sono: - Estrazione del campione casuale semplice = tutti le unità della popolazione di riferimento hanno la stessa possibilità di essere selezionati. - Stratificato = si hanno più informazioni sulla popolazione in base alle quali viene suddivisa in strati, come per esempio la stratificazione per sesso. All’interno di ogni strato avviene il campionamento casuale semplice. - A grappoli = le unità sono suddivise in maniera naturale in gruppi per cui vengono campionati i grappoli e non le unità.
  • Campionamento non probabilistico : non fornisce a tutte le unità della popolazione la stessa possibilità di essere scelte a far parte del campione e quindi alcune unità hanno più possibilità di altre. Questo perché la selezione del campione avviene in base criteri di praticità, di costo, o per la presenza di volontari.