Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Dispensa statistica applicata primo modulo, Dispense di Statistica Applicata

Dispensa statistica applicata primo modulo

Tipologia: Dispense

2025/2026

Caricato il 23/04/2026

federicotomasoni
federicotomasoni 🇮🇹

4 documenti

1 / 67

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA APPLICATA
Parziale: 27/10
STATISTICA DESCRITTIVA sintesi delle osservazioni campionarie o dei dati
della popolazione
STATISTICA INFERENZIALE dal campione alla popolazione
STATISTICA DESCRITTIVA
Descrive fenomeni osservati su un insieme di unità (popolazione di
riferimento) e che costituisce la parte dell’universo che ci interessa.
Gli elementi di questo insieme, che di volta in volta nei problemi concreti
possono essere persone, cose, animali, immagini raccolte da un satellite
vengono chiamate unità statistiche.
Attraverso l’analisi (indici e grafici) delle rilevazioni delle caratteristiche delle
unità statistiche si descrive la popolazione di riferimento.
ESEMPIO statistica descrittiva e inferenziale
Fino al 2011 l’ISTAT realizzava il Censimento generale della popolazione ogni
dieci anni e aveva carattere universale, coinvolgeva cioè tutte le famiglie sul
territorio nazionale.
A partire dal 2018 questa modalità è stata sostituita dal Censimento
permanente realizzato attraverso una rilevazione a cadenza annuale su un
campione di famiglie. Questa novità, resa possibile grazie a innovative tecniche
statistiche e organizzative, non sminuisce la qualità e la quantità dei dati
raccolti.
Una volta effettuato, i risultati delle elaborazioni sono disponibili e fruibili dal
sito dell’ISTAT.
Dalla statistica descrittiva all’inferenza
Non sempre si hanno a disposizione i dati su tutto l’universo che vogliamo
descrivere. Per diverse ragioni:
1. Tempi e costi
2. Popolazione di interesse infinita o virtuale
3. La rilevazione distrugge le unità statistiche
4. Precisione dei risultati
Causa 1: tempi e costi
Il censimento si fa ogni 10anni quindi dovrei aspettare troppo tempo per vare le
informazioni; inoltre i costi sarebbero troppo elevati
Causa 2: Popolazione infinita o virtuale
Nello studio di un nuovo farmaco si deve verificare la sua tossicità rispetto alla
gravità della malattia che vuole curare e rispetto alla tossicità di altri farmaci in
commercio.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43

Anteprima parziale del testo

Scarica Dispensa statistica applicata primo modulo e più Dispense in PDF di Statistica Applicata solo su Docsity!

STATISTICA APPLICATA

Parziale: 27/ STATISTICA DESCRITTIVA  sintesi delle osservazioni campionarie o dei dati della popolazione STATISTICA INFERENZIALE  dal campione alla popolazione STATISTICA DESCRITTIVA Descrive fenomeni osservati su un insieme di unità ( popolazione di riferimento ) e che costituisce la parte dell’universo che ci interessa. Gli elementi di questo insieme, che di volta in volta nei problemi concreti possono essere persone, cose, animali, immagini raccolte da un satellite vengono chiamate unità statistiche. Attraverso l’analisi (indici e grafici) delle rilevazioni delle caratteristiche delle unità statistiche si descrive la popolazione di riferimento. ESEMPIO statistica descrittiva e inferenziale Fino al 2011 l’ISTAT realizzava il Censimento generale della popolazione ogni dieci anni e aveva carattere universale, coinvolgeva cioè tutte le famiglie sul territorio nazionale. A partire dal 2018 questa modalità è stata sostituita dal Censimento permanente realizzato attraverso una rilevazione a cadenza annuale su un campione di famiglie. Questa novità, resa possibile grazie a innovative tecniche statistiche e organizzative, non sminuisce la qualità e la quantità dei dati raccolti. Una volta effettuato, i risultati delle elaborazioni sono disponibili e fruibili dal sito dell’ISTAT. Dalla statistica descrittiva all’inferenza Non sempre si hanno a disposizione i dati su tutto l’universo che vogliamo descrivere. Per diverse ragioni:

  1. Tempi e costi
  2. Popolazione di interesse infinita o virtuale
  3. La rilevazione distrugge le unità statistiche
  4. Precisione dei risultati Causa 1: tempi e costi Il censimento si fa ogni 10anni quindi dovrei aspettare troppo tempo per vare le informazioni; inoltre i costi sarebbero troppo elevati Causa 2: Popolazione infinita o virtuale Nello studio di un nuovo farmaco si deve verificare la sua tossicità rispetto alla gravità della malattia che vuole curare e rispetto alla tossicità di altri farmaci in commercio.

La popolazione di interesse sarebbe l’insieme di tutti i pazienti a cui potremmo voler somministrare il farmaco da oggi fino alla fine del mondo. Si tratta di una popolazione teoricamente infinita e solamente virtuale. Causa 3: La rilevazione distrugge le unità statistiche Quando per effettuare una rilevazione completa (censimento) distruggiamo la popolazione di riferimento che non esisterebbe più. ESEMPI:

  • Misura del grado di friabilità dei biscotti (devo rompere e mangiare il biscotto)
  • Verifica del quantitativo di una certa sostanza all’interno di una pastiglia (la pastiglia va triturata e mescolata a solventi) Causa 4: precisione dei risultati Anche se può sembrare strano, si è dimostrato che rilevazioni campionarie più piccole possano portare a risultati più precisi di quelle più ampie, in cui, cioè, si intervistano più soggetti, realizzate non rispettando determinati criteri. Un esempio storico: ANNI 20 AMERICA

nella stima del parametro di interesse. Si deve però disporre di una lista delle unità della popolazione. Non si possono usare elementi della statistica descrittiva, esistono degli strumenti appositi che consentono di fare inferenza e cioè di generalizzare i risultati rilevati attraverso l’indagine campionaria a tutta la popolazione. Gli strumenti della statistica inferenziale si possono usare e sono validi solo se il campione è CASUALE. È attraverso questi strumenti che è possibile quantificare l’errore che si compie nella stima del parametro di interesse. In generale il campione può essere: ATTENZIONE: SOLO per i campionamenti di tipo casuale (o probabilistico) è possibile calcolare la precisione della stima e fare inferenza sulla popolazione. Tra i piani di campionamento non casuale il più noto per la sua frequenza di impiego, è CAMPIONAMENTO PER QUOTE (usato per i sondaggi) : La popolazione oggetto di analisi è suddivisa in gruppi sulla base di alcune variabili come l’età, il sesso, la professione o il reddito, etc. Fonti ufficiali (es. censimento) indicano i pesi percentuali di ogni gruppo. Sulla base di queste percentuali si definiscono le QUOTE, cioè il numero di interviste che dovranno essere effettuate in ciascun gruppo dall’intervistatore, che però può scegliere le unità da intervistare in modo assolutamente arbitrario (quindi è esclusa la casualità), purchè soddisfino le caratteristiche del gruppo.

Il campionamento CASUALE può essere effettuato: 1.CAMPIONAMENTO CASUALE SEMPLICE (noto come campionamento con reimmissione o con ripetizione) Lo schema di riferimento è quella dell’urna che contiene un numero N di palline numerate: si estrae a caso una pallina dall’urna, se ne osserva il numero e poi si reimmette nell’urna. Si ripete l’operazione per n volte

  • Lo stesso numero può essere estratto più di una volta
  • Ciascuna delle unità ha una medesima probabilità pari ad 1/N di essere estratta ad ogni estrazione
  • Per le sue proprietà statistiche (indipendenza) è lo schema utilizzato per il campionamento da variabili casuali 2. CAMPIONAMENTO IN BLOCCO (noto come campionamento senza reimmissione o senza ripetizione)

4.CAMPIONAMENTO STRATIFICATO

5.CAMPIONAMENTO A GRAPPOLI

E’ come il campionamento a due stadi, in cui viene a mancare l’estrazione di secondo stadio. Il piano di campionamento consiste nella estrazione casuale di h dei k gruppi (grappoli) in cui è suddivisa la popolazione; si procede quindi alla disamina di tutte le unità contenute nei grappoli estratti. Il valore di n non può essere prefissato. Adatto alle situazioni in cui la variabile di interesse presenta caratteristiche molto differenti all’interno di ogni gruppo, ma vi è omogeneità tra un gruppo e l’altro. 6.CAMPIONAMENTO SISTEMATICO Data una popolazione le cui N unità statistiche sono numerate da 1 a N, e posto N/n=k (passo di campionamento); ordiniamola lista secondo una certa caratteristica da cui selezioniamo un elemento ogni k, dopo aver estratto il 1^elemento casualmente tra i primi k

Per definire P(A) abbiamo bisogno di:

  1. Proprietà o assiomi
  2. Regola per assegnare la probabilità degli eventi elementari 1. Assiomi del calcolo delle probabilità Dagli assiomi derivano le regole per calcolare la probabilità degli eventi composti: **1. Probabilità dell’unione 2.Probabilità della differenza 3.Probabilità del complementare 4.Probabilità dell’evento impossibile
  3. Regola per l’assegnazione della probabilità** Gli assiomi del calcolo della probabilità ci dicono quali sono le proprietà che una funzione deve verificare per potere essere definita “probabilità” ma non ci dicono come fare a calcolare la probabilità di un generico evento A.

Ci è di aiuto al riguardo l’assioma 3) del calcolo della probabilità il quale stabilisce che la probabilità dell’unione di eventi disgiunti è pari alla somma delle loro probabilità. Si osservi che gli eventi elementari, per definizione, sono eventi disgiunti e che un evento generico può essere visto come l’unione di eventi elementari. Se quindi riusciamo a definire la probabilità di un evento elementare, utilizzando il terzo assioma (da qui la sua importanza), possiamo definire la probabilità di un evento generico A. Uno dei modi più naturali e semplici per definire la probabilità di un evento elementare è quella che fa riferimento al caso in cui lo spazio campionario ha dimensione finita a ciascun evento ha la medesima probabilità di verificarsi. Esempio

Osservazione Per estrarre più oggetti:

  • Estrazione CON REIMMISSIONE (con reinserimento)  gli eventi sono indipendenti e ad ogni estrazione si ha la stessa situazione iniziale
  • Estrazione SENZA REIMMISSIONE (senza reinserimento)  gli eventi dipendono ogni volta dall’estrazione precedente VARIABILI CASUALI Una variabile casuale (v.c.) X è una funzione che associa ad ogni evento elementare dello spazio campionario uno ed un solo numero reale Tipologia v.c:
  • Discrete  il supporto contiene un numero finito o numerabile di valori
  • Continue  il supporto contiene infiniti valori (ad es. intervallo di valori reali)

Funzione di densità  funzione tramite cui si definisce la probabilità di un generico evento (probabilità = area sottesa alla f.d.) Funzione di ripartizione  funzione reale tramite cui si possono trovare le probabilità dei vari intervalli, strumento unico per caso discreto continuo

Tutte le prove che producono due soli risultati generano una v.c. di Bernoulli: lancio di una moneta, sesso di un nascituro, superamento o meno di un test, etc. Distribuzione Binomiale

Distribuzione normale

Proprietà analitiche della funzione di densità Normale Osservazioni