Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Riassunti statistica, Appunti di Statistica

Riassunti sintetico statistica

Tipologia: Appunti

2025/2026

Caricato il 25/02/2026

ernesto-ricci
ernesto-ricci 🇮🇹

13 documenti

1 / 9

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1. Introduzione alla statistica
La statistica è la disciplina che studia i fenomeni collettivi mediante strumenti quantitativi. Il suo
scopo principale è comprendere realtà complesse analizzando dati raccolti in modo sistematico. La
statistica è indispensabile ogni volta che dobbiamo prendere decisioni in condizioni di incertezza,
perché permette di trarre conclusioni ragionate a partire da osservazioni parziali o incomplete.
La disciplina può essere suddivisa in tre aree principali:
1. Fase di progettazione dell’indagine, che riguarda la raccolta dei dati e la scelta del metodo
di rilevazione.
2. Statistica descrittiva, che sintetizza e rappresenta i dati attraverso tabelle, grafici e misure
numeriche.
3. Statistica inferenziale, che utilizza l’informazione campionaria per trarre conclusioni
sull’intera popolazione.
La qualità di ogni analisi dipende fortemente da come i dati sono stati raccolti. Una cattiva
rilevazione non può essere “corretta” nelle fasi successive: per questo la progettazione dell’indagine
costituisce una parte fondamentale del lavoro statistico.
2. Popolazioni, campioni e caratteri statistici
La statistica si occupa di fenomeni collettivi, ossia fenomeni che richiedono l’osservazione di molte
unità.
Le definizioni principali sono:
Unità statistica: l’elemento su cui si osserva il fenomeno.
Popolazione (o collettivo): l’insieme di tutte le unità statistiche oggetto di studio.
Campione: sottoinsieme della popolazione selezionato per l’osservazione.
Carattere statistico: proprietà misurata sulle unità.
Modalità del carattere: valori assunti dal carattere.
Parametro: valore numerico che descrive la popolazione (tipicamente ignoto).
Statistica campionaria: valore calcolato sul campione, utilizzato come stima del parametro.
2.1 Tipi di indagine
Possono essere:
Totale o censuaria: si osserva l’intera popolazione; è esatta ma costosa.
Campionaria: si osserva solo una parte della popolazione; più rapida ed economica.
2.2 Classificazione dei caratteri
I caratteri possono essere:
pf3
pf4
pf5
pf8
pf9

Anteprima parziale del testo

Scarica Riassunti statistica e più Appunti in PDF di Statistica solo su Docsity!

1. Introduzione alla statistica

La statistica è la disciplina che studia i fenomeni collettivi mediante strumenti quantitativi. Il suo scopo principale è comprendere realtà complesse analizzando dati raccolti in modo sistematico. La statistica è indispensabile ogni volta che dobbiamo prendere decisioni in condizioni di incertezza, perché permette di trarre conclusioni ragionate a partire da osservazioni parziali o incomplete. La disciplina può essere suddivisa in tre aree principali:

  1. Fase di progettazione dell’indagine , che riguarda la raccolta dei dati e la scelta del metodo di rilevazione.
  2. Statistica descrittiva , che sintetizza e rappresenta i dati attraverso tabelle, grafici e misure numeriche.
  3. Statistica inferenziale , che utilizza l’informazione campionaria per trarre conclusioni sull’intera popolazione. La qualità di ogni analisi dipende fortemente da come i dati sono stati raccolti. Una cattiva rilevazione non può essere “corretta” nelle fasi successive: per questo la progettazione dell’indagine costituisce una parte fondamentale del lavoro statistico.

2. Popolazioni, campioni e caratteri statistici

La statistica si occupa di fenomeni collettivi, ossia fenomeni che richiedono l’osservazione di molte unità. Le definizioni principali sono:

  • Unità statistica : l’elemento su cui si osserva il fenomeno.
  • Popolazione (o collettivo) : l’insieme di tutte le unità statistiche oggetto di studio.
  • Campione : sottoinsieme della popolazione selezionato per l’osservazione.
  • Carattere statistico : proprietà misurata sulle unità.
  • Modalità del carattere : valori assunti dal carattere.
  • Parametro : valore numerico che descrive la popolazione (tipicamente ignoto).
  • Statistica campionaria : valore calcolato sul campione, utilizzato come stima del parametro.

2.1 Tipi di indagine

Possono essere:

  • Totale o censuaria : si osserva l’intera popolazione; è esatta ma costosa.
  • Campionaria : si osserva solo una parte della popolazione; più rapida ed economica.

2.2 Classificazione dei caratteri

I caratteri possono essere:

Caratteri qualitativi

Non espressi numericamente.

  • Sconnessi (nominali) : non ordinabili (es. colore occhi, genere).
  • Ordinati : esiste un ordine naturale (es. livello di soddisfazione).

Caratteri quantitativi

Esprimono una quantità numerica.

  • Discreti : numeri interi ottenuti da conteggi (es. numero di figli).
  • Continui : valori reali ottenuti da misurazioni (es. peso, altezza). Altre classificazioni:
  • Trasferibili : possono essere “spostati” tra unità (reddito).
  • Non trasferibili : intrinseci all’unità (età, altezza).
  • Scala a intervalli : valori con origine convenzionale (temperatura Celsius).
  • Scala a rapporti : presenza di zero assoluto (altezza, reddito).

2.3 Suddivisione in classi

Utilizzata per caratteri quantitativi continui: si raggruppano i valori in intervalli, che possono essere chiusi a sinistra, a destra o a entrambi i lati.

3. Distribuzioni di frequenza

Una distribuzione di frequenza associa a ciascuna modalità un valore che rappresenta quante volte essa è stata osservata. Le frequenze possono essere:

  • Assolute : numero di osservazioni in una modalità.
  • Relative : frequenza assoluta divisa per il totale.
  • Percentuali : frequenze relative × 100.
  • Cumulate : somma progressiva delle frequenze per modalità ordinabili. La frequenza cumulata è utile per capire come si distribuiscono progressivamente le osservazioni.

4. Medie e indici di posizione

Le medie sono strumenti sintetici che permettono di rappresentare un’intera distribuzione con un singolo valore.

5.2 Coefficiente di variazione

DV/Media. Serve per confrontare variabilità tra distribuzioni con scale diverse.

5.3 Campo di variazione

Differenza tra massimo e minimo.

5.4 Interquartile range (IQR)

Differenza tra Q3 e Q1, misura robusta della variabilità.

6. Indici di forma

Analizzano l’aspetto della distribuzione.

6.1 Asimmetria

Una distribuzione è asimmetrica se non è speculare rispetto al centro. Può essere:

  • Positiva (coda lunga a destra)
  • Negativa (coda lunga a sinistra)
  • Simmetrica (media=mediana)

6.2 Indice di Fisher

Normalizza la misura di asimmetria ed è comparabile tra distribuzioni differenti.

7. La concentrazione

Misura quanto un carattere trasferibile (ad esempio reddito) è distribuito in modo equo o diseguale fra le unità.

7.1 Retta di equidistribuzione e curva di Lorenz

La curva di Lorenz rappresenta la concentrazione: Quanto più è lontana dalla retta di equidistribuzione, tanto maggiore è la disuguaglianza.

7.2 Indice di Gini

Compreso tra:

  • 0 → perfetta equidistribuzione
  • 1 → massima concentrazione

8. Distribuzioni bivariate

Si studiano due caratteri osservati sulle stesse unità statistiche.

8.1 Tabelle a doppia entrata

Raccolgono frequenze congiunte tra modalità X e Y. Le frequenze marginali descrivono i caratteri singolarmente. Le frequenze condizionate descrivono una variabile alla luce di una modalità dell’altra.

8.2 Indipendenza

Due caratteri sono indipendenti se conoscere uno non migliora la conoscenza dell’altro.

8.3 Test Chi-quadro e V di Cramer

Misurano l’intensità dell’associazione.

9. Dipendenza tra caratteri qualitativi e quantitativi

Se un carattere è qualitativo e l’altro quantitativo, si studiano:

  • le medie condizionate
  • la variabilità entro e tra gruppi
  • il rapporto di correlazione η² η² misura quanta parte della variabilità totale è spiegata dalla suddivisione in gruppi.

10. Associazione tra variabili quantitative

La relazione tra due variabili numeriche può essere studiata mediante:

10.1 Scatter plot

Visualizzazione grafica della relazione.

  • certi
  • impossibili
  • incompatibili
  • complementari
  • indipendenti

12.3 Definizioni di probabilità

  • Classica : casi favorevoli / casi possibili
  • Frequentista : limite delle frequenze relative
  • Soggettivista : grado di fiducia
  • Assiomatica : definita mediante assiomi (Kolmogorov)

12.4 Probabilità condizionata

Due eventi sono indipendenti se:

13. Variabili casuali

Una variabile casuale associa un numero a ciascun esito dell’esperimento.

13.1 Variabili discrete

Assumono valori isolati (es. conteggi). Principali modelli: Bernoulliana Due esiti: successo/insuccesso. Binomiale n prove Bernoulliane indipendenti.

13.2 Variabili continue

Distribuzione normale La più importante in statistica:

  • forma campanulare
  • simmetrica
  • media, moda e mediana coincidono
  • regola empirica 68– 95 – 99.

Standardizzazione

14. Statistica campionaria e teorema del limite centrale

Le statistiche campionarie (come la media) sono variabili casuali. Il Teorema del Limite Centrale (TLC) afferma che la distribuzione delle medie campionarie tende alla normale al crescere di n.

15. Stima puntuale

Uno stimatore puntuale associa un unico valore al parametro sconosciuto. Proprietà:

  • Correttezza : valore atteso uguale al parametro
  • Efficienza : varianza minima
  • Consistenza : converge al vero valore quando n→∞

16. Stima per intervallo

L’intervallo di confidenza indica un insieme di valori plausibili del parametro con un determinato livello di fiducia (95%, 99%). La formula generale è: Il margine dipende da:

  • deviazione standard
  • ampiezza campionaria
  • livello di confidenza

17. Verifica delle ipotesi

Serve per decidere se accettare o rifiutare un’affermazione sul valore di un parametro.

  • H0 (ipotesi nulla) : ipotesi da testare.
  • H1 (ipotesi alternativa).
  • Statistica test : valore calcolato dal campione.
  • Regione critica : zona in cui si rifiuta H0.