Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Introduzione alla Statistica: Definizioni e Concetti Fondamentali - Prof. Rivellini, Schemi e mappe concettuali di Statistica

Appunti e definizioni di statistica I

Tipologia: Schemi e mappe concettuali

2015/2016

Caricato il 03/09/2016

Jolandamessori
Jolandamessori 🇮🇹

4

(1)

1 documento

1 / 6

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
DEFINIZIONI DI STATISTICA
Statistica: analisi in termini quantitativi dei fenomeni collettivi, ossia i fenomeni il cui studio
richiede l’osservazione di un insieme di manifestazioni individuali. L’osservazione riguarda
unità di analisi differenti, coinvolte secondo modalità diverse, definite dalla forma della
rilevazione scelta.
Serie ordinata: la successione di modalità osservate di un carattere, rispettando l’ordine di
rilevazione.
Variabile statistica: è una successione ordinata di coppie di valori univocamente associati,
relativi ad un carattere osservato in una popolazione.
Modalità: i diversi modi in cui si presenta il carattere X nel nostro studio. Devono possedere
tre qualità:
Devono essere disgiunte (senza sovrapposizioni)
Devono essere esaustive (ossia coprire tutto il ventaglio delle possibilità)
Devono essere riportate sempre in ordine crescente (quando possibile)
Carattere quantitativo: le modalità sono espresse numericamente
Carattere quantitativo con scala ad intervalli: non esiste uno 0 assoluto, naturale, reale
e non arbitrario. Ha senso considerare la differenza tra le modalità del carattere, ma
non il rapporto tra tali modalità.
Ex. Temperatura misurata in gradi centigradi (lo 0 è deciso arbitrariamente).
Carattere quantitativo con scala di rapporti: esiste uno 0 assoluto e reale. Si può
considerare anche il rapporto tra tali modalità.
Ex. peso, reddito, lunghezza ecc.
Carattere quantitativo discreto: l’insieme delle modalità assumibili può essere messo
in corrispondenza biunivoca con un sottoinsieme dei numeri interi. È frutto di
un’operazione di conteggio. Le modalità assumibili da un carattere discreto sono in un
numero finito o al più un’infinità numerabile.
Carattere quantitativo continuo: l’insieme delle modalità assumibili può essere messo
in corrispondenza biunivoca con un sottoinsieme di numeri reali. È frutto di
un’operazione di misurazione.
Carattere quantitativo trasferibile: se ha senso immaginare che un’unità statistica possa
cedere tutto o parte del carattere posseduto ad un’altra unità statistica. Ex. reddito, numero di
proprietà, di operai ecc.
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Introduzione alla Statistica: Definizioni e Concetti Fondamentali - Prof. Rivellini e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!

DEFINIZIONI DI STATISTICA

Statistica: analisi in termini quantitativi dei fenomeni collettivi, ossia i fenomeni il cui studio richiede l’osservazione di un insieme di manifestazioni individuali. L’osservazione riguarda unità di analisi differenti, coinvolte secondo modalità diverse, definite dalla forma della rilevazione scelta. Serie ordinata: la successione di modalità osservate di un carattere, rispettando l’ordine di rilevazione.

Variabile statistica: è una successione ordinata di coppie di valori univocamente associati, relativi ad un carattere osservato in una popolazione.

Modalità: i diversi modi in cui si presenta il carattere X nel nostro studio. Devono possedere tre qualità:

  • Devono essere disgiunte (senza sovrapposizioni)
  • Devono essere esaustive (ossia coprire tutto il ventaglio delle possibilità)
  • Devono essere riportate sempre in ordine crescente (quando possibile)

Carattere quantitativo: le modalità sono espresse numericamente

  • Carattere quantitativo con scala ad intervalli: non esiste uno 0 assoluto, naturale, reale e non arbitrario. Ha senso considerare la differenza tra le modalità del carattere, ma non il rapporto tra tali modalità.

Ex. Temperatura misurata in gradi centigradi (lo 0 è deciso arbitrariamente).

  • Carattere quantitativo con scala di rapporti: esiste uno 0 assoluto e reale. Si può considerare anche il rapporto tra tali modalità.

Ex. peso, reddito, lunghezza ecc.

  • Carattere quantitativo discreto: l’insieme delle modalità assumibili può essere messo in corrispondenza biunivoca con un sottoinsieme dei numeri interi. È frutto di un’operazione di conteggio. Le modalità assumibili da un carattere discreto sono in un numero finito o al più un’infinità numerabile.
  • Carattere quantitativo continuo: l’insieme delle modalità assumibili può essere messo in corrispondenza biunivoca con un sottoinsieme di numeri reali. È frutto di un’operazione di misurazione.

Carattere quantitativo trasferibile: se ha senso immaginare che un’unità statistica possa cedere tutto o parte del carattere posseduto ad un’altra unità statistica. Ex. reddito, numero di proprietà, di operai ecc.

Suddivisione in classi di un carattere quantitativo: l’operazione consistente nel suddividere l’insieme dei possibili valori in intervalli tra loro disgiunti. Carattere qualitativo: le modalità non sono espresse da numeri ma da parole.

  • Carattere sconnesso: se, date due modalità, è possibile affermare soltanto se queste sono uguali o diverse. È misurabile con una scala nominale.
  • Carattere ordinato: se, date due modalità, è possibile anche dargli un ordine, specificando che una precede l’altra. È misurabile con una scala ordinale.

Variabili: si suddividono in

  • Variabili qualitative nominali
  • Variabili qualitative ordinali
  • Variabili quantitative discrete
  • Variabili quantitative per classi

Variabile dicotomica: una variabile che presenta due sole modalità. Ex. sesso (M-F).

Numerosità o frequenze assolute specifiche n(i): sono il risultato di un conteggio. La loro somma è sempre pari alla numerosità totale N.

Frequenze relative specifiche f(i): i rapporti tra le frequenze assolute specifiche n(i) e la numerosità totale N. La somma di tutte le frequenze relative deve fare sempre 1.

Frequenze cumulate: si dice frequenza cumulata (F) associata alla modalità x(i) la frequenza di osservare modalità di x inferiori o al più uguali ad x(i).

I DIAGRAMMI

Diagramma a barre

  • Si costruisce per le variabili nominali (anche diagramma a torta, a nastri..)
  • La lunghezza delle barre deve essere proporzionale a n(i) o f(i)
  • È del tutto arbitraria la scelta sia dell’ordine tra le modalità sia la distanza tra le barre.

Diagramma a barre

  • Si costruisce per le variabili ordinali
  • La lunghezza delle barre deve essere proporzionale a n(i) o f(i)
  • L’ordine tra le modalità è obbligatorio
  1. Media in senso stretto: di v.s. quantitativa X è una qualsiasi funzione reale M=φ (x1, x2, ….; n1, n2…) che soddisfi tre proprietà:
  • Internatilità: la media deve essere compresa tra il minimo e il massimo valore assunto dalla variabile.
  • Monotonicità: date due v.s. X e Y, con osservazioni identiche salvo (almeno) una per la quale y(i )> x(i), la media di Y non può essere più piccola della media di X.
  • Moltiplicatività: (o invarianza rispetto all’unità di misura); se C è una costante reale e ogni modalità x(i) è moltiplicata per C, anche la media è moltiplicata per C.

Medie analitiche: sono medie in senso stretto e possono essere calcolate solo per v.s. quantitative; quindi coinvolgono in un’unica funzione φ di sintesi matematica tutti i termini della distribuzione, x(i) e n(i).

La più comune è la media aritmetica ponderata.

Medie lasche (o medie in senso lato): sono medie che non coinvolgono nel calcolo tutti i termini della distribuzione. Alcune medie lasche possono essere calcolate anche per variabili qualitative. In compenso possono non godere delle proprietà di monotonicità. Medie lasche sono la moda e la mediana.

Moda: corrisponde alla modalità più osservata; misurabile per qualunque v.s.

Mediana (modalità di mezzo): corrisponde alla modalità di mezzo; misurabile per le v.s. almeno ordinabili (qualitative ordinali e quantitative).

Media aritmetica: corrisponde alla modalità che, sostituita alle x(i), lascia immutata una misura di sintesi. È misurabile solamente per le variabili quantitative.

Media obbiettivo (o secondo Chisini): rispetto ad una data funzione obbiettivo, è quel valore numerico che, sostituito a ogni modalità osservata, lascia inalterata la funzione obbiettivo stessa.

Una media analitica richiede:

  • La possibilità di maneggiare algebricamente le modalità individuali osservate
  • Una scelta ragionata della misura di sintesi

Moda Per le variabili qualitative la moda è la modalità con la massima frequenza (relativa).

Per le variabili discrete la moda è il valore più frequentemente osservato.

Per le variabili per classi la moda è la semisomma della classe ((val. min + val. max)/2) con massima densità di frequenza h(i). In questo caso si distingue una classe modale e un valore modale.

Proprietà:

  • Un fenomeno può avere più di una moda, può essere bimodale, trimodale, amodale (tutte le modalità con uguale frequenza).
  • La moda è data a ogni livello di misurazione ma non soddisfa la proprietà di monotonicità.
  • Il limite grande è che la moda non coinvolge nel conto tutte le modalità.

Media aritmetica ponderata

La funzione obbiettivo più diffusa è l’intensità totale del carattere studiato, cioè la somma delle modalità osservate nelle N unità della popolazione.

L’intensità totale ripartita tra le N unità è la media aritmetica.

Media aritmetica ponderata: le modalità sono ponderate con le rispettive frequenze. m(x) = 0 1A 9x(i) · n(i) = 0 1A 9x(i) · f(i)

La media aritmetica possiede le proprietà di base delle medie analitiche: internalità, invarianza alle trasformazioni e monotonicità.

Ma essa possiede altre due proprietà importanti:

  • Baricentricità: la media aritmetica è il baricentro della distribuzione. 0 1A 9 (x(i)-m(x)) · f(i) = 0

La somma degli scarti semplici delle modalità osservate dalla media aritmetica, ponderati per le rispettive frequenze è zero.

  • (^) Minimizzazione del danno: la media aritmetica rende minima una funzione di errore o di perdita di informazioni.

Funzione di perdita: serve a misurare la perdita di informazioni data una v.s e un indice di posizione.

Danno: data una funzione di perdita, definiamo danno la media aritmetica della perdita. Scegliamo la media che minimizza il danno.