Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica. Prof: Costanzo e Misuraca, Appunti di Statistica

Gli appunti sono integrati con sbobine della lezione e slide. Comprendono anche gli esercizi che sono spiegati punto per punto. Sono 100 pagine in totale e vi è l'indice totale con tutti gli argomenti da svolgere. Io ho preso 30 all'esame.

Tipologia: Appunti

2023/2024

In vendita dal 17/02/2025

EsamiEconomia30L
EsamiEconomia30L 🇮🇹

5

(1)

18 documenti

1 / 101

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Programma ESAME STATISTICA
1. Collettivo, Unità e Caratteri: i fenomeni collettivi; definizione di collettivo e unità statistica; differenza tra
sottopopolazione e campione; modalità e carattere; tipi di carattere.
2. (02) Distribuzioni statistiche univariate e bivariate: distribuzioni unitarie; distribuzioni di frequenze;
frequenze assolute, relative e percentuali; rappresentazioni grafiche; distribuzioni in classi; densità di
frequenza; istogramma; frequenze cumulate assolute, relative e percentuali; poligono delle frequenze;
tabelle di contingenza; diagramma di dispersione; frequenze congiunte e marginali; distribuzioni
condizionate.
3. (03) Indici di centralità: media aritmetica; proprietà delle medie aritmetiche; media geometrica; media
ponderata; moda; mediana, primo e terzo quartile; percentili; medie condizionate.
4. (04) Indici di variabilità e forma della distribuzione: variabilità; proprietà degli indici di variabilità; campo
di variazione e differenza interquartile; scostamenti semplici; scostamenti quadratici; scarto quadratico
medio; coefficiente di variazione; varianze condizionate; intervalli di variabilità e sintesi a cinque; box plot.
5. (05) La concentrazione: caratteri trasferibili; indici di concentrazione e loro interpretazione; curva di
Lorenz; metodo dei trapezi (approccio grafico).
6. (06) Indipendenza in Distribuzione e in Media: concetto di indipendenza/dipendenza; connessione,
indice chiquadro e intensità della relazione; dipendenza in media, rapporto di correlazione; relazione tra
indipendenza in distribuzione e in media; concordanza tra variabili; indice di correlazione, regressione
lineare.
7. Eventi e Probabilità: definizione di esperimento causale; eventi semplici e composti; leggi di De Morgan;
concetto di probabilità; teoria assiomatica di Kolmogorov; teoremi fondamentali sulle probabilità.
8. Probabilità Condizionate, Indipendenza, Teorema di Bayes: definizione di eventi e probabilità
condizionate; teoremi fondamentali sulle probabilità condizionate; estrazioni senza e con reimmissione;
indipendenza stocastica; formula di Bayes e sue applicazioni.
9. Variabili Casuali Discrete e Continue: definizione di variabile casuale; funzione di probabilità, funzione di
ripartizione; valore atteso e varianza.
10. Modelli Probabilistici Discreti e Continui: distribuzione Bernoulliana, Binomiale, Poissoniana;
distribuzione Normale, Normale standardizzata; approssimazioni alla Normale.
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Anteprima parziale del testo

Scarica Statistica. Prof: Costanzo e Misuraca e più Appunti in PDF di Statistica solo su Docsity!

Programma ESAME STATISTICA

1. Collettivo, Unità e Caratteri: i fenomeni collettivi; definizione di collettivo e unità statistica; differenza tra

sottopopolazione e campione; modalità e carattere; tipi di carattere.

2. ( 02) Distribuzioni statistiche univariate e bivariate: distribuzioni unitarie; distribuzioni di frequenze;

frequenze assolute, relative e percentuali; rappresentazioni grafiche; distribuzioni in classi; densità di

frequenza; istogramma; frequenze cumulate assolute, relative e percentuali; poligono delle frequenze;

tabelle di contingenza; diagramma di dispersione; frequenze congiunte e marginali; distribuzioni

condizionate.

3. (03) Indici di centralità : media aritmetica; proprietà delle medie aritmetiche; media geometrica; media

ponderata; moda; mediana, primo e terzo quartile; percentili; medie condizionate.

4. ( 04) Indici di variabilità e forma della distribuzione: variabilità; proprietà degli indici di variabilità; campo

di variazione e differenza interquartile; scostamenti semplici; scostamenti quadratici; scarto quadratico

medio; coefficiente di variazione; varianze condizionate; intervalli di variabilità e sintesi a cinque; box plot.

5. ( 05) La concentrazione: caratteri trasferibili; indici di concentrazione e loro interpretazione; curva di

Lorenz; metodo dei trapezi (approccio grafico).

6. (06) Indipendenza in Distribuzione e in Media: concetto di indipendenza/dipendenza; connessione,

indice chiquadro e intensità della relazione; dipendenza in media, rapporto di correlazione; relazione tra

indipendenza in distribuzione e in media; concordanza tra variabili; indice di correlazione, regressione

lineare.

7. Eventi e Probabilità: definizione di esperimento causale; eventi semplici e composti; leggi di De Morgan;

concetto di probabilità; teoria assiomatica di Kolmogorov; teoremi fondamentali sulle probabilità.

8. Probabilità Condizionate, Indipendenza, Teorema di Bayes: definizione di eventi e probabilità

condizionate; teoremi fondamentali sulle probabilità condizionate; estrazioni senza e con reimmissione;

indipendenza stocastica; formula di Bayes e sue applicazioni.

9. Variabili Casuali Discrete e Continue: definizione di variabile casuale; funzione di probabilità, funzione di

ripartizione; valore atteso e varianza.

10. Modelli Probabilistici Discreti e Continui: distribuzione Bernoulliana, Binomiale, Poissoniana;

distribuzione Normale, Normale standardizzata; approssimazioni alla Normale.

1° capitolo: Collettivo, Unità e Caratteri

La statistica è un insieme di tecniche che ci permettono di conoscere quantitamente un fenomeno. L’approccio statistico nasce dalla constatazione che la mente umana riesce a percepire singolarmente le unità coinvolte in un determinato aspetto (fenomeni), ma non riesce a percerperli totalmente

Operazioni tipiche delle analisi statistiche sono:

  1. il conteggio (es quante famiglie hanno più di 5 componenti)
  2. la classificazione (suddivisione della forza lavoro per qualifica)
  3. la misurazione sulle unità che crea il dato
  4. la sintesi , tramite modelli esplicativi, dei fenomeni reali

La statistica descrittiva è l'insieme dei metodi utilizzati per rilevare, sintetizzare e interpretare i dati espressione di un certo

fenomeno d'interesse in un insieme di entità

● fenomeno collettivi

1. Fenomeni PROPRIAMENTE DETTI -> si riferiscono ad una collettività di casi singoli ( il fenomeno del consumo

è collettivo in quanto la sua conoscenza avviene tramite l'osservazione di un collettivo, quello dei consumatori)

2. Fenomeni originati dalla ripetizione dell'osservazione di un unico fenomeno (i prezzi di un certo prodotto

rilevati in un certo arco temporale)

● unità statistica = unità elementare coinvolta nello studio di un fenomeno (individui, famiglie, entità amministrativa)

● Popolazione/collettivo statistico= insieme delle unità statistiche coinvolte nello studio del fenomeno interessato, che hanno

almeno una caratteristica in comune.

  • La sotto-popolazione : gruppi di unità omogenei rispetto a un determinato criterio

(Es: gli italiani di sesso maschile e gli italiani di sesso femminile sono due sottopopolazioni del collettivo formato da tutti i cittadini italiani)

In statistica, i termini "carattere" e "modalità" sono utilizzati per descrivere le caratteristiche delle unità di un collettivo

● Carattere: è la proprietà o caratteristica che viene osservata o misurata sulle unità statistiche di un collettivo. Ad

esempio, il carattere può essere l'età, il sesso, il reddito, l'altezza, il colore degli occhi , ecc.

● Modalità: sono i possibili valori o categorie che un carattere può assumere. Le modalità variano in base alla

natura del carattere. Tali modalità devono essere esaustive e non sovrapposte Ad esempio, per il carattere "sesso," le modalità sono "maschio" e "femmina" ; per il carattere "colore degli occhi," le modalità possono essere " blu," "verde," " marrone

Tipi di Caratteri

● Caratteri qualitativi: le modalità sono espresse da attributi

  • sconnesso : non ammettono alcun ordine logico(sesso)
  • ordinabile : ordinare le unità statistiche in modo crescente (titolo di studio) Può essere attuata LA MEDIANA

● caratteri quantitativi : le modalità sono espresse numericamente (es : componenti, peso , statura)

  • discreti: numeri interi (componenti familiari, età) Sono enumerabili
  • continui : numeri non interi, reali. (statura: 1,55, peso)

VARIAZIONE ASSOLUTA E RELATIVA

La variazione assoluta e la variazione relativa sono due misure utilizzate in statistica per descrivere il cambiamento di un fenomeno tra due momenti nel tempo o tra due gruppi diversi.

  • La variazione assoluta Ci dice come fenomeno Si è modificato in termini assoluti tra due momenti diversi. È espressa nella stessa unità di misura di quanto osservato. Si calcola come la differenza tra il valore finale e il valore iniziale di una quantità:

Variazione assoluta= Vfinale−Vinizialeù

  • Variazione relativa: esprime il cambiamento di un fenomeno in termini percentuali rispetto al valore iniziale, fornendo un'indicazione della grandezza del cambiamento in rapporto al valore di partenza.

Variazione relativa (%)=(VinizialeVfinale−Viniziale)× 100

I tassi di variazione : percentuale che indica la velocità di cambiamento del fenomeno (VAR RELATIVA-1)X

Individuare negli esempi riportati di seguito il collettivo, le unità statistiche, il carattere oggetto di studio e la sua natura, quali potrebbero essere le modalità del carattere:

1) Gli studenti iscritti al primo anno delle diverse facoltà dell'UNICAL Il collettivo sono tutte le diverse facoltà , ognuna di esse è un’ unita statistica. il carattere oggetto di studio sono gli studenti iscritti al primo anno ed é una variabile quantitativa discreta; le modalita sono date dal conteggio degli studenti

2) I premi pagati dagli assicurati di una certa Compagnia Il collettivo sono gli assicurati, il carattere osservato è l’ammontare del premio assicurativo, esso è una variabile quantitativa continua, le modalità sono date da tutti i possibili premi pagati

3) Il titolo di studio conseguito dagli impiegati di un certo stabilimento Il collettivo sono gli impiegati di un certo stabilimento, il carattere è il titolo di studio il quale è una variabile qualitativa ordinabile. Le modalita sono tutti i possibili titoli di studio.

3. Distribuzione di frequenze: indica come le unità statistiche del collettivo si distribuiscono tra le diverse modalita

del carattereSi presenta in forma tabellare come un elenco delle diverse modalità e delle corrispondenti frequenze

La frequenza : numero di volte che le modalità è stata Rilevata sul collettivo

● frequenza assoluta (ni) -->numero delle unità statistiche che presentano una certa modalità

● frequenza relativa (fi): conteggio delle unità statistiche che presentano una certa modalità del

carattere in relazione alla numerosità del collettivo.

Il passaggio dalla frequenza assoluta a quella relativa :

  1. valutare il peso che ciascuna modalità del carattere ha nel collettivo
  2. permette di operare confronti su collettivi diversi

Le frequenze percentuali (Fi x100) -> sono le frequenze relative moltiplicate x 100

LEZIONE 8/

AMPIEZZA E distribuzioni di CLASSI

Distribuzioni in classi

Viene utilizzata Quando i caratteri quantitativi continui e discreti assumono diverse modalità sul collettivo. Le classi (intervalli di valori) che devono essere CONTIGUE, DISGIUNTE ED ESAUSTIVE. Possibilmente devono avere la stessa ampiezza

Quando si costruiscono le classi È necessario tenere in considerazione diversi elementi:

  • il numero di classi adeguato al problema
  • l'ampiezza delle diverse classi,
  • la possibilità di includere tutte le modalità del carattere

Non esiste un modo univoco per determinare il numero di classi→ tale numero deve essere in grado di contenere tutte le informazione e in generale il numero di classi adeguato è non meno 4-5 e non piu di 15-

Formula di Sturges: serve per determinare il numero ottimale di classi K

L'ampiezza delle classi può essere

● costante= si parla di classi equiampie- > suddivisione in classi del carattere è dettata da

un criterio esterno

● differente= classi non equiampie->ottenuta considerando l'ampiezza della

distribuzione, a partire dalla differenza della modalità più grande e della modalità più piccola osservata nella distribuzione unitaria dei dati e dividendo per il numero di classi definito precedentemente:

Il valore centrale è un valore rappresentativo dell intera class e. Calcolato dalla semisomma degli estremi inferiore e superiore di ciascuna classe

Istogramma

L'istogramma rappresenta graficamente le distribuzioni di frequenza IN classi

  • sull 'asse orizzontal e sono rappresentate le classi
  • su quello verticale è invece espressa l'intensità del fenomeno

Le barre sono accostate l’una all’altra, ci troviamo nell insieme dei numeri reali e non vi è discontinuità

Classi EQUIAMPIE : area del rettangolo: w(ampiezza) x la relativa frequenza

Nel caso di CLASSI NON EQUIAMPIE non si può confrontare in base all’altezza delle colonne dell’ istogramma, poiché hanno diverse ampiezze. Per poter ottenere delle barre proporzionali all'intensità espressa nella classe, e allo stesso tempo considerare

l'ampiezza della stessa, si utilizza come misura dell'intensità non più la frequenza ma la cosiddetta densità di frequenza

DISTRIBUZIONE UNITARIA DOPPIA:

La distribuzione unitaria doppia è una rappresentazione statistica che per ogni unità del collettivo, vengono riportati i valori assunti da due diverse variabili, creando così una coppia di dati.

  • Unità statistica : Ogni riga della distribuzione rappresenta una singola unità del collettivo con due caratteri osservati.
  • Doppia : Viene considerato il modo in cui due variabili si manifestano simultaneamente su ogni unità statistica. Le variabili possono essere di diversa natura: - entrambe quantitative - entrambe qualitative - una quantitativa e una qualitativa

RAPPRESENTAZIONE : Le coppie di valori delle variabili doppie quantitative possono essere rappresentate graficamente su un piano cartesiano che prende il nome di diagramma di dispersione o scatterplot

Distribuzione doppia di frequenza : indica la frequenza con cui si presentano simultaneamente le modalità di

due diverse variabili.

Caratteristiche della Distribuzione Doppia di Frequenza

  • Due variabili: La distribuzione prende in considerazione due caratteri o variabili, che possono essere qualitativi, quantitativi discreti o quantitativi continui.
  • Tabelle di contingenza/A DOPPIA ENTRATA: le righe rappresentano le modalità di una variabile e le colonne le modalità dell'altra variabile.
  • Frequenze Congiunte (nij) : Numero di unità che presentano contemporaneamente la modalità I della prima variabile e la modalità J della seconda variabile.

FREQUENZA RELATIVA CONGIUNTA: fij = Ni/N

UNITA 3: Indici di centralità

CARATTERISTICHE DELLA DISTRIBUZIONE :

centralitàvariabilitàforma

l'intensità totale: l'ammontare di carattere posseduto complessivamente da tutte le unità tre diversi metodi di calcolo dell'intensità totale:

Il calcolo dell'intensità totale differisce a seconda del tipo di distribuzione che andiamo a considerare e del tipo di fenomeno studiato:

Quando si raccolgono i dati di un carattere, inizialmente si ha un elenco di modalità, ovvero i diversi valori o categorie osservati.

Per organizzare e sintetizzare meglio questi dati, si costruisce una distribuzione di frequenza ,possono essere di due tipi principali:

Modalità distinte : Ogni modalità viene considerata singolarmente, ad esempio, quante persone hanno un'altezza di 170 cm, quante di 165 cm, e così via. ● Classi di modalità : Per variabili quantitative continue (come l'altezza), i dati vengono raggruppati in intervalli o classi, ad esempio, da 160 a 170 cm, da 170 a 180 cm, ecc.

Per trarre conclusioni più significative è necessario sintetizzare ulteriormente i dati in indici DI CENTRALITA’ -> il centro ideale

della distribuzione, ossia quel valore intorno al quale tendono a gravitare i dati

Gli indici più comuni per la sintesi dei dati includono:

Media aritmetica : fornisce un valore medio attorno al quale si distribuiscono i dati. ● Mediana : il valore che divide la distribuzione in due metà uguali. ● Moda : il valore che si presenta con maggiore frequenza.

La scelta di un indice sintetico è legato essenzialmente a tre fattori:

  1. tipologia del carattere in esame (qualitativo o quantitativo)
  2. la sua rappresentazione statistica (distribuzione unitaria, di frequenza o in classi)
  3. le motivazioni che inducono a "riassumere" la distribuzione in un unico valore rappresentativo

La media equidi partisce l’ammontare complessivo del carattere tra le unità del collettivo Le medie sono utili perché sono espresse nella stessa unità di misura del carattere osservato e perché danno una idea immediata della manifestazione del fenomeno nel collettivo Ci sono due grandi gruppi:

Tra le medie analitiche troviamo: ● media aritmetiche : all’ammontare effettivo si giunge tramite la somma del carattere. ● media geometriche: all’ammontare effettivo si previene tramite il prodotto (produttoria: moltiplicare al variare l’indice o valori dell’argomento)

Le medie di posizioneMODA-> tiene conto della frequenza delle modalità del carattere studiato (può essere calcolata su qualsiasi tipo di carattere) ● MEDIANA-> si tiene conto della posizione delle modalità del carattere studiato (può essere calcolata su qualsiasi tipo di carattere ordinabile) Le medie, data la loro funzione di sintesi, possono essere impiegate per confrontare:

  • uno stesso fenomeno rilevato su collettivi diversi
  • uno stesso fenomeno rilevato in tempi diversi e/o luoghi diversi
  • due o più fenomeni diversi tra di loro

La media aritmetica gode di cinque proprietà fondamentali (DIMOSTRAZIONI QUADERNO)

1) (INTERNALITA'->La media è sempre un valore interno(compreso tra il valore più piccolo e più grande) alla

distribuzione ordinata dei dati → è la condizione di cauchy sulla media

2) La somma di tutte le differenze tra le modalità della distribuzione e il loro valore medio ( la somma degli scart i) è

sempre pari a zero (Xi-x = scarto della media)

  1. La somma di tutte le differenze al quadrato tra i valori della distribuzione e il loro valore medio(La somma degli

scarti della medi a) è sempre un minimo → solo se è TRASFERIBILE, secondo CHISINI

4) LINEARITÀ= La media è invariante per trasformazioni lineari->moltiplicare o aggiungere ai valori del carattere una

costante

5) ì A SSOCIATIVITA'-> La media di un carattere osservato su una popolazione divisa in sottogruppi è pari alla

media delle medie di tutti i sottogruppi () tenendo conto della numerosità del gruppo /(quad esempio) In una distribuzione doppia di frequenza POSSIAMO CALCOLARE TANTE MEDIE quante sono: n. riga+ n. colonne+ le due marginali , anche se dipende dal carattere

MEDIE PARZIALI E MEDIE CONDIZIONATE

Seconda della natura del carattere per ogni profilo riga e per ogni profilo colonna -> medie parziali/medie condizionate