Secondo parziale statistica UNICATT | Schemi e mappe concettuali di Statistica

STATISTICA E PROBABILITA’ 2

LEZIONE 7/11

Abbiamo visto precedentemente: lo studio dei caratteri qualitativi -> tabella a doppia entrata (di contingenza) per

visualizzare la connessione attraverso il chi quadrato (vari tipi di dipendenza).

Ciò che è stato visto in precedenza può essere problematico quando si visualizza un carattere quantitativo -> la tabella

non sempre va bene in questo caso (se sono presenti tanti numeri diversi la tabella a doppia entrata può risultare difficile

da usare).

È necessario superare il principio di usare sempre e solo una tabella per studiare la relazione tra dati quantitativi -> in

altre parole lo studio della dipendenza tra caratteri, come y possa dipendere da x, diventa complicato in questo caso.

In sintesi in questa seconda parte del corso andremo a costruire dei modelli e a misurare se questi modelli che la teoria

economica suggerisce funzionano bene o meno.

MODELLI DI REGRESSIONE

Regressione in media

STUDIO DELLA DIPENDENZA TRA CARATTERI QUANTITATIVI

caratteri quantitativi – ad esempio credito aggregato e consumo aggregato

data una v.s. doppia (X,Y) ci si propone di descrivere al meglio l’andamento di Y al variare di X (o viceversa)

per fare questo si cercano dei: modelli teorici del tipo y* = g(x)

metto l’asterisco sulla y poiché la relazione non vale in modo esatto ma in modo approssimato per fornire una

previsione di y -> per ottenere y è necessario tenere conto della presenza di errori di approssimazioni.

Questi modelli teorici approssimano al meglio le osservazioni (𝑥𝑖,

𝑦𝑗)

𝑦𝑗 = 𝑔(𝑥𝑖) + 𝑒𝑗

𝑒𝑗 = 𝑒𝑟𝑟𝑜𝑟𝑒 𝑚𝑖𝑠𝑢𝑟𝑎

Per identificare g(x):

1) interpolazione matematica: curva analitica 2) interpolazione statistica:

che passa esattamente PER i punti dati curva analitica che passa TRA i punti dati

La soluzione 1) NON è possibile vista l’alta In questo caso considero il margine di

numerosità dei punti nelle indagini statistiche errore -> esso è la distanza che c’è tra il “vero”

In altre parole questa tipo di soluzione non punto e la funzione che uso per approssimare i

permette di leggere bene la complessità dei dati dati

in questo caso, in altre parole si cerca di

approssimare

Scrivere l’equazione di una funzione che passa esattamente per tutti i punti che si considerano nella analisi statistica è

sicuramente più giusto -> questo modo è però più costoso; è difficile trovare ciò.

Usare quindi una interpolazione di tipo statistica permette quindi di approssimare bene i dati. Certo questa

approssimazione non sarà esatta, ma si può rinunciare all’esattezza per poter costruire una funzione che in qualche

modo comprenda tutti i dati analizzati (matematicamente impossibile).

Inoltre rappresentare i dati attraverso una funzione che approssima i dati, tenendo conto di un margine di errore,

permette di fare previsioni e poi di sapere che cosa succede dopo (cosa che invece non si può fare con la funzione

matematica in quanto questa si riferisce strettamente ai sui valori)

INTERPOLAZIONE STATISTICA = REGRESSIONE

Modello di regressione = modello matematico che cerca di determinare la relazione tra una variabile dipendente (Y),

rispetto ad altre variabili, dette esplicative o indipendenti (X).

Abbiamo due tipi di modelli di regressione

❑ regressione in media (modello poco usato)

❑ regressione ai minimi quadrati ordinari (modello più usato in assoluto)

Per poter costruire le nostre funzioni di regressioni è necessario costruire una serie di basi:

Secondo parziale statistica UNICATT, Schemi e mappe concettuali di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica Secondo parziale statistica UNICATT e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!

STATISTICA E PROBABILITA’ 2

LEZIONE 7/

MODELLI DI REGRESSIONE

STUDIO DELLA DIPENDENZA TRA CARATTERI QUANTITATIVI

INTERPOLAZIONE STATISTICA = REGRESSIONE

MEDIE E VARIANZE MARGINALI E CONDIZIONATE

MARGINALI CONDIZIONATE

➢ MEDIE E VARIANZE MARGINALI

- MEDIE MARGINALI

- VARIANZE MARGINALI

[(

= 𝑀 [(𝑌 − 𝜇

] = ∑ (𝑦

ESEMPIO

➢ V.S. MEDIE CONDIZIONATE

ESEMPIO

LEZIONE 8/

SPEZZATA DI REGRESSIONE.

ESEMPIO NUMERICO

Y\X 1 2 3

𝑔(𝑥) = 𝑀[𝑦|𝑥]

𝑀[𝑉[𝑦|𝑥]] = 𝑀[𝜎

)] =

𝑀[𝜎

)] =

DUE CASI :

VARIANZA WITHIN UGUALE A ZERO

VARIANZA WITHIN DIVERSA DA ZERO

= 𝑉[𝑀

[

]

] + 𝑀[𝑉[𝑦|𝑥]]

𝑀[𝑦 − 𝜇

]

= 𝑉[𝑀[𝑦|𝑥]] + 𝑀[𝑉[𝑦|𝑥]]

UN MODELLO E’ TANTO PIU’ PERFORMANTE QUANTO PIU’ PICCOLA E’ 𝝈

E GRANDE 𝝈

RISPETTO ALLA 𝝈

ESEMPIO NUMERICO :

MEDIE CONDIZIONATE LE DISTRIBUZIONI DI FREQUENZE RELATIVE DELLE

VARIABILI CONDIZIONATE

UGUALI ALLA MEDIA QUELLA DI UN ALTRO CARATTERE

INDIPENDENZA STOCASTICA 𝜒

= 0 ⟹ INDIPENDENZA IN MEDIA 𝜂

INDIPENDENZA STOCASTICA 𝜒

= 0 ⟸ INDIPENDENZA IN MEDIA 𝜂

ESEMPIO

LEZIONE 14/

RELAZIONE TRA INDIPENDEZA STOCASTICA E IN MEDIA

DIMOSTRAZIONE

DF: AD OGNI X CORRISPONDE UNA E UNA SOLA Y

DF: AD OGNI Y CORRISPONDE UNA E UNA SOLA X

ESEMPIO

OSSERVAZIONE

SE SEI STOCASTICAMENTE INDIPENDENTE - > HAI LA STESSA DISTRIBUZIONE - > HAI LA STESSA

ESPRESSIONE ANALITICA DELLA FUNZIONE DI REGRESSIONE

[

]

[

]

LEZIONE 15/

) = 𝑀[(𝑦

] =

= 𝑀[(𝑌 − 𝑎

)]

ORDINARI

ESEMPI

LEZIONE 18/

BONTA’ ED ADEGUATEZZA DEL MODELLO

R = Y – Y * - > DIFFERENZA TRA IL VERO VALORE E QUELLO PREVISTO

PRIMA ORA

SPEZZATA DI REGRESSIONE

DIAGRAMMA A DISPERSIONE

COSTRUZIONE DEL DIAGRAMMA A DISPERSIONE

QUALI VALORI PUO’ ASSUMERE LA COVARIANZA?