







Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
appunti di lezione riassunti di statistica università di economia a pisa, professoressa slide
Tipologia: Appunti
1 / 13
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!








Nozioni generali La varianza è un valore numerico che descrive la variabilità delle osservazioni dalla sua media aritmetica. La deviazione standard è una misura della dispersione di osservazioni all'interno di un set di dati. ... È la media delle deviazioni al quadrato. È la deviazione quadrata media della radice Base per il confronto Varianza Deviazione standard Senso La varianza è un valore numerico che descrive la variabilità delle osservazioni dalla sua media aritmetica. La deviazione standard è una misura della dispersione di osservazioni all'interno di un set di dati. Che cos'è? È la media delle deviazioni al quadrato. È la deviazione quadrata media della radice. Etichettato come Sigma-quadrato (σ ^ 2) Sigma (σ) Espresso in Unità quadrate Stesse unità dei valori nel set di dati. Indica Quanto distano gli individui in un gruppo. Quante osservazioni di un set di dati differiscono dalla sua media.
INTRODUZIONE: oggetto dell’analisi, dati a disposizione e usati, metodo e finalità Da Statistica Elearning (2020/21) lezione su interpolazione /regressione lineare Come possiamo interpolare dei punti al fine di creare una retta, in modo da stimare il valore di y ogni dato x Con la tecnica dei minimi quadrati possiamo studiare e misurare la relazione lineare tra due caratteri quantitativi (x,y) stabilendo prima quale sia a determinare l’altro
Determinazione deterministico (funzionale): se ogni volta scelto un valore x corrisponde uno e un solo valore di y => indica una dipendenza perfetta di y a x, in quanto la conoscenza del valuro assunto dalla variabile x permete di conoscere con certezza il valore di y Es. supponiamo che Una volta fissato x => y risulta determinato dall’equazione della retta (intercetta= 50 e coeff=1,20) Quindi fissato qualsiasi valore di x, il valore di y risulta determinato
Sul grafico si vede che i punti si dispongono lungo una retta crescente (quindi ad aumentare l’età aumenta anche l’altezza in cm), i punti però non sono su una stessa retta, per cui non si può parlare di relaione deterministica) CALCOLIAMO i caratteri della retta interpolante 1- Calcolare la media di x e di y 2-
il reddito delle famiglie è un argomento di cui, al giorno d’oggi, si sente sempre di più parlare, in quanto capace di influenzare e indirizzare rispettivamente il potere e le decisioni di acquisto. In questa tesi si vuole in particolare, concentrare l’attenzione sull’andamento e i mutamenti dei consumi delle famiglie, rispetto al reddito delle stesse, basandosi sui dati pubblicati annualmente dalla banca d’Italia. REGRESSIONE LINEARE L’analisi di regressione lineare è una tecnica che permette di analizzare la relazione lineare tra una variabile dipendente (o variabile di risposta) e una o più variabili indipendenti (o predittori). L’analisi della regressione lineare è una metodologia asimmetrica che si basa sull’ipotesi dell’esistenza di una relazione di tipo causa-effetto tra una o più variabili indipendenti (o esplicative) e la variabile dipendente (o di criterio). Lo studio di questa relazione può avere un duplice scopo:
Nella realtà operativa economica, quando ci troviamo ad analizzare dei fenomeni, troviamo spesso la necessità di individuare quali siano le variabili indipendenti alle variazioni dei valori in esame, e quali siano le variabili dipendenti alle stesse variazioni. In questo modo possiamo costruire un modello in grado di far comprendere e prevedere l’andamento del fenomeno stesso. Questo tipo di analisi statistica, viene affrontata tramite il Modello di Regressione Lineare, in grado di prevedere i valori di una variabile (detta dipendente o di risposta) partendo dai valori di un’altra variabile (detta indipendente o esplicativa). Questa funzione può inoltre assumere diverse forme, come: lineare, non lineare, multipla,… Analizzeremo per primo il modello di Regressione Lineare Semplice Per scegliere la più adeguata funzione di regressione che descriva l’andamento nel modo migliore, è necessario considerare la complessità e specificità della struttura del fenomeno che andiamo ad analizzare, al fine di rappresentarlo nel modo più preciso possibile. Questa funzione infatti assumere diverse forme, come: lineare, non lineare, multipla,… Analizzeremo per primo il modello di Regressione Lineare Semplice Supponiamo di individuare come: Y la variabile dipendente o di risposta X la variabile indipendente o esplicativa Lo scopo del modello è quello di individuare una relazione tra le due variabili, o diversamente stimare il valore della variabile dipendente ad ogni variazione della variabile indipendente. La relazione che si creano tra le due variabili possono essere espresse come: Y = f (X) Assume inoltre varie forme, tra cui: lineare, non lineare, semplice, multipla,… Le relazioni che si vengono a creare vengono definite come funzionale e statistica La relazione funzionale si fonda sul concetto che Y è funzione di X se ad ogni valore di X corrisponde uno e un solo valore di Y. Questa funzione è lineare quando possiamo scrivere: Y = β + βx Dove b0 = intercetta ( (valore di Y per X=0) b1 => coeff angolare A questo proposito può essere usato per esempio per : calcolare i gradi da farenaith a centigradi. In quest’ultimo esempio avremo che la funzione sarà espressa come Y = 32 + 1,8x (funzione lineare)
Calcolare la spesa per elettricità in funzione del reddito famigliare; in questo caso non avremo un solo valore per quanto riguarda la variabile dipendente per ogni valore della variabile indipendente. Questo perché saranno presenti nel mercato altre variabili che influenzeranno il nostro risultato. RELAZIONE STATISTICA Nell’esempio si può osservare come la quantità di beni che la famiglia acquisterà da un determinato mercato (Y) sarà la funzione lineare del reddito famigliare (X) se il reddito sarà precisamente x e la quantità acquistata sarà y. Ma altri fattori tuttavia influenzeranno quelle scelte. Ciò porta a far sì che nel modello lineare semplice gli altri effetti diversi da questo in esame, saranno sintetizzati come una componente di errore “e”. Questa nuova assunzione si fondo quindi su una relazione statistica, descritta come: Y = f (X) + e dove f(x)… (libro) Introduciamo ora delle assunzioni per ottenere il modello di regressione lineare semplice: 1- Per ogni valore di x, il valore di e è 0 2- Yi = Bo+B1Xi + e per ogni osservazione i= 1,…,n 3- Le e’i sono variabili casuali indipendenti con valore atteso E(e’i)=0 e varianza costante V(e’i)= per ogni i=1,…,n (aggiungere libro) 4- I valori Xi della variabile esplicativa sono noti senza errore La prima assunzione porta ad assumere che f(X) è la media condizionata di y per un valore fissato di X, tale funzione viene chiamata: funzione di regressione. “e” rappresentando l’ignoto che non comprendiamo è quindi chiamato errore. Questa componente porta ad analizzare, in questa relazione, sia una componente deterministica f(X), sia una componente stocastica “e”. La seconda assunzione implica che la funzione f(X) è lineare La terza assunzione implica che la “e” è una variabile casuale in quanto rappresenta gli scostamenti dal valore atteso di Y. Implica quindi che le variabili casuali siano tra loro statisticamente indipendenti con valore atteso = e varianza costante (libro) (ipotesi di omoschedasticità) Inoltre Dalla terza assunzione poiché “e” è una variabile casuale, anche la variabile Y (somma di una componente detrministica e una stocastica) sarà una variabile casuale. Per cui, sapendo che per ogni Xi fissato, la componente Bo+B1Xi è una costante e il valore atteso E(e’i)=0, ne discende che il valore atteso di Yi condizionato al valore X=xi è: …libro Mentre la vaianza di Yi p V(Yi)=V(e’i)=libro Avendo inoltre assunto l’indipendenza delle variabili causali, per cui anche Yi, possiamno dire che: le osservazioni Yi sono realizzazioni di variabili casuali indipendenti con valore atteso Bo+B1Xi e varianza comune ..libro STIMA PUNTUALE DEI COEFFICIENTI DI REGRESSIONE Definiremo ora il metodo che stimerà i coefficienti di regressione.
Dal punto di vista geometrico: Possiamo osservare che: -SQT vale 0 quando tutte le yi sono uguali tra loro, quindi uguali al valore medio ( no variabilità nei dati) -SQE va a rappresentare il grado di incertezza residua, data la funzione di regressione stimata; quando la relazione lineare prevede perfettamente le osservazioni si ha SQE=0 (più sarà alta la dispersione dei dati lungo la retta, maggiore sarà SQE -SQR è la devianza delle y’i, in quanto la media elle y’i è uguale a y’ è uguale a 0 Per quello che abbiamo detto, ne deriva che SQR è una parte di SQT, in particolare la parte riprodotta dalle y’i attraverso la funzione di regressione Le situazioni estreme invece saranno:
Inoltre, poiché: b’1= pxy… libro la pendenza corrisponderà al segno del coefficiente di correlazione: quando assumerà i valori estermi + - 1, i punti saranno allineati perfettamente sulla retta quando assumerà valore 0 la regressione sarà parallela all’asse delle ascisse (in questo caso il valore medio di Y non dipende linearmente da X) osservando le situazioni estreme in cui abbiamo combinazioni di Pxy per R2xy=0 e R2xy=1, possiamo scrivere: R2xy = …….libro Cioè come il prodotto dei coefficienti angolari delle due rette di regressione Y’ = B’o + B’1X’ e X’=a’o+a’1Yi, scambiando così il ruolo delle variabili => al crescere di R2xy, l’angolo interno delle due rette diminuisce fino a quando per le R2xy=1 si avrà B’1=1/a’1 e le due rette coincidono PROPRIETA’ DEGLI STIMATORI DEI COEFFICIENTI E DELLA RISPOSTA MEDIA …… VIDEOLEZIONE Per misurare la relazione lineare tra due caratteri X e Y, utilizzeremo la retta dei minimi quadrati, assumendo primariamente che sia X a influenzare Y Le relazioni che si creano tra due variabili X e Y saranno ti tipo deterministico o statistico => Y=f(X) y è una funzione di X Per esempio Così scriveremo che: B0 => intercetta B1 => coeff angolare , entrambe sono quantità costanti
DA TESI STATISTICA (selezione della variabile migliore) mod regr lineare: Lo studio statistico delle scienze economiche e della vita economica stessa, ha generalmente l’obbiettivo di analizzare, comprendere e prevedere l’andamento di un dato fenomeno. Per fare questo è di primaria importanza trovare un modello in grado di descrivere, per ogni popolazione o campione analizzati, le relazioni Nella vita economica e nello studio di questa materia, abbiamo spesso la necessità di individuare, tra le diverse variabili che compongono un dato fenomeno, dei legami tra i diversi valori. L’obbiettivo è quello di andare ad analizzare, comprendere e prevedere, il “come” e “perché” una data variabile, detta dipendente (o di risposta), varia al variare della variabile indipendente (o di domanda?). Nelle scienze statistiche questo tipo di analisi viene affrontata tramite il modello di regressione, in grado di creare e spiegare, visivamente e matematicamente, il fenomeno in questione, creando una funzione di regressione, capace di descrivere come e quanto varia una variabile al variare di un’altra stessa.