







Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Teoria modello regressione trattato durante il corso di Ricerche di Mercato
Tipologia: Appunti
1 / 13
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!








Modello -> è uno schema teorico in base al quale sono verificabili tutte le relazioni e le ipotesi proprie di una teoria. Consiste nella semplificazione di una realtà , esprime quindi una realtà complessa in modo parsimonioso. Si parla di un modello causa- effetto in cui dato un certo effetto misurabile ed individuate le variabili che lo hanno consentito , si individuano i parametri che legano le variabili esplicative alla variabile dipendente. Un modello può fallire nei suoi obiettivi per varie cause che possono verificarsi anche congiuntamente :
regressione di Y su X. Tali distanze rappresentano gli errori del modello. La retta di regressione e quindi chiamata retta dei minimi quadrati, in quanto rende minima la somma dei quadrati degli errori. La relazione lineare tra la variabile XE la variabile y che si propone di andare a calcolare è la seguente: ŷ=b0+b 1 xi Con la dicitura ŷ (y teoriche)Intendiamo quel valore di y secondo il modello teorico di regressione lineare che andremo a costruire. b 0 rappresenta il intercetta della retta, indica ovvero il valore della Y quando X è uguale a 0. b 1 rappresenta invece il coefficiente angolare della retta e indica la variazione della Y a una variazione unitaria della x. Lo studio dell'analisi di regressione consiste unicamente dunque nel definire, attraverso i dati a nostra disposizione, i valori di b 0 e b1, rispettivamente i valori dell'intercetta e del coefficiente angolare. Il coefficiente angolare è dato dalla seguente formula: Dove con Cov (XY) intendiamo la covarianza tra la X e la Y e con Var(X) la varianza di X. La covarianza È un numero che fornisce una misura di quanto le due varino assieme, ovvero della loro dipendenza. Ricordando le formule della covarianza e della varianza, dividendo tutto per n, il risultato della covarianza sarà uguale al rapporto tra la codevianza di XY e la devianza di X. Il coefficiente di regressione può variare da −∞ a +∞: o se b1>0la retta di regressione è crescente e il carattere Y aumenta all'aumentare di X; o se b1<0la retta di regressione è decrescente e il carattere Y diminuisce all'aumentare di X; o se b1=0, la retta di regressione è costante e il carattere Y non varia al variare del carattere X. o Per calcolare l’ intercetta la formula è la seguente: b 0 =-b 1 È quindi data dalla differenza tra la media dei valori riferiti alla variabile dipendente e il prodotto del coefficiente angolare e la media riferita ai valori della variabile indipendente.
andare a determinare il coefficiente di determinazione lineare R 2 . La formula dell’R 2 è la seguente: Questo indice misura quanta parte della devianza totale è spiegata o determinata dalla devianza di regressione. Più piccola è la devianza residua tanto più elevata è la devianza spiegata dalla regressione e quindi tanto più la retta di regressione si avvicina ai punti osservati e meglio descrive la distribuzione osservata. Se ne trae che più alta è la devianza di regressione tanto più la variabilità della Y è spiegata dalla relazione lineare. Infatti, il calcolo del coefficiente di determinazione lineare altro non è che la somma tra la devianza residua e la devianza di regressione. L'indice risulta essere compreso tra 0 e 1, dove 0 rappresenta un modello privo di bontà, mentre 1 rappresenta un modello dalla massima bontà. La verifica delle ipotesi Spesso lo scopo ultimo è quello di utilizzare la stima trovata al fine di avere un'idea su alcuni aspetti rilevanti ma incogniti della popolazione, in questo caso quindi si procede con il metodo della verifica delle ipotesi. A questo fine andranno definite sempre due tipi di ipotesi: la prima che si va a definire è quella chiamata ipotesi nulla, la cui dicitura è H 0 e ci si chiede dunque se esistono le condizioni per dire che In sostanza non c'è differenza tra l'ipotesi e il parametro calcolato; alternativamente all’ipotesi nulla formulata, si pone un'altra ipotesi detta ipotesi alternativa H 1. Si rifiuta l'ipotesi statistica H 0 sei solo se il valore calcolato appartiene ad una regione critica, ovvero regione di rifiuto. Per la verifica delle ipotesi va posto un’eventualità di errore che indichiamo con Alfa. L'errore andrà posizionato lungo le code della distribuzione che si utilizza. Regressione lineare multipla Il modello di regressione ha come obiettivo principale la previsione: si mira la costruzione di un modello attraverso cui prevedere i valori di una variabile dipendente a partire dai valori di una variabile indipendente. Al fine di tener conto di più di una variabile indipendente, includiamo nel modello di regressione lineare k-1 variabili esplicative, diventando così un modello di regressione lineare multipla, con la seguente espressione:
Dove: Y = è un vettore …………………… X= è una matrice dei valori dei k-1 regressori per le n unità del campione = intercetta è il punto di intersezione tra l’asse delle y e la retta di regressione -> è il coefficiente angolare che indica la pendenza della retta. = inclinazione di Y rispetto alla variabile X 1 tenendo costanti le variabili X 2 …Xk- = inclinazione di Y rispetto alla variabile X 2 tenendo costanti le variabili X1, X 3 …Xk- Le sono i parametri incogniti da stimare. Come si stimano? con il metodo dei minimi quadrati che minimizzano la sommatoria dei quadrati degli errori. = errore in corrispondenza dell’osservazione i. I parametri non noti del modello sono: intercetta ( e i coefficienti di regressione () Nel modello di regressione si distingue l’eq della retta da un termine detto errore (e). QUEST’ULTIMO è UNA VARIABILE CASUALE CHE INDICA CHE UNA RELAZIONE LINEARE TRA VARIABILI NON PUO ESSSERE ESATTA MA CONTIENE DELLE MPRECISIONI DOVUTE ALLE LIMITAZIONI DELLE MISURAZIONI E O DALL’ASSENZA DI INFO COMPLETE SUL FENOMENO. Il metodo di stima dei minimi quadrati ricerca gli stimatori dei parametri bo e beta1. per minimizzare la funzione f (bo b1) si calcola il sistema delle derivate parziali rispetto ai parametri incogniti beta0 e beta 1 , si uguagliano a 0 e si ottengono cosi gli stimatori dei parametri della funzione di regressione. Ipotesi del modello di regressione lineare multipla
per il controllo dell’ipotesi nulla di indipendenza. Tale modello può essere considerato un confronto fra:
opportuno standardizzarli dividendoli per una stima dell'oro scarto quadratico medio. la media aritmetica dei residui standardizzati è nulla e la loro varianza è 1, ma sono ancora moderatamente correlati. un eventuale osservazione anomala influenzerà inevitabilmente la varianza di dispersione e quindi anche i residui standardizzati internamente. Per ovviare a tale inconveniente, Si calcoleranno i residui standardizzati esternamente e le osservazioni per cui |ti|2 rappresentano potenziali outliner. IPOTESI DI DIPENDENZA LINEARE O IP FORTE : Fissato un livello di significatività alfa se F > Falfa ( quindi il nostro Pvalue è minore di α allora vi sarà dipendenza lineare ossia almeno uno dei k repressori (x) contribuisce a spiegare la y .. accetto H1 diverso da 0 Multicollinearità Questa ipotesi prevede che le variabili non siano dipendenti l'una dall'altra. Nel caso in cui nel modello vengono introdotte variabili perfettamente dipendenti tra loro, si avrà come conseguenza un’errata specificazione del modello e si è in presenza di multicollinearità, che prevede una relazione lineare tra i repressori
. La varianza degli stimatori cresce al crescere della multicollinearità. Un vif elevato è indice di dipendenza lineare tra la colonna jesima e le restanti colonne della matrice. È uguale a 1/ 1-RQUADRO JESIMO Omoschedasticità Prevede varianza costante e covarianza degli errori pari a 0.Tra le cause di eteroschedasticità si evidenziano: - l'esistenza di una relazione tra le ei e le Xi; - la presenza di outlier (valori anomali).
coefficiente di correlazione parziale più elevato e significativo, si prosegue inserendo una successiva variabile dipendente. Il procedimento ha fine quando il coefficiente di correlazione parziale dell’ultima variabile inserita non è più significativa rispetto al livello prefissato; il modello definitivo è quello ottenuto al penultimo passo N best = miglior modello di regressione ( 2 x ) Metod = adjR Cbind=specifichiamo le nostre variabili indipendenti. X è la combinazione di ener , beats……..
all’aumentare di 1valen diminuisce di 0.08 lengh
o LINEAR LINEARE RISPETTO A Y o BEST è IL PIU EFFICIENTE NELLA CLASSE DEGLI STIMATORI LINEARE CORRETTI Scomposizione della devianza In base alla scomposizione della devianza è possibile conoscere quanta parte della varianza totale di y è spiegata dal modello. la devianza è il numeratore della varianza ossia la sommatoria degli scarti al quadrato tra yi e la media di y