Prepara i tuoi esami
Ottieni punti
Guide e consigli
Vendi su Docsity
Docsity AI

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Guide e consigli

Vendi su Docsity

Docsity AI

Accedi Registrati

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Cerca documenti

Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity

Cerca la tua università

Trova i documenti specifici per gli esami della tua università

Video Corsi

Preparati con lezioni e prove svolte basate sui programmi universitari!

Quiz

Rispondi a reali domande d’esame e scopri la tua preparazione

Docsity AINEW

Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali

Maturità 2026

Studia con prove svolte, tesine e consigli utili

Esplora domande

Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te

Argomenti di studio

Esplora i documenti più scaricati per gli argomenti di studio più popolari

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Condividi documenti

20 Punti

Per ogni documento caricato

Rispondi alle domande

5 Punti

per ogni risposta data (max 1 al giorno)

Tutti i modi per ottenere punti gratis

Ottieni punti subito

Scegli un piano Premium con tutti i punti di cui hai bisogno

Opportunità di studio

Scegli il tuo prossimo programma di studio

Entra in contatto con le migliori università del mondo e scegli il tuo percorso di studi

Classifica delle migliori università

Scopri le migliori università italiane secondo gli studenti

Community

Chiedi alla community

Chiedi aiuto alla community e sciogli i tuoi dubbi legati allo studio

Guide Gratuite

I nostri eBook salva studente

Scarica gratuitamente le nostre guide sulle tecniche di studio, metodi per gestire l'ansia, dritte per la tesi realizzati da tutor Docsity

testi statistica appunti regressione lineare, Appunti di Statistica Medica

Università di Pisa (UNIPI)Statistica Medica

Prof. Angela Tarabella

appunti di lezione riassunti di statistica università di economia a pisa, professoressa slide

Tipologia: Appunti

2021/2022

Caricato il 04/01/2022

Pietropietrooo 🇮🇹

4.5

(2)

2 documenti

1 / 13

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

Nozioni generali

Lavarianza èun valore numerico che descrive la variabilità delle osservazioni dalla sua

media aritmetica. Ladeviazione standard èuna misura della dispersione di osservazioni

all'interno di un set di dati. ...Èla media delledeviazionial

quadrato.Èladeviazionequadrata media della radice

Base per il

confronto Varianza Deviazione standard

Senso

La varianza è un valore

numerico che descrive la

variabilità delle osservazioni

dalla sua media aritmetica.

La deviazione standard è una

misura della dispersione di

osservazioni all'interno di un

set di dati.

Che cos'è? È la media delle deviazioni al

quadrato.

È la deviazione quadrata

media della radice.

Etichettato

come Sigma-quadrato (σ ^ 2) Sigma (σ)

Espresso in Unità quadrate Stesse unità dei valori nel set

di dati.

Indica Quanto distano gli individui in

un gruppo.

Quante osservazioni di un set

di dati differiscono dalla sua

media.

Scopri Appunti di Statistica Medica Università di Pisa (UNIPI)

Documenti correlati

Statistica - 7. MODELLO DI REGRESSIONE LINEARE SEMPLICE

(10)

Regressione Lineare statistica aziendale

regressione lineare esercizio statistica

Regressione lineare - Statistica

Regressione lineare (Statistica)

(2)

Regressione lineare statistica

esercizi regressione lineare

Regressione lineare documento

regressione lineare statistica per l'impresa

regressione lineare semplice di statistica

Regressione lineare - Appunti - Statistica

Analisi Statistica: Regressione Lineare Semplice

Anteprima parziale del testo

Scarica testi statistica appunti regressione lineare e più Appunti in PDF di Statistica Medica solo su Docsity!

Nozioni generali La varianza è un valore numerico che descrive la variabilità delle osservazioni dalla sua media aritmetica. La deviazione standard è una misura della dispersione di osservazioni all'interno di un set di dati. ... È la media delle deviazioni al quadrato. È la deviazione quadrata media della radice Base per il confronto Varianza Deviazione standard Senso La varianza è un valore numerico che descrive la variabilità delle osservazioni dalla sua media aritmetica. La deviazione standard è una misura della dispersione di osservazioni all'interno di un set di dati. Che cos'è? È la media delle deviazioni al quadrato. È la deviazione quadrata media della radice. Etichettato come Sigma-quadrato (σ ^ 2) Sigma (σ) Espresso in Unità quadrate Stesse unità dei valori nel set di dati. Indica Quanto distano gli individui in un gruppo. Quante osservazioni di un set di dati differiscono dalla sua media.

INTRODUZIONE: oggetto dell’analisi, dati a disposizione e usati, metodo e finalità Da Statistica Elearning (2020/21) lezione su interpolazione /regressione lineare Come possiamo interpolare dei punti al fine di creare una retta, in modo da stimare il valore di y ogni dato x Con la tecnica dei minimi quadrati possiamo studiare e misurare la relazione lineare tra due caratteri quantitativi (x,y) stabilendo prima quale sia a determinare l’altro

RELAZIONE DETERMINISTICA

Determinazione deterministico (funzionale): se ogni volta scelto un valore x corrisponde uno e un solo valore di y => indica una dipendenza perfetta di y a x, in quanto la conoscenza del valuro assunto dalla variabile x permete di conoscere con certezza il valore di y Es. supponiamo che Una volta fissato x => y risulta determinato dall’equazione della retta (intercetta= 50 e coeff=1,20) Quindi fissato qualsiasi valore di x, il valore di y risulta determinato

Sul grafico si vede che i punti si dispongono lungo una retta crescente (quindi ad aumentare l’età aumenta anche l’altezza in cm), i punti però non sono su una stessa retta, per cui non si può parlare di relaione deterministica) CALCOLIAMO i caratteri della retta interpolante 1- Calcolare la media di x e di y 2-

ABSTRACT

il reddito delle famiglie è un argomento di cui, al giorno d’oggi, si sente sempre di più parlare, in quanto capace di influenzare e indirizzare rispettivamente il potere e le decisioni di acquisto. In questa tesi si vuole in particolare, concentrare l’attenzione sull’andamento e i mutamenti dei consumi delle famiglie, rispetto al reddito delle stesse, basandosi sui dati pubblicati annualmente dalla banca d’Italia. REGRESSIONE LINEARE L’analisi di regressione lineare è una tecnica che permette di analizzare la relazione lineare tra una variabile dipendente (o variabile di risposta) e una o più variabili indipendenti (o predittori). L’analisi della regressione lineare è una metodologia asimmetrica che si basa sull’ipotesi dell’esistenza di una relazione di tipo causa-effetto tra una o più variabili indipendenti (o esplicative) e la variabile dipendente (o di criterio). Lo studio di questa relazione può avere un duplice scopo:

esplicativo : comprendere e ponderare gli effetti delle variabili indipendenti (VI) sulla variabile dipendente (VD) in funzione di un determinato modello teorico;
predittivo : individuare una combinazione lineare di variabili indipendenti per predire in modo ottimale il valore assunto dalla variabile dipendente In tutti i settori possiamo sempre avere la necessità di comprendere e spiegare perché e come un dato fenomeno varia al variare di un altro dato fenomeno. Quando parliamo di dati quantitativi, è fondamentale cercare delle relazioni tra i diversi componenti, e come questi possono influenzarsi tra di loro se non addirittura determinare il risultati degli altri. È stato per questo elaborato in Statistica, il modello di Regressione Lineare, il quale consente di determinare, date due variabili (una dipendente e l’altra indipendente), l’esito e le variazioni della variabile dipendente rispetto alle variazioni della variabile indipendente. Possiamo trovare questo modello a rappresentazione dei costi rispetto ai ricavi di un azienda, nella relazione esistente tra età ed altezza,… vogliamo in questo elaborato studiare la relazione esistente tra il reddito delle famiglie italiane rispetto al decorso degli anni e delle rispettive politiche emanate dallo Stato. Con la regressione lineare possiamo costruire un modello che permette di prevedere i valori di una variabile dipendente o di risposta (quantitativa) a partire dai valori di una o più variabili indipendenti o esplicative. Solitamente nel Modello di Regressione Lineare si indica con:
Y la variabile dipendente
X la variabile indipendente

Nella realtà operativa economica, quando ci troviamo ad analizzare dei fenomeni, troviamo spesso la necessità di individuare quali siano le variabili indipendenti alle variazioni dei valori in esame, e quali siano le variabili dipendenti alle stesse variazioni. In questo modo possiamo costruire un modello in grado di far comprendere e prevedere l’andamento del fenomeno stesso. Questo tipo di analisi statistica, viene affrontata tramite il Modello di Regressione Lineare, in grado di prevedere i valori di una variabile (detta dipendente o di risposta) partendo dai valori di un’altra variabile (detta indipendente o esplicativa). Questa funzione può inoltre assumere diverse forme, come: lineare, non lineare, multipla,… Analizzeremo per primo il modello di Regressione Lineare Semplice Per scegliere la più adeguata funzione di regressione che descriva l’andamento nel modo migliore, è necessario considerare la complessità e specificità della struttura del fenomeno che andiamo ad analizzare, al fine di rappresentarlo nel modo più preciso possibile. Questa funzione infatti assumere diverse forme, come: lineare, non lineare, multipla,… Analizzeremo per primo il modello di Regressione Lineare Semplice Supponiamo di individuare come: Y la variabile dipendente o di risposta X la variabile indipendente o esplicativa Lo scopo del modello è quello di individuare una relazione tra le due variabili, o diversamente stimare il valore della variabile dipendente ad ogni variazione della variabile indipendente. La relazione che si creano tra le due variabili possono essere espresse come: Y = f (X) Assume inoltre varie forme, tra cui: lineare, non lineare, semplice, multipla,… Le relazioni che si vengono a creare vengono definite come funzionale e statistica La relazione funzionale si fonda sul concetto che Y è funzione di X se ad ogni valore di X corrisponde uno e un solo valore di Y. Questa funzione è lineare quando possiamo scrivere: Y = β + βx Dove b0 = intercetta ( (valore di Y per X=0) b1 => coeff angolare A questo proposito può essere usato per esempio per : calcolare i gradi da farenaith a centigradi. In quest’ultimo esempio avremo che la funzione sarà espressa come Y = 32 + 1,8x (funzione lineare)

Calcolare la spesa per elettricità in funzione del reddito famigliare; in questo caso non avremo un solo valore per quanto riguarda la variabile dipendente per ogni valore della variabile indipendente. Questo perché saranno presenti nel mercato altre variabili che influenzeranno il nostro risultato. RELAZIONE STATISTICA Nell’esempio si può osservare come la quantità di beni che la famiglia acquisterà da un determinato mercato (Y) sarà la funzione lineare del reddito famigliare (X) se il reddito sarà precisamente x e la quantità acquistata sarà y. Ma altri fattori tuttavia influenzeranno quelle scelte. Ciò porta a far sì che nel modello lineare semplice gli altri effetti diversi da questo in esame, saranno sintetizzati come una componente di errore “e”. Questa nuova assunzione si fondo quindi su una relazione statistica, descritta come: Y = f (X) + e dove f(x)… (libro) Introduciamo ora delle assunzioni per ottenere il modello di regressione lineare semplice: 1- Per ogni valore di x, il valore di e è 0 2- Yi = Bo+B1Xi + e per ogni osservazione i= 1,…,n 3- Le e’i sono variabili casuali indipendenti con valore atteso E(e’i)=0 e varianza costante V(e’i)= per ogni i=1,…,n (aggiungere libro) 4- I valori Xi della variabile esplicativa sono noti senza errore La prima assunzione porta ad assumere che f(X) è la media condizionata di y per un valore fissato di X, tale funzione viene chiamata: funzione di regressione. “e” rappresentando l’ignoto che non comprendiamo è quindi chiamato errore. Questa componente porta ad analizzare, in questa relazione, sia una componente deterministica f(X), sia una componente stocastica “e”. La seconda assunzione implica che la funzione f(X) è lineare La terza assunzione implica che la “e” è una variabile casuale in quanto rappresenta gli scostamenti dal valore atteso di Y. Implica quindi che le variabili casuali siano tra loro statisticamente indipendenti con valore atteso = e varianza costante (libro) (ipotesi di omoschedasticità) Inoltre Dalla terza assunzione poiché “e” è una variabile casuale, anche la variabile Y (somma di una componente detrministica e una stocastica) sarà una variabile casuale. Per cui, sapendo che per ogni Xi fissato, la componente Bo+B1Xi è una costante e il valore atteso E(e’i)=0, ne discende che il valore atteso di Yi condizionato al valore X=xi è: …libro Mentre la vaianza di Yi p V(Yi)=V(e’i)=libro Avendo inoltre assunto l’indipendenza delle variabili causali, per cui anche Yi, possiamno dire che: le osservazioni Yi sono realizzazioni di variabili casuali indipendenti con valore atteso Bo+B1Xi e varianza comune ..libro STIMA PUNTUALE DEI COEFFICIENTI DI REGRESSIONE Definiremo ora il metodo che stimerà i coefficienti di regressione.

Dal punto di vista geometrico: Possiamo osservare che: -SQT vale 0 quando tutte le yi sono uguali tra loro, quindi uguali al valore medio ( no variabilità nei dati) -SQE va a rappresentare il grado di incertezza residua, data la funzione di regressione stimata; quando la relazione lineare prevede perfettamente le osservazioni si ha SQE=0 (più sarà alta la dispersione dei dati lungo la retta, maggiore sarà SQE -SQR è la devianza delle y’i, in quanto la media elle y’i è uguale a y’ è uguale a 0 Per quello che abbiamo detto, ne deriva che SQR è una parte di SQT, in particolare la parte riprodotta dalle y’i attraverso la funzione di regressione Le situazioni estreme invece saranno:

SQR = 0 => SQE = SQT, i valori stimati sono tutti uguali alla media campionaria y’ -SQR=SQT => SQE=0, tutti i valori stimati sono uguali a quelli osservati COEFFICIENTE DI DETERMINAZIONE Dalla relazione SQT=SQR+SQE si può definire un indice che misura la bontà di adattamento della retta di regressione. Dividiamo SQR per il suo massimo valore, SQT, ed otteniamo il coeff. Di determinazione È detto ciefficiente di determinazione e indica la proporzione di variabilità di Y spiegata dalla variazione esplicativa X, attraverso il modello di regressione Questo coefficiente, nelle situazioni estreme può valore: -0 in assenza di relazione statistica di tipo lineare SQR= -1 in presenza di perfettta dipendenza SQR=SQT Possiamo dimostrare che il coefficiente di determinazione corrisponde al quadrato del coefficiente di correlazione lineare tra x e y, in questo modo

Inoltre, poiché: b’1= pxy… libro la pendenza corrisponderà al segno del coefficiente di correlazione: quando assumerà i valori estermi + - 1, i punti saranno allineati perfettamente sulla retta quando assumerà valore 0 la regressione sarà parallela all’asse delle ascisse (in questo caso il valore medio di Y non dipende linearmente da X) osservando le situazioni estreme in cui abbiamo combinazioni di Pxy per R2xy=0 e R2xy=1, possiamo scrivere: R2xy = …….libro Cioè come il prodotto dei coefficienti angolari delle due rette di regressione Y’ = B’o + B’1X’ e X’=a’o+a’1Yi, scambiando così il ruolo delle variabili => al crescere di R2xy, l’angolo interno delle due rette diminuisce fino a quando per le R2xy=1 si avrà B’1=1/a’1 e le due rette coincidono PROPRIETA’ DEGLI STIMATORI DEI COEFFICIENTI E DELLA RISPOSTA MEDIA …… VIDEOLEZIONE Per misurare la relazione lineare tra due caratteri X e Y, utilizzeremo la retta dei minimi quadrati, assumendo primariamente che sia X a influenzare Y Le relazioni che si creano tra due variabili X e Y saranno ti tipo deterministico o statistico => Y=f(X) y è una funzione di X Per esempio Così scriveremo che: B0 => intercetta B1 => coeff angolare , entrambe sono quantità costanti

DA TESI STATISTICA (selezione della variabile migliore) mod regr lineare: Lo studio statistico delle scienze economiche e della vita economica stessa, ha generalmente l’obbiettivo di analizzare, comprendere e prevedere l’andamento di un dato fenomeno. Per fare questo è di primaria importanza trovare un modello in grado di descrivere, per ogni popolazione o campione analizzati, le relazioni Nella vita economica e nello studio di questa materia, abbiamo spesso la necessità di individuare, tra le diverse variabili che compongono un dato fenomeno, dei legami tra i diversi valori. L’obbiettivo è quello di andare ad analizzare, comprendere e prevedere, il “come” e “perché” una data variabile, detta dipendente (o di risposta), varia al variare della variabile indipendente (o di domanda?). Nelle scienze statistiche questo tipo di analisi viene affrontata tramite il modello di regressione, in grado di creare e spiegare, visivamente e matematicamente, il fenomeno in questione, creando una funzione di regressione, capace di descrivere come e quanto varia una variabile al variare di un’altra stessa.