Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Analisi della Varianza e Correlazione: Esercizi e Spiegazione, Schemi e mappe concettuali di Statistica

Covarianza, correlazione, regressione lineare, analisi della varianza, correlazione parziale e tabelle di contingenza

Tipologia: Schemi e mappe concettuali

2020/2021

In vendita dal 01/12/2021

sabrina-biglioli
sabrina-biglioli 🇮🇹

2 documenti

1 / 13

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
covarianza
(
J
)
DIAGRAMMA
A
DISPERSIONE
M
-
-47
Province
con
3
indicatori
socio-Economici
misura
di
fertilità
istruzione
}
trovare
relazioni
tra
loro
occupati
in
agricoltura
Faccio
un
grafico
a
dispersione
agricoltura
e
fertilit à
associazione
positiva
(
Aureliano
Entrambi
)
#
agricoltura
e
istruzione
PIÙ
debole
PERCHÉ
DATI
associazione
negativa
Istruzione
E
fertilit à
non
concentrati
su
diagonale
covarianza
misura
la
forza
della
relazione
tra
DUE
variabili
coppie
di
dati
(
+1,41
)
.
.
.
(
n
,
4m
)
cov
(
×
,
4)
=
£
È
(
×
;
-
e)
(
Yi
-
Y
)
󲰛
E
arretra
:
coven
)
=
covfy
,
×
)
sorratazia
del
Prodotto
di
due
scarti
COU
Ha
valore
positivo
se
Hi
-
I
)
e
Mi
-
F)
sono
concorsi
Entrambe
variabili
valori
alti
o
Bassi
negativo
se
f-
i
-
e)
e
Hi
-
Y
)
solo
discorsi
una
variabile
valore
arti
,
l'
altra
Bassi
=D
SE
ti
-
E)
e
Yi
-
T
)
sono
un
po
'
Discorsi
e
un
Po
'
concorsi
(
no
relazione
proprietà
:
ÈÈ
cauti
=L
È
=
1m
È
Hi
-
È
=
>
Vare
)
>
O
COVA
,
×
)
=
vare
)
sempre
concorsi
(
COU
È
"
generalizzazione
"
di
var
)
d
a
se
×
;
-
E
sono
concorsi
󲰛
ca
cou
É
Grande
e
Positiva
misura
la
relazione
misura
variabilità
Di
due
variabili
di
singola
variabile
m
e
l'
Intensità
cova
,
-
D=
1m
È
=
-1M
(
×
:
-
E)
'
=
-
vasaio
7
con
più
Essere
raro
grande
a
causa
dell'
Elevata
variabilità
DEI
dati
stessi
Farcel a
per
il
calcolo
cou
(
×
,
4)
=
Èlite
)
-
se
xi-yi~raran.vn
=
#
È
-
e
'
mottetto
misto
Dim
:
1mF
,
Hi
-
e)
È
-
e)
=
In
-
È'
il
"
-
e)
-
ÈÈÈÈ
.
poniamo
I
1m
È
i
(
Yi
-
E)
=
%
È
,
illi
-
4-
'
f-
È
i
=
1m
È
illi
-
ect
pf3
pf4
pf5
pf8
pf9
pfa
pfd

Anteprima parziale del testo

Scarica Analisi della Varianza e Correlazione: Esercizi e Spiegazione e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!

covarianza

J

DIAGRAMMA A DISPERSIONE
M
Province con 3 indicatori socio-Economici

misura

di fertilità

istruzione

}

trovare relazioni tra
loro
occupati

in

agricoltura Faccio un grafico
a dispersione
agricoltura

e

fertilità

→ associazione positiva

(

Aureliano

Entrambi )

agricoltura

e istruzione PIÙ debole PERCHÉ DATI

associazione negativa

Istruzione E fertilità non concentrati su diagonale

covarianza

misura la forza della relazione tra DUE variabili

coppie di dati ( +1,41)

... (

n ,

4m

)

cov
×

,

=

£ È

(

×

;

e) (

Yi

Y

)

E arretra : coven )

=

covfy

,

×

)

sorratazia del Prodotto di due

scarti

COU
Ha valore
positivo se

Hi

  • I

) e Mi

F) sono concorsi → Entrambe variabili valori

alti

o Bassi
negativo se

f-

i

e)

e Hi

  • Y ) solo discorsi → una variabile valore arti

,

l'

altra Bassi

=D

SE

ti

E) e

Yi

T

)

sono un

po

'

Discorsi

e

un Po

'

concorsi (

no

relazione

proprietà

:

ÈÈ

cauti =L

È

=

1m

È

Hi

  • È

=

>

Vare ) >

O

COVA

,

×

)

=

vare)

sempre

concorsi (

COU È

"

generalizzazione

"

di var
d
a
se ×

;

  • E sono concorsi ca
cou É Grande e Positiva

misura la relazione

misura variabilità

Di due variabili di

singola variabile

m

e

l' Intensità

cova,

D=

1m È

=

-1M€

(

× :

E)

'

=

vasaio

7

con più Essere raro grande a causa dell' Elevata variabilità DEI dati

stessi

Farcela

per

il calcolo

cou (

×

, 4)

=

Èlite)

se

xi-yi~raran.vn

=

È

e

'

mottetto misto

Dim : 1mF

,

Hi

e) È

e)

=

In

  • È'

il

e)

ÈÈÈÈ→ .

poniamo

I

1m

È

i

(

Yi

E)

= % È

,

✗ illi

'

f- È

✗i =

1m È

✗illi - ect

⑥ trasformazioni lineari

se discorsi → IL SEGNO

di cov (v.

w )

vi

= di

bx

i Wi

=

aytbyyi

coup,

w )

=

bi

by cou (

×

, a)

È

Manso da cov (✗

i 4)

% È

,

(

vi

  • e)

(

Wi

E)

=

1m È

,

/

bxxi-H-b.FI/a-bu4i-Xu-byy-)-=f-m.&bx(xi-E)bu(4i-4-)--bxbu

1m È

,

Hi

E) (

Yi

T )

porto

fuori

varianza

aerea serra di

due

variabili

1... Xm

e

...

Un

→ INSIEME di

dati
Wi... Wn trasformazione

Wi

=

ti

Yi con te = Età

=

In

{

wi

=

In

¥

,

(✗ i - :)

=

%

È

✗i +

In

[ Yi = Età

÷

,

i

VALE CHE Vaz

(

w)

=

var

(

×

)

  • Var

y)

+ ZCOU

(

×

, 4)

POTREBBE
ESSERE minore di

Vara)

o var

y

Dim :

1M¥

(

wi

E)

'

=

f.

È

IÉÌTI

(

ÉÉT =

! È

lei

E)

lui -47T

=

M

% È

Hit

Hit

1M€

lui

¥

,

(

x :

E) (

Yi

= covlhi-couhtzcovlx.ie)

muro e massimo

della

covarianza : cov mai superiore a Prodotto Decon scarti Quadratici MEDI

sqm

A) sqm / 4)

E

cov

×
E

sqmlisqm (a)

/covate ) /

E

sqmlxlsqmlu )

Dim: E-

=

Sqm

(

× ) e Ou

=

sqm (a)

var

%)

= var

var

(E)

zcovfa.io?)=f--Y+1-;#+a.ocout-ie)---2(1t

÷

con

HH ) coulx.ie)

_

(

✗ μ) ,

oeo

,

ansiosamente Per
a

,

l'altra

Disuguaglianza
sempre 70
covarianza Max

:

cova ,

=

sqmlisqm(

n

)

covarianza nin :

cova , 4)

=

sama

sqm(

y

)

ponti allentati

covarianza una → Punti DISPERSI

METODO

DEI

muri Quadrati

vogliamo una formula in cui (volumi =

xp (

diametro

dia un risultato cerca ragionevole cappello : unica umore

f f

ragioniere

deve produrre delle buone previsioni PER i vanesi osservati :

fa

,

=

À

È

✗ ^

(Xr ,

Ya) →

=

I

+ pila

j

.

..

nel grafico delle osservazioni le rette ragionevoli sono allieve che passano tra i dati

identifico una rata la cui distanza

dai punti f- osservazioni)

sia la PIÙ Piccola possibile

m

III.

/

Yi

Bxi

) / trovare ✗ e B

Già rendono minima onesta sorratoria

no : non

si Ha

una risoluzione in

forma ESPUGNA

/

diventa

funzione

a. p

È

(

Yi

X -

BX;)

'

: metodo dei minimi avanzati

d'stanze di

ciascun Punto Dana Rata

,

elevate

di perdita

i Mln

al QUADRATO e poi sono tutte ONESTE Distanze

§ E? rinirizzo la serra Dean errori al Quadrato

i

= 1

Funzione di

perdita

£

,

È

=

rendono renren.ca

funzione di Perdita : (

à

, B)

= argmnlk.rs

,

B

l' unica soluzione

:

(

À

, B)

=

argy.iq

È

,

lui

  • a

Bxi)

'

Ó = è

pe

e D=

×

Varin

con

valli

>

o

comitato aria cov (resina cerare variabile

DIM :

HO Una funzione IN

DUE

variabili

,

SE

LO trovo il minimo di un valore per ogni valore fissato dell' altro parametro

,

Esso

viene attizzato mentro vocale : il minimo che si ottiene in corrispondenza di

un valore fissato aerei altro parametro

m

arguin

E

  • considero p

core costante

arguin

E lui

  • ✗ -

BXIÌ

Posto wi

=

Yi

pxi

aeri,

(wi

À

AGIR

i

t

Problema di minimizzazione

Il

valore rietro

di

pace

GIA visto con la media

Ils)

= %

?_?

wi

=

In ??

lui

Bxi

)

=

pe

Elevazione

è =

In CÈWI

(

la costante ✗ Deve ESSERE VT

)

lla

,

B)

Il

/

d'

(B)

,

B)

renz. Pessima originale

è maggiore

DIM

l

/

d' (B) ,

B)

gli

DIPENDE sono da

p

minimizza

gps

B-

arguin

l (

à

b

, B)

PER

2

È

[(

ui
  • it

)

B

(

✗ i

  • e)

]

'

=

È

,

[

wi

Bzi

]

'

l

(

à

b)

, B)

=

E Gi

àpo

)

pxi

]

=

È

lui

pe

BXÌ

=

i. e

¥

¥

È

IN

= a-

_

BE

(b)

=

S

÷,

2

wi

pz
  • Zi )

= -

È

,

zi

(

wi

Bz

)

=

È

,

(× :

E) [ (

y

;

Ù

)

Phi

I

) ]

gps

)

=

ÈIL

[

wi -

Bzi]

'

=

È

impongo derivata prima

=

O PER Punto

di

Massimo e mentro

g.

(b)

Èalx

:

E) [ (

:

  • ù ) -

Pixie

) ]

È

in

Hi

E) (

:

ù

)

  • È

Blxi

e)

'

io

i -

Ehi

e) te

:

ù

)

p §

,

:

= Ehi

e) Hi

ù

)

è

=

i "

vare)

"^

È

,

× :

ej

In

p

=

Couch

I RESIDUI

RESIDUI

ri

= differenza tra

i dati e la rata reale

ri = Yi

Itp

✗ i)

se ✗

e

B

tieniti grazie ai minimi avatar Proprietà : % È

" = °

(

le differenze si compensano

E

"

ri

=

È

,

Hi

  • I -

pixi

)

=

È

Yi

✗ i

=

MIT

BE)

npe

= O

n

÷

.

÷
Per capire SE il moderno può andare bene

,

i dati devono ESSERE molto vicini alla retta

,

varianza dei residui

: INDICE DI adattamento DEL modello SE varranno acceca

,

le

distanze dalla

retta piccole

var

r )

=

1m

È

,

ri

'

PROPRIETÀ:

^

°

°

SE
B.

= o sono

uguali

var

(r

E

una

y )

|

.

.

.

.

it

☐istanze

vari

"=MÈÈ

> un 1m ÈI

lui

  • a -

px

:/

'

= varia)

distanze

da

retta da 4-

dirette

minore PERCHÉ Posso fare

m

PIÙ

cose per minimizzare

1M€

,

/

Yi

  • I - È ✗ i)

! In FÉ

,

ri

'

= Var

(a)

Prima seconda costante

variabile variabile

a

m L L

② var

(r)

=

varie

_

È

varlr)

=

In §

,

[

lui

pixi )

Tpe )]

'

=

varie

_

pix)

=

varlz)

dove zi
    • Yi -

Biri

vare)

t

sostituisco il valore

pre

cov (

× ,

y)

sorta di

Val

è

uguale a

varhi-fivarlx-zpcoulx.ie)

varia

Vara

co

"

" )

"

var ,×,

☐ covey)

= varie

)

    • vk.nl

'

uaryy.vn#

  • 2
varia

coefficiente di determinazione

R

'

considerare il nostro indicatore E lo dividiamo per il suo massimo :

VARIN
maggiore È uguale a var

(4)

santamente :

uazlr

)

E

Vally) misura la reazione

vasta = valli

quando

coven

di varianza della

coefficiente di determinazione

: R' = 1-

vari

variabile y

spiegata la reazione : poco

si = I
  • OE
varia

dal roseo

SE

È

-0 :

varca

= var (

n

→ il roano non

spiega la risposta

versione standardizzata

della varianza dei residui

con

OE

R'

EI
SE

È

: var (a)

= o → coseno spiega perfettamente la risposta

R' = 1-

varlr)
cou (×

,

'

var

(y)

=

var

varia

= car

(

✗ ' "Ì :

Corr

-1 SE Punte animati residui e = o

correlazione spuria

correlazione spuria : Qualsiasi correlazione

positiva o negativa a cui non

è associata

nessun

negare di

Interdipendenza

dirlo

tra le variabili → la relazione con risvolti pratici

ci sono due motivi per

cui onesto può avvenire

I )

la Carr. spuria

È

dovuta aeieraeo di

una causa carine

E)

la cara .

Saima

È

dovuta acierfeto DEL caso avanza

È la probabilità che due variabili

casuali siano

LEGATE

positivamente?

Presenza di correlazione
non È

sufficiente Bassa

: ma abbiano rarissime variabili

E

PER stabilire rapporti di causa-Effetto Quasi certo l' esistenza DI correlazioni

  • correlazione
non implica causalità
  • causalità spesso implica correlazione

la

correlazione parziale CHE aiuta ad identificare correlazioni SPURIE

,

NECESSITA

di congetture

fornite da esperti

difficile identificare rapporti di causa

Effetto necessità di IPOTESI

ANALISI

della

VARIANZA

"

vogliono verificare la dipendenza di due variabili regressione lineare

: variabili continue

analisi Della varianza : una variabile continua e l'Altra OUAUTNTIUA

ls

. carne

e

calorie : dati bluastri

bovina parare

INIZIALMENTE
LE
STUDIO singolarmente

[

variabile carne e calorie sono intuitivamente

"

correlate

"

mista

Statistica descrittiva

/(

SE cambia tipologia di carne

cambia

ANCHE

media e MEDIANA )

voouaro avanti recare la correlazione tra le due variabili Canarie

v .

avanzatiUA

)

focalizzarsi sulle

tipo di carne

v. Qualitativa )

Differenti. tra MEDIE

4

Carr. Forte

← rotto =\

:

dipendenza in media

Corr

. debole

c-

Poca
=\

:

indipendenza

in media

K

K

:

uretra

di gruppi
M

= EMS

5=

nn

: Moreno

di osservazioni

Fred. Ass

is

:

osservazione

i - esima DEL gruppo g- eg, ra →

I

,

=

%

,

§

,

is

la media aritmetica di tutte

le osservazioni

DEL 5- Estro GRUPPO

[

=3 Bovina

mi

,

... K (in QUESTO caso

MISTA

Ma

= 17

pollame
M

>

)

i =

,

...

Ms

(

Free .

Ass

)

n

ASS.

PROPRIETÀ

: Ernie ,

=

1m

È × ; >

SE faccio la media di tti i dati

,

onesta
coincide con
la MEDIA

delle

MEDIE

1M

i -

varare

meno

5=

i "

Èy

PESATE con le rare.

Assolute
DEL GRUPPO
MEDIA PONDERATA DI

tre le MEDIE

M k Ms Sarro

gruppo

Poi aggiungo

1... 4m)

=

(

11

...

mal ,

12

... Xnaz

,

Xns

.. . Xm >

In €

=

In

E E ✗

is

Sarra gruppo 2

e infine 3

5=

i : 1

SI llllle Identificare un

indice

di

dipendenza

in

MEDIA

: MEDIE molto =\

dipendenza

forte

varianza aree

MEDIE DEI
Gruppi

(

si

Preferisce usare la devianza

)

M

devianza

= var

. n = o

m

= n. In

Ems (

es

e)

'

=

È

,

(

✗ i

e)

=

i. 1

la varianza tra i gruppi misura Quanto

LE MEDIE distano dal proprio cenno

Quanto le medie dei gruppi distano dalla MEDIA DENE MEDIE

TIPI

DI

devianza

k

k Ms

E {

is

① devianza entro i gruppi : Est Quanto i dati variano nel gruppo considerato

Den = E

di

>=,

÷ 5=1 ,

M

di

=

§ ,

(

is

È

varianza DEI

dati

di uno specifico gruppo : devianza der J
  • esimo gruppo
Quanto i

dati

variano dal

centro del

proprio
gruppo

TABELLE di CONTINGENZA

Descrizione Umuarama di variabili Qualitative unità
I

Quantitativa

quantitativa cosa

,

cou

...

già

vista

si voce capire relazioni tra due variabili dannate

antipatica

  • OUAEUTAMUA analisi della u)

grazie

a

studio di tabelle

DI contingenza = analisi congiunta /

contemporanea delle 2 varia.

I

prima ce Guardiamo singolarmente

distribuzione

di
FREQUENZA
marginale

=

Distribuzione
di neotenia

cenando Ho due

variabili

vogliamo vedere se È presente

correlazione tra

classe e Esito :

costruire tazza
di contingenza

(

tabella

a doppia

entrata )

H

fremente congiunte relative :

diviso

Penn Prima classe
  • salvato fremente
congiunte
Free. Più Alta

finiscono

le due variabili

)

( sonora

=

e)

PROPRIETÀ

:

a

te

① Mix

=

Emis

② Mis

= E mi

M =

Mis

i -1 ii. 1 5=

k

h

h k

④ Si

=

=

fis ⑤

=

=

Efis

Iis

Distribuzioni condizionate : a)

la

Distribuzione Di
✗ PER
uno specifico valore

di

4

= ds

a)

{

=

ds

b) la distribuzione di

4 Per
uno specifico umore di ✗

= Ci

ricondizionamento

restringe campo

DI analisi ad

b)

/

= ci

unknown

seleziono solo i dati

che Hanno una determinata caratteristica

)

I

oggetto

Evento a cui lei

d' analisi sto condizionando

distribuzione congiunta

: il

torero di osservazioni CHE presentano una modalità della
prima

variabile e contemporaneamente f- congiuntamente

)

ad una Modalità
della seconda variabile

Distribuzione condizionata : fremente della prima variabile solamente ( = condizionatarette )

PER
certi valori della seconda variabile

distribuzione

marginale :

Heon-TAE della prima
variabile

a

prescindere f- marginalmente

)

Dall'
Esito della seconda variabile

ls .

la

sopravvivenza

esito )

DIPENDE dalla classe in cui si viaggia C'È DIPENDENZA : ✗ DIPENDE DA 4
DIPENDENZA
DI
✗ DATO 4 =

La UARIAB.

✗ DIPENDE

DA

4 SE le distribuzioni condizionate

DI ✗

Dato 4 Sono

tra loro diverse in termini di

fr

indipendenza di
✗ DATO

: la variabile

× È
INDIPENDENTE IN DISTRIBUZIONE da 4 SE PER OGNI

SE tre

le

DISTRIBUZIONI i

= 1

...

ln vale che Mi 1

=.. .

=

Mi

=

... =

Mi "

condizionate sono

uguali

Mtn
Mts Mtk

IN termini di f.

Relative

Dove

mi >

È la

f.

relativa di Ci

nella distribuzione di ✗ condizionata a

= ds

Mts

PROPRIETÀ

:

se ×

E

indipendente dalla classe

,

allora le distribuzioni condizionate sono tutte uguali

① e pari Alla

distribuzione marginale di

×

(

onesto

PERCHÉ la variabile

non condiziona la

×

)

F. Margin.

f. congiunta

f

; + =

Mit

Ass .

Mi ]

f.

condizionata

di ×

M

=

Ma ,

M

. Campionaria

di una

f.

marginale generica marginale

dato y

= A Qualcosa

Dena × DELL' Altra variabile

SE

LE Free .

Condizionate

due

f.

condizionate solo = PERCHÉ

sono TUTTE uguali

Avvera anche

per

P

.

le uareab

. sono INDIPENDENTI

la marginale

È

uguale

1M : indipendenza implica :

mi>

'

Mag

.

=

Mi >

Mi >

'

= Mis

Mis

'

Mts

Nt 5

Porto

fuori ciò che

non dipende da

3

'

DISTR.

marginale

sorta f. concolor.

F. marginali

"

§

Mis Mis

'

"

Mxs

' Mi> M Mis

(

F. Marg

) f-+

=

Mit

=

In § ,

misi

=

In

÷,

ma >

=

Mi >

E

M

Mts

g.

,

M

=

Mts

M

=

M

  • s

= 1

= 1

② se × È INDIPENDENTE da 4

,

allora 4

È indipendente in

distribuzione da ×

indipendenza reciproca

( concetto simmetrico)

mi

m

=

f-

s

proprietà precedente

ma in

y

Mi

= - -. =

MHJ

=

Mt]

May ,

= ' -.

=

Mi ]

Mitt

INDIP

.

Recep .

&

; + =

>

Mm

M'

=

m

Mi >

= 8+

"

Mit

f. MIG.

( ST. CONDIZ .

DI 4

Dato ×

Indipendenza = assenza di relazioni

frequenze attese

supponiamo di avere solo distribuzioni marginali di ✗ e

Quali sono le

f. congiunte SE

✗ e

y
indie

(

unicamente determinate

)

mi

>

=

mi + Mis

dalle

F. marginali

M

FREQUENZE ATTESE : sono le free

.

congiunte CHE

È

lecito attendersi

sotto l' IPOTESI DI

INDIPENDENZA tra le variabili ✗ e

Y

^

Ànis =

Mit Mts

m

fis

=

Mi

>

lgitfts

m

DIPENDENZA tra

VARIABILI

IN

relazione tra

M

e È

→ un

pò forzato

N'

=

una variabile

continua e una Qualitativa Possibile solo

levando la Uariab.

'

= Entrambe variabili avannotti UE quantitativa

e Discreta

ls

. uova DEPOSTE

IN NIDI

di Pettirosso

confrontare

scacciare
lunghezza

Due variabili

ospite

wnatezzn.FI?-IaeYEpuIIene--nza

calcolo MEDIA ,

MEDIANA

(

e devianza standard )

il

calcolo

rapporto di

correlazione

nf

(

risultato : Forte dipendenza in

MEDIA

utilizzo strumenti delle tabelle di contingenza PER calcolare una connessione tra le due variabili

indice di connessione

'

: misura il anello

di

  • Analisi della varianza mi indica che

c'È dipendenza

IN MEDIA

dirrenenza ma dati e Messia è marcata )

DIPENDENZA

tra due

variabili

lo

guardo solo se le MEDIE sono =\

Indice ×

'

,

sta vantando invece la in

Dipendenza in distribuzione

di

dipendenza

PIÙ forte

: considero l' intera distribuzione e non

solo

la MEDIA PER verificare l' indipendenza

SE DUE
variabili

sono indipendenti in distribuzione

lo saranno

anche su Totti crei

altri aspetti

Questo comporta ate:

'

M

Ma non

viceversa urina

le

{

mi

> ds

LE

MEDIE condizionate 4-n.

m

,

condizionate a

✗= Ci

sono pari a

:

Ti

=

Mit

÷ ,

K

in caso di

indipendenza in

distribuzione sappiano che :

=

fts

:

Ti

=

ds