Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Distribuzioni di Frequenza: Caratteristiche e Misure - Prof. Viroli, Schemi e mappe concettuali di Statistica

Una panoramica dettagliata sulle distribuzioni di frequenza, una rappresentazione statistica dei dati qualitativi o quantitativi. Vengono presentate le modalità di calcolo delle frequenze assolute, relative, cumulative, medie, medie armoniche, geometriche, aritmetiche, posizione, variabilità, concentrazione di gini, indice di coesistenza, indice di derivazione, indice di conangenza quadrato, indice di ditchuprov, indice di correlazione lineare, indice di covarianza, indice di devianza totale di y in devianza di regressione e devianza residua. Vengono inoltre spiegate le proprietà delle medie aritmetiche, la scomposizione della devianza, l'indipendenza in distribuzione e in media, la regressione lineare e le misure di distanza dalla indipendenza in distribuzione e in media.

Tipologia: Schemi e mappe concettuali

2022/2023

Caricato il 13/02/2024

anitacurina
anitacurina 🇮🇹

4.5

(2)

10 documenti

1 / 7

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
DISTRIBUZIONI
DI
FREQUENZA
hi
=
FREQUENZEASSOWE
,
H
=
=
=
ehi
,
k
=
numero
di
modalità
del
carattere
fi=
FREQUENZE
RELANUE
,
i
=
2
fi
=
1
Ni=
FREQUENZE
ASSOWT
CUMUIATE
,
Ur
=
i
=
1
hi
=
n
Wi=
AMPIEZZA
DEUA
CIASSE
=
bi-Ri-1
ni
Fi=
FREQUENZE
RELATUE
CMULAT
,
FR=
1
Ri
=
DENSITA
DELIA
CLASSE
=
Wi
RAPPORTI
·
Di
composizione
(diparte
al
tutto)
:
Mahmat
n
Gemmine
·
DI
COESISTENZA
/relazione
tra
die
modalità)
:
n
maschi
ri
nate
in
un
anno
·
DI
DERIVAZIONE
/Genomeni
di
flusso
in
cambiamento)
:
quoziente
di
popolazione
ad
inizio
anno
:
natal
VALORI
DI
SINTESI
calcolabile
per
-
ere
·
MODA
:
la
modalità
a
si
corrisponde
la
frequenza
(assoluta
o
relativa
massima
·
ogni
carall
·
MEDIANA
:
Il
valore
de
occupa
il
valore
centrale
nella
successione
ordinata
dei
valori
,
a
e iuerra attri
quantitativi
·
senédispari
:
Att
,
se
ne
pari
:
e
+1
&
-
Nirz
·
per
classi
intervallari
:
trow
la
classe
mediane
,
Xen
Xi-et
ni
(Xi-Xie
·
PERCENTE
,
QUARTUE
e
TRZilE
:
valori
che
coincidono
con
un
certo
frazionamento
,
generat
zighed
e
solo
per
caratteri
MEDIE
-
quantital
-
MEDIEPOTENZIAT-P I
=
I
-
vi
DI
ORDINE
P
n
x5
·
MEDIAARITMEMA
:
N
=
1
=
1
n
·
per
distribuzioni
di
frequenza
:
=
=
=
~
X
:
fi
~
K
k
p
=
1
per
distribuzioni
per
classi
:
=
i
=
2
Xi
-
hi
=
=
=
2
Xifi
,
con
Ni
walore
centrale
delle
dasse
n
1
·
MEDIA
ARMONIC
:
-1M(x)
=
_
=
=2
in state
utilizzato
per
·
fenomeni
di
tempe
sp
=
=
1
conserva
l'identitai
del
prodotto
utilizzato
per
Genomeni
di
·
MEDIA
GEOMERICA
:
oM(X)
=
(X)h
:
Zin
·
perfenomeni
in
progressione
I
natura
moltiplicativa
-
<p
=
0
·
2
si
Di
-
1/2
L
·
MEDIA
QUADRAMA
:
2M(x)
=
i
=
1
n
=i
=
~
!
2 fi
-
-
<p
=
2
MISURE
DI
VARIABILITA
calcolabili
per
tutt
i
caratteri
-I
01-1
·
INDICE
DI
GINi
Omogeneità
:
01
=
i
=
1
Ozt
,
11
,
normalizzato
:
Or
=
K
.
k
-
1
K
.
E
·
eterogeneità
:
Es:
=1
bi
,
Est
!
O
,
-
,
normalizzato
:
Es
=
n
-
1
-
e
gete
·
INDICE
DI
SHANNON
comogeneità
:
02
=
.
Gilagfi
,
Ozt
.
log
,
o
normalizzato
:
De
I
·
eterogeneitei
:
Ec
=
-i
=
bi.logfi
,
Eat
O
,
logt
.
normalizzato
:
Es
=
loge
scostamento
di
k
23
PSm
=
P
=
=
2
MISURE
DI
VARIABILITA'
PER
CARATTERI
QUANTTATVI
ordine
polam
n
-mP
_
Pi
=
2
Xi
-m/P
.
ni
SCOSTAMENTO
SEMPLICE
·
MEDIO
DAUA
MEDIANA
:
S="Xs-Med
,
i
=
~
Xi-Med
ni
n
n
-P
=
1
,
m
=
mediana
DEVIANZA
SCARTO
QUADRATCO
DEVIAZIONE
n x5
-
X
2
/Xi-212
.
ni
.
Se
MEDIO
STANDARD
i
8
:
J
=
1
n
I
i
=
1
n
p
=
2
,
m
=
media
FORMULA
CALCOLATORIA
~
il
numeratore
si
chiama
DEUIANZA
n
·
la
devianza
fratton
sichiama
VARIANZA
:
8
=
=
(25
-
1)2
I
S
=
*
-
x
n
2 M2(
*
)
FORMULA
DEFINITORIA
PROPRIETA'
DINNASSOCIARVITA
I
SCOMPOSIZIONE
DELIA
DEVIANZA
:
DEUTOT=
DEVENTRO
DEURA
g
=
1
=
148(Xsg
-
2
=
-
sg-g)
+
geng (xg-
x
COEFFICIENTE
DI
VARIAZIONE
sindice
adimensionale
usato
al
fine
di
fare
confront
:
c
.
V
.
=
&
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Distribuzioni di Frequenza: Caratteristiche e Misure - Prof. Viroli e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!

DISTRIBUZIONI DI FREQUENZA

hi

= FREQUENZEASSOWE , H^

=

= ehi , k = numero di modalità del carattere

fi= FREQUENZE (^) RELANUE , i= 2 fi =^1

Ni= (^) FREQUENZE ASSOWT CUMUIATE (^) , Ur

= i = 1 hi

= n Wi= AMPIEZZA DEUA CIASSE = bi-Ri-

ni Fi= FREQUENZE (^) RELATUE CMULAT , FR= 1 Ri^

= DENSITA DELIA^ CLASSE

= Wi

RAPPORTI

· Di composizione (diparte altutto)^

: Mahmat

n Gemmine · DI COESISTENZA^ /relazione tra die^ modalità) : n maschi ri nate in un anno

·DI DERIVAZIONE /Genomeni di (^) flusso in cambiamento) : quoziente

di popolazione

: ad (^) inizio anno nataltà

VALORI (^) DI SINTESI

calcolabile per

  • ere · MODA :^ la modalità a si corrisponde

la frequenza (assoluta^

o (^) relativa massima · ogni

carall

· MEDIANA :^ Il^ valore de^ occupa

il valore (^) centrale nella successione (^) ordinata dei valori ,^ ae iuerra attri

quantitativi

· senédispari

: Att ,

se ne pari : (^) e

&

  • Nirz

·per

classi intervallari

: trow la^ classe mediane , Xen Xi-et ni

(Xi-Xie

· PERCENTE , QUARTUE e TRZilE (^) : valori che coincidono con un certo frazionamento

, (^) generatzighed

e

solo per caratteri

MEDIE

  • quantital - MEDIEPOTENZIAT-P I= I

vi (^) DI ORDINE P n x · MEDIAARITMEMA

: N

= 1 =^1 n^

· per distribuzioni di frequenza :

=

= ~^

X (^) : fi

~ K k

p

= 1

per

distribuzioni per

classi :

= i = 2

Xi

  • hi = = = 2 Xifi^ ,^ con^ Ni^ walore^ centrale^ delle^ dasse n

1

· MEDIA (^) ARMONIC: -1M(x) = _

=

in state

utilizzato (^) per · fenomeni

di tempe

sp =^ = 1

conserva l'identitai^ del prodotto utilizzato (^) per Genomeni^ di · MEDIA (^) GEOMERICA

: oM(X)

= (X)h

: Zin

·perfenomeni^ in progressione

I natura moltiplicativa

n - 1 minimo

: 0

J= 1

CONCENRAZIONE DI GINI

·

Pe deter^ i R

=

(P

    n - 1

pj

n

  • 1

pj

MASSIMO

: 3 =^1 I

= (^1) -

Us=^ la^ cumulata (^) fino a 5 dell'ammontare

del carattere^ posseduti date (^) IUnita

  • = n

· pg =

diciamo che^ B^ e^ indipendente da^ A se tutte^ le^ distribuzioni^ condizionate^ di corrispondenti

alle

CONNESSIONE

S modalita (^) di A sono simili fra loro (^) , ossia hanno frequenze

relative uguali

uA

· INDICE CHI QUADRATO

: 22

= i = 2

Cha-nial"

s

D ,

  • &^ i = 2

Di ,

= (^4) Ri . 0 . No , h

ne

i

1n

· INDICE DI^ CONANGENZA^ QUADRATCO^

: U = & E

0 , U-1)(V-1)-

· INDICE DITCHUPROV

: T

=

-> 10 , 2 :

INDIPENDENZA IN MEDIA

quando almeno un carattere è quantitativo

· I e indipendente in media da A se la media dix^ non varia al^ variare di A

U

· MEDIE PARZIALO CONDIZIONATE

: Es

= i =

:- hi,

a

= i= 2

Ri. Dich

· v

= i = 2

bi-Dir

no , 1 noch^ no , v

a Xi . Di (^) , 0

·MEDIA (^) GENERALE : X

= i = 1 n

·INDICE G

=

Be dove^ DEU .TOT=

i =

"

(xi-E) . ni (^) ,

,

DEU (^). RA= h=^ =" -e) oh ,

DEV . ENRO = i = e"a=

(Xi-ka) . Di ,

↓ ↓

st

0 , 11

se na a zero c'è^ se^ na^ azero^ c'è

indipendenza

massima dipendendenza

CODEVIANZA

: misura se die (^) Genomeni hanno relazione diretto o inversa

(0d(x, b)^

=

==

2 s

  • x) y - y)

= 3 =

  • (^) n. xy

FORMULA DEFINITORIA FORMULA CALCOLATORIA

REGRESSIONE LINEARE due caratteri

quantitativi

· yj = bo+b1X5+ (^) es ->^ PUNT OSSERVAT

L

sta

·

y*^

= bo+b2xs < (^) PUNTORIC

A variabile^ esplicativa

variabile rispo

· indipendente o dipendente

CODEUCX , y)

COVAR(X , y) · bo

= 5

  • b1x

· b

= DEV(x) VAR(X)

·

=

es

= 0

m^ -

yj

2 I

n

(^45) -y-

2

scomposizione

della devianza (^) :

Y-yc = I

= 1

    • 21 j=^1

y

  • y -s

Ys- y I = 1 DEV

. REG = bI . DEVE ↓ ↓ N

DEV TOT DEU REG DEVDISP

indice

di

determinazione lineare (^) : R^

=

DEVREG

= 1-

DEV. DISP

  • ->^ e

indipendenza massima (^) dipendenza

· indipendenza in^ distribuzione implica indipendenza^

in media , Indipendenza

in media

implica indipendenza

lineare, il contrario (^) non è vero !

INDICE DI^ CORRELAZIONE V^ :

CODEV (X^ , y) COVAR(X^ , y)

verevaris"

= R =

V br =

=

DEVEDEr(y) be^ r (^) -ti 1 ,

1

v = - 101 se^ tutt^ , (^) punt sono^ sulle^ retta^ e^ R^

= 1

r

= br

= R =

DEV. REG

v

= 0 Se R

= 0 DEVY

2 PROF. CINZIA VIROLI

  1. Propriet`a della media aritmetica

(1) Identit`a di somma:

P

n

j=

x j = nx¯

(2) Nullit`a della somma degli scarti dalla media aritmetica:

P

n

j=

(x j ¯x) = 0

(3) Minimo della somma degli scarti al quadrato: P n

j=

(x j x¯)

2 = min

(4) Associativit`a (per dati raggruppati):

¯x =

G X

g=

¯x g n g

n

x¯ 1 n 1 +... + ¯x G n G

n

(5) Equivarianza della media aritmetica rispetto a trasformazioni lineari (translazioni a e cambia-

menti di scala b):

x

j

= a + bx j ) x¯

⇤ = a + bx¯

  1. Misure di variabilit`a

Caratteri qualitativi (o categorici)

  • Eterogeneit`a di Gini E 1

P

k

i=

f

2

i

(valore minimo 0, valore massimo 1 1 /k)

  • Entropia E 2

P

k

i=

f i log f i (valore minimo 0, valore massimo log k)

Caratteri quantitativi

  • Range xmax xmin
  • Range (o di↵erenza) interquartile: Q 3 Q 1
  • Somma dei quadrati degli scarti dalla media aritmetica o devianza

Dev(X) =

n X

j=

(x j x¯)

2

n X

j=

x

2

j

n¯x

2

  • Varianza

V ar(X) = s

2

x

Dev(X)

n

  • Deviazione standard o scarto quadratico medio

SD(X) = s x

p

V ar(X)

  • Devianza per una distribuzione di frequenza

Dev(X) =

k X

i=

(xi x¯)

2 ni =

k X

i=

xi

2 ni nx¯

2

  • Varianza per una distribuzione di frequenza

V ar(X) = s

2

x

n

k X

i=

(x i x¯)

2 n i

n

k X

i=

x i

2 n i x¯

2

k X

i=

(x i x¯)

2 f i

k X

i=

x

2

i

f i ¯x

2

  • Deviazione standard o scarto quadratico medio per una distribuzione di frequenza

SD(X) = s x

v

u

u

t

n

k X

i=

(x i x¯)

2 n i

v

u

u

t

n

k X

i=

x i

2 n i ¯x

2

v

u

u

t

k X

i=

(x i ¯x)

2 f i

v

u

u

t

k X

i=

x i

2 f i x¯

2

  • Coeciente di Variazione

CV =

s x

x ¯

STATISTICA I FORMULARIO 3

  • Indice di concentrazione di Gini

Un carattere quantitativo e trasferibile X e detto equidistribuito se tutte le n unita statistiche

possiedono lo stesso ammontare del carattere della variabile X, che `e x j = ¯x per ogni j. Un

carattere X non equidistribuito `e detto concentrato. La situazione di massima concentrazione

si ha quando una singola unit`a statistica possiede l’ammontare totale del carattere e le altre

unit`a non possiedono nulla, ovvero x (1) = x (2) = · · · = x (n1) = 0 e x (n)

P

n

j

x j , dove x (j)

indica il valore di X per la jsima unit`a statistica nulla successione ordinata crescente delle n

osservazioni.

Se x (1)

  • x (2)
  • · · · + x (j) e l’ammontare del carattere X posseduto dalle prime j unita pi`u

povere, q j = (x (1)

  • x (2)
  • · · · + x (j) )/nx¯ `e la corrispondente proporzione dell’ammontare totale.

Indicando con p j = j/n la frequenza relativa cumulata delle prime j unit`a statistiche, l’indice di

concentrazione di Gini `e definito come

R =

P

n 1

j=

(p j q j

P

n 1

j=

p j

Poiche il denominatoree il valore massimo che teoricamente il numeratore pu`o raggiungere (nella

situazione di massima concentrazione) R pu`o essere considerato come un rapporto di parte al

tutto e pertanto varia nell’intervallo [0 1]: `e 0 nel caso di equidistribuzione e 1 nel caso di

massima concentrazione.

  1. Scomposizione della devianza
  • Per dati suddivisi in gruppi, la deviazione totale dalla media di un carattere quantitativo X si

scompone nella devianza entro e devianza tra:

Dev(X) = Dev(X) Entro

  • Dev(X) T ra o equivalentemente in inglese T SS = W SS + BSS

Dev(X) Entro

= W SS =

G X

g=

ng X

j=

(x jg x¯ g

2

G X

g=

s

2

g

n g

Dev(X)T ra = BSS =

G X

g=

(¯xg x¯)

2 ng

dove n g e s

2

g

sono la numerosit`a e la varianza del gruppo g-simo.

  1. Misure di associazione fra due caratteri

Data una distribuzione bivariata

b 1... bh... bv

a 1 n 11

... n 1 h ... n 1 v n 10

a i n i 1

... n ih ... n iv n i 0

a u n u 1

... n uh ... n uv n u 0

n 01

... n 0 h ... n 0 v n

possiamo misurare l’associazione fra i due caratteri come distanza da una data struttura di indipendenza.

Indipendenza in distribuzione

Due caratteri A e B (quantitativi oppure qualitativi) sono detti (mutualmente) indipendenti in di-

stribuzione se le loro distribuzioni condizionate sono simili fra loro e simili alla marginale:

n ih

n 0 h

n i 0

n

STATISTICA I FORMULARIO 5

  • Coeciente angolare ed intercetta della retta di regressione:

b 1

Codev(X, Y )

Dev(X)

s xy

s

2

x

b 0 = y¯ b 1 x¯

  • Codevianza

Codev(X, Y ) =

n X

j=

(x j x¯)(y j y¯) =

n X

j=

x j y j nx¯y¯

  • Covarianza

Covar(X, Y ) = s xy

P

n

j=

(x j x¯)(y j y¯)

n

P

n

j=

x j y j

n

x¯¯y

Inoltre, nel contesto della indipendenza lineare, le quantit`a seguenti giocano un ruolo importante:

  • Coeciente di correlazione lineare

r =

Codev(X, Y )

p

Dev(X)Dev(Y )

s xy

sxsy

p

b 1 yx b 1 xy = b 1

s x

sy

  • Scomposizione della devianza totale di Y in devianza di regressione e devianza residua o di di-

spersione

Dev.Reg =

n X

j=

(y

j

y¯)

2 = b

2

1

Dev(X)

Dev.Disp =

n X

j=

(y j y

j

2

n X

j=

e

2

j

Dev(Y ) = Dev.Reg + Dev.Disp

  • Indice di determinazione lineare

R

2

Dev.Reg

Dev(Y )

Dev.Disp

Dev(Y )

= r

2