Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica - Formulario del Corso, Schemi e mappe concettuali di Statistica

Formulario e appunti sintetici dell'intero corso di Statistica dell'università Bocconi, corso Cleam. Sono presenti tutte le formule da sapere e tutte le definizioni importanti. Esame superato con 27/30

Tipologia: Schemi e mappe concettuali

2021/2022

In vendita dal 10/11/2022

AleIsi
AleIsi 🇮🇹

5

(2)

5 documenti

1 / 51

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
FORMULARIO
-
Statistica
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33

Anteprima parziale del testo

Scarica Statistica - Formulario del Corso e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!

FORMULARIO - Statistica

Distribuzione di^ Frequenza

Sia ✗^ una variabile statistica^ e siano

✗ (^1) , ✗ (^2) ,^ ✗^ } (^) ,.^.^ - ,^ ✗^ K

le K^ modalità distinte di ✗ osservate negli n dati

Si definisce , con i = 1,2 , 3 ,.... K

Fi (^) = (^) Frequenza Assoluta^ della i^ - esima modalità = num di^ volte (^) per cui^ ×^ ; si^ ripete nei dati e Pi =^ Fr^ { ✗^ =^ ✗^ i (^) } = È = Frequenza Relativa^ = = (^) proporzione per cui Xi si (^) ripete nei^ dati la distribuzione di^ frequenza è una tabella^ che^ raccoglie le^ K modalità distinte e le^ corrispettive frequenze (^) , compresa la^ frequenza cumulata (^) : la i^ - esima (^) frequenza cumulata è (^) : i Fi (^) = Fr (^) / ✗ (^) i (^) } = ÷, B- =^ Peso^ congiunto delle^ prime i^ modalità Proprietà Assolute (^) : Relative Cumulate :

  • Q E (^) Fi C- (^) N • Of (^) Fi 41
  • i.
ti = n • Fo = 0 , Fu = 1 Vale solo se su scala
  • Fi. . E^ Fi^ ordinate^ o^ superiore Relative (^) :^ • Pi = (^) Fi - Fi-
  • ospiti
  • Pi = 1

Rappresentazione Grafica

Istogramma

serie di^ rettangoli tali^ che l'^ i. esimo

rettangolo abbia^ :

  • Base l' (^) i - esima classe
^ Area

uguale alla^ frequenza^ relativa^ della^ i^

  • esima classe pi ' altezza (^) = Ci Curve delle (^) frequenze cumulate

È la Funzione

, per^ ogni ✗^ sull'asse^ : FAI = Fr^ { ✗^ <^ ×^ } = (^) Frequenza Relativa^ di^ valori^ osservati (^) < ✗ Proprietà :

  • 0s

FINE 1

  • FAI = o se ✗ < (^) ✗o
  • FA
) -1.^ se^ ✗^ JXK
  • FLUFFY) se ✗^ i
  • FIX) =^ Fi (^). ,^ +^ li ' H - Xi. )^ >
Ci
  • Fr la <^ ✗E (^) b) = Flb)^ - Fla)

Dipendenza statistica Tabella (^) di Contingenza

  • Ottenuta classificando le unità (^) statistiche sulla (^) base delle coppie di modalità di^ ✗ (^) e Y Fi,^ - = (^) Frequenza assoluta^ congiunta della^ coppia Hi (^) ; %-) = num (^).^ di^ unità^ che^ presentano (^) congiuntamente ✗^ =^ ✗^ i e^ ✗^ = Yi Proprietà

Off is t n

is Fit^ =^ N

Distribuzioni (^) Marginali

(Determinabili^ dalla^ tabella^ di^ Contingenza)

Di = totale della i. esima riga = num . unità con ✗ = ✗ i

G- =^ Totale^ della^ J-^ esima^ colonna^ =^ num^.^ Unità^ con^ A-yt

Proprietà :

  • 0s Rif n
  • (^04) G- In Frequenze relative^ congiunte : pi,
  • = fitn.fr/X=xi.Y--Yi }^ =^ Frequenza^ Relativa (^) congiunta di (^) Hi (^) ; %) Frequenze subordinate^ :
  • di Y data X Fit (^) = Fr (^) / l'= (^) A / ✗= ✗ (^) i (^) } = (^) proporzione di unità (^) con A- (^) Ys nel (^) sottogruppo di Ri

quelle con^ ✗^ =^ ✗i

  • di
✗ data Y

Fit (^) = Fr (^) / ✗ (^) = ✗i / Y (^) } = (^) proporzione di unità (^) con ✗ = (^) Xi nel G- sottogruppo^ con^ E-%.

Proprietà :

  1. E (^) lo (^) μ) è^ il minimo di^ L^ (a) = E^ i Hi - a) 2

2) la^ somma^ delle^ deviazioni^ dalla^ media^ è^ nulla

3) la^ media^ preserva il^ totale^ :^ ne = i ✗i

4) ninfe^ E^ Max

5) Se Yi = a + bx;^ - > I = a +^ be
6) Monotona^ in^ ciascuno^ degli argomenti ,^ se^ ✗^ i aumenta^ ,^ E^ aumenta^.

Media Ponderata^ :

la media ponderata dei K valori di X

,

con pesi

V1 (^). Uh,... μ,^ è^ : K I (^) = ii. Wi^

  • (^) ✗ (^) i K in Wi
Media di una distribuzione di

Frequenza

  • Numerica

Discreta :

Wi-Fi →^ L ' iii. ✗i Wi (^) -^ - pi '^ i= , Pi '^ ✗i

  • Numerica in^ classi 4 Mi (^) =^ (✗^ in^ + (^) Xi) a

→ I^ =^ %^ È.fi^

'

mi = ii. Pi ' mi

Mediana la (^) mediana (^) degli n valori osservati è (^) il valore letale che : Fr (^) { ✗^ E Me (^) } > (^) 0.50 e Fr {

✗ ZME / 70.

% dati d^ % di dati^ sopra Me sotto Me yYIE.io ordinati decrescenti Me (^) = {

Inuit se (^) n (^) dispari ✗ 10.5. n)

¢0.5 -^ ni^ -11) se n

pari 2 Mediana (^) per distribuzione di (^) frequenza Numerica (^) Discreta

Me è il primo valore le^ cui frequenze cumulate sono 70.

Numerica in classi : Me è il valore che soddisfa^ : (^) FIMe) = 0. In (^) più : se (^) ti (^) -140.50 sti → Me (^) = (^) ✗i. ,

0.5 -^ Fi-

Ci

Boxplot

Utilizzo dei b- numeri di sintesi

Ò ' min Ù^ , m'e Ù (^) } Max Criterio di Individuazione (^) degli Outlier 2 Estremi (^) , IQR (^) = Q (^) }^ - Qi

L =

Qi

    1. b- • IQR
L = Q} +^ 1.5^.^ IQR

un valore ✗ (^) i è un outlier (^) se ✗ (^) i ¢ [t (^) ;D Q,

  • minimax - Q } { Me - Qui a^ } - me - > Distribuzione

ne et^ simmetrica

Q,

  • min ( Max^ - Q } { Me - Qi < Q^ } - me -^ >^ Distr. Asimmetrica positiva
me < I

Q,^ -^ min^ >^ Max^ - Q} , Distr (^). Asimmetrica negativa {

Me - Qi )^ Q } - me
ne > F

Robustezza :

Una (^) misura di (^) sintesi si dice (^) robusta se non risente in modo (^) significativo di (^) cambiamenti in una porzione limitata dei valori^. Es :^ Moda^ e^ Mediana^.

Misure della variabilità (^) o (^) Dispersione campo di^ Variazione ampiezza dell'^ intervallo^ che^ contiene^ tutti^ i^ dati R (^) = Max - min Non (^) Robusta Differenza (^) lnterqvartile ( IQR ) Ampiezza che^ contiene^ il^ 50%^ Centrale^ dei^ dati

IQR .^ - Q }

  • Q , Robusta

Varianza :

Popolazione Campione^ :

O'

=L ii.^ Hi^

  • μ ' s' = (^) % ' in Hi - È =L ii.^ ✗^ i^

μ ' =L, [%^ ii.^ Hi^

È =L, IL :X, ? (^) - (^) È }

Scarto Quadratico Medio /Deviazione standard

Popolazione Campione O (^) = (^82) =^1 N μ i (^) -1 ( Xi

' 5=5 (^) = [ , i^ :( ✗ (^) i - FÌ amore mio sei bravissimo ma

Numerica in^ Classe Popolazione : Campione 62= " (^2 ) " μ iii. ( mi - μ)^ " S =p. , i.→ Fi - ( mi -^ IÌ " n "

= i. ipi

. / Mi -

μ)^

"

=p , i.^ ipi^
  • ( mi - È " n = (^) i. Piim?^ - μ '

=p, pi.tn

2 Disuguaglianze di^ Chebychev

Siano μ e o media^ e deviazione standard . Sia K^ > 1

E /

μ

  • Kotkin
Ko

} Etti Regola (^) Empirica : Fr (^) /

μ -6s^

✗ E

μ (^) -181=0. Fr (^) / (^) μ -26^? ✗^ E (^) μ -^ }

Fr (^) / μ -384K. (^) μ -136^ } -50.

Analisi Bivariata Diagramma a^ Dispersione la i^ - esima unità nel^ set (^) è un (^) pt. di coordinate^ (Xiii )

nel piano cartesiano .

Misure delle relazioni lineari

covarianza Popolazione 1 N 1 "

Oxy = μ in Hi^

  • th)^ Hi^ -^ M)^ su = n , i , Hi^ -^ E)^ Hi^ -^ t) 1 N I 1 n = μ in^ Xi' Yi

Nim n.it^ in^ Xi'Yi^

- FI

) Coefficiente di^ Correlazione lineare Popolazione (^) Campione fxy = ÓXY (^) rxy = SXY

G. A sx^
  • Sy -1 (^) E fatt

Media (^) Campionaria : si consideri (^) un (^) campione casuale^ di^ ampiezza n da^ una popolazione di^ media^ μ , e varianza si '

allora la^ Media^ Campionaria

I (^) =L ii. ✗i = (^) E (^) (E) = μ

o

e (^) Var (^) [E^ ]. -^ ° ' a- ' (^) der

.^ Std^. =

in

= errore standard

se il

campionamento è^ SZ^.^ Remissione^ e^ n^ >^ 0.^

. N Var (^) (E) = 0 ' (^) N - n n ' N -^1

Distribuzione della media campionaria :

Popolazione Normale

F preso da^ una^ popolazione normale^ ha^ a^ sua^

volta

una distribuzione^ normale :

Inn (^) / μ ;^ Il

Teorema del^ limite centrale^ :

si consideri un^ campione casuale di^ ampiezza n da^ una (^) pop.

arbitraria con media μ e varianza 62. Sia h sufficientemente

elevato (^) , allora (^) : Frank (^) ; Il

Popolazione BernoulliCina

si consideri un^ Camp casuale di^ ampiezza n da una pop.^ bernoullicena

di parametro

p ,^ apri^ , media^ μ =p^ e^

O'

=p ftp.

Sia n.ph- p) >^9 , allora :

Fan (p ; NÈ)

In Sintesi

, preso un^ campione^

di ampiezza n^ : Pop Normale^ >^ In^ N(^ μ; %) Pop.^ Arbitraria^ >^ Fan^ ( (^) μ ; [^ )

( n^ suff.^ elevato)

Pop.^ Bernoulli^ una^

(^) Fin (p (^) ;P" (^) ) se (^) npltp) >^9 in

2 " PARTE (^) DEL CORSO (^) ( lezione a)

Come usare dei Dati

per

trarre conclusioni sulla Popolazione?

Stima Puntuale^ >^ Fornisco^ un^ valore^ stimato

stima Intervallare >^ Fornisco^ un intervallo di valori plausibili

Verifica d' Ipotesi >^ Verifico^ la^ ragionevolezza di un' ipotesi su un parametro

Previsione >^ Fornisco un valore

approssimato per un^ valore^

futuro

STIMATORE e STIMA

Uno (^) stimatore T (^) è una statistica (^) campionaria (una (^) var. aleatoria)

funzione del campione casuale , usata per stimare un parametro 0

della (^) popolazione :

T = the

..^.^. , Xn^ )

Una stima t^ è il valore assunto dallo stimatore T^ in corrispondenza

di una specifica realizzazione^ campionaria.

Esempio n (^) = 6 Valori^ osservati^ ( ✗ (^1) ,.... ✗ (^) g) (^) = (^) (5. (^) 5,8. 2,71 (^) , 9.1 (^) , 8.3 (^) ,^ 13.5)

stimatore di

μ Stima^

di

μ con : 1 g

✗i >^ 8.

con : Me >^ 8. con : Q^

  • (^) Q } >^ 8. 2

Osservazioni

  • Più (^) stimatori

per

lo stesso

parametro

  • Per sapere qual'^

è il^ migliore serve conoscere 0

  • Vanno valutati in base al metodo ,^ le^ sue^ proprietà sono

sintetizzate nella^ Distribuzione campionaria dello stimatore

Valutazione (^) degli stimatori :

Non Distorsione :

Uno stimatore T^ si^ dirà^ non distorto^ per un parametro 0 se

vai (^). Atteso < (^) [ (^) [T ] =^ O^

V

di T centro della^ distribuzione

campionaria

Distorsione (^) : (^) Dtt) (^) = (^) EIT) -^0 ,^ se^ non^ distorto (^) Dtt) = 0

Non Distorsione asintotica :

Uno stimatore T si dirà asintoticamente non distorto

per un^ parametro^

0 sei EIT]^ >^ O^ quando n^ >^ +^ a^ te 0 DIT )

(^) O quando n^ >^ +^

co to