

Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Schemi di formule di statistica
Tipologia: Formulari
1 / 2
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!


(n)
x
n
x
n
i= 1
x
i
n
i= 1
x
i
n
i= 1
x i
n
i= 1
x i
n
i= 1
x
i
n
i= 1
x i
n ∑
n
i= 1
x
i
x
−λ x
(x 1
,...,xn )
n
i= 1
−λ x i
(x 1 ,...,xn )
n
i= 1
i
δ log L (x 1
,...,xn )
(λ )
δ λ
n
λ
n
i= 1
i
n
n
i= 1
x i
x
n
i= 1
x i
n
n
n
i= 1
x i
n
n
i
n
i= 1
(x i −x)
n
c
n
i= 1
(x i −x)
n− 1
c
i
σ
n
nσ
n
σ
n
x−μ
n
n− 1
α
2
n
n
z
x
n
Tn
nπ
n+ 1
n
2
x
n
n+ 1
2
n
n
n
n− 2
i
i
i
r
i
f i
i
n 6 i
n
r
i
n 6 i
i
i,k
j
k
r
i,k
f i,k
n
j,k
r i l
r
j
l
k
j,k
r i l
n
i= 1
x i
n
imax
imin
n
n
i= 1
i
n
n
i= 1
i
n− 1
n
i= 1
i
k
i= 1
i
i
n
n
i= 1
i
i
n
n
i= 1
i
i
n
i= 1
(x i
−x)
nσ
n
i= 1
(x i −x)
nσ
x,y
n
n
i= 1
i
i
i
i
i
i
i
i
Cx ,y
(x)S
(y)
n
x 1
,...,xn
n
n
i= 1
i
z 1 −
α
σ
α
2
σ √ n
x−μ
σ √ n
1 −α
α
2
σ √ n
x−μ
n
1 −α
α
2
n
(n− 1 )S
σ
1 −α
(n− 1 )S
χ
α
2
(n− 1 )
(n− 1 )S
χ
α
2
(n− 1 )
/σ
/σ
1 −α
α
2
α
2
x 1
−x 2
−(μ 1
−μ 2
σ
n 1
σ
n 2
Sp
1 −α
α
2
σ
n 1
σ
n 2
x 1
−x 2
−(μ 1
−μ 2
n 1
n 2
Sp
p
(n 1
+(n 2
n 1
+n 2
x 1 −x 2 −(μ 1 −μ 2
n 1
n 2
1 −α
α
n 1
n 2
α
2
n 1
t 1
n 2
t 2
n 1
n 2
α
α
Sn
n
Sn
n
Var(
Sn
n
1 −α
α
2
pˆ( 1 − pˆ)
n
Sn
n
Sn
n
p( 1 −p)
n
z 1 −
α
z 1 −
α
2
2 pe
e
S z 1 −
α
2
pe
1 −α
α
pˆ 1 ( 1 − pˆ 1
n 1
pˆ 2 ( 1 − pˆ 2
n 2
p ˆ 1
− ˆp 2
pˆ 1
( 1 − ˆp 1
n 1
ˆp 2
( 1 − pˆ 2
n 2
x−μ 0 σ √ n
α
2
1 −α
1 −α
x−μ 0
S √
n
α
1 −α
1 −α
(n− 1 )S
σ
α
α
1 −α
α
σ
(n− 1 )
x
n
n
α
1 −α
α
p ˆ 1
− pˆ 2
−(p 1
−p 2
pˆ 1 ( 1 − ˆp 1
n 1
pˆ 2 ( 1 − ˆp 2
n 2
Test a 2 code Coda dx Coda sx
: p 1 − p 2 = (p 1 − p 2
: p 1
− p 2
= (p 1
− p 2
NOTA: Per la R.C. vedi la tabella sopra.
La differenza tra le frequenze relative rilevate su due campioni
casuali estratti dalle due popolazioni è statisticamente
significativa o invece si può ritenere puro effetto del caso?
x 1
−x 2
−δ √
σ
n 1
σ
n 2
NOTA: se n > 30, δ = 30.
Se σ
e σ
non sono note e il campione è di taglia grande,
vengono stimate tramite S
e S
Rifiuto H 0 se
μ 1
= μ 2
= μ 2
α
2
μ 1 6 μ 2
μ 2
μ 1
μ 2
< μ 2
x 1
−x 2
−(μ 1
−μ 2
n 1
n 2
∼ T (n 1
Rifiuto H 0
se
μ 1
= μ 2
μ 1
= μ 2
|t| > t 1 −
α
(n 1
μ 1
6 μ 2
μ 1
μ 2
t > t 1 −α
(n 1
μ 1
μ 2
μ 1 < μ 2 t < t α (n 1
p
(n 1
+(n 2
n 1
+n 2
Devo verificare l’uguaglianza delle varianze. Non si fa se due
campioni sono ti taglia grande, si considerano le varianze note
sostituendole alle varianze campionarie. Se i campioni sono di
taglia piccola e le varianze sono incognite, si effettua
preliminariamente il test sull’uguaglianza tra le varianze.
Considero x − y > 0 → considero D = ∑
n
i= 1
(x i − y i ) (media
campionaria delle differenze )
n
i= 1
((x i −y i
n− 1
(var. campion. delle diff.)
n
∼ T (n − 1 )
Rifiuto H 0 se
D = 0 D 6 = 0 |T | > t 1 −
α
2
(n − 1 )
∼ F(n − 1, m − 1 ) (ho due campioni di taglia m ed n)
Rifiuto H 0
se
σ
= σ
σ
= σ
α
(n − 1, m − 1 )
o F < F α
2
(n − 1, m − 1 )
σ
6 σ
σ
σ
1 −α (n − 1, m − 1 )
σ
σ
σ
< σ
α (n − 1, m − 1 )
Si usano quando non si hanno informazioni preliminari sul tipo
e sulla forma della distribuzione e/o quando non si è certi della
normalità della distribuzione.
Si applica ad una popolazione qualunque di taglia n e mediana
Ipotesi di test:
Le differenze x i
hanno probabilità di essere negative
), positive (=
) o nulle (= 0).
∼ B(n,
Usato per vedere l’indipendenza di due fattori in una tabella di
contingenza con r righe e c colonne.
f 0
= freq. osservate in una cella della tabella
fe = freq. teoriche o attese in una cella della tabella nel caso in
cui H 0
di indipendenza sia vera
: le due var. categoriche sono indipendenti
Statistica per il test:
χ
tutte le celle
( f 0
− fe )
fe
Attribuita a χ
con (r − 1 )(c − 1 ) gradi di libertà
(Rc : χ
χ
1 −α
Usato per verificare H 0
, dato un campione estratto/adattato da/a
una specifica distribuzione, che può essere specificata
completamente o non specificata completamente (parametri
stimati prima dei dati del campione)
Si usa quando di vogliono confrontare campioni con una
probabilità teorica.
(x 1
, ..., xn ) v. a. multinom. di parametri n, p 1
, ..., p k
ε = ∑
k
i= 1
(x i
−np i
np i
(per n grande)
x i = numero di prove che danno i come risultato (si denota con
i o N i
np i = E[x i
i = numero atteso di prove che danno i come
risultato
k
i= 1
i
i
i
= χ
(k − 1 ) (k è il numero di classi)
Si vuole eseguire una distr. campionaria F ad una distr. nota F
R.C. : χ
χ
1 −α
(k − 1 )
La frequenza attesa dev’essere almeno 5, sennò raggruppo le
classi.
i = np i
Usata se i parametri della distribuzione ipotizzata non sono
specificati, ma devono essere stimati preliminarmente del
campione.
n = k − d − 1 (n = gradi di libertà della χ
, k = numero di
classi, d = numero di parametri stimati)
Problema: stabilire se il campione a disposizione è estratto da
una popolazione normale senza usare test parametrici o non
parametrici.
Errore di 1
a specie (con probabilità α): si rifiuta H 0
quando
invece è vera
Errore di 2
a specie (con probabilità β ): si accetta H 0
quando
invece è falsa
Test di significatività: si calcola il p-value, e con il p-value
< 0, 05 si rifiuta H 0
Serve per riconoscere l’esistenza di un legame tra due variabili
casuali.
y = μ(x) = β 0
x 1 , ..., xn è l’n-pla associata alla n-pla campionaria y 1 , ..., yn
y i ∼ fy i
y i = β 0
E[y i ] = β 0
Var(y i
) = σ
Var(εi) = σ
Obiettivo: determino b 0 e b 1 (stime di β 0 e β 1 ) ottimali
affinchè la retta ottenuta costituisca il miglior fit possibile per i
dati sperimentali.
Regressione lineare:
ε ∼ N(0, σ
y = αx + β + ε αˆ = b 0
β = b 1
y = b 0
b 1
σ xy
σ
x
x i
y i
x i
y i
)/n)
x
i
x i
/n)
b 0
= y − b 1
x =
y i n
− b 1
x i n
t =
b 1 √
e
σ
x
e
σ
y −(σ
xy )/σ
x
n− 2
t ∼ t(n − 2 )
Rifiuto H 0 se
b 1 = 0 b 1
b 1
S
σ x > t 1 −
α
(n − 2 )
Confronto tra n > 2 medie di popolazioni normali.
: μ 1
= μ 2
= ... = μ k
H 1
i, j
/ esiste almeno una coppia con μ i
= μ j
(ai livelli
α = 0, 05 o 0, 01 o 0, 1)
NOTA: Se si fanno test a coppie, aumentano notevolmente gli
errori di 1
a specie.
La var. aleatoria è una F di Fisher.
Nel test ANOVA, ci sono due varianze: una è in funzione dei
livelli del fattore, l’altra è interna (generica).
Condizioni: Tutte le pop. devono essere normali, e tutte le
varianze delle pop. devono essere uguali (σ
= σ
...σ
k
x i j
= μ j
(dove x i j
sono gli elementi della tabella con i
righe/elementi e j colonne/livelli, e e i j
indica l’errore)
μ grandmean
k
j= 1
μ j
k
(media di tutte le medie)
τ j
= μ j
− μ grandmean
(τ j
ci dà una variabilità sui livelli)
x i j
= μ grandmean
τ j
e i j
Statistica del test:
(k− 1 )
(N−k)
∼ F(k − 1, N − k)
(k− 1 )
(N−k)
NOTA: il test ANOVA si fa solo a coda destra.
C.V. S.d.Q. G.L. M.Q. VR
T.C. SSA k − 1 MSA VR
I.C. SSW N − k MSW.
Quando occorre usare la correzione di continuità, e in cosa
consiste? Quando si utilizza l’approssimazione normale per
variabili casuali discrete. Consiste nell’arrotondare i valori
estremi delle classi al mezzo punto superiore.
In quali situazioni si effettua uno z-test e in quali un t-test?
Dettagliare tutti i casi possibili. z-test: media di v.c. normali
con varianza nota; differenza tra medie di v.c. normali con
varianze note. t-test: media di v.c. normali con varianza non
nota; differenza tra medie di v.c. normali con varianze non
note, ma uguali.
A parità di livello di condenza, qual’è leffetto della taglia del
campione sullintervallo di condenza per un parametro di una
data distribuzione? L’aumento della taglia rende l’intervallo
più preciso.
Se l’ipotesi nulla è vera, il solo aumento della dimensione
campionaria aumenterà la probabilità di rifiutare lipotesi nulla.
In quali test si impiega una regione critica che costituisce una
sola coda? Test del chi-quadro e analisi della varianza.
Se si aumenta il livello di signicatività (es: da 0.01 a 0.05),
l’ampiezza dellintervallo di condenza... a parità di taglia e
varianza diminuisce.
La quantità
( yˆ−μ) √
σ
/n
ha distribuzione t con n − 1 gradi di
libertà. F
Il test t può essere applicato senza nessun assunto riguardo alla
distribuzione della popolazione. F
Il valore z della distribuzione normale standard può essere
sempre usato per procedure inferenziali riguardanti proporzioni
di popolazioni. F
Si può utilizzare la statistica F per vericare l’uguaglianza di più
medie solo se le dimensioni campionarie sono identiche. F Le
popolazioni devono avere distribuzione nota? Sì, normale.
Se una retta di regressione viene calcolata su dati in cui x varia
da 0 a 30, si può predire y per x = 32. V
Date le 2 variabili statistiche X e Y , con r(X,Y ) molto vicino a
+1 o a 1, allora c’è una relazione di causa ed effetto tra X e Y. F
Nel caso in cui la popolazione sia normale è preferibile usare il
test di adattamento del chi-quadro oppure un test parametrico
per verificare che μ = μ 0 ? Un test parametrico.
Qual’è lo stimatore di massima verosimiglianza del parametro
λ di una distribuzione di Poisson? La media campionaria.
Qual’è lo stimatore di massima verosimiglianza del parametro θ
di una distribuzione uniforme continua nell’intervallo (0, θ )?
(0, θ ) = max(X 1
, ..., Xn )
Il modello di regressione lineare assume che al variare del
valore della variabile esplicativa la varianza dell’errore
aumenta. F
Con il metodo dei minimi quadrati si ottengono le stime dei
coefficienti di regressione. V
Il segno di b 1
dipende dalla covarianza tra X e Y. V
Il coefficiente di determinazione indica la proporzione di
variabilità totale dovuta all’errore. V
Il valore atteso dello stimatore b 1 è pari a β 1
Se Y è indipendente da X, il coefficiente regressione è sempre
positivo. F
Un coefficiente di determinazione pari a 0.88 indica un buon
adattamento della retta di regressione ai dati campionari. V
La funzione di regressione descrive la relazione tra la X e il
valore medio di Y. F
Nel modello di regressione lineare si assume che le osservazioni
della variabile risposta siano dipendenti. F
Tra il peso e la statura degli individui di una popolazione esiste
una relazione funzionale. F
Per applicare il test ANOVA è necessario che tutti i campioni
relativi ai diversi trattamenti abbiano la stessa varianza. F
Le taglie dei campioni relativi ai diversi trattamenti nel test
ANOVA devono essere uguali. F
Il test ANOVA consente di stabilire quale o quali trattamenti
originino delle risposte medie anomale. F
La distribuzione delle popolazioni è indifferente per l’uso del
test ANOVA. F
Il nome del test ANOVA deriva dal fatto che significa "Analysis
Of Variance".
La tabella ANOVA illustra la decomposizione della varianza
totale della variabile risposta Y. V
Nella tabella ANOVA il valore di SSW è sempre minore del
valore di SSA. F
Un valore che si presenta raramente è sempre un dato anomalo.
(N−k)
(k− 1 )
C.V. S.d.Q. G.L. M.Q. VR