Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Formulario R- seconda parte, Formulari di Statistica

Statistica- seconda parte formulario R

Tipologia: Formulari

2020/2021

Caricato il 15/02/2021

violarota
violarota 🇮🇹

2 documenti

1 / 1

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
!
PARTE 3
!
Distribuzione normale -> pnorm(zoss), qnorm(1-alfa)!
Distribuzione T di Student -> pt(toss, k), qt(1-alfa,k)!
Distribuzione CHI^2 -> pchisq(X^2oss, (r-1)*(c-1)), qchisq(1-alfa,(r-1)*(c-1))!
!
Per popolazione normale con varianza non nota uso t.test(DATASET$variabile, mu=mu0, alternative:
“two sided”, “greater”, “less”)!
Per trovare la stima della varianza sd(DATASET$variabile)!
Per trovare la stima della media mean(DATASET$variabile)!
!
Se ho il test per la proporzione ricordo table(DATASET$variabile)!
!
Per la verifica di ipotesi sulla dierenza di medie uso t.test(V1~V2, data=nome_data, var.equal=T,
alternative:“two sided”, “greater”, “less”)!
!
Se devo trovare il p-value o il X^2oss uso tab<-table(DATASET$variabile1,DATASET$variabile2) e poi
uso summary(tab).!
!
Quando mi parla della dierenza fra il valore della variabile 1 quando assume la variabile 2 dummy
assume la modalità 1 e la modalità due 2 uso il t.test! Non uso quindi lm (questa lo uso per vedere se
la modalità della dummy è significativa nel modello)!
PARTE 4!
!
Funzione lm: per utilizzarla faccio modn<-lm(Y~X1+X2+Xn, data=dataset)!
Con summary(modn) trovo le stime delle variabili esplicative e delle intercette, dei vari standard error
delle intercette, la stima della deviazione standard degli errori (radice di se^2), la statistica test e il p-
value per ogni stima (verifica ipotesi), R^2 normale e adj(solo confronti), il numero di gradi di libertà,
la statistica test per il test F globale e i gradi di libertà della statistica test stessa (in fondo).!
Con confint(modn, level=alfa) trovo gli intervalli di confidenza per i singoli coecienti.!
Con anova(modn) trovo le devianze .!
Con anova(modridotto,modcompleto) trovo la statistica test per il test F parziale, con gradi di libertà
e p-value.!
Con predict(modn, newdata=data.frame(Dummy=“valore assunto”,
Variabilex1=N...),interval=“prediction” se voglio la previsione per il singolo o interval=“confidence” se
voglio l’intervallo per la media, level=alfa) se voglio trovare l’intervallo di confidenza di y0 fissate tutte
le variabili.!
!
Per il test F parziale o globale se devo trovare il quantile qf(1-alfa,p-q,n-p-1), sennò per il p-value:
1-pf(Foss,p-q,n-p-1)!
!
Per il grafico di dispersione plot(data$var1, data$var2)!
!
!

Anteprima parziale del testo

Scarica Formulario R- seconda parte e più Formulari in PDF di Statistica solo su Docsity!

PARTE 3

  • Distribuzione normale -> pnorm(zoss), qnorm(1-alfa)
  • Distribuzione T di Student -> pt(toss, k), qt(1-alfa,k)
  • Distribuzione CHI^2 -> pchisq(X^2oss, (r-1)(c-1)), qchisq(1-alfa,(r-1)(c-1))
  • Per popolazione normale con varianza non nota uso t.test(DATASET$variabile, mu=mu0, alternative: “two sided”, “greater”, “less”)
  • Per trovare la stima della varianza sd(DATASET$variabile)
  • Per trovare la stima della media mean(DATASET$variabile)
  • Se ho il test per la proporzione ricordo table(DATASET$variabile)
  • Per la verifica di ipotesi sulla differenza di medie uso t.test(V1~V2, data=nome_data, var.equal=T, alternative:“two sided”, “greater”, “less”)
  • Se devo trovare il p-value o il X^2oss uso tab<-table(DATASET$variabile1,DATASET$variabile2) e poi uso summary(tab). Quando mi parla della differenza fra il valore della variabile 1 quando assume la variabile 2 dummy assume la modalità 1 e la modalità due 2 uso il t.test! Non uso quindi lm (questa lo uso per vedere se la modalità della dummy è significativa nel modello) PARTE 4
  • Funzione lm: per utilizzarla faccio modn<-lm (Y~X1+X2+Xn, data=dataset)
  • Con summary (modn) trovo le stime delle variabili esplicative e delle intercette, dei vari standard error delle intercette, la stima della deviazione standard degli errori (radice di se^2), la statistica test e il p- value per ogni stima (verifica ipotesi), R^2 normale e adj(solo confronti), il numero di gradi di libertà, la statistica test per il test F globale e i gradi di libertà della statistica test stessa (in fondo).
  • Con confint (modn, level=alfa) trovo gli intervalli di confidenza per i singoli coefficienti.
  • Con anova (modn) trovo le devianze.
  • Con anova (modridotto,modcompleto) trovo la statistica test per il test F parziale, con gradi di libertà e p-value.
  • Con predict (modn, newdata=data.frame(Dummy=“valore assunto”, Variabilex1=N...),interval=“prediction” se voglio la previsione per il singolo o interval=“confidence” se voglio l’intervallo per la media, level=alfa) se voglio trovare l’intervallo di confidenza di y0 fissate tutte le variabili.
  • Per il test F parziale o globale se devo trovare il quantile qf (1-alfa,p-q,n-p-1), sennò per il p-value: 1- pf (Foss,p-q,n-p-1)
  • Per il grafico di dispersione plot(data$var1, data$var2)