Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Formulario e concetti base di Statistica, Formulari di Statistica

contiene tutti i concetti base e le parole chiave per imparare le basi della statistica

Tipologia: Formulari

2018/2019

Caricato il 19/02/2019

aless101298
aless101298 🇮🇹

4.2

(6)

7 documenti

1 / 3

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
OMOGENEITA’: si parla di massima omogeneità se le unità statistiche del collettivo
presentano la stessa modalità
CONCENTRAZIONE: si intende la possibilità di trasferire l’ammontare complessivo
del carattere da un’unità statistica ad un’altra, allontanandosi da una situazione di
equi distribuzione. Si ha concentrazione minima quando l’ammontare complessivo
della variabile è ripartito in tutte le unità che presentano modalità pari alla media; si
ha concentrazione massima quando l’ammontare complessivo della variabile è
posseduto da una sola unità statistica che lo possiede in misura pari alla media,
mentre le rimanenti (N -1) unità posseggono zero.
INDIPENDENZA IN MEDIA: si ha quando al variare della modalità della X le
medie condizionate Y/ X restano costanti tra di loro
DIFFERENZA EVENTI INDIPENDENTI E INCOMPATIBILI: gli elementi entrano
in gioco cioè l’incompatibilità guarda il rapporto logico; con l’indipendenza entrano
in gioco le probabilità: due eventi possono essere compatibili ma indipendenti
INDIPENDENZA STOCASTICA: si ha indipendenza stocastica quando la
probabilità condizionata di un evento coincide con la probabilità dell’evento stesso
cioè quando il verificarsi di un evento non modifica la probabilità dell’altro
CORRELAZIONE LINEARE: misura la relazione tra due variabili (numerica e
qualitativa) e dati due eventi X e Y l’indice è dato dal rapporto tra la covarianza e il
prodotto della deviazione standard P= CovXY/ sigmaXsigmaY; assume valori tra -1<
p < +1; nel caso di P = 0 si tratta di incorrelazione lineare
VARIABILE TEST: È lo strumento che ci consente di capire quali valori sono
coerenti con Ho e H1
RESIDUI DEL MODELLO: E la stima dell’errore c’è una distanza di punti dalla
retta di regressione ei (cappello) = Yi-Yi(cappello)
DISTRIBUZIONE DI FREQUENZA: associa delle modalità che è un carattere può
assumere nelle rispettive frequenze
PROBABILITÀ CONDIZIONATA: Dati due eventi A e B la probabilità condizionata
P (B/A) = P(A B) / P(A) dato che si è verificato l’evento B
POTENZA DEL TEST: E la misura della capacità della regola di decisione di
individuare la falsità di H0 o la verità di H1
TEST DI ADATTAMENTO: la ratio del test È quella di verificare se il modello
sottostante i nostri dati coincide con il modello ipotizzato; la variabile test è il Chi
Quadro
TEST PARAMETRICO: È un test statistico applicato a campioni dei quali si
conoscono i parametri relativi della distribuzione
TEST NON PARAMETRICO: sono test che non necessitano di particolari condizioni
per essere applicati, infatti sono definiti “indipendenti dalle distribuzioni”
STIMA PUNTUALE: si ha quando il parametro della popolazione è stimato
attraverso un singolo valore, e tale valore viene chiamato stima puntuale del
parametro
STIMA INTERVALLARE: quando un parametro della popolazione incognito è
stimato mediante un intervallo di valori con la possibilità di trovare in tale intervallo
il valore incognito
pf3

Anteprima parziale del testo

Scarica Formulario e concetti base di Statistica e più Formulari in PDF di Statistica solo su Docsity!

OMOGENEITA’: si parla di massima omogeneità se le unità statistiche del collettivo presentano la stessa modalità CONCENTRAZIONE: si intende la possibilità di trasferire l’ammontare complessivo del carattere da un’unità statistica ad un’altra, allontanandosi da una situazione di equi distribuzione. Si ha concentrazione minima quando l’ammontare complessivo della variabile è ripartito in tutte le unità che presentano modalità pari alla media; si ha concentrazione massima quando l’ammontare complessivo della variabile è posseduto da una sola unità statistica che lo possiede in misura pari alla media, mentre le rimanenti (N -1) unità posseggono zero. INDIPENDENZA IN MEDIA: si ha quando al variare della modalità della X le medie condizionate Y/ X restano costanti tra di loro DIFFERENZA EVENTI INDIPENDENTI E INCOMPATIBILI: gli elementi entrano in gioco cioè l’incompatibilità guarda il rapporto logico; con l’indipendenza entrano in gioco le probabilità: due eventi possono essere compatibili ma indipendenti INDIPENDENZA STOCASTICA: si ha indipendenza stocastica quando la probabilità condizionata di un evento coincide con la probabilità dell’evento stesso cioè quando il verificarsi di un evento non modifica la probabilità dell’altro CORRELAZIONE LINEARE: misura la relazione tra due variabili (numerica e qualitativa) e dati due eventi X e Y l’indice è dato dal rapporto tra la covarianza e il prodotto della deviazione standard P= CovXY/ sigmaXsigmaY; assume valori tra -1< p < +1; nel caso di P = 0 si tratta di incorrelazione lineare VARIABILE TEST: È lo strumento che ci consente di capire quali valori sono coerenti con Ho e H RESIDUI DEL MODELLO: E la stima dell’errore c’è una distanza di punti dalla retta di regressione ei (cappello) = Yi-Yi(cappello) DISTRIBUZIONE DI FREQUENZA: associa delle modalità che è un carattere può assumere nelle rispettive frequenze PROBABILITÀ CONDIZIONATA: Dati due eventi A e B la probabilità condizionata P (B/A) = P(A B) / P(A) dato che si è verificato l’evento B POTENZA DEL TEST: E la misura della capacità della regola di decisione di individuare la falsità di H0 o la verità di H TEST DI ADATTAMENTO: la ratio del test È quella di verificare se il modello sottostante i nostri dati coincide con il modello ipotizzato; la variabile test è il Chi Quadro TEST PARAMETRICO: È un test statistico applicato a campioni dei quali si conoscono i parametri relativi della distribuzione TEST NON PARAMETRICO: sono test che non necessitano di particolari condizioni per essere applicati, infatti sono definiti “indipendenti dalle distribuzioni” STIMA PUNTUALE: si ha quando il parametro della popolazione è stimato attraverso un singolo valore, e tale valore viene chiamato stima puntuale del parametro STIMA INTERVALLARE: quando un parametro della popolazione incognito è stimato mediante un intervallo di valori con la possibilità di trovare in tale intervallo il valore incognito

STIMATORE: È la sintesi delle variabili casuali, è anch’essa una variabile casuale e assume valori diversi del parametro teta in base al campione osservato. Il valore assunto dallo stimatore in corrispondenza di un particolare campione è detto stima LE SUE PROPRIETÀ: correttezza, uno stimatore è corretto o non distorto se il suo valore medio è uguale al parametro da stimare. Qualora tale condizione non si verificasse, si tratterebbe di distorsione: è la differenza tra il valore che abbiamo ottenuto calcolando il valore medio e il valore che avremmo dovuto tenere affinché lo stimatore fosse stato corretto. Efficienza, tra due stimatori corretti il più efficiente è quello che presenta varianza minore, cioè quello le cui stime sono più prossime al valore di teta E dunque gli errori sono minori. Il più efficiente è quello con EQM(T1) < EQM (T2) Sufficienza, quando la sua distribuzione campionaria non dipende dal parametro incognito (teta) Consistenza, indica la capacità di fornire stime migliori al crescere della numerosità campionaria P-VALUE: È un nuovo alfa (livello di significatività) è il valore minimo che deve assumere la regione di rifiuto per rigettare Ho nulla ERRORE: È una variabile casuale distribuita con una normale con media emme e varianza S VALORE EMPIRICO DEL TEST: consiste nella realizzazione della variabile test ed è quel valore che va confrontato con il valore critico che dipende dal livello di significatività p-value > alfa accettato; p-value<alfa rifiutato COMPONENTE STOCASTICA: Ui è la componente aleatoria o stocastica che riassume l’errore Y1= B1+B2x+U CARDINALITA’: È l’insieme dei possibili risultati di un esperimento casuale COME VARIA L’AMPIEZZA DELL’INTERVALLO: variare di numerosità campionaria (inversamente proporzionale); (1-alfa) direttamente proporzionale MEDIA: È il valore che si ottiene sommando tutti i dati e poi dividendo per n, la somma degli scarti della media è uguale a zero (proprietà equidistanza), È un valore interno alla distribuzione compresa tra i valori massimi e i valori minimi (internalità). I pregi della media sono che è sempre compresa tra il minimo e il massimo dei valori osservati, la somma degli scarti è zero; i difetti sono: la teoria della robustezza, è sensibile alla presenza di outlier MEDIANA: È il valore centrale della serie, se N è dispari -> N+1/2; se N è pari -> n/2 + n/2 // 2 PROPORZIONE CAMPIONARIA: è lo stimatore della probabilità di successo si distribuisce come una binomiale con parametri probabilità di successo e numerosità campionaria MODELLO REGRESSIONE LINEARE SEMPLICE: È un modello che esprime il legame lineare esistente in media tra la variabile Y e la variabile esplicativa X. È semplice perché considera la relazione tra due sole variabili, è classico perché si basa su Mp classiche, esso intende stimare il valore medio della Y sulla base di valori prefissati della X, e lineare perché riferito ai parametri indipendentemente dalle variabili che possono essere trasformate Y1= B1+B2X