Mappe concettuali statistica | Schemi e mappe concettuali di Statistica

Inferenza statistica:

Verifica delle ipotesi: i dati del campione

vengono elaborati con l’obiettivo di valutare

se si conformano ad una congettura

riguardante il parametro o i parametri di

interesse

Stima dei parametri: i dati del campione

vengono elaborati con l’obiettivo di

assegnare valori “ragionevoli” al parametro

(o ai parametri) incognito (incogniti)

Def: I campioni casuali rappresentano

l’anello di congiunzione tra il calcolo delle

probabilità e l’inferenza statististica

Campione casuale: un insieme di n ≠ 0 elementi

estratti casualmente dalla popolazione

Si chiama campione casuale di ampiezza la

n-upla di variabili casuali X1, X2, ..., Xn

indipendenti e identicamente distribuite.

Popolazione

(universo o collettivo statistico): l’insieme degli

elementi cui si rivolge l’interesse del ricercatore

Esempio

Se valuto il QI di 50 persone estratte a caso dalla

popolazione, ogni singolo QI è descritto da una

variabile casuale X~N(100,225).

Queste 50 variabili sono:

Indipendenti: la singola osservazione non

produce effetti sulle altre

Identiche: perché l’esperimento (estrazione

casuale) è ripetuto nelle medesime condizioni

La ripetizione di un esperimento casuale n volte

genera le variabili casuali X1, X2, ..., Xn che

sono indipendenti e hanno tutte la stessa

distribuzione di probabilità.

Queste variabili casuali rappresentano un

campione casuale di X

Distribuzione campionaria di una statistica

campionaria:

è la distribuzione dei valori che la statistica

assume nell’insieme dei campioni casuali

osservabili

• Non è altro che la distribuzione di quella

statistica (es. media) in tutti i diversi campioni

estratti dalla stessa popolazione.

• Ovviamente, le medie più vicine alla media

della popolazione saranno le più probabili,

mentre quelle più “estreme” saranno le meno

probabili.

Conoscere la distribuzione campionaria della

statistica significa poter calcolare la

probabilità che la statistica assuma valori

all’interno di un intervallo [a, b] qualsiasi

Distribuzione campionaria della media:

(DCM)

Una delle distribuzioni campionarie di una

statistica più utilizzate è la Distribuzione

Campionaria della Media (DCM)

Lo studio della DCM ha come scopo quello di

poter calcolare la probabilità che una

variabile casuale assuma una valore

nell’intervallo [a,b], per una coppia

qualsiasi di numeri a e b.

Come nella distribuzione di un campione ogni

dato è costituito da una singola osservazione,

nella DCM ogni dato è rappresentato dalla

media dei singoli campioni, di ampiezza n,

estratti dalla stessa popolazione.

▪

La radice quadrata della varianza si chiama

errore standard della media e rappresenta la

media delle oscillazioni della variabile casuale

attorno alla media µ

▪

è una stima di quanto la media del

campione si avvicini alla media della

popolazione.

▪

Più il campione è grande, minore sarà

l’errore standard, e più la media del

campione si

avvicinerà alla media della popolazione.

Se la popolazione generatrice è normale

la DCM sará una variabile casuale normale

con media µ e varianza σ2/n

Se la popolazione generatrice NON è

normale la DCM non è normale

Tuttavia, all’aumentare dell’ampiezza del

campione, la DCM tende ad una forma sempre

più stabile, sempre più indipendente dal modello

della popolazione

⚠

Se il campione è maggiore di 30,

qualunque sia la sua distribuzione la

possiamo approssimare a una curva

normale (gaussiana), perchè se il nostro

campione è grande possiamo sfruttare la

formula di Z (standardizzazione)—> Xi-

media/deviazione standard

Se la varianza non è nota applico la formula di

S^2 (varianza campione) che ha come

denominatore

Dividere per n – 1 invece che per n aumenta di

un po’ la dispersione stimata.

—>s2 è allora una stima corretta di σ2

Parametro: una costante numerica che

caratterizza la variabile casuale x

Statistica inferenziale:

campioni casuali

Anteprima parziale del testo

Scarica Mappe concettuali statistica e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!

Inferenza statistica: Verifica delle ipotesi: i dati del campione vengono elaborati con l’obiettivo di valutare se si conformano ad una congettura riguardante il parametro o i parametri di interesse Stima dei parametri: i dati del campione vengono elaborati con l’obiettivo di assegnare valori “ragionevoli” al parametro (o ai parametri) incognito (incogniti) Def: I campioni casuali rappresentano l’anello di congiunzione tra il calcolo delle probabilità e l’inferenza statististica Campione casuale: un insieme di n ≠ 0 elementi estratti casualmente dalla popolazione Si chiama campione casuale di ampiezza la n-upla di variabili casuali X1, X2, ..., Xn i ndipendenti e identicamente distribuite. Popolazione (universo o collettivo statistico): l’insieme degli elementi cui si rivolge l’interesse del ricercatore Esempio Se valuto il QI di 50 persone estratte a caso dalla popolazione, ogni singolo QI è descritto da una variabile casuale X~N (100,225). Queste 50 variabili sono: Indipendenti: la singola osservazione non produce effetti sulle altre Identiche: perché l’esperimento (estrazione casuale) è ripetuto nelle medesime condizioni La ripetizione di un esperimento casuale n volte genera le variabili casuali X1, X2, ..., Xn che sono indipendenti e hanno tutte la stessa distribuzione di probabilità. Queste variabili casuali rappresentano un campione casuale di X Distribuzione campionaria di una statistica campionaria: è la distribuzione dei valori che la statistica assume nell’insieme dei campioni casuali osservabili

Non è altro che la distribuzione di quella statistica (es. media) in tutti i diversi campioni estratti dalla stessa popolazione.
Ovviamente, le medie più vicine alla media della popolazione saranno le più probabili, mentre quelle più “estreme” saranno le meno probabili. Conoscere la distribuzione campionaria della statistica significa poter calcolare la probabilità che la statistica assuma valori all’interno di un intervallo [a, b] qualsiasi Distribuzione campionaria della media: (DCM) Una delle distribuzioni campionarie di una statistica più utilizzate è la Distribuzione Campionaria della Media (DCM) Lo studio della DCM ha come scopo quello di poter calcolare la probabilità che una variabile casuale assuma una valore nell’intervallo [a,b], per una coppia qualsiasi di numeri a e b. Come nella distribuzione di un campione ogni dato è costituito da una singola osservazione, nella DCM ogni dato è rappresentato dalla media dei singoli campioni , di ampiezza n, estratti dalla stessa popolazione. La radice quadrata della varianza si chiama errore standard della media e rappresenta la media delle oscillazioni della variabile casuale attorno alla media μ è una stima di quanto la media del campione si avvicini alla media della popolazione. Più il campione è grande, minore sarà l’errore standard, e più la media del campione si avvicinerà alla media della popolazione. Se la popolazione generatrice è normale la DCM sará una variabile casuale normale con media μ e varianza σ2/n Se la popolazione generatrice NON è normale la DCM non è normale Tuttavia, all’aumentare dell’ampiezza del campione, la DCM tende ad una forma sempre più stabile, sempre più indipendente dal modello della popolazione Se il campione è maggiore di 30, qualunque sia la sua distribuzione la possiamo approssimare a una curva normale (gaussiana), perchè se il nostro campione è grande possiamo sfruttare la formula di Z (standardizzazione)—> Xi- media/deviazione standard Se la varianza non è nota applico la formula di S^2 (varianza campione) che ha come denominatore Dividere per n – 1 invece che per n aumenta di un po’ la dispersione stimata. —>s2 è allora una stima corretta di σ 2 Parametro: una costante numerica che caratterizza la variabile casuale x

Statistica inferenziale:

campioni casuali

Non è altro che la distribuzione di quella statistica (es. media) in tutti i diversi campioni estratti dalla stessa popolazione.
Ovviamente, le medie più vicine alla media della popolazione saranno le più probabili, mentre quelle più “estreme” saranno le meno probabili. Conoscere la distribuzione campionaria della statistica significa poter calcolare la probabilità che la statistica assuma valori all’interno di un intervallo [a, b] qualsiasi Distribuzione campionaria della media: (DCM) Una delle distribuzioni campionarie di una statistica più utilizzate è la Distribuzione Campionaria della Media (DCM) Lo studio della DCM ha come scopo quello di poter calcolare la probabilità che una variabile casuale assuma una valore nell’intervallo [a,b], per una coppia qualsiasi di numeri a e b. Come nella distribuzione di un campione ogni dato è costituito da una singola osservazione, nella DCM ogni dato è rappresentato dalla media dei singoli campioni , di ampiezza n, estratti dalla stessa popolazione. La radice quadrata della varianza si chiama errore standard della media e rappresenta la media delle oscillazioni della variabile casuale attorno alla media μ è una stima di quanto la media del campione si avvicini alla media della popolazione. Più il campione è grande, minore sarà l’errore standard, e più la media del campione si avvicinerà alla media della popolazione. Se la popolazione generatrice è normale la DCM sará una variabile casuale normale con media μ e varianza σ2/n Se la popolazione generatrice NON è normale la DCM non è normale Tuttavia, all’aumentare dell’ampiezza del campione, la DCM tende ad una forma sempre più stabile, sempre più indipendente dal modello della popolazione Se il campione è maggiore di 30, qualunque sia la sua distribuzione la possiamo approssimare a una curva normale (gaussiana), perchè se il nostro campione è grande possiamo sfruttare la formula di Z (standardizzazione)—> Xi- media/deviazione standard Se la varianza non è nota applico la formula di S^2 (varianza campione) che ha come denominatore Dividere per n – 1 invece che per n aumenta di un po’ la dispersione stimata. —>s2 è allora una stima corretta di σ 2 Parametro: una costante numerica che caratterizza la variabile casuale x

Mappe concettuali statistica, Schemi e mappe concettuali di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica Mappe concettuali statistica e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!

Statistica inferenziale:

campioni casuali

Statistica inferenziale:

campioni casuali

Il test Z si riferisce a un'analisi statistica univariata utilizzata per verificare

l'ipotesi che le proporzioni di due campioni indipendenti differiscano

notevolmente.

Determina in che misura un punto dati è lontano dalla media del set di dati,

nella deviazione standard.

la varianza campionaria è considerata approssimativamente uguale alla

varianza della popolazione. In questo modo, si presume che sia noto,

nonostante siano disponibili solo dati di esempio e quindi possa essere

applicato un test normale.

Ipotesi del test Z :

Tutte le osservazioni del campione sono indipendenti

Le dimensioni del campione dovrebbero essere più di 30.

La distribuzione di Z è normale, con uno zero medio e una varianza 1.

Il test T fa riferimento a un test di ipotesi univariato basato sulla statistica t, in cui la

media è nota e la varianza della popolazione viene approssimata dal campione. D'altra

parte, Z-test è anche un test univariato basato sulla normale distribuzione standard.

In termini semplici, un'ipotesi si riferisce a una supposizione che deve essere accettata

o respinta. Esistono due procedure di verifica delle ipotesi, ovvero test parametrico e

test non parametrico, in cui il test parametrico si basa sul fatto che le variabili sono

misurate su una scala a intervalli, mentre nel test non parametrico si presume che lo

stesso sia misurato su una scala ordinale. Ora, nel test parametrico, ci possono essere

due tipi di test, t-test e z-test.

Questo articolo ti darà una comprensione della differenza tra T-test e Z-test in dettaglio.

La forma di una distribuzione t è fortemente influenzata dal grado di libertà. Il grado di

libertà implica il numero di osservazioni indipendenti in un dato insieme di

osservazioni.

Forma:

poiché entrambi sono simmetrici e a forma di campana.

Tuttavia, differiscono nel senso che in una distribuzione t,

c'è meno spazio nel centro e più nella coda.