Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Mappe concettuali statistica, Schemi e mappe concettuali di Statistica

Mappe concettuali con le formule, i concetti e le definizioni principali della statistica descrittiva e inferenziale, con anche esercizi di esempio svolti.

Tipologia: Schemi e mappe concettuali

2021/2022

In vendita dal 06/06/2023

ale-camuto
ale-camuto 🇮🇹

4.3

(3)

25 documenti

1 / 2

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Inferenza statistica:
Verifica delle ipotesi: i dati del campione
vengono elaborati con l’obiettivo di valutare
se si conformano ad una congettura
riguardante il parametro o i parametri di
interesse
Stima dei parametri: i dati del campione
vengono elaborati con l’obiettivo di
assegnare valori “ragionevoli” al parametro
(o ai parametri) incognito (incogniti)
Def: I campioni casuali rappresentano
l’anello di congiunzione tra il calcolo delle
probabilità e l’inferenza statististica
Campione casuale: un insieme di n 0 elementi
estratti casualmente dalla popolazione
Si chiama campione casuale di ampiezza la
n-upla di variabili casuali X1, X2, ..., Xn
indipendenti e identicamente distribuite.
Popolazione
(universo o collettivo statistico): l’insieme degli
elementi cui si rivolge l’interesse del ricercatore
Esempio
Se valuto il QI di 50 persone estratte a caso dalla
popolazione, ogni singolo QI è descritto da una
variabile casuale X~N(100,225).
Queste 50 variabili sono:
!
Indipendenti: la singola osservazione non
produce effetti sulle altre
!
Identiche: perché l’esperimento (estrazione
casuale) è ripetuto nelle medesime condizioni
La ripetizione di un esperimento casuale n volte
genera le variabili casuali X1, X2, ..., Xn che
sono indipendenti e hanno tutte la stessa
distribuzione di probabilità.
Queste variabili casuali rappresentano un
campione casuale di X
Distribuzione campionaria di una statistica
campionaria:
è la distribuzione dei valori che la statistica
assume nell’insieme dei campioni casuali
osservabili
• Non è altro che la distribuzione di quella
statistica (es. media) in tutti i diversi campioni
estratti dalla stessa popolazione.
• Ovviamente, le medie più vicine alla media
della popolazione saranno le più probabili,
mentre quelle più “estreme” saranno le meno
probabili.
Conoscere la distribuzione campionaria della
statistica significa poter calcolare la
probabilità che la statistica assuma valori
all’interno di un intervallo [a, b] qualsiasi
Distribuzione campionaria della media:
(DCM)
!
Una delle distribuzioni campionarie di una
statistica più utilizzate è la Distribuzione
Campionaria della Media (DCM)
!
Lo studio della DCM ha come scopo quello di
poter calcolare la probabilità che una
variabile casuale assuma una valore
nell’intervallo [a,b], per una coppia
qualsiasi di numeri a e b.
"
Come nella distribuzione di un campione ogni
dato è costituito da una singola osservazione,
nella DCM ogni dato è rappresentato dalla
media dei singoli campioni, di ampiezza n,
estratti dalla stessa popolazione.
La radice quadrata della varianza si chiama
errore standard della media e rappresenta la
media delle oscillazioni della variabile casuale
attorno alla media µ
è una stima di quanto la media del
campione si avvicini alla media della
popolazione.
Più il campione è grande, minore sarà
l’errore standard, e più la media del
campione si
avvicinerà alla media della popolazione.
!
Se la popolazione generatrice è normale
la DCM sará una variabile casuale normale
con media µ e varianza σ2/n
!
Se la popolazione generatrice NON è
normale la DCM non è normale
Tuttavia, all’aumentare dell’ampiezza del
campione, la DCM tende ad una forma sempre
più stabile, sempre più indipendente dal modello
della popolazione
Se il campione è maggiore di 30,
qualunque sia la sua distribuzione la
possiamo approssimare a una curva
normale (gaussiana), perchè se il nostro
campione è grande possiamo sfruttare la
formula di Z (standardizzazione)—> Xi-
media/deviazione standard
Se la varianza non è nota applico la formula di
S^2 (varianza campione) che ha come
denominatore
Dividere per n – 1 invece che per n aumenta di
un po’ la dispersione stimata.
—>s2 è allora una stima corretta di σ2
Parametro: una costante numerica che
caratterizza la variabile casuale x
Statistica inferenziale:
campioni casuali
pf2

Anteprima parziale del testo

Scarica Mappe concettuali statistica e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!

Inferenza statistica: Verifica delle ipotesi: i dati del campione vengono elaborati con l’obiettivo di valutare se si conformano ad una congettura riguardante il parametro o i parametri di interesse Stima dei parametri: i dati del campione vengono elaborati con l’obiettivo di assegnare valori “ragionevoli” al parametro (o ai parametri) incognito (incogniti) Def: I campioni casuali rappresentano l’anello di congiunzione tra il calcolo delle probabilità e l’inferenza statististica Campione casuale: un insieme di n ≠ 0 elementi estratti casualmente dalla popolazione Si chiama campione casuale di ampiezza la n-upla di variabili casuali X1, X2, ..., Xn i ndipendenti e identicamente distribuite. Popolazione (universo o collettivo statistico): l’insieme degli elementi cui si rivolge l’interesse del ricercatore Esempio Se valuto il QI di 50 persone estratte a caso dalla popolazione, ogni singolo QI è descritto da una variabile casuale X~N (100,225). Queste 50 variabili sono: Indipendenti: la singola osservazione non produce effetti sulle altre Identiche: perché l’esperimento (estrazione casuale) è ripetuto nelle medesime condizioni La ripetizione di un esperimento casuale n volte genera le variabili casuali X1, X2, ..., Xn che sono indipendenti e hanno tutte la stessa distribuzione di probabilità. Queste variabili casuali rappresentano un campione casuale di X Distribuzione campionaria di una statistica campionaria: è la distribuzione dei valori che la statistica assume nell’insieme dei campioni casuali osservabili

  • Non è altro che la distribuzione di quella statistica (es. media) in tutti i diversi campioni estratti dalla stessa popolazione.
  • Ovviamente, le medie più vicine alla media della popolazione saranno le più probabili, mentre quelle più “estreme” saranno le meno probabili. Conoscere la distribuzione campionaria della statistica significa poter calcolare la probabilità che la statistica assuma valori all’interno di un intervallo [a, b] qualsiasi Distribuzione campionaria della media: (DCM) Una delle distribuzioni campionarie di una statistica più utilizzate è la Distribuzione Campionaria della Media (DCM) Lo studio della DCM ha come scopo quello di poter calcolare la probabilità che una variabile casuale assuma una valore nell’intervallo [a,b], per una coppia qualsiasi di numeri a e b. Come nella distribuzione di un campione ogni dato è costituito da una singola osservazione, nella DCM ogni dato è rappresentato dalla media dei singoli campioni , di ampiezza n, estratti dalla stessa popolazione. La radice quadrata della varianza si chiama errore standard della media e rappresenta la media delle oscillazioni della variabile casuale attorno alla media μ è una stima di quanto la media del campione si avvicini alla media della popolazione. Più il campione è grande, minore sarà l’errore standard, e più la media del campione si avvicinerà alla media della popolazione. Se la popolazione generatrice è normale la DCM sará una variabile casuale normale con media μ e varianza σ2/n Se la popolazione generatrice NON è normale la DCM non è normale Tuttavia, all’aumentare dell’ampiezza del campione, la DCM tende ad una forma sempre più stabile, sempre più indipendente dal modello della popolazione Se il campione è maggiore di 30, qualunque sia la sua distribuzione la possiamo approssimare a una curva normale (gaussiana), perchè se il nostro campione è grande possiamo sfruttare la formula di Z (standardizzazione)—> Xi- media/deviazione standard Se la varianza non è nota applico la formula di S^2 (varianza campione) che ha come denominatore Dividere per n – 1 invece che per n aumenta di un po’ la dispersione stimata. —>s2 è allora una stima corretta di σ 2 Parametro: una costante numerica che caratterizza la variabile casuale x

Statistica inferenziale:

campioni casuali

Inferenza statistica: Verifica delle ipotesi: i dati del campione vengono elaborati con l’obiettivo di valutare se si conformano ad una congettura riguardante il parametro o i parametri di interesse Stima dei parametri: i dati del campione vengono elaborati con l’obiettivo di assegnare valori “ragionevoli” al parametro (o ai parametri) incognito (incogniti) Def: I campioni casuali rappresentano l’anello di congiunzione tra il calcolo delle probabilità e l’inferenza statististica Campione casuale: un insieme di n ≠ 0 elementi estratti casualmente dalla popolazione Si chiama campione casuale di ampiezza la n-upla di variabili casuali X1, X2, ..., Xn i ndipendenti e identicamente distribuite. Popolazione (universo o collettivo statistico): l’insieme degli elementi cui si rivolge l’interesse del ricercatore Esempio Se valuto il QI di 50 persone estratte a caso dalla popolazione, ogni singolo QI è descritto da una variabile casuale X~N (100,225). Queste 50 variabili sono: Indipendenti: la singola osservazione non produce effetti sulle altre Identiche: perché l’esperimento (estrazione casuale) è ripetuto nelle medesime condizioni La ripetizione di un esperimento casuale n volte genera le variabili casuali X1, X2, ..., Xn che sono indipendenti e hanno tutte la stessa distribuzione di probabilità. Queste variabili casuali rappresentano un campione casuale di X Distribuzione campionaria di una statistica campionaria: è la distribuzione dei valori che la statistica assume nell’insieme dei campioni casuali osservabili

  • Non è altro che la distribuzione di quella statistica (es. media) in tutti i diversi campioni estratti dalla stessa popolazione.
  • Ovviamente, le medie più vicine alla media della popolazione saranno le più probabili, mentre quelle più “estreme” saranno le meno probabili. Conoscere la distribuzione campionaria della statistica significa poter calcolare la probabilità che la statistica assuma valori all’interno di un intervallo [a, b] qualsiasi Distribuzione campionaria della media: (DCM) Una delle distribuzioni campionarie di una statistica più utilizzate è la Distribuzione Campionaria della Media (DCM) Lo studio della DCM ha come scopo quello di poter calcolare la probabilità che una variabile casuale assuma una valore nell’intervallo [a,b], per una coppia qualsiasi di numeri a e b. Come nella distribuzione di un campione ogni dato è costituito da una singola osservazione, nella DCM ogni dato è rappresentato dalla media dei singoli campioni , di ampiezza n, estratti dalla stessa popolazione. La radice quadrata della varianza si chiama errore standard della media e rappresenta la media delle oscillazioni della variabile casuale attorno alla media μ è una stima di quanto la media del campione si avvicini alla media della popolazione. Più il campione è grande, minore sarà l’errore standard, e più la media del campione si avvicinerà alla media della popolazione. Se la popolazione generatrice è normale la DCM sará una variabile casuale normale con media μ e varianza σ2/n Se la popolazione generatrice NON è normale la DCM non è normale Tuttavia, all’aumentare dell’ampiezza del campione, la DCM tende ad una forma sempre più stabile, sempre più indipendente dal modello della popolazione Se il campione è maggiore di 30, qualunque sia la sua distribuzione la possiamo approssimare a una curva normale (gaussiana), perchè se il nostro campione è grande possiamo sfruttare la formula di Z (standardizzazione)—> Xi- media/deviazione standard Se la varianza non è nota applico la formula di S^2 (varianza campione) che ha come denominatore Dividere per n – 1 invece che per n aumenta di un po’ la dispersione stimata. —>s2 è allora una stima corretta di σ 2 Parametro: una costante numerica che caratterizza la variabile casuale x

Statistica inferenziale:

campioni casuali

Il test Z si riferisce a un'analisi statistica univariata utilizzata per verificare

l'ipotesi che le proporzioni di due campioni indipendenti differiscano

notevolmente.

Determina in che misura un punto dati è lontano dalla media del set di dati,

nella deviazione standard.

la varianza campionaria è considerata approssimativamente uguale alla

varianza della popolazione. In questo modo, si presume che sia noto,

nonostante siano disponibili solo dati di esempio e quindi possa essere

applicato un test normale.

Ipotesi del test Z :

Tutte le osservazioni del campione sono indipendenti

Le dimensioni del campione dovrebbero essere più di 30.

La distribuzione di Z è normale, con uno zero medio e una varianza 1.

Il test T fa riferimento a un test di ipotesi univariato basato sulla statistica t, in cui la

media è nota e la varianza della popolazione viene approssimata dal campione. D'altra

parte, Z-test è anche un test univariato basato sulla normale distribuzione standard.

In termini semplici, un'ipotesi si riferisce a una supposizione che deve essere accettata

o respinta. Esistono due procedure di verifica delle ipotesi, ovvero test parametrico e

test non parametrico, in cui il test parametrico si basa sul fatto che le variabili sono

misurate su una scala a intervalli, mentre nel test non parametrico si presume che lo

stesso sia misurato su una scala ordinale. Ora, nel test parametrico, ci possono essere

due tipi di test, t-test e z-test.

Questo articolo ti darà una comprensione della differenza tra T-test e Z-test in dettaglio.

La forma di una distribuzione t è fortemente influenzata dal grado di libertà. Il grado di

libertà implica il numero di osservazioni indipendenti in un dato insieme di

osservazioni.

Forma:

poiché entrambi sono simmetrici e a forma di campana.

Tuttavia, differiscono nel senso che in una distribuzione t,

c'è meno spazio nel centro e più nella coda.