Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


statistica 2 parziale, Appunti di Statistica

La media geometrica, Concordanza, Dipendenza e regressione , Probabilità, Gli eventi e algebra degli eventi, Principio delle probabilità totali , Concezione frequentista della probabilità , Le variabili causali, Campionamento e distribuzioni campionarie, Stimatori e stima puntuale , Efficienza,

Tipologia: Appunti

2018/2019

In vendita dal 17/12/2021

Gaiaserale
Gaiaserale 🇮🇹

4.7

(6)

27 documenti

1 / 12

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1
La media geometrica
La media geometrica è una media analitica utilizzata soprattutto nel caso in cui l’insieme dei dati è costituito da valori
positivi generati da rapporti. La media geometrica di un insieme di n valori positivi x1, x2, …, xn di un carattere
quantitativo X è pari alla radice n-esima del prodotto dei singoli valori xg= x1×x2×…×xn
n
come per la media aritmetica, anche per quella geometrica vi è una formulazione più sintetica se si dispone della
distribuzione di frequenze del carattere X, infatti in questo caso la media geometrica può essere calcolata come segue:
xg=x1
n1×
n x2
n2 × ..× xK
nK oppure xg=𝒙𝟏
𝒇𝟏× 𝒙𝟐
𝒇𝟐×…× 𝒙𝑲
𝒇𝑲×
Dove K è il numero di modalità assunte dal carattere, nj è la frequenza assoluta della j-esima modalità e fj è la
corrispondente frequenza relativa
Misura dell’interdipendenza tra due caratteri quantitativi
Le relazioni tra caratteri statistici sono un aspetto fondamentale della statistica in quanto ci permettono di valutare se
due caratteri sono legati, per poi successivamente compiere delle previsioni o supposizioni. Nello specifico la
concordanza riguarda la presenza di un legame tra variabili entrambe quantitative. In caso di concordanza, possiamo
valutare la correlazione, ovvero la valutazione dell’intensità reciproca di questo legame tra le due variabili.
Concordanza
Con essa si cerca la direzione del legame che unisce due variabili quantitative X e Y. In primo luogo, si analizza il grafico
di dispersione che pone la variabile X sull’asse dell’ascisse e la Y sull’asse delle ordinate in un piano cartesiano. Si
ottiene una “nuvola di punti”:
- Se la nuvola allungata dal basso verso l’alto: relazione positiva.
- Se allungata dall’alto verso il basso: relazione negativa.
Esempio:
Considerando che la media delle x=40,83 e quella delle y=31,67 si possono andare ad individuare gli scostamenti
(scarti) rispetto alla media. Si ottiene che
I valori rispetto ai 4 quadranti sono:
Quadrante
(xi-x)
(yi-y)
I
+
+
II
-
+
III
-
-
IV
+
-
Cercando la concordanza ci si chiede, in pratica, se le deviazioni da un termine di riferimento (media aritmetica) per i
due caratteri vadano nella stessa direzione.
Se scarti concordi (tutti e due positivi o negativi): I e III quadrante.
Se scarti discordi (uno positivo e l’altro negativo): II e IV quadrante.
Una misura sintetica di concordanza la covarianza, espressa come media aritmetica dei prodotti degli scarti delle due
variabili dalle rispettive medie: COV (X, Y) = 1/n ∑ (xi-x) (yi-y) = σXY
Il numeratore della covarianza detta codevianza. Se due caratteri sono statisticamente indipendenti tra di loro la
covarianza è 0. D’altra parte, se la covarianza è 0 non è detto che i due caratteri siano indipendenti, infatti la
covarianza si annulla se i prodotti degli scostamenti della media si compensano tra loro, ma ciò può avvenire anche se
25
30
35
40
25 35 45 55
Grafico di dispersione
Nome
Età (X)
Giulio
30
Mario
43
Valerio
55
Maria
22
Flavia
58
Roberta
37
Nome
Età (X)
Reddito (Y)
Giulio
-10,83
-6,67
Mario
2,17
6,33
Valerio
14,17
-0,67
Maria
-18,83
-7,67
Flavia
17,17
7,33
Roberta
-3,83
1,33
-10
-5
0
5
10
-30 -20 -10 0 10 20
Grafico degli scostamenti dalla media
pf3
pf4
pf5
pf8
pf9
pfa

Anteprima parziale del testo

Scarica statistica 2 parziale e più Appunti in PDF di Statistica solo su Docsity!

La media geometrica

La media geometrica è una media analitica utilizzata soprattutto nel caso in cui l’insieme dei dati è costituito da valori

positivi generati da rapporti. La media geometrica di un insieme di n valori positivi x 1 , x 2 , …, x n di un carattere

quantitativo X è pari alla radice n-esima del prodotto dei singoli valori x g

x 1

×

x 2

×…×x n

n

come per la media aritmetica, anche per quella geometrica vi è una formulazione più sintetica se si dispone della

distribuzione di frequenze del carattere X, infatti in questo caso la media geometrica può essere calcolata come segue:

x g

=x 1

n 1

×

n

x 2

n 2

× ..× x K

n K

oppure x g

𝟏

𝒇 𝟏

× 𝒙 𝟐

𝒇 𝟐

×…× 𝒙 𝑲

𝒇 𝑲

×

Dove K è il numero di modalità assunte dal carattere, n j è la frequenza assoluta della j-esima modalità e f j è la

corrispondente frequenza relativa

Misura dell’interdipendenza tra due caratteri quantitativi

Le relazioni tra caratteri statistici sono un aspetto fondamentale della statistica in quanto ci permettono di valutare se

due caratteri sono legati, per poi successivamente compiere delle previsioni o supposizioni. Nello specifico la

concordanza riguarda la presenza di un legame tra variabili entrambe quantitative. In caso di concordanza, possiamo

valutare la correlazione , ovvero la valutazione dell’intensità reciproca di questo legame tra le due variabili.

Concordanza

Con essa si cerca la direzione del legame che unisce due variabili quantitative X e Y. In primo luogo, si analizza il grafico

di dispersione che pone la variabile X sull’asse dell’ascisse e la Y sull’asse delle ordinate in un piano cartesiano. Si

ottiene una “ nuvola di punti ”:

  • Se la nuvola allungata dal basso verso l’alto: relazione positiva.
  • Se allungata dall’alto verso il basso: relazione negativa.

Esempio:

Considerando che la media delle x =40,83 e quella delle y =31,67 si possono andare ad individuare gli scostamenti

(scarti) rispetto alla media. Si ottiene che

I valori rispetto ai 4 quadranti sono:

Quadrante (x i

- x) (y i - y)

I + +

II - +

III - -

IV + -

Cercando la concordanza ci si chiede, in pratica, se le deviazioni da un termine di riferimento (media aritmetica) per i

due caratteri vadano nella stessa direzione.

  • Se scarti concordi (tutti e due positivi o negativi): I e III quadrante.
  • Se scarti discordi (uno positivo e l’altro negativo): II e IV quadrante.

Una misura sintetica di concordanza la covarianza , espressa come media aritmetica dei prodotti degli scarti delle due

variabili dalle rispettive medie: COV (X, Y) = 1/n ∑ (x i

- x) (y i - y) = σ XY

Il numeratore della covarianza detta codevianza. Se due caratteri sono statisticamente indipendenti tra di loro la

covarianza è 0. D’altra parte, se la covarianza è 0 non è detto che i due caratteri siano indipendenti, infatti la

covarianza si annulla se i prodotti degli scostamenti della media si compensano tra loro, ma ciò può avvenire anche se

25

30

35

40

25 35 45 55

Grafico di dispersione

Nome Età (X) Reddito (Y)

Giulio 30 25

Mario 43 38

Valerio 55 31

Maria 22 24

Flavia 58 39

Roberta 37 33

Nome Età (X) Reddito (Y)

Giulio - 10,83 - 6,

Mario 2,17 6,

Valerio 14,17 - 0,

Maria - 18,83 - 7,

Flavia 17,17 7,

Roberta - 3,83 1,

0

5

10

-30 -20 -10 0 10 20

Grafico degli scostamenti dalla media

tra i due caratteri sussiste una relazione di dipendenza ma non di tipo lineare. Un difetto della covarianza è quello di

dipendere dall’unita di misura dei caratteri di conseguenza non è utilizzabile per fare confronti. Per ovviare tale

inconveniente è opportuno trasformare la covarianza in un indice relativo. La covarianza può assumere valori

all’interno del seguente intervallo: −σ X σ Y ≤ σ XY ≤ σ X σ Y dove σ X e σ Y sono le derivazioni standard di X e Y. A questo punto

si può introdurre un indice relativo noto proposto da Bravais e Pearson, ossia il coefficiente di correlazione lineare di

Bravais e Pearson , che è dato da: ρ XY = σ XY / σ X σ Y

. Esistono delle proprietà, quali:

  • ρ XY =1 se tra X e Y c’è massima concordanza
  • ρ XY = - 1 se tra X e Y c’è massima discordanza
  • ρ XY =0 se tra X e Y non c’è nessun legame lineare

Dipendenza e regressione

Quando si analizzano 2 o più caratteri quantitativi si può cercare di individuare una funzione che descriva in modo

dettagliato la relazione che emerge dai dati. Se una delle variabili è considerata dipendente dall’altra si utilizzerà un

modello di regressione. La sua importanza all’interno della statistica deriva dalla sua semplicità. Il modello di

regressione lineare semplice considera 2 variabili:

  1. una variabile dipendente o risposta

  2. una variabile esplicativa o indipendente

In questo senso si parla di una variabile X detta indipendente o esplicativa che influenza una variabile Y detta

dipendente o risposta.

Una variabile Y è una funzione di X se ad ogni valore di X corrisponde un solo valore di Y; in tal caso si può affermare

che esiste una relazione funzionale tra le 2 variabili. Una relazione funzionale linare si può scrivere: Y= β 0 +β 1

X

Nello specifico:

  • β 0 è l’ordinata all’origine, detta anche intercetta (il punto in cui la retta incontra l’asse delle Y).
  • β 1 è il coefficiente angolare della retta di regressione, detto “coefficiente di regressione”. Riassume verso e

intensità della dipendenza lineare della Y da X. Esso descrive la variazione che subisce in media x quando

passo da x 0 a x 1

. Non trovo mai un nesso di causa effetto. Possono avvenire diversi casi:

o se β 1

0 significa che all’aumentare di x aumenta anche y e viceversa

o se β 1 <0 significa che all’aumentare di x diminuisce y e viceversa

o se β 1 = 0 significa che la retta è piatta →i ndipendenza lineare

Se tra Y e X ci fosse una relazione di dipendenza perfetta i punti si troverebbero tutti sulla retta, non intorno a questa.

Dato un valore di X possibile tramite la relazione lineare determinare il valore di Y corrispondente. La relazione non

perfetta , quindi ad un certo valore di X possono corrispondere più valori di Y.

In pratica, il modello statistico: **Y= β 0

  • β 1 X +** e

dove e rappresenta un termine d’errore , ottenuto come differenza tra il valore osservato di Y e il valore

teorico Y

∗ ricavato dal modello in caso di dipendenza perfetta. Esprime, ipoteticamente, tutte le variabili non

inserite nel modello e che influenzano la Y.

Nello specifico:

  • y i corrisponde al valore osservatoy i = β 0 + β 1 x i + e i i= 1, 2, …, n
  • y i ***** corrisponde al valore teoricoy i *= β 0 + β 1 x i i= 1, 2, …, n

e i = y i

- y i ***** i= 1, 2, …, n

Ci si chiede quindi come individuare la retta migliore? Si devono determinare di β 0 e β 1 cercando di individuare la retta

che più si avvicina ai punti (dati osservati) → criterio di accostamento

Si utilizza il metodo dei minimi quadrati che stabilisce di trovare quei valori di β 0 e β 1 per cui la somma dei quadrati

delle differenze tra valore osservato e valore teorico minima: ∑ (y i

- y i

2 →minimo tale formula può essere scritta

anche come G (β 0 , β 1 ) = ∑ (y i

- β 0 - β 1 x i

2

Per individuare i valori di β 0 e β 1 che rendono minima la funzione di perdita G(β 0 , β 1 ), occorre calcolare le derivate

parziali di tale funzione rispetto a β 0 e β 1 e porle uguali a 0. Successivamente si ottengono le stime dei minimi

quadrati dei coefficienti di regressione che sono date da:

  • β 1 = [∑ (x i - x) (y i - y)] : [∑ (x i - x)

2 ]

  • β 0 = y - β 1 x

Il coefficiente di regressione β 1 indica quanto varia in media Y per ogni variazione unitaria di X (le variazioni sono

espresse nell’unità di misura della Y). Ha il segno della codevianza (o covarianza).

  • β 1 > 0 → CoVar (X,Y) >0 retta ascendente , concordanza
  • β 1 < 0 → CoVar (X,Y) < 0 retta discendente, discordanza
  • β 1 = 0 → CoVar (X,Y) = 0 retta parallela all’asse delle X, indipendenza lineare.

Lancio un dado a sei facce, l’evento complesso è che esca un numero pari, si scompone in tre elementi

elementari dove esce un numero 2 o esce il numero 4 o esce il numero 6. Con un dado da 6 facce la

probabilità che esca un numero pari è 1/

Esempi: Prova: lancio di un dado

  • Evento elementare: faccia del dado (es. E=5, ciò corrisponde a dire “esce 5 nel lancio del dado”).
  • Evento non elementare: “uscita di un numero dispari” o “esce un multiplo di due”. Si possono trovare

prendendo un pezzetto elementare. Si verifica ogni volta che esce uno degli eventi elementari [1,3,5].

Prova: esame universitario

  1. Evento elementare: voto 25.
  2. Evento non elementare: voto > 25. Non è elementare perché si scompone in prendo 26 oppure prendo 27

oppure prendo 28 oppure prendo 29 oppure prendo 30

Gli eventi e algebra degli eventi

Gli eventi formano un’algebra di Boole , essa è una struttura matematica sui cui elementi sono definite tutte le

operazioni e le regole necessarie per un’algebra degli eventi. In tale struttura matematica sono definite 3 operazioni

fondamentali:

  • La negazione di un evento E, ossia E

. Dato un evento E

, la sua negazione E

è data dall’evento “E non si

verifica”

  • L’ intersezione tra due eventi E 1 e E 2 , ossia E 1

∩ E

2

. Dati 2 eventi, E 1 e E 2 , la loro intersezione E 1

∩ E

2 è data

dall’evento “tutti e due gli eventi si verificano contemporaneamente”

  • L’ unione tra due eventi E 1 e E 2 , ossia E 1

∪ E

2

. Dati due eventi E 1 e E 2 , la loro unione E 1

∪ E

2 è data dall’evento

“almeno uno degli eventi E 1 e E 2 si verifica”

  • Può verificarsi anche il caso di due eventi E 1 e E 2 che si rivelano disgiunti , ossia E 1

∩ E

2

Esempio: la prova di lancio di un dado. Due possibili eventi E 1

= [1, 2], E

2

= [2, 4].

- E

1

∪ E

2 = [1, 2, 4]: si verifica quando accade almeno uno dei due eventi.

- E

1

∩ E

2 = [2]: quando si verificano contemporaneamente entrambi.

- E

1

= S − E

1 = [3,4,5,6]: si verifica quando non si verifica E 1

Esempio Eventi disgiunti: E 1 = “numeri pari” E 2 = “numeri dispari” → non esiste nessun numero matematico che sia

contemporaneamente pari e dispari di conseguenza l’intersezione è uguale a 0

1 negato corrisponde a E 2 → con la negazione ci si chiede “tutto quello che non è E 1

Generalmente un evento E è un qualcosa di logico perché o si verifica o non si verifica. Di conseguenza è

possibile giungere alla logica bouleiana e fare l’unione o l’intersezione dei due eventi

Definizione assiomatica della probabilità

Dalla definizione assiomatica si costruisce tutto quello che ne deriva. La misura di probabilità è una funzione che

associa a un evento E ∈ S un valore numerico P (E), che soddisfa le seguenti proprietà:

  1. P(E) ≥ 0 → indica la probabilità

2. P(S) = 1

  1. Data una serie finita o infinita di eventi disgiunti (E i

∩ E

j = ∅ per ogni i ̸= j), P(E 1

∪ E

2

∪...) = P(E

1

)+P(E

2

Proprietà della probabilità fornite dai tre assiomi:

  • Per ogni evento E∈S: P(E)=1−P(E) →P(S)=1-P(∅) di conseguenza P(S) è sempre uguale a 1 e P(∅) è sempre

uguale a 0

  • La probabilità dell’evento impossibile ∅ (insieme vuoto) nulla: P (∅) = 0.
  • Per ogni evento E∈S: 0≤P(E)≤1.
  • Se E 1 eE 2 sono due eventi in S : P (E 1

∪ E

2

) = P(E

1

) + P(E

2

) – P (E

1

∩ E

2 ) → questa formula è definita la regola

dell’addizione o principio delle probabilità totali

Come calcolare la probabilità di un evento

Come definizione classica dice che “La probabilità data dal rapporto tra il numero di casi favorevoli e il numero di casi

possibili, purché essi siano tutti egualmente possibili”.

Esempio: qual la probabilità che esca 5 nel lancio di un dado?

  • Prova: lancio di un dado
  • Spazio degli eventi: S = 1,2,3,4,5,
  • Evento E = [5]
  • Probabilità → P(E) = (numero di casi favorevoli) : (numero di casi possibili) = 1/

Esempio: qual la probabilità che lanciando due volte una moneta si abbia due volte testa?

  • Prova: lancio di una moneta due volte
  • Spazio degli eventi: S = [(T, T), (T, C), (C, T ), (C, C)]
  • Evento E=[(T, T)]
  • Probabilità: P [(T, T)] = (numero di casi favorevoli) : (numero di casi possibili) = ¼

Esempio: qual la probabilità che estraendo a caso una delle regioni italiane per fare un’analisi sulle imprese si estragga

l’Emilia-Romagna?

  • Prova: estrazione di una regione
  • Spazio degli eventi: S= [Valle d’Aosta, Piemonte, …, Sardegna]
  • Evento E = [Emilia-Romagna]
  • Probabilità: P [Emilia-Romagna] = (numero di casi favorevoli) : (numero di casi possibili) = 1/

Principio delle probabilità totali

P (E1 ∪ E2) = P(E1)+P(E2)−P(E1 ∩E2)

- P(E

1

) +P(E

2 ) = probabilità marginale

- (E

1

∩ E

2 ) = probabilità congiunta

Esempio 1. Si calcoli la probabilità che da un mazzo di 52 carte si estragga o un asso (E 1 ) o una carta di cuori (E 2

• E

1

∩ E

2 : evento asso di cuori.

• P(E

1

) = 4/52; P(E2) = 1/4; P(E

1

∩ E

2

• P ( E

1

∪ E

2

) = P(E

1

)+P(E

2

)−P(E

1

∩ E

2 )= 4/52+1/4−1/52 = 3/52+13/52 = 16/52 = 0.31 - > ovvero il 31%

L’evento asso di cuori già compreso nell’evento E1 e quindi lo dobbiamo sottrarre all’evento E 2 altrimenti lo

contiamo due volte.

Esempio 2. Si calcoli la probabilità che lanciando una moneta due volte venga testa almeno una volta.

• S= [(T, T), (C, T), (T, C), (C,C)]

  • i casi favorevoli sono [(T, T), (T, C), (C, T)].

• E

1 : testa al primo lancio. E 2 : testa al secondo lancio. E 1

∩ E

2 : testa sia al primo che al secondo lancio. (E 1

∪ E

2

“almeno una volta esce testa” - > 1-( E 1

∪ E

2

) = (C, C)

• P(E

1

) = 1/2; P(E

2

) = 1/2; P (E

1

∩ E

2

• P ( E

1

∪ E

2

) = P(E

1

) + P(E

2

) −P(E E

1

∩ E

2

La probabilità condizionata

La probabilità condizionata P(E 1

|E

2 ) esprime la probabilità di un determinato evento E 1 condizionatamente al

verificarsi di un evento E 2

. Si calcola come : P (E 1

| E

2

) = [P (E

1

∩ E

2

)] /P(E

2 ) posto che P (E 2

Cioè la probabilità di E 1 dato E 2 uguale alla probabilità congiunta di E 1 e E 2 diviso la probabilità marginale di E 2

Moltiplicando entrambi i membri per P(E 2 ), si ottiene: P(E 1

∩ E

2

) = P(E

2

)P(E

1

| E

2

Principio delle probabilità composte o regola della moltiplicazione

P(E

1

∩ E

2

) = P(E

2

)P(E

1

| E

2

) = P(E

1

)P (E

2

|E

1

Due eventi si dicono indipendenti se il verificarsi di E 2 non influenza la probabilità di E 1 e il verificarsi di E 1 non

influenza la probabilità di E 2

: P(E

1

| E

2

) = P(E

1

) P(E

2

| E

1

) = P(E

2

da cui si ricava P(E 1

∩ E

2

) = P(E

1

)P(E

2 ) per il principio delle probabilità composte o regola della moltiplicazione.

- P(E

1

) = P(E

1

| E

2 ) - > indipendenza

- P(E

1 ) (diverso) P(E 1

| E

2 ) - > dipendenza

Esempio 1 : Si calcoli la probabilità che se una carta estratta di un seme rosso (cuori o quadri) (E 2 ) essa sia un re (E 1

  • La probabilità congiunta di avere un re di seme rosso P(E 1

∩ E

2 ) 2/52 (2 re rossi nel mazzo).

  • La probabilità (marginale) di estrarre una carta di un seme rosso P(E 2

• P(E

1

| E

2

) = [P(E

1

∩ E

2

)]: P(E

2

Quando voglio conoscere la probabilità di A condizionatamente al verificarsi di B scrivo P(A|B) che si legge

“probabilità condizionata di A dato B”. Applicando la definizione classica di probabilità si ha quindi che P(A|B)= (n casi

favorevoli ad A B) : (n dei casi favorevoli a B) ossia P(A|B)=[P(A∩B)]/ P(B) con P(B) > 0

  • Con la stessa logica si ottiene che P(B|A) = [P (A∩B)]/ P(A) se P(A) > 0

Dalla definizione di probabilità condizionata discende la proprietà che viene definita principio delle probabilità

composte, secondo il quale “dati 2 eventi A e B tali che P(A) > 0 e P(B) > 0 si ha che:

P (A∩B) = P(A) x P(B|A) = P(B) x P(A|B)

  • Due eventi A e B si dicono indipendenti se P(A∩B) = P(A) P(B)

Concezione frequentista della probabilità

Non sempre sappiamo quale è l’insieme degli eventi. Inoltre, il concetto di eventi equiprobabili ci porta a definire la

probabilità ricorrendo al concetto di probabilità stessa: vizio logico. Un’altra definizione di probabilità si basa sulla

ripetibilità dell’evento (prova). Il Postulato empirico del caso dice che “In un gruppo di prove ripetute nelle stesse

Variabile casuale binomiale

La variabile casuale con distribuzione detta di Binomiale Bin(n,p) descrive il numero x di successi ottenuti in una serie

di n prove casuali indipendenti, con p probabilità di successo. La variabile casuale binomiale X assume quindi valori x =

0, 1, 2, …, n con probabilità P(X = x) =

x

p

x

(1−p)

n−x

x!(n−x)!

p

x

(1−p)

n−x

  • n! = n×(n−1)×(n−2)×...2×1 (ad esempio, 6! = 6×5×4×3×2×1).
  • Una variabile casuale Binomiale ha valore atteso E(X) = np e varianza pari a V (X) = np(1−p)

Esempio: Supponiamo che ad una partita di rugby il 20% dei tifosi presenti sulle tribune sia femmina. Determinare la

probabilità che, scegliendo in modo casuale 6 tifosi tra quelli presenti ci siano esattamente due femmine.

  • Esperimento: scelta di sei spettatori.
  • Singoli eventi: maschio o femmina.
  • X: numero di femmine. X = [0,1,2,3,4,5,6].
  • P(X =2;n=6;p=0,2)

• P (X=2) = (6 2) 0,

2 0,

2 = 15x0,04x0,41 = 0,

Variabili casuali continue

Consideriamo una variabile casuale che assume valori reali (es. statura, peso,

punteggio medio agli esami sostenuti, reddito, indice di disoccupazione, pil...).

A partire dall’insieme di valori che la X può assumere, chiameremo funzione di

densità di probabilità , la funzione f(x) per cui l’area sottesa, corrispondente ad

un certo intervallo, uguale alla probabilità che X assuma un valore in

quell’intervallo. Quindi in termini più formali la funzione di densità soddisfa, per

ogni intervallo reale, la seguente condizione P ( a ≤ X ≤ b) = ∫ f(x) dx

Le proprietà della funzione di densità sono:

  • f(x) ≥ 0 sempre.
  • L’area totale sottesa alla funzione pari a uno, ossia ∫ f(x) dx = 1

Valore atteso, funzione di ripartizione e varianza di una variabile causale continua

  • Data una variabile casuale continua X, la funzione che fa corrispondere ai valori x le probabilità cumulate P (X

≤ x) viene detta funzione di ripartizione F (x): F(x) = P(X ≤ x) =f(w) dw

  • Il valore atteso di una variabile casuale continua X definito come: E (X) = ∫ 𝒙 f(x) dx = μ
  • La varianza definita come: V(X) = E(X- μ)

2 f(x) dx = σ

2

Variabile causale normale

La variabile casuale Normale X una variabile casuale continua che può

assumere valori su tutto l’asse reale. il valore atteso E(X) = μ e la varianza V

(X) = σ

2

Le principali caratteristiche della funzione di densità normale sono:

  1. Dipende solo dai due parametri μ e σ, rispettivamente la media e la varianza della distribuzione.

  2. Assume una forma campanulare simmetrica intorno al valore μ, che corrisponde anche al valore della x per cui

f(x) raggiunge il suo massimo.

  1. Tende asintoticamente a zero per x che tende a −∞ e +∞.

  2. L’area compresa sotto la curva risulta pari a uno.

  3. È contrassegnata da “intervalli tipici”, cioè aree di probabilità costante indipendenti da media e varianza:

  • il 68.26% dei valori di X sono compresi nell’intervallo μ ± σ
  • il 95.00% dei valori di X sono compresi nell’intervallo μ ± 1.96σ
  • il 95.45% dei valori di X sono compresi nell’intervallo μ ± 2σ
  • il 99,73% dei valori di X sono compresi nell’intervallo μ ± 3σ

Variabile casuale normale standardizzata

Si ricorre spesso a una particolare variabile casuale normale, detta normale standardizzata , avente valore atteso 0 e

varianza 1. Questo perché per questa variabile casuale si dispone di tavole che permettono di calcolare le aree in

corrispondenza di intervalli assunti dalla X. Per questo bisogna trasformare la variabile casuale normale con valore

atteso μ e varianza σ in una normale standardizzata, sottraendo a X il valore atteso μ e dividendo per la radice

quadrata della varianza, ottenendo una nuova variabile denotata con Z : Z = (X- μ)/ σ

Essa ha una distribuzione di densità normale standardizzata pari a

Campionamento e distribuzioni campionarie

La rivelazione statistica può essere:

  • TOTALE : considera tutte le unità della popolazione (es. censimento);
  • CAMPIONARIA : considera un sottoinsieme ridotto di unità della popolazione, cioè il campione statistico.

La nozione di popolazione (introdotta precedentemente) risulta ora da approfondire. La prima distinzione base che va

compiuta è tra:

  • La popolazione finita , ossia costituita da un numero finito di unità rintracciabili in una lista (il numero di

aziende informatiche dell’Emilia-Romagna, i cittadini della provincia di Forlì, …). Sappiamo che `è composta

da N unità ed è descritta dai parametri di popolazione μ = 1/N ∑ x i ; e σ

2 = 1/N ∑ (x i

- μ)

2

  • La popolazione infinita o illimitata, ossia costituita da tutte le unità potenzialmente osservabili e non

necessariamente già esistenti fisicamente (il numero di futuri acquirenti di un certo prodotto, i pezzi difettosi

che può produrre una macchina, …). Indichiamo con X il carattere oggetto di interesse nella popolazione,

caratterizzato da determinati parametri, quali il valore atteso μ = E(X) e σ

2 = E (X – μ)

2

Il campione

Per poter fare inferenza induttiva dai campioni, cioè trarre dalle caratteristiche di un campione le proprietà statistiche

di un insieme di ordine superiore (popolazione finita o infinita/illimitata), è necessario che il campione sia

rappresentativo della popolazione da cui proviene. Per convenzione, si ritiene rappresentativo un campione formato

con criterio casuale: l’eventuale mancata conformità di tale insieme alla popolazione è effetto del solo errore di

campionamento. Se il campione è scelto casualmente è possibile:

  • calcolare il rischio d’errore a cui ci si espone nella stima delle caratteristiche di interesse (errore casuale di

campionamento).

  • estendere mediante processi di inferenza induttiva inversa i risultati all’intera popolazione.

La casualità può essere ottenuta tramite un’operazione di sorteggio (campionamento probabilistico).

I campioni possono essere estratti casualmente dalla popolazione:

  • con ripetizione : una volta estratta un’unità viene rimessa dentro la popolazione e quindi potrebbe essere

nuovamente estratta → Campionamento bernoulliano o casuale semplice.

  • senza ripetizione : una volta estratta un’unità questa viene messa da parte e quindi non può essere estratta

più di una volta. → Campionamento in blocco.

Esiste una sorte di “ universo dei campioni ”, ossia l’insieme di tutti i possibili campioni. L’universo dei campioni ha una

numerosità finita e determinabile, diversa a seconda del piano di campionamento scelto. Data una popolazione di

numerosità N estraendo n unità l’universo dei campioni è costituito da:

  • campionamento bernoulliano: N

n campioni.

  • campionamento in blocco: (N n) campioni.

Esempio:

  • Popolazione: N=6 studenti.
  • Carattere osservato: X: numero di libri posseduti →1 2 3 4 5 6
  • Primo quesito Quali sono la media e la varianza di tale popolazione?

μ = 1/6 ∑ x i

σ

2 = 1/6 ∑ (x i

  • μ)

2 = [(1-3,5)

2 +(2-3,5)

2 +(3-3,5)

2 +(4-3,5)

2 +(5-3,5)

2 +(6-3,5)

2 ] :6 = 2,

  • Secondo quesito Campionando con reimmissione, quanti campioni di numerosità n = 2 si possono estrarre?

N

n = 6

2 = 36

Esempio X: fatturato annuo delle aziende informatiche italiane.

  • Vogliamo stimare il valore atteso della variabile X → E(X) = μ: fatturato medio annuo.
  • Supponiamo di estrarre un campione C di numerosità n
  • Lo stimatore che usiamo, indicato con X ̄, è lo stimatore media aritmetica campionaria

X ̄= 1/n ∑ X i

  • La stima è il valore che tale stimatore assume nell’unico campione osservato

x ̄= 1/n ∑ X i

Variabili casuali campionarie - la proporzione campionaria

Sia X una variabile che assume due soli valori (successo/insuccesso, maschio/femmina, …), che si distribuisce quindi

come una Bernoulliana di parametro π: P(X = x) = π

x (1−π)

1−x x = 0,

Vogliamo stimare il parametro π sulla base di un campione osservato di numerosità n. Si può considerare quindi la

proporzione di casi nel campione che hanno la caratteristica X = 1 sul totale dei casi. Uno stimatore possibile è dato

dalla variabile casuale campionaria proporzione che può essere vista come una media aritmetica campionaria definita

nello specifico P = numero di volte che si presenta X = 1 sul totale n di casi

  • E(P) = π V(P) = [π (1- π)] : n
  • P → n→∞ N (π, √ [ π (1- π)] : n

Proprietà di uno stimatore

Lo stimatore è uno strumento teorico che permette di dare dei giudizi sulla bontà della stima. È necessario individuare

lo stimatore più adeguato per stimare i parametri della popolazione. Lo stimatore presenta delle:

  • proprietà finite : valgono per qualsiasi numerosità del campione.
  • proprietà asintotiche : valgono solo per campioni di grande numerosità.

Vedremo ad esempio che per stimare la media della popolazione si può utilizzare la media campionaria, mentre la

varianza campionaria non è lo stimatore migliore della varianza della popolazione.

Proprietà finite di uno stimatore

  • Correttezza : riferita al valore atteso. Si intende quando uno stimatore T è corretto se il suo valore atteso

coincide col parametro θ che si vuole stimare.

  • Efficienza : riferita alla variabilità.

Fra tutti i campioni ce ne sono alcuni che forniscono sottostime e altri sovrastime del parametro, altri ancora che

danno valori molto lontani, altri molto vicini o anche uguali. Lo stimatore è corretto se sovrastime e sottostime si

compensano , e in media lo stimatore coincide con il valore vero incognito del parametro. Uno stimatore non corretto

si dice DISTORTO e indichiamo con B la distorsione B(T) = E(T) − θ

Media aritmetica campionaria

Esempio. La media aritmetica campionaria è uno stimatore corretto per la

media del carattere X nella popolazione

E(X) = μ?. Lo abbiamo visto empiricamente nell’esempio sul numero di libri

posseduti, vediamolo ora teoricamente

E(X) = E [(∑ X

i )/n] = [∑ X i

E (X

i )]/n = nμ/n = μ

La dimostrazione si basa:

  • sulla proprietà per cui il valore atteso di una somma è uguale alla somma

dei valori attesi

  • tutte le hanno la stessa media in virtù del piano di campionamento

bernoulliano.

Varianza campionaria

Esempio. La varianza campionaria è uno stimatore corretto per la varianza del carattere X nella popolazione

E(S

2 ) = σ

2 ?

Lo stimatore S è definito come S

2 = [∑ (X i

– X)

2 ] /n

Si dimostra che E(S

2 ) = σ

2 → Pertanto lo stimatore è distorto.

Uno stimatore corretto si può ottenere nel seguente modo

S

2 = [∑ (X i

– X)

2 ] /n - 1

Efficienza campionaria

Un’altra proprietà desiderabile per uno stimatore è quella di essere poco variabile , quindi di determinare in media

stime del parametro più vicine al valore vero incognito. La variabilità solitamente è misurata dalla deviazione standard

che nel caso di uno stimatore è anche detta errore standard. L’efficienza è una proprietà relativa e riguarda la

variabilità di uno stimatore.

Uno stimatore è detto più efficiente di un altro se determina stime del parametro più vicine al vero valore, in

media, rispetto ad altri stimatori. Si parla di efficienza di uno stimatore in termini di confronto con quella di un

altro stimatore.

Efficienza

Per valutare la variabilità di T intorno a θ possiamo usare la varianza (o anche

l’errore standard), ma se lo stimatore è distorto è più opportuno usare l’errore

quadratico medio dato dal valore atteso della differenza al quadrato tra lo

stimatore e il valore incognito che si vuole stimare:

MSE(T) = E[T − θ]

2

Si dimostra che:

MSE(T) = E[(T − θ)]2 = V (T) + B(T)

2

dove

V (T ) = E[T − E(T )]

2

Diciamo che lo stimatore T è più efficiente di T se

MSE(T

1

) < MSE(T

2

per tutti i possibili valori di θ. Se lo stimatore è corretto e quindi è nulla la distorsione si ha:

MSE(T) = V (T)

Dati due stimatori corretti T e T, si dirà che T è più efficiente di T se

V (T

1

) < V (T

2

Proprietà degli stimatori - esempio-

Si supponga di estrarre, con campionamento casuale semplice, un campione di numerosità n = 4 da una popolazione

con media μ e varianza σ

2 → (X 1

, X

2

, X

3

, X

4 ). Consideriamo i seguenti due stimatori per il parametro μ di popolazione:

T

1

= X T

2

= (X

1

+ 2X

2

+ 3X

3

+ 4X

4

E (T

1 ) = (X) = μ E (T 2 ) = (7/4)μ → B(T 2 ) = (7/4)μ − μ = (3/4)μ

V (T

1 ) = V(X) = σ

2 /4 V(T 2 ) = (15/16) σ

2

MSE(T

1 ) = σ

2 /4 MSE(T 2 ) = (15/16)σ

2

  • (9/16)μ

2

Proprietà asintotiche - consistenza-

Lo stimatore T n di un parametro θ, dove l’indice indica la dipendenza dello stimatore dalla numerosità campionaria, `e

uno stimatore consistente in media quadratica se

lim MSE(T n ) = lim E(T n

- θ)

2 = 0

da cui lim MSE(T n ) = 0 se e solo se lim V(T n ) = 0 e lim B(T n

Correttezza asintotica

Uno stimatore T n di un parametro è uno asintoticamente corretto se:

lim E(T n

per ogni possibile valore di θ

Indipendenza in media

Dipendenza di un carattere QUANTITATIVO da un carattere QUALITATIVO o QUANTITATIVO DISCRETO.

Y: “tempo per trovare lavoro (in mesi)”

X: “residenza”

Il tempo che mediamente è occorso per trovare la prima

occupazione differente nelle tre aree geografiche di residenza.

In che misura il tempo medio DIPENDE dalla zona

geografica di residenza?

  • dipendenza in media di y da x: Si osservano valori medi di Y differenti in corrispondenza delle diverse

modalità osservate di X. Si realizza quando le medie condizionate di Y rispetto a X NON sono tutte uguali.

  • indipendenza in media di y da x: Si osservano valori medi di Y uguali in corrispondenza delle diverse modalità

osservate di X. Si realizza quando le medie delle distribuzioni condizionate di Y rispetto a X sono tutte uguali.

Conosciamo la distribuzione congiunta di due caratteri Y e X, in cui:

  • Y un carattere quantitativo
  • X un carattere qualitativo o quantitativo discreto.

Nord Centro Sud e isole

Media 5,69 7,50 12,