Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Trasformazioni Lineari: Proprietà di Media e Varianza - Esercizi di Probabilità, Appunti di Statistica

Dispensa creata da me sulla base di tutte le lezioni svolte. Comprende sia la parte teorica che esercizi ed esempi. Molto completa Presenta gli argomenti inerenti al secondo parziale

Tipologia: Appunti

2023/2024

In vendita dal 22/06/2024

chiara.grimoldi3
chiara.grimoldi3 🇮🇹

4.7

(3)

12 documenti

1 / 55

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Trasformazioni lineari: proprietà di media e varianza !
!
!
!
!
!
!
!
!
X= n. computer vendute al giorno!
!
!
Sappiamo che per ogni computer venduto il negozio guadagna 10 euro. !
Qual è il guadagno atteso a fine giornata?!1.
Qual è la varianza del guadagno a fine giornata !2.
!
!
!
!
!
!
Variabili aleatorie discrete, caso particolare: BERNOULLI/BINOMIALE !
Variabile aleatoria di Bernoulli: si basa sull’esperimento aleatorio di Bernoulli che ha solo 2 esiti,
“successo” e “insuccesso”!
Es: lancio della moneta (T o C); tiro in rete (Goal o non goal) !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
se yan beha media ma e84 e8
ESEMPIO
µx3,25 84 2,688
32 5
208,8 è
8g THE 16 39
2ªPARTE
Lie PPE o1
esempio
p0,5 si distribuiscecome
Be p05
SIMMETRICA
ipno
p0,1 Be p0,1
èio ASSIMMETRICA ADESTRA POSITIVA
se pe 0,5
µ0,1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37

Anteprima parziale del testo

Scarica Trasformazioni Lineari: Proprietà di Media e Varianza - Esercizi di Probabilità e più Appunti in PDF di Statistica solo su Docsity!

Trasformazioni lineari : proprietà di media e varianza

X= n. computer vendute al giorno

Sappiamo che per ogni computer venduto il negozio guadagna 10 euro.

  1. Qual è il guadagno atteso a fine giornata?
  2. Qual è la varianza del guadagno a fine giornata

Variabili aleatorie discrete, caso particolare: BERNOULLI/BINOMIALE

  • Variabile aleatoria di Bernoulli : si basa sull’esperimento aleatorio di Bernoulli che ha solo 2 esiti,

“successo” e “insuccesso”

Es: lancio della moneta (T o C); tiro in rete (Goal o non goal)

se

y

an

b e ha media

ma

e

84

e 8

ESEMPIO

μ

x

3,

84 2,

32

208,

è

8g

THE

2 ª

PARTE

L ie

P

PE

o 1

esempio

p

si distribuisce

come

Be

p

SIMMETRICA

i

p

no

p

0,

Be

p

è

io

ASSIMMETRICA

A

DESTRA

POSITIVA

se

pe

0,

Valore atteso e varianza della famiglia di variabili Bernoulli:

=> la probabilità di successo è anche la media di X

Varianza= incertezza se successo o insuccesso

Esempio: gioca a basket e so che farò canestro con probabilità 0,3. E vinco 1€ se faccio canestro

  1. quale variabile aleatoria può modellare questa vincita?

  2. qual è la vincita attesa?

  3. qual è la varianza (incertezza) della vincita?

Distribuzione Binomiale

Esperimento aleatorio: replicare n volte l’esperimento di Bernoulli, con probabilità p, in modo

indipendente

Es. Lancio moneta n=10 volte; controllo di qualità, controllo i primi n= 100 pezzi prodotti

PH

P

o

an

Be

p

0,

ASIMMETRICA

A

SINISTRA NEGATIVA

a

a

μ

Eln

μ

II

A

plx

0 A

p

p p

x

ELN

μ plx μ

p

p

pa

p p

p

A

P

idea

Ix

p

A P

a

gg

massima

varianzaincertezza se

p

0,

Idfinittepee

sicuramente a

successo

o

0,

vincita

I è

p

arretra

μ

p

via pi

a

p

0,3 0,7 0,

In R, funzione di probabilità Binomiale -> dbinom (y,n,p) Bernoulli -> n=

In R, funzione di ripartizione Binomiale -> pbinom (y,n,p)

Esempio

Un promotore finanziario riesce a vendere a un cliente il proprio prodotto con probabilità 0,4. In una

giornata incontra 5 clienti

Qual è la probabilità che riesca a vendere almeno 1 prodotto in quella giornata

Ripetiamo l’esperimento n=5 volte

Y= n. prodotti venduti tra i n=5 clienti

Qual è il numero atteso di prodotti venduti nel giorno?

Per ogni prodotto venduto il promotore guadagna 20€, qual è il guadagno atteso e la sua varianza a

fine giornata?

Ely

n

p

è il n atteso di successi in n

prove

Y

n

p

p

è

la varianza

I Iii

p

singolo

cliente

ma

In

Bi u

p

0,

Sy

o

P

Y

P

Y

a P

Y

a

PIU

S

I

P

4

in R

o 1

albinoni

o

EH

up

2

V

m

p

a

p

0,410,

Y

vi

prodottivenduti nel

giorno

a

guadagno

giornata

o W 204 tras lineare w a

by

c

Esempio 2

VETTORI ALEATORI

(X,Y) è discreto quando entrambe X e Y sono discrete

  • Probabilità congiunta

funzione di probabilità congiunta

Tabella di contingenza (a doppia entrata)

(X,Y) vettore aleatorio

qual è la probabilità che X=1 e Y>2?

  • Probabilità marginali
  • Probabilità condizionate :

X eY sono dipendenti

4 Bi n 10

p

0,

In R

a P 4

8 dba

b

P

Y

pbinom

t 10 0.

a

ppa.es

piu

dbinomls.io a

dbinomla.io a

1s

me

ply

s P

yea

o

pbinom

5 io

pbinom 2,

Pxy

x

Y

P X

Y

y

pay

x

y

o

2

E pay

x

y

Esempio

4

1 2

4 Px

p

x

y

0,

0,

ma

is

PM 1,

2 P

2,

41

ma

di

pe

x

I

p

x

y

fisso

righe

sommo

colonne

di

4

py

Y

E p

x

y

fino

colonne

sommo

righe

a Di

dato

4 4

4

Px

Pygy

Di 4 dato a

Py

Pip

S continua

a

gia

Prob.com

o PIU

0 0.6 PIU 1

VARIABILE ALEATORIA CONTINUA

  • Valori in intervalli (valori reali)
  • Variabile di misurazione (Es. Reddito, tempo, fatturato ecc.)
  • Per descrivere i dati a disposizione si usa l’istogramma (simmetrico, asimmetrico a destra o a

sinistra) -> distribuzione di probabilità di variabili aleatorie continue

La probabilità di una variabile aleatoria continua è indicata dalla funzione di densità di probabilità

la curva che approssima l’istogramma) ->

  • f(x) consente di calcolare probabilità
  • Per variabili continue (a differenza delle variabili discrete):

allora

Un particolare intervallo è

0,

disegni istogrammi

x tale che

fax

1 AREA

ESEMPIO

È

A

Bane

P

a

e

b x ok

a b

P x a o

perogni

a

Plaenebl

P

arena

b

P a

b

P

a

e

e b

C

x

y

Fx

y

P

x

e

y

Èla

funzione

di

ripartizione

CNN.EU

PIxey

y

Media o valore atteso

Varianza

Quartili

Anche per variabile aleatoria continua:

Caso particolare della trasformazione lineare: Standardizzazione

Se X ha

Qualunque sia X, se la standardizzo, cioè , allora Z ha media=0 e varianza=

Una speciale variabile aleatoria continua: Variabile aleatoria normale o Gaussiana

-> densità simmetrica rispetto alla media

-> media = mediana

-> a campana (alta probabilità a valori vicini alla media;

bassa probabilità a valori lontani dalla media

Esempi applicazione:

  • Punteggi test
  • Rendimenti di investimenti finanziari
  • Scarti di produzione
  • Altezza, peso, pressione sanguigna

μ

E FIX dx si

fa

con R

8

VIX

A

M

1

1

si

fa

con R

MEDIANA

go.si

P

go.es 0,

PRIMO QUARTILE

go.rs

P

go.es

0,

TERZO QUARTILE

go.is

P

NE

go.is

Se 4

a bx

y

trasformazione

lineare di

Mx

e

84

e se

g 1

Z

VARIABILE

STANDARDIZZATA

nota

z

Ia

b

È

E

z a

tb.mx

II

ma

v

b 8

8

2

1

Emi

Esempio 2

Il prezzo di un prodotto ha distribuzione normale di media=100 e varianza=

  • qual è la probabilità che il prodotto venga venduto a prezzo superiore a 90
  • determinare il quartile di ordine 0,8. Qual è il suo significato?

Esempio 3

Il rendimento mensile di in titolo segue distribuzione normale, con rendimento medio= 0.04 è uno

scarto quadratico medio= 0.

Qual è la probabilità che il rendimento sia compreso tra 0 e 0.05?

Determinare quel valore k del rendimento tale che sia 0.7 la probabilità di avere rendimento maggiore

di k

Si considerino 6 mesi in ciascuno dei quali la probabilità che il rendimento sia compreso tra 0 e 0.05 è

al punto a (0.539). Qual è la probabilità che in almeno 3 di questi sei mesi il rendimento sia tra 0 e 0.

b P

Ne 2

c

93

commento

quam

0,

la

probabilità

che

x anuma valori

e io

a

4,

è 75

d

senza R

23

go.es

P 90 1

priorm

4

0,

quorm

0,

100

Significato

la probabilità che il

prodotto

venga

venduto

ad un

prezzo

inferiore

a 103

è

dell 80

Plo

e e

p

norm

prorm

o

K

quorm

P A

G

P

K

p

0,

e

probabilità

di

successo

Combinazioni lineari di 2 variabili (discrete o continue)

2 variabili

esempio

Il rendimento di un portafoglio finanziario (T) risulta essere composto da combinazione lineare dei

rendimenti di due titoli:

Sappiamo che i valori attesi dei rendimenti sono:

Inoltre i due rendimenti sono positivamente correlati COV=0.

Determinare rendimento atteso e varianza del portafoglio

n 6 mesi

y

vi di

successi

vi di volte in cui il rendim

è

nell'intervallo

0.05 nei 6 mesi

y

0 1

yn

Bi m 6

p

1

pbinom

1 P

con media

μ

e

varianza

2

y

con media

my

e varianza

8J

COMBINAZIONE LINEARE

W

ax

by

e

casi

particolari

I

I

tg

E

w

μ

w

a.mx

b.my

e

w

8in a

8 b

by

2 ab

cov

x Y

CASI

PARTICOLARI

c

Etattacovina

o

acovix.nl

0 3 0 t

y

si

8g

E TI

0,

0

1 0

VIT

0 32 0 16

0 1005

Statistica inferenziale

Statistica inferenziale : ha come obiettivo di generalizzare le conclusioni (indici di sintesi,

associazione…) del campione all’intera popolazione di riferimento

—> questa inferenza porta a correre dei rischi che prendono il nome di errore campionario (perché il

campione ≠ popolazione), questo errore non si può annullare, ma bisogna misurarlo

Vedremo:

  • Stima puntuale
  • Stima per intervalli
  • Test di ipotesi
  • Regressione lineare

Obiettivo della statistica inferenziale: stimare (approssimare) una caratteristica della popolazione a

partire da un campione -> parametro

Es. Media (fenomeno: reddito); Varianza (fenomeno: reddito); Proporzione (di laureati)

Campione casuale

Es. T. di occupazione in Italia nel 2023

  • ISTAT estrae campione probabilistico di 3000 individui —> stima tasso occupazione 60%

Campione casuale (i.i.d) = è un vettore di n. variabili (x1, x2, …, xn):

‣ Indipendenti tra loro

‣ Identicamente distribuite (rappresentative della popolazione) come la

popolazione

Esempio: X= reddito (fenomeno d’interesse); pop.=famiglie italiane; n=

Campione casuale (x1, x2, x3)

Estrazione: (Anghileri, Carabelli, Annoni ) -> (x1,x2,x3)=(1550, 1700, 2000)

POPOLAZIONE

CAMPIONE

Dati

r

INFERENZA

probabilità

POPOLAZIONE

TARGET

on

casuale probabilistico

rappresentativo

Iiiiia

T.EE 1 ie

aeori

Se campione estratto fosse stato: (Visconti, Comerio, Gervasoni)

—> campione osservato: (x1,x2,x3)=(3700, 2800, 2500)

Da campione casuale (teorico) (X1,X2,…,Xn) ottengo tanti campioni estratti (x1,x2,…,x3)

Esempio

Popolazione di 4 individui (A,B,C,D).

Interessa età= X

Sappiamo che X(A)= 18, X(B)=20, X(C)=22, X(D)=

Estrarre un campione casuale di n=

Quali sono i possibili campioni osservati?

Quali possibili valori X1? (18,20,22,24)

Quali possibili valori X2? (18,20,22,24)

il campione osservato è solo uno dei possibili

Obiettivo: stimare un parametro della popolazione tramite un campione casuale (X1,X2,…Xn) è

campione osservato (x1,x2,…,xn) [es: vettore di redditi per stimare reddito medio]

=> dobbiamo sintetizzare gli n numeri (x1,…xn) in un unico numero ( stima )

  • Stimatore T = T(X1,…,Xn) -> é una sintesi del campione teorico
  • Stima t = T(x1,…,x2) -> sintesi del campione osservato

Esempio (continua)

Vogliamo stimare l’età media della popolazione a partire da un campione di ampiezza n=

  • Quale stimatore?
  • Quali possibili stime?

Campione casuale (X1,X2)

Campione osservato (x1,x2)

campionne osservato

var

aleatori

numeri

è

campione

casuale

a

A

B

B

a

16 possibili

campioni

osservati

Na

Na

e

22,

D

variaicatoriastintesi

immero

a

A

18

1

stima

B

Stimatore T

1

media

campionaria

o

Ittie

D

24

24

stima te

Se popolazione ha distribuzione normale, cioè se allora

grafico :

La situazione preferibile è la curva verde, perché ha delle stime più stabili

Esempio

La percentuale di aumento annuo degli stipendi dei dirigenti di tutte le imprese lombarde di distribuisce

come una normale di media = 12,2 e scarto quadratico medio= 3,

X= aumento dello stipendio

Estraiamo campione casuale di n=9 dirigenti e calcoliamo media campionaria del loro aumento di

stipendio.

Qual è la probabilità che la media campionaria stimi la media della popolazione con valori inferiori a

10? (Probabilità di sottostimare la media)

Teorema centrale del limite —> qualunque sia la distribuzione della popolazione X (non deve per

forza essere una normale) se n grande:

Esempio

Il prezzo medio di vendita delle nuove abitazioni in una città è 115000€ con deviazione standard di

25000 €. Estraiamo in campione casuale di 100 nuove abitazioni vendute.

Qual è la probabilità che il prezzo medio del campione sia superiore a 110000€?

X= prezzo di vendita

NN

n

NN

I

μ

12,

82

P

e

10

prop

3 della

x ̅

visto

che x

nn 12.2 3.6 x̅ N

12,

P

x̅ 10

È

prorm

1 μF

È molto

bassa

la

prob

di sottostimare

I

a

μ

I

i

approssimazione

b

II

i

N n

n

n

non

c'è

ipotesi

che

μ

115

8 25000

dellapopolazione

prezzo

mediodel

campione

n 100

giustifica

uso delTeor

cent

limite

Varianza campionaria

Misura quanto i dati del campione si discostano dalla media del campione

È stimatore della varianza della popolazione

Perché n-1 al denominatore?

se al denominatore avessimo n —> la proprietà non vale più

Esempio

Da un campione casuale di 5 dipendenti di un’azienda abbiamo rilevato il numero di ore di straordinario

nell’ultimo mese: (22,16,28,12,28).

Vogliamo stimare la media e la varianza del numero di ore di straordinario (X) di tutti i dipendenti

dell’azienda (popolazione)

Stimiamo

P x

T.c.tn

115000

P

000 1

priorm

sig

f

Stimatore Parametro

Media

campionaria

μ

media

pop

i

Varianza campionaria

s

I 1

II

i

x ̅

82

varianza

pop

Proporzione campionaria proporzione

della

popolazione

s

I

1

III

82

Se allora

E

5 82

lamentello

stimatore

coincide

con il verovalore

82

con

Esempio

Nella popolazione di un certo comune il 40% è laureato, si estrae un campione casuale di 120 cittadini.

Qual è la probabilità che la stima basata sul campione, della popolazione laureati, sia compresa tra il

35% e il 45%?

2 proprietà importanti per gli stimatori

  1. Non distorsione ( o correttezza) -> stimatore T è non distorto (o corretto) per il parametro che

vuole stimare se

  1. Consistenza -> stimatore T è consistente per stimare il parametro se

(Cioè se variabilità delle stime decresce all’aumentare dell’ampiezza del campione)

i 3 stimatori considerati consistenti sono:

Stima per intervalli: intervalli di confidenza

Stima puntuale si basa solo sul campione osservato, ma è importante tenere conto anche dei campioni

non osservati. Questo è possibile grazie agli intervalli di confidenza

Intervallo di confidenza per stimare : sono due stimatori tali che

Cioè l’intervallo (T1,T2) contiene il vero valore del parametro con una certa probabilità fissato

da noi

“Intervallo di confidenza al 95%” significa che sono confidente che l’intervallo conterrà il vero valore

non laureato

laureato

Be

p

a

propor

di

successo

nella

pop

n 120

Quale

stimatore

per

p

proporzione

campionaria

P

P 0,

I

45 prorm

prorm

poiché

n

50 x ̅

N o

o

p.lt

1

O

E

T

sappiamo

che

o P

è non distorto

per

p

E

E

p

O

VIT

o

se ne sta

a x̅ VII

o

se n a è consistente

5

V

s o

è consistente

proporzione

campionaria

è consistente

μ

Ta Ta

Plta

amata

1

per

es 1 α 1

oasi

am

ÉTÉ

con probabilità = 95%

  1. Costruiamo intervallo di confidenza per la media della popolazione
  • Popolazione normale con varianza nota:

stima migliore per

standardizzazione X

=> intervallo di confidenza per la media a livello di confidenza

Esempio

μ

reddito

medio

famiglie

italiane

intervallo

infryafo

molto

non HA

senso

NU

inctognita

da

stimare conintervalli

μ

è NN

μ

Z

EI

NN

o 1

z

z

n

g

quantile

chelascia

a

sx

1 _I

prob

vogliamo

intervallo

per

μ

a confidenza

1

è

i

Pfa

z

fi

α

P Z

e e

za

z

1

α

PFI.II.net

E

α

μ

è

za

z

fi

Z

I

f

stima

puntuale margine

d'errore

Se 1 α

0,

allora 1

I

0,

Z

Zo as

quam

Se 1 α

0,

allora

I

Z

zoats

quam

o 975

Se

1 α

0,

allora

I

Z

Zona

quam

2,