Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Probabilità e Statistica, Appunti di Probabilità e Statistica

Appunti presi in classe durante tutte le lezioni del prof Orlando. Comprende sia teoria che pratica con esercizi svolti dopo ogni argomento trattato per fissare i concetti.

Tipologia: Appunti

2025/2026

In vendita dal 26/06/2026

luca-fabrizio-1
luca-fabrizio-1 🇮🇹

3

(2)

5 documenti

1 / 114

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Anteprima parziale del testo

Scarica Probabilità e Statistica e più Appunti in PDF di Probabilità e Statistica solo su Docsity!

STATISTICA

DESCRITTIVA

fazione

~

popolazione

campione

I sotto

insieme popolazionel

VARIABILE : Risultato numerico che

puo

variare

(voto esame

,

,

24

,

...

(Sa. calcio : Juve

,

Inter

QUALITATIVE

:

Si descrivano in termini di

categorie/classi

. Sistema

operativo

utilizzato

~

QUANTITATIVE : Si descrivano in termini di valori

numerici.

lintera

-Voto

esame /intera

~

DISCRETE

:

Possono assumere

valori in un

insieme finito

/o

numerabile)

CONTINUE : Assumono valori in intervalli di
R
(a

,

b)

tempo

'

Idecimalel impiegato

Ican

virgelal

DATI DEL CAMPIONE : Valori

assunti della
variabile

in esame

sulle unità del

campione

.

(Juve

,

Inter

~

popolazione

σ

Attenzione al rischio di BIAS

/distorsionel

nella

DATI >> INFERENZA

scelta del

campione

.

Xcampione

Il

campione

deve
rappresentare
la

popolazione

.

FREQUENZE DI DATI

X

·

Siamo Xs

,

Xc

.....,

Xn

dati di un

campione

.

· Siamo

V , V , ...,

Un i

volori che

può

assumere

la variabile

in esame.

·

Fe

,

fa

, ....,

fr

le FREQUENZE ASSOLUTE dei volori nel

campione

ovvero ,

per j

= 1

.....,

k

Osservazione :

I Quante volte esce un

determinato data

Fi

=

n

fj

=

#[i

e

...,

n) tole dhe

Xi

=

Vj }

numero

di dati

numero

elementi insieme

nel

campione

TABELLA
DELLE FREQUENZE ASSOLUTE

va

.

… …

.

Per le variabili

quantitative

continue

,

non si

opera

come

visto in

precedenza

ma si vanno a

raggruppare

i valori in

degli

INTERVALLI

DATI

RAGGRUPPATI IN CLASSI

Siamo

Xs

,

Xc ....,

Xn

dati del

campione

Siamo Is

,

Iz

, ...,

Ik
INTERVALLI

DI CLASSE

(bim)
Siamo
fa

,

fc

, ...,

fr

le

frequenze

assolute

degli

intervalli

Fi

=

#[it(1....,

m)t

. c. Xi

= [

Siamo

Pr , Pr , ..., pr

le

frequenze

relative

degli

intervalli

Ps

IQuante volte i dati codono nel nostro intervalla

ì ;

Iire

Gli

Ij

,

devano

soddisfare la

seguente

condizione :

j

  • 1

compreso

mon compr

. "

Se

Fi

a ,

bill

=

(xeR t

.

c

. aj

= x

=

bi)

Ovj + 1

allora

bj

=

0j

  • 1 per

j

= 1

, ...,

k

  • 1 e

I

deve contenere tutti i valori

assunti dai

dati

In

realtà noi vorrano confrontare

le

frequenze

considerando anche

l'ampiezza

dell'intervalle

:

Stampicontengano

pii ol

e

Per

questo

viene introdotto

il concetto di DENSITA DI FREQUENZA :

DENSITA' di frequenze assolute : di

= a

,

Densità di frequenze relative :

di

ISTOGRAMMA
DELLE DENSITA' :

frequenze

relative lo assolutel

densità

n

k

freq ,

relative f
relativa,
= Area tra l'intervallo
Ic

= dalba-oc

PC

Ps Area totale = 1

bc

a

bg

O

Pコ

Pa

Esempio

:

b

Q

f, rel. <

ba

  • oua

Q

bs

bo

"valori

Ov

Ouz

VALORI DI SINTESI Se il volare modele è unico ,

fr

, ...,

fr

frequenze

assolute Si chiama moda calcolata sui dati. lequivalente :

Pj

=

Pel

Valori che

compaiono

di

più

.

Per le variabili

quantitative continue :

X

, .. ., Xm

dati Una

CLASSE Ij e'

MODALE

se

It

, ...,

In

intervalli

fi

z

fl

fr

, ...,

fr

frequenze

assolute bj-aj

be-ove

per

l= 1 , ..., K P1 , ..., Pr

frequenze

relative Intervallo

con la densità di

frequenza maggiore

m

D'ora

in poi si

parla

di variabili

quantitative

: Lezione

es

MEDIA

Siamo

X ...., Xn

dati del

campione .

La Media CALCOLata Sul Dati /del

campione) e : m

T

⼆ 吉 i

1

ti

I

j

s pjvs * Es : Esami CFU 6 6 .... Vt ~ 6 6

Siano 11

,

... ,n

[

,

1] PESI

, ovvero tolichei

. λ I = 6

  • IIC ,

ta

ot ⑤ IR , t 3

ot % L m

La
MEDIA

PESATA

con

pesi

(Xili

1 .... in CALCOLATA SVI DATI l' : で ⼆ 1

i

ti

media

pesata

=

18 + 1151 S - 3 . 1 系

OSS

: Se Xe , .. ., Xn dati

1 Xi

= fj .

Vj)

La media calcolata sui dati è

equivalente

alla media

pesata

V , ..., Un valori 」

  • 吉 %

Firi

← jpivi dei valori i cui pesi sono le

frequenze

relative

fr,

, ...,

fr

freq

. assolute

P1, ..., Pr

Freq

relative

VARIANZA Piccola :

dati concentrati

Def

:

Siamo X

, ...,

Xn

dati

. Grande :

dati

più

dispersi
La

VARIANZA

I

campionaial

calcolata

sui

dati /del

campionel

e :

Ski

Unità di misura

al

quadrato

lastrattal

IS se occorre

specificare

dei dati

Xil

Xi

·

t

. ∅

La
DEVIAZIONE STANDARD colcelata sui

dati l'i

t

Unità di misura reale.

n

1 ki

  • x)

V

"

St

m - t ize

"

(fi

I?

Mi dice effettivamente di

quanto

i

dati si "allontanano" dalla media.

Misurano
la

"dispensione"

dei dati

rispetto
alla

media .

OSS : Se i dati

Xz

, ...,

Xn Verificano

S= O

,

allora

:

Tutti i dati coincidono

0 = S

1 MKi-

Ki-= O

peri

= 1 ..., Xperi

0 con

la medien

^

i

=

i 1

^

Zo = mF

OSs :

S '

m

.

t: -

i

( ti

  • I

)

'

n. i

1 Ai -

Ztitt

tl

.

I

(i- i

ti

Zt

..

i

ti t

nt

)

m

.

1 (i -

zto - 2

nt ' +

n

)

.

(

iil '

tie nt

'

)

, §

'

n(

xi

  • FORMULA PIU' FACILE PER LA CALCOLATRICE
X

,

. ..,

Xm

dati
Va,

, ...,

Vk

valori

s1mk-

=

m-m)c-

fr,

, ...,

fr

freq

.

assolute

]

P

,

..., Pr

Freq

relative

X

, ...,

Xn

dati

roggruppati

in classi
Variabile

quantitativa

continua formita in

classi :

Classi [Ore

,

bel Lazibal ...

La

,

bul

Un'approssimazione

della

varianza

deviazione standard

calcolata sui
dati

e :

f

.a .

fr fa fr
f
. r. PI Pi
Pr

s 0

品品 (

;

p ;

s

.

u (

p

;

by'

Es :

Xx,

, ...,

Xn

temperature

in OF

S

.

8

Y

, ..., Yn

in

°

C

Qatitb

  • 32

Y

  • attb

Sy

Yo

te

t b

S

§

=

m

.: -

i "

(

π

)

'

  • m

.

:

e

latith

at

b :

& m

.

: -

i ( ti

  • I

'

  • 's'

Si

=

aS

)

Sy

=

1a/Sx

=

5

. 1 .

~

S = O VxeR

perché

el una

rodice

quodrator

QUARTILI Ivariabili

quantitative

Lezione

13/

Tre valori

/Q

,

Qc

,

Qa) che

dividono un

elenco di dati

,

crescente

,

in

quattro parti uguali

;

ciascuna

parte

contiene il

25 %

dei dati .

Siano

Xs ....,

Xn

dati di

un

campione

.

Assumiamo

che i dati siamo ordinati

:

X

= X =... Xm

壮 x Xs

Xm

QUARTILI ESCLUSIVI

:

Escludono

gli

estremi nella divisione

Z m

n

+ 1 del

segmento

in

parti

uguali.

G na Qe
Calcolo del 1 o

quartile

esclusivo

Q1 :

resto

  • X X

Xa x5X6 X

·

m

1

=

ke Es
. dati

:

m

= 7

poi

k e Nn e

40 ,, 3

, 3}

~

_

pesiy

posizion

ss

as

0

aa

s o o a to

Aa
  • a

1

= (

-re)Xx

Ve

Xk

  • 1
Q
Calcolo del 2

o

quartile

esclusivo

QC :

MEDIANA

Es

: dati : 44 56671014

m

= S

·

M

1

. 2

Kate

kz eN

,

r e

{0, ] "

k

,

5

0

0

if

to f

μ

_

poi 1

1

{

posizioni

:

O

2 3 《 可 6 f

g

Öz =

(

-r)Xx

vaxk+ 1

Qc
Re:

Oth =

= O

,

R 5 zoom :

,

5

,

media

peasa

e

ae

Calcolo

del 3

o

quartile

esclusivo Qs :

·

M

  • 1

. 3

Kst

s

Es : M

= Es : m

= 10

ks-N ,

40 ,, 3

,

poi

tt

ato

= atOis

aO

l

L - 是 +

0

T 5

&

s

=

(1-B)xkg

Xa

1

a

viene detto MEDIANA

dei dati :

Avremo metà dei dati

a

destra e

metà a

sinistra

. (Volare

centrale

OSS

:

Quartili, Meno sensibili alla

presenza
di dati anomali

.

INDIVIDUAZIONE DI DATI ANOMALI

3IQR 3IQR

,

5 IQR

,

5 IQR

Δ Δ $

c

O ㎥

o

spetti DATO

ANOMALO

IRQ

anomali

_

_

un

questa

regione

c'è

il

50 % dei

dati

  • >

e

Sospetti

ne anomali

La
distanza

tra

Re e Q3 indica

la

dispersione

dei
dati

rispetto

al volare centrale Qc

.

INTERQUANTILE RANGE :

IQR

=

Qs Qe

Se

Xi è un

dato tole che Se

Xi

l un

dato tole che

Xi non

l'anomalo

e

Xi

= Q1- 3 IQR

/Troppo piccola

xi

= Q
  • 1

,

5 IQR

ω

Xi

= Q

3 IQR

/Troppo grandel

Xi

= Qz

1

,

5 IQR

allora

Xi e un
DATO ANOMALO
/Outlier)

allora

Xi

è un DATO

SOSPETTO
BOX
PLOT

/Diogramma

a

scatola

e

baffil

Dati :

min dato ne anomalo max
dato ne anomalo O =
sospetti

ne sospetto

ne sospetto

X = anomali

X

X

Δ ^

" 、

a
a

^

Può

essere realizzato

anche inverticale :

CALCOLO DEL PERCENTILE CON VARIABILI
QUANTITATIVE
CONTINUE RAGGRUPPATE IN CLASSI :

Sarà un

volare

approssimato,

perché

non abbiamo

tutti

i

prezzi

dei dati

,

ma abbiamo

dei dati

raggruppati

in classi.

Es
: Calcola

il novantesimo

percentile

dei

prezzi

dei dati :

Classi f

. r. free.

cumulate relative

[50,100) 9

,

vogliamo

5

[

,

91 %

27

,

27 %

"

xn

.

^ }

[

,

さ F

L 90 %

[

,

36 %

84 ,

250

302 ,

91 aoo

[

,

45 %

Poo

ricade nell'intervallo tra

,

Xe

, ....

Xn

dati

roggruppati

in

classi

Is

,

...

Ik

,

45 .

10 %

wy

can fe

, ...,

fu

freq

assolute e

Pr , ..., PK

free

relative

、 、

2 5 D 400

1j

= [aj, bj).

II ↑ μ

aj

0 ,

3528

D ,

64 y 2

15 ,

45 %

La FREQUENZA Assoluta cumulata fino

a bj

e' :

Fj

fat fat..

t

fj

α

β = 5 ,

45 %

Le
FREQUENZE RELATIVE

CUMULATE Sond : リーの

=5,45% = 0,

Pi

品⼆

… +㎥←+

Pe

Po

感告

15 ,

45 %

Si vuole calcolare

un'approssimazione

di un

quantile

a

con

2

e 10

,

1) Po

δ

[

I
  • λ

i

ajt

ibi

(Non

distinguiamo

tra inclusivo

esclusiva

= 0 ,

. 250 + 0

,

  1. 400 = 302

,

91

·

Consideriamo 1

. 2 = 100 % L

·

Cerchiamo l'intervallo

Ij

tole che
Es

: Approssimazione

di

Pao :

F Fi

Pso code in

[

,

·

Utilizziamo lo scarto

1-Fi-

> O
per
individuare la

posizione

del

quantile

. Xi

=

30

% 2727o.

=

0 ,

2001

n

;

=

Fj - 1

I

:

  • te . j

, bj

) Poo

=

Xj)

. 130

+ X

;.

m =

Fi

-Fi

P

= 0 ,

130 + 0

,

  1. 150
E[

,

poi

11-X

i

( j

+ Xjb

j

dove X

j

[

,

è un

peso

ESERCIZIO D'ESAME 17/06/

,

o

turno

IEsclusival

  1. Ordiniamo i dati :

,

,

,

,

,

,

,

,

,

,

,

1050 m

= 12

. MAI =

12

#1 = 310,25 < Re = 0, 75.420 +

h27,

5

met

R =

tee

5 530 55,

.

装⼟

.

了⼀⼟⼠

.

  • {
    • 0 .

5

>

Qs

→①

5

. 65 O + ①

,

5

.

  • 6 号

,

5

2 ) IQ

.

R
Q

3

Qe

G
  • 1

,

5 IQR

= 60 non ci sono

dati

sospetti piccoli

,

5 IQR

= 1040 c'è un dato

sospetto

grande

:

1050 C'è solo

un

dato

sospetto

:

+ 3IQR

=

,

: non l anomalo

  1. Box Plot :

P

Δ M

" }

sao

0

427

,

5500555

672 ,

5 1 wop

1050

1100

1 OO

REGRESSIONE LINEARE

Consideriamo i dati

(X

,

Ye)

...,

IXm

,

Ym)

di un CAMPIONE BIVARIATO

Problema

: Cercare

di individuare

una "dipendenza

statistica lineare" tra

i

dati

Xi

e i

dati

Yi

Ψ

DIAGRAMMA A DISPERSIONE :

k

x

□ B

ISCATTERPLOT)

y

·

·

X2 xz

'

Xi

Yin Yin

Yi A

Δ

Δ

4

D

e

D

⑨ ·

e

② w o

t

^

o

□ ←

_

K

>

ti ㎡

DATI
CORRELATI LINEARMENTE /Rettal
DATI CORRELATI NON
LINEARMENTE/Parabolal DATI NON CORRELATI

Cerchiamo

di trovare una retta che

y

= ax +

b

a ,

b

parametri

reali

approssimi

la relazione tra i

dati

Yi

e Xi

T

Dobbiamo

quindi

trovare i coefficienti a e

b

da attribuire alla mostra retta :

y

= ax

  • b

Yi

·

Ki

,

Yil

e

'

Xi

SSE

=

i-laxi +

b) = ela

,

b)
/minore

possibile

c minore errore nell'approssimazione

_ _

Sum of

volare predetto

squared

volore misurat

a me

dalla retta

errors

Obiettivo

:

Trovare a

tali che
elâ

,

min

ela

,

b)
min elo

,

bl

,

GoceloITte

en

da ela

,

b) =

Galax

b-

yi() =

a +

b-

yi

{

&

ela,b) =

Galax

b

yi() =

2ax +

b -

yi)

= 0

M

代⼆ 1

孌感

I =

i-

^

to.

9

i-

s

Yo

{

lats-ani

e

ank + mb

my

{

b

=

y

  • ax

{

¤

Imxi-nx) =

XiYi

nxy

b

=

y

  • at

Segue

che :

XiYi-nx

METODO DEL MINIMI QUADRATI

l

a -

i- e

"

ti

nts

Sono i valori

dei

parametri

che minimizzano

l'errore

.

be

  • at

Lezione

Possiamo

anche scrivere :

D

ef :

Siano

,

Ye)

, ...,

/Xm

,

Ya)

dati di un

campione

bivariato

.

M

>

La COVARIANZA calcolata sui dati

e :

"

器 “

燕別

Covxy

1MKi-(i-)

unita di misuray

b

  • ax

OSs :

CBriy

=

s

i - s "

(

ti-

Illy.

t

is"

tiYo- tif

  • Fet Iy

osS : a

=

Covi

s

=

1 MKiYi-my-my

my

=

Kiyi-ny

PIU' COMODA PER CALCOLATRICE

oSS :

a =

CovyCov g

s

e

Pr

Oss :

· Se

Pr

,

allora

yi

= axi

b

con

acO)

In

questi

casi non

ha erari ,

i

mici dati

giacciono

perfettamente

sulla retto

·

Se

Px, y

,

allora

yi

= axi

+ b

con a

ESERCIZIO D'ESAME 17/06/25 Traccia 3

KE

α

y

= 2

,

56x - 42

,

81

1

@

LF 5 _

1 6 g

_ 器

^

④ 0

ua 0

13 S

  • 0

1 R 5

_ ·

III

1 o

best tr to

a =

XiYi -nx

,

256

ritfti

MJa

La retta

passa

sicuramente

per

il

punto

dato delle medie

{

M

Y = さ 50

b -

y

  • at
  • a 2

,

81

Y

  • aftb
y

= 2

,

56x

  • 42

,

81

A = 60

YA

188

Pre =

County =

Pi-

R

Prig

= 0

.