Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


CALCOLO DELLE PROBABILITÁ E FORMULE, Appunti di Statistica Descrittiva

Incertezza dei dati sperimentali, errori di tipo A e B Formule del calcolo delle probabilità Modelli di distribuzione di probabilità (Poisson, uniforme, Gauss) relative funzioni EXCEL delle formule

Tipologia: Appunti

2020/2021

In vendita dal 15/03/2023

camilla-grea
camilla-grea 🇮🇹

4

(2)

68 documenti

1 / 5

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
CALCOLO DELLE PROBABILITÀ
SIGNIFICATIVITA STATISTICA: quantifica il rischio di sbagliare affermando che le differenze tra i dati non
siano dovute a incertezze di misura valutazione del rischio
L’INCERTEZZA NEI DATI SPERIMENTALI
Una misura, per quanto precisa e accurata, non fornisce un valore esatto. L’incertezza è intrinseca di
qualunque grandezza che sia il risultato di una misura sperimentale, ovvero che sia calcolata usando altre
grandezze misurate sperimentalmente. La statistica ci permette di trattare l’incertezza valutando il rischio
di errore.
La probabilità di commettere un errore maggiore di n deviazioni standard è minore di 1/n2
Il risultato di una misura si esprime sempre indicando: il valore, l’incertezza (±), e le unità di misura
Alcune cause di incertezza comuni possono essere:
- imperfetta realizzazione del misurando
- condizioni ambientali
- valori esatti di costanti e parametri
- approssimazioni
Errori di tipo A = valutazione della deviazione standard
Errori di tipo B = stima della deviazione standard della distribuzione dei possibili risultati della misura
L’incertezza di una misura è definita tramite la varianza 2 della distribuzione dei valori del misurando.
L’errore standard su un valore misurato o valutato da misure indirette è definito come la deviazione
standard .
La diseguaglianza di Cebysev: stima del rischio
𝑃(|𝑥 𝜇| 𝑛𝜎) 1
𝑛2 la probabilità che il risultato di un osservazione x si discosti dal valore vero
più di n-volte la deviazione standard è minore di 1/n2
Errore/incertezza relativa A = A/A es. V= 32cm3 ; M = 2 cm3 M = 0,063 = 6,3% V = 32 cm3 ± 6,3%
Le cifre significative della grandezza e della sua incertezza si devono accordare
La legge (matematica) per la propagazione delle incertezze nelle misure indirette (grandezze derivate)
richiede la varianza
Y = F(x1, x2, x3…) in cui ogni x ha una propria deviazione standard 1, 2, 3… y = ?
pf3
pf4
pf5

Anteprima parziale del testo

Scarica CALCOLO DELLE PROBABILITÁ E FORMULE e più Appunti in PDF di Statistica Descrittiva solo su Docsity!

CALCOLO DELLE PROBABILITÀ

SIGNIFICATIVITA STATISTICA: quantifica il rischio di sbagliare affermando che le differenze tra i dati non

siano dovute a incertezze di misura → valutazione del rischio

L’INCERTEZZA NEI DATI SPERIMENTALI

Una misura, per quanto precisa e accurata, non fornisce un valore esatto. L’incertezza è intrinseca di

qualunque grandezza che sia il risultato di una misura sperimentale, ovvero che sia calcolata usando altre

grandezze misurate sperimentalmente. La statistica ci permette di trattare l’incertezza valutando il rischio

di errore.

La probabilità di commettere un errore maggiore di n deviazioni standard è minore di 1/n

2

Il risultato di una misura si esprime sempre indicando: il valore, l’incertezza (±), e le unità di misura

Alcune cause di incertezza comuni possono essere:

  • imperfetta realizzazione del misurando
  • condizioni ambientali
  • valori esatti di costanti e parametri
  • approssimazioni

Errori di tipo A = valutazione della deviazione standard

Errori di tipo B = stima della deviazione standard della distribuzione dei possibili risultati della misura

L’incertezza di una misura è definita tramite la varianza 

2

della distribuzione dei valori del misurando.

L’errore standard su un valore misurato o valutato da misure indirette è definito come la deviazione

standard .

La diseguaglianza di Cebysev: stima del rischio

1

𝑛

2

→ la probabilità che il risultato di un osservazione x si discosti dal valore vero 

più di n-volte la deviazione standard  è minore di 1/n

2

Errore/incertezza relativa  A

A

/A es. V= 32cm

3

M

= 2 cm

3

M

= 0,063 = 6,3% → V = 32 cm

3

Le cifre significative della grandezza e della sua incertezza si devono accordare

La legge (matematica) per la propagazione delle incertezze nelle misure indirette (grandezze derivate)

richiede la varianza

Y = F(x1, x2, x3…) in cui ogni x ha una propria deviazione standard 1, 2, 3… → y =?

Incertezze di tipo A

Incertezza sulla media campionaria 𝑋

𝑥

̅

Combinazione delle incertezze di tipo A e tipo B: se uA e uB sono rispettivamente incertezze di tipo A e di

tipo B, l’incertezza totale è 𝑢

𝑡𝑜𝑡

𝐴

2

𝐵

2

Il criterio di Chauvenet

Dato un insieme di N valori, nell’ipotesi che i dati seguono una distribuzione normale con un valore atteso

e deviazione standard, scelgo un intervallo tale che racchiuda N-1/2 valori.

Sono da considerarsi outlaiers ovvero un valore anomalo e aberrante ossia chiaramente distante dalle altre

osservazioni, I valori il cui scarto in modulo sia maggiore di:

𝜖 max = 𝑑𝑒𝑣. 𝑠𝑡.× 𝐼𝑁𝑉. 𝑁𝑂𝑅𝑀. 𝑆𝑇(

𝜖 max = 𝑑𝑒𝑣. 𝑠𝑡.× 𝐼𝑁𝑉. 𝑁𝑂𝑅𝑀. 𝑆𝑇(𝑃

𝑜𝑢𝑡

Non sempre affidabile al 100% perché potrebbe lasciare fuori dei valori che in realtà sono buoni

CALCOLO DELLE PROBABILITA

Gli eventi possono essere:

  • compatibili, se possono avvenire insieme
  • incompatibili, se non possono avvenire insieme
  • dipendenti, se l’avvenire di uno influisce sull’avvenire dell’altro
  • indipendenti, se l’avvenire di uno non influenza l’avvenire dell’altro
  • complementari, se l’avvenire di uno esclude l’avvenire dell’altro

Probabilità di un evento A → P(A) = n. casi favorevoli / n. casi possibili (equiprobabili); sempre compreso

tra 0 e 1

Frequenza di un evento A → f(A) = n. successi / n. prove indipendenti

Numeri di successi attesi dopo Ntot prove indipendente → N=Ntot*P(A)

Probabilità di A oppure B

P(AB) = P(A) + P(B) - P(AB) nel caso di eventi compatibili

P(AB) = P(A) + P(B) nel caso di eventi incompatibili

Eventi complementari = AB = 1 → P(A) = 1- P(B) e P(B) = 1 – P(A)

Probabilità di A e B

P(AB) = P(A)P(B|A) = P(B)P(A|B) → teorema di Bayes nel caso di eventi dipendenti

P(AB) = P(A)P(B) nel caso di eventi indipendenti

P(B|A) = probabilità che avvenga B una volta che si è verificato A

P(A|B) = probabilità che avvenga A una volta che si è verificato B

Se P(B|A) = P(B) oppure P(A|B) = P(A) gli eventi sono indipendenti

P(A|B) = P(AB) / P(B)

Esempio di applicazione del teorema di Bayes: i test di screening

  • sensibilità = veri positivi (T+|M+) →→→→ falsi negativi (T-|M+) = 1- sensibilità
  • specificità = veri negativi (T-|M-) →→→→ falsi positivi (T-|M+) = 1- specificità

DISTRIBUZIONE DI POISSON

Qual è la probabilità che si verifichino k successi su N prove in un dato intervallo di tempo o di spazio sapendo

che in media se ne verificano ?

𝑘

−𝜆

  • Gli eventi devono essere indipendenti
  • La probabilità che gli eventi avvengono insieme non è nulla

=POISSON(k;  ;c)

c = cumulativo

Valore atteso  = 

Varianza 

2

Dev. st.  =

DISTRIBUZIONE UNIFORME

Per una variabile continua la probabilità di osservare un determinato valore è uguale in tutti i punti

dell’intervallo

F(x) = funzione di distribuzione di probabilità → funzione che calcola la probabilità di ottenere un valore

minore o uguale ad x = integrale di p(x) d(x) = area

p(x) = densità di probabilità = dF(x)/dx = distribuzione a campana di Gauss = derivata di F

Intervallo L = B-A

F(x) = x-A / L

P(x) = 1 / L

Valore atteso  = L / 2

Varianza 

2

= L

2

Dev. st.  = L /  12

DISTRIBUZIONE DI GAUSS

Teorema del limite centrale

Sia una variabile aleatoria X la cui distribuzione ha valore atteso  e deviazione standard . Se da questa

vengono estratti campioni casuali ciascuno di numerosità N, la distribuzione dei valori medi P(𝑥̅ ) è:

  • Approssimativamente normale, con
  • valore atteso (𝑥̅ )

uguale al valore atteso della popolazione

  • e deviazione standard 𝜎

𝑥̅

𝜎

√𝑁

→ viene usata per fare previsioni sul valore medio della popolazione (N molto grande), avendo osservato

un determinato valore dal campione

=DISTRIB.NORM(x;  ;  ;c) funzione inversa =INV.NORM(  ;media;dev.st)

=DISTRIB.NORM.N(x;  ;  ;c)

Una distribuzione normale con  = 0 e  = 1 è detta distribuzione normale standard = DISTRIB.NORM.ST

I punti a distanza , 2, 3 rappresentano i valori critici della distribuzione normale, utilizzati per la

definizione di intervalli di confidenza standard = l'intervallo di valori entro i quali si stima che cada, con un

certo livello di probabilità, il valore vero della popolazione.

INTERVALLI DI CONFIDENZA

Un intervallo di confidenza individua una regione attorno al valore misurato (media) che contiene il valore

atteso  (vero) della popolazione da cui proviene il dato con probabilità .

  • Un intervallo di confidenza si trova tra due valori limite 𝑥̅ −

2

e 𝑥̅ +

2

, al di la dei quali c’è 

  • =1- è la probabilità che per caso l’intervallo non contenga il valore vero  della popolazione da

cui proviene il dato - > presenta il rischio di commettere un errore maggiore di /2 nella stima del

valore vero

  • /2 rappresenta il rischio di commettere un errore per eccesso (o per difetto) maggiore di /2 nella

stima del valore vero.

Δ

2

= 𝐶𝑂𝑁𝐹𝐼𝐷𝐸𝑁𝑍𝐴. 𝑁𝑂𝑅𝑀(𝛼; 𝜎; 𝑁) deviazione standard nota → modello gaussiano

Δ

2

deviazione standard campionaria → modello T-student

DISTRIBUZIONI QUASI NORMALI

Per diversi fenomeni la distribuzione dei risultati può essere approssimata ad una distribuzione normale,

eventualmente come prima approssimazione, in prospettiva di un successivo approfondimento.

  • Propagazione delle incertezze sperimentali
  • Distribuzione di Poisson
  • Retta di regressione
  • Coefficiente di correlazione