Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Probabilità e Statistica, Appunti di Probabilità e Statistica

Probabilità e statistica aa 2024/25

Tipologia: Appunti

2023/2024

Caricato il 12/11/2025

alberto-bernasconi-1
alberto-bernasconi-1 🇮🇹

2 documenti

1 / 22

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Probabilit`a e Statistica
Alberto Bernasconi
a.a. 2024/2025
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16

Anteprima parziale del testo

Scarica Probabilità e Statistica e più Appunti in PDF di Probabilità e Statistica solo su Docsity!

Probabilit`a e Statistica

Alberto Bernasconi

a.a. 2024/

Indice

  • 1 Distribuzione di frequenza
    • 1.1 Indici di posizione e di dispersione
      • 1.1.1 Definizione
      • 1.1.2 Definizione
      • 1.1.3 Definizione
      • 1.1.4 Definizione
      • 1.1.5 Definizione
      • 1.1.6 Definizione
      • 1.1.7 Definizione
      • 1.1.8 Definizione
    • 1.2 Analisi della forma di distribuzione
      • 1.2.1 Definizione
    • 1.3 Correlazione fra le variabili
      • 1.3.1 Definizione
      • 1.3.2 Definizione
      • 1.3.3 Definizione
    • 1.4 Metodo dei minimi quadrati
      • 1.4.1 Definizione
    • 1.5 Parabola dei minimi quadrati
      • 1.5.1 Definizione
    • 1.6 Metodo di linearizzazione
      • 1.6.1 Esempio di linearizzazione
  • 2 Probabilit`a
    • 2.1 Esperimenti casuali
    • 2.2 Spazio dei campioni
    • 2.3 Eventi
      • 2.3.1 Definizione
  • 3 Calcolo combinatorio
    • 3.1 Introduzione al calcolo combinatorio
      • 3.1.1 Teorema
      • 3.1.2 Teorema
      • 3.1.3 Definizione
      • 3.1.4 Teorema
      • 3.1.5 Definizione
      • 3.1.6 Teorema
      • 3.1.7 Teorema
      • 3.1.8 Definizione
      • 3.1.9 Teorema
    • 3.2 Assiomatica di probabilit`a
      • 3.2.1 teorema
      • 3.2.2 teorema
      • 3.2.3 teorema
    • 3.3 Probabilit`a condizionata
      • 3.3.1 teorema
      • 3.3.2 Definizione
    • 3.4 teorema
      • 3.4.1 Osserazione
    • 3.5 Teorema di Bayes
      • 3.5.1 teorema
      • 3.5.2 Teorema
      • 3.5.3 Osservazione
      • 3.5.4 Definizione
      • 3.5.5 Definizione
      • 3.5.6 Definizione
  • 4 Variabili aleatorie e distribuzioni di probabilita - 4.0.1 Definizione - 4.0.2 Definizione - 4.0.3 Distribuzione di probabilita discrete - 4.0.4 Definizione - 4.0.5 Definizione
    • 4.1 Densita di probabilit`a
      • 4.1.1 Definizione
      • 4.1.2 Osservazione
    • 4.2 Parametri di una distribuzione
    • 4.3 Valor medio - caso discreto
      • 4.3.1 Definizione
      • 4.3.2 Osservazione
    • 4.4 Valor medio - caso continuo
      • 4.4.1 Definizione
    • 4.5 Varianza e scarto quadratico medio
      • 4.5.1 Definizione
      • 4.5.2 Definizione
    • 4.6 Varianza e scarto quadratico medio - caso discreto
      • 4.6.1 Definizione
      • 4.6.2 Definizione
    • 4.7 Varianza e scarto quadratico medio - caso continuo
      • 4.7.1 Definizione
      • 4.7.2 Definizione
      • 4.7.3 Definizione
    • 4.8 Altre misure di tendenza centrale - Moda e mediana
      • 4.8.1 Definizione
    • 4.9 Definizione
    • 4.10 Disuguaglianze di Chebyshev
      • 4.10.1 Teorema
  • 5 Distribuzioni di probabilita discrete
    • 5.1 Distribuzione binomiale di Bernoulli
      • 5.1.1 Teorema
      • 5.1.2 Propriet`a
      • 5.1.3 Propriet`a
    • 5.2 Uso delle tavole della distribuzione binomiale
    • 5.3 Relazione di ricorrenza per la distribuzione binomiale
      • 5.3.1 Propriet`a 3: Relazione di ricoorrenza per la binomiale
  • 6 Distribuzione di Poisson - 6.0.1 Teorema - 6.0.2 Propriet`a
    • 6.1 Relazione di ricorrenza per la distribuzione di Poisson
      • 6.1.1 Propriet`a 5: Relazione di ricorrenza per la Poisson
    • 6.2 Approsimazione dlela distribuzione binomiale con la distribuzione di Poisson
  • 7 Distribuzione di probabilit`a continue
    • 7.1 Distribuzione uniforme
    • 7.2 Distribuzione normale o di Gauss
      • 7.2.1 Definizione
    • 7.3 Distribuzione normale standardizzata
      • 7.3.1 La distribuzione di probabilita della variabile normale standardizzata Ze data da
      • 7.3.2 La funzione di distribuzione o di ripartizione della variabile normale standardizzata Z `e data da
    • 7.4 Alcune applicazioni della distribuzione normale
      • 7.4.1 Curva degli errori casuali nella misurazione di una grandezza fisica.
        • casuali attorno a una media. 7.4.2 Distribuzione di una caratteristica quantitativa di una popolazione, che presenta oscillazioni
      • 7.4.3 Dimensione effettiva di oggetti prodotti in serie, che si cerca di produrre in modo identico.
    • 7.5 Uso delle tavole della distribuzione normale
      • 7.5.1 Propriet`a
    • 7.6 Relazione tra la distribuzione binomiale e la distribuzione normale
    • 7.7 Distribuzione uniforme
      • 7.7.1 Definizione
      • 7.7.2 Propriet`a
  • 8 Teoria elementare dei campioni
    • 8.1 stime puntuali e stime per intervallo
      • 8.1.1 Definizione
      • 8.1.2 Definizione
      • 8.1.3 Definizione
  • 9 Tesi di ipotesi
    • 9.1 Introduzione
      • 9.1.1 Definizione
    • 9.2 Ipotesi statistiche
      • 9.2.1 Regole per la scelta delle ipotesi
      • 9.2.2 Tipi di errore e livello di significativit`a
      • 9.2.3 Definizione
      • 9.2.4 Definizione
      • 9.2.5 Definizione
      • 9.2.6 Definizione
    • 9.3 Test di ipotesi sulla media (varianza nota)
      • 9.3.1 Definizione
    • 9.4 Test di ipotesi sulla media
    • 9.5 Test di ipotesi sulla proporzione
  • 10 Test chi-quadro
    • 10.1 Test chi-quadro di adattamento
    • 10.2 Test chi-quadro di indipendenza

1 Distribuzione di frequenza

1.1 Indici di posizione e di dispersione

1.1.1 Definizione 1 Si definisce media aritmetica di un insieme di dati come la somma dei dati diviso il numero di dati. Per ogni valore viene poi definito lo scarto dalla media, ovvero la differenza tra il valore e la media. Si definisce poi la varianza come la media degli scarti al quadrato, ovvero:

σ^2 =

n

X^ n

i=

(xi − x¯)^2

1.1.2 Definizione 2 Si definisce la mediana come il valore che divide in due parti uguali un insieme di dati ordinati. Se il numero di dati e dispari, la medianae il valore centrale; se e pari,e la media dei due valori centrali.

1.1.3 Definizione 3

Si definisce moda come il valore che all’interno di una raccolta di dati e il piu frequente, ovvero che si presenta il maggior numero di volte. Oltre alla mediana `e possibile definire altri indici di posizione che prendono il nome di primo quartile e terzo quartile.

1.1.4 Definizione 4

Si definisce primo quartile il valore che in un insieme di numeri ordinati `e minore o uguale al 25% dei dati.

1.1.5 Definizione 5 Si definisce terzo quartile il valore per cui il 75% dei dati `e minore o uguale a tale valore.

1.1.6 Definizione 6 Si definisce varianza campionaria la quantit`a:

s^2 =

n − 1

X^ n

i=

(xi − x¯)^2

1.1.7 Definizione 7

si definisce scarto quadratico medio o deviazione stanrdard come la radice quadrata della varianza:

s =

v u u t 1 n − 1

X^ n

i=

(xi − x¯)^2

1.1.8 Definizione 8 Il coefficiente di variazione e definito come cio che indica lo scarto quadratico medio in valore percentuale rispetto alla media:

CV = s x ¯

q 1 n− 1

Pn i=1(xi^ −^ x¯) 2

x ¯

1.2 Analisi della forma di distribuzione

per analizzare la forma di distrubzione di un insieme di dati e sufficiente confrontare la media e la mediana, se la mediae maggiore della mediana si ha una distribuzione asimmetrica a destra, se la media `e minore della mediana si ha una distribuzione asimmetrica a sinistra, se la media e la mediana coincidono si ha una distribuzione simmetrica.

1.2.1 Definizione 9 la relazione tra media e mediana pu`o essere utilizzata per definire una misura di asimmetria detta: coefficiente di asimmetria di Pearson. SK =

3(¯x − M ) s

1.6.1 Esempio di linearizzazione

Supponiamo di avere una relazione esponenziale tra due variabili:

y = aebx

Per linearizzare questa relazione, si applica il logaritmo naturale a entrambi i membri:

ln y = ln a + bx

Ponendo Y = ln y e A = ln a, si ottiene una relazione lineare:

Y = bx + A

In questo modo, si possono applicare i metodi di regressione lineare ai dati trasformati.

2 Probabilit`a

2.1 Esperimenti casuali

Un esperimento casuale e un procedimento che, pur essendo eseguito nelle stesse condizioni, puo produrre risultati diversi e imprevedibili. Ad esempio, il lancio di una moneta o di un dado sono esperimenti casuali, poich´e non `e possibile prevedere con certezza il risultato di ciascun lancio.

2.2 Spazio dei campioni

Lo spazio dei campioni (o spazio campionario), indicato con S o Ω, e l’insieme di tutti i possibili risultati di un esperimento casuale. Ad esempio, per il lancio di una moneta, lo spazio dei campionie Ω = {Testa, Croce}; per il lancio di un dado a sei facce, Ω = { 1 , 2 , 3 , 4 , 5 , 6 }.

2.3 Eventi

Un evento e un qualsiasi sottoinsieme dello spazio dei campioni. Un evento semplicee costituito da un solo risultato, mentre un evento composto contiene piu risultati. Ad esempio, nel lancio di un dado, l’evento ”esce un numero pari” corrisponde al sottoinsieme { 2 , 4 , 6 }.e possibile schematizzare gli eventi in un diagramma di Venn, dove ogni cerchio rappresenta un evento e le aree sovrapposte indicano eventi che condividono risultati comuni. come algebra insiemistica valgono le seguenti operazioni:

  • Unione: A ∪ B `e l’insieme di tutti gli elementi che appartengono ad almeno uno dei due eventi A o B.
  • Intersezione: A ∩ B `e l’insieme di tutti gli elementi che appartengono sia all’evento A che all’evento B.
  • Differenza: A − B `e l’insieme degli elementi che appartengono all’evento A ma non all’evento B.
  • Complemento: A `e l’insieme degli elementi che non appartengono all’evento A.
  • Evento certo: l’insieme di tutti gli elementi dello spazio dei campioni, denotato come S o Ω.
  • Evento impossibile: l’insieme vuoto, denotato come ∅.

2.3.1 Definizione 1

Due eventi A e B sono detti mutuamente esclusivi o incompatibili se non hanno elementi in comune, ovvero se la loro intersezione `e l’insieme vuoto: A ∩ B = ∅.

3 Calcolo combinatorio

3.1 Introduzione al calcolo combinatorio

Il calcolo combinatorio e una branca della matematica che si occupa di contare, ordinare e raggruppare gli elementi di un insieme secondo determinate regole. E fondamentale per risolvere problemi in cui si vogliono determinare il numero di modi in cui si possono verificare determinati eventi, come ad esempio la formazione di gruppi, la disposizione di oggetti o la scelta di sottoinsiemi. Le principali questioni affrontate dal calcolo combinatorio sono:

  • Disposizioni: conteggio delle sequenze ordinate di oggetti.
  • Permutazioni: conteggio dei modi in cui si possono ordinare tutti gli elementi di un insieme.
  • Combinazioni: conteggio dei modi in cui si possono scegliere sottoinsiemi di oggetti senza considerare l’ordine.

Il calcolo combinatorio e alla base di molte applicazioni della probabilita e della statistica, poich´e permette di determinare il numero totale di casi possibili e di casi favorevoli in un esperimento casuale.

3.1.1 Teorema 1

se gli insiemi A 1 A 2... Ak contengono rispettivamente n 1 , n 2... nk elementi, il numero di assegnazione di elementi `e:

N = n 1 · n 2... nk

3.1.2 Teorema 2

il numero di disposizioni con ripetizioni di n oggetti distinti presi a gruppi di k `e dato da:

D(n, k) = nk

3.2.2 teorema 8

Se A e B sono due eventi di uno spazio campione S, allora:

P (A ∪ B) = P (A) + P (B) − P (A ∩ B)

3.2.3 teorema 9

Se A `e un qualunque evento di S, allora: P (A) = 1 − P (A)

3.3 Probabilit`a condizionata

La probabilita condizionata di un evento A dato che sie verificato un evento B (con P (B) > 0) `e definita come:

P (A|B) =

P (A ∩ B)

P (B)

dove P (A ∩ B) e la probabilita che si verifichino entrambi gli eventi A e B. analogamente, se P (B) ̸= 0, la proprabilita di A condizionata a Be definita come:

P (A|B) =

P (A ∩ B)

P (B)

il seguente risultato e conseguenza immediata della definizio di probabilita condizionata:

3.3.1 teorema 10

P (A ∩ B) = P (A) · P (B|A) se P (A) ̸= 0 P (B ∩ A) = P (B) · P (A|B) se P (B) ̸= 0

questo significa che la probabilita di A e B che si verificano contemporaneamentee uguale alla probabilita di A moltiplicata per la probabilita di B dato che A si e verificato, oppure alla probabilita di B moltiplicata per la probabilita di A dato che B sie verificato.

3.3.2 Definizione 6

Due eventi A e B sono detti indipendenti se la probabilita di A dato che sie verificato B e uguale alla probabilita di A, ovvero: P (B|A) = P (B)

e viceversa: P (A|B) = P (A)

in questo caso il teorema 10 diventa:

3.4 teorema 11

Se A e B sono due eventi indipendenti, allora:

P (A ∩ B) = P (A) · P (B)

3.4.1 Osserazione

Si osservi che eventi mutuamente esclusibi, non sono indipendenti, poich´e se A e B sono mutuamente esclusivi, allora P (A ∩ B) = 0, mentre se sono indipendenti, allora P (A ∩ B) = P (A) · P (B), che non `e necessariamente zero.

3.5 Teorema di Bayes

Il teorema di Bayes e un risultato fondamentale della teoria della probabilita che consente di aggiornare le probabilit`a a posteriori in base a nuove informazioni. Esso afferma che:

3.5.1 teorema 12

Sia A un evento e {B 1 , B 2... , Bn} una famiglia di eventi dello spazio canpione S mutuamente esclusivi e tali che uno e uno solo di essi si verifichi, ossia tali che

Bi ∩ Bj = ∅ per i ̸= j (mutuamente esclusivi)

B 1 ∪ B 2 ∪ · · · ∪ Bn = S (esaustivi) P (Bi) ̸= 0 per ogni i

Allora si dimostra che:

P (A) = P (A|B 1 ) · P (B 1 ) + P (A|B 2 ) · P (B 2 ) + · · · + P (A|Bn) · P (Bn) =

X^ n

i=

P (A|Bi) · P (Bi)

3.5.2 Teorema 13

Sia A un evento con P (A) > 0 e {B 1 , B 2 ,... , Bn} una famiglia di eventi dello spazio campione S soddisfacenti le ipotesi del teorema precedente. Allora:

P (Bk|A) = P (A|Bk) · P (Bk) Pn i=1 P^ (A|Bi)^ ·^ P^ (Bi) questo teorema ci permette di trovare le probabilita degli eventi Bk che possono essere la causa del verificarsi dell’evento A, in altre parole che l’effetto A sia stato provocato dalla causa Bk; per questo motivoe detto anche teorema della probabilita a posteriori teorema della probabilita delle cause

3.5.3 Osservazione

Nel caso in cui gli eventi della famiglia {B 1 , B 2 ,... , Bn} hanno la stessa probabilita P (Bi) = 1 n , il teorema di Bayes si semplifica notevolmente:

P (Bk|A) =

P (A|Bk) Pn i=1 P^ (A|Bi) Usufruendo delle nozioni di probabilit`a condizionata si danno le seguenti definizione, considerando tale legenda:

  • Evento M = ”l’individuo `e malato”
  • Evento S = ”l’individuo `e sano”
  • Evento Pos = ”l’individuo risulta positivo al test”
  • Evento Neg = ”l’individuo risulta negativo al test”

3.5.4 Definizione 7

La Probabilita condizionata P (P os|M ) viene detta sensibilita del test.

3.5.5 Definizione 8

La Probabilita condizionata P (N eg|S) viene detta specificita del test.

3.5.6 Definizione 9

La probabilita che un individuo che risulta positivo al test sia effettivamente malatoe data da P (M |P os), e viene detta valore predittivo del test.

4.3 Valor medio - caso discreto

4.3.1 Definizione 6 si definisce valor medio o speranza matematica di una variabile aleatoria discreta X la quantit`a:

μ = E(X) = x 1 P (X = x 1 ) + x 2 P (X = x 2 ) + · · · + xnP (X = xn) =

X^ n

i=

xi(P (X = xi) =

X^ n

i=

xi℧(xi))

4.3.2 Osservazione nel caso particolare in cui le probabilit`a di ℧(xi) sono tutte uguali:

f (xi)P (X = xi) =

n

i = 1, 2 ,... , n

in tal caso μ diventa la media aritmetica di x 1 , x 2 ,... , xn:

μ = E(X) =

x 1 + x 2 + · · · + xn n

4.4 Valor medio - caso continuo

4.4.1 Definizione 7

si definisce valor medio di X la quantit`a:

μ = E(X) =

Z +∞

−∞

x℧(x)dx

4.5 Varianza e scarto quadratico medio

4.5.1 Definizione 8 si definisce varianza della variabile aleatoria discreta X la quantit`a:

σ^2 = V ar(X) = E[(X − μ)^2 ] =

dove μ `e il valor medio della variabile aleatoria X

4.5.2 Definizione 9 La radice quadrata non negativa σ =

p V ar(X) =

p E[(X − μ)^2 ]

e detta scarto quadratico medio o deviazione standart di X La varianza (o la deviazione standard)e una misura della dispersione dei valori della variabile aleatora X attorno al valor medio μ. Se i valori sono concentrati vicino alla media, la varianza e piccola, mentre se i vlaori sono dispersi lontano dal valor medio, la varianzae grande.

4.6 Varianza e scarto quadratico medio - caso discreto

4.6.1 Definizione 10

si definisce varianza della variabile aleatoria discreta X, avente valore medioμ, la quantit`a:

σ^2 =

X^ n

i=

(xi − μ)^2 ℧(xi)

4.6.2 Definizione 11 si definisce deviazione standard o scarto quadratico medio della variabile aleatoria discreta X avente valore medio μ, la quantit`a:

σ =

vu u t

Xn

i=

(xi − μ)^2 ℧(xi)

4.7 Varianza e scarto quadratico medio - caso continuo

4.7.1 Definizione 12

si definisce varianza della variabile aleatoria continua X la quantit`a.

σ^2 = E[(Xμ)] =

Z +∞

−∞

(x − μ)^2 ℧(x)dx

4.7.2 Definizione 13

si definisce scarto quadratico medio o deviazione standard della variabile aleatoria continua X la quantit`a:

σ =

sZ +∞

−∞

(x − μ)^2 ℧(x)dx

Per il valor medio e la varianza valgono alcune propriet`a:

  • Sia X una variabile aleatoria con valor medio E(X); si ha:

E(aX + b) = aE(X) + b

dove a e b sono costanti reali.

  • Sia X e Y due variabili aleatorie con valori medi E(X) e E(Y ); si ha:

E(aX + bY ) = aE(X) + bE(Y )

dove a e b sono costanti reali.

  • Siano X e Y variabili aleatorie indipendenti( ci`o avviene se gli eventi X = xi e Y = yj sono indipendenti per ogni x e y); si ha: V ar(aX + bY ) = a^2 V ar(X) + b^2 V ar(Y ) con a e b costanti reali.

4.7.3 Definizione 14

Sia X una variabile aleatoria con valor medio μ e deviazione standard σ, si definisce variabile aleatoria standardizzata Z associata a X la variabile aleatoria:

Z = X − μ σ

  • La variabile aleatoria Z ha valor medio 0 e deviazione standard 1.

μ = E(Z) = 0 σ =

p V ar(Z) = 1

4.8 Altre misure di tendenza centrale - Moda e mediana

4.8.1 Definizione 15

la moda ˜x e il valore che si verifica il maggior numero di volte, ossia che ha la maggior probabilita di verificarsi.

4.9 Definizione 16

la mediana `e il valore M per il quale si ha:

P (X ≤ M ) = P (X ≥ M ) =

4.10 Disuguaglianze di Chebyshev

La disuguaglianza di Chebyshev fornisce un limite superiore alla probabilit`a che una variabile aleatoria si discosti dal suo valor medio di un certo numero di deviazioni standard.

4.10.1 Teorema 1

Sia X una variabile aleatoria con valor medio μ e deviazione standard σ^2 allora per ogni ϵ > 0 si ha:

P (|X − μ| ≥ ϵ) ≤ σ^2 ϵ^2

questa disuguaglianza afferma che la probabilita che la variabile aleatoria X assuma un valore fuori dall’intervallo (μ − ϵ, μ + ϵ) `e minore o uguale a σ 2 ϵ^2

5.3.1 Propriet`a 3: Relazione di ricoorrenza per la binomiale

P (X = x + 1) =

n − x x + 1

p 1 − p · P (X = x)

6 Distribuzione di Poisson

Vi sono fenomeni il cui verificarsi dell’evento in un intervallo di tempo o spazio accadde raramente. il numero di eventi che si verificano varia da 0 a n, e n non e determinabile a propri. Nello studio degli eventi rari si usa la distribuzione di proprabilita di Poisson. Le seguenti condizioni descrivono il cosi detto processo di Poisson:

  • le realizzazioni degli eventi sono indipendenti; il verificarsi di un evento in un intervallo non ha alcun effetto sulla probabilit`a di verificarsi dell’evento una seconda volta nello stesso o in altro intervallo.
  • la probabilita di una singola realizzazione dell’evento in un dato intervalloe proporzionale alla lunghezza dell’intervallo.
  • in ogni parte arbitrariamente piccola dell’intervallo, la probabilita che l’evento si verifichi piu di una volta `e trascurabile

SIa X la variabile aleatoria che indica il numero di volte in cui si verifica un evento raro in un dato intervallo di tempo o di spazio, ossia il numero di successo; la variabile X pu`o assumere i valori x = 0, 1 , 2 ,... Si dimostra il seguente risultato:

6.0.1 Teorema 2

La probabilita che la variabile aleatoria X assuma il valore xe data dala distribuzione di probabilit`a di Poisson:

℧(x) = P (X = x) = e−γ^ γx x!

per x = 0, 1 , 2 ,...

dove il parametro γ > 0 indica il numero medio di realizzarsi dell’evento nell’intervallo assegnato. Una Variabile aleatoria che ammette questa distribuzione e detta variabile aleatoria di Poisson con parametro γ. La distribuzione di Poisson viene anche indicata con il simbolo f (x; γ); la corrispondente funzione di distribuzione di Poissone datat da:

F (x) = P (X ≤ x) =

X^ x

k=

e−γ^ γk k!

6.0.2 Propriet`a 4

Il valor medio e la varianaza della distribuzione di Poisson di parametro γ sono dati da:

μ = γ σ^2 = γ

Grande differenza fra ditribuzione di Poisson e Binomiale: per una distribuzione binomiale il numero n di prove e finito e il numeor di provee essenzialmente infinito e il numero di successi puo essere infinitamente grande, anche se la probabilita di aver x successi diventa molto piccola al crescere di x. Per il calcolo della distribuzione di Poisson sono utili le relazioni elencate nella propriet`a 2, vale anche per questa distribuzione discreta.

6.1 Relazione di ricorrenza per la distribuzione di Poisson

In certi casi e richiesto il calcolo di piu valori della distribuzione di Poisson, per lo stesso valor medio μ = γ non presente sulle tavole. Se γ e grande (γ ≥ 10) la distrivuzione puo essere approssimata dalla distribuzione normale, altrime pu`o essere utile la seguente realzione di ricorrenza.

6.1.1 Propriet`a 5: Relazione di ricorrenza per la Poisson

P (X = x + 1) γ x + 1

P (X = x)

6.2 Approsimazione dlela distribuzione binomiale con la distribuzione di Poisson

Quando il numero di prove n e grande e la probabilita di sucesso p e piccola, la distribuzione binomiale puo essere approssimata con la distribuzione di Poisson avente media γ = np Una regola pratica accettabile `e di usare questa approssimazione se n ≥ 50 e pleq 0 .1.

7 Distribuzione di probabilit`a continue

7.1 Distribuzione uniforme

Questa distribuzione e anche nota come legge degli errori, in quanto essa descrive in particolare la distribuzione degli errori casuali relativi a successive misure di una quantita fisica. La distribuzione normale `e importante in statistica per tre motivi fondamentali:

  • diversi fenomeni continui seguono, almento approsimativamente, una distribuzione normale
  • la distribuzione normale puo essere utilizzat per approssiamre numerose distribuzioni di probabilita discrete;
  • la distribuzione normale e alla base dell’inferenza statistica, in virtu del teorema del limite centrale.

7.2 Distribuzione normale o di Gauss

7.2.1 Definizione 1 La densita di probabilita normale, o distribuzione normale o di Gauss, `e definita dalla funzione:

f (x) =

σ

2 π

e−^

(^12) ( x−σ μ)^2 − ∞ < x < ∞

di parametri μ e σ, con σ > 0

7.3 Distribuzione normale standardizzata

La distribuzione normale e una famiglia di distribuzioni in cui ogni membroe distinto dall’altro in base ai valori di μ e σ, per poter ricavare la normale standardizzata, data una variabile aleatoria X con medi μ e varianza σ^2 si passa alla nuova variabile Z, detta variabile standardizzata, ponendo:

Z =

X − μ σ La trasformazione svolta fa in odo che la media di Z sia 0 e la varianza 1

7.3.1 La distribuzione di probabilita della variabile normale standardizzata Ze data da

f (z) =

2 π

e−^

z 22 − ∞ < z < ∞

7.3.2 La funzione di distribuzione o di ripartizione della variabile normale standardizzata Z `e data da

F (z) = P (Z ≤ z) =

2 π

Z (^) z

−∞

e−^

t 22 dt − ∞ < x < ∞

7.4 Alcune applicazioni della distribuzione normale

7.4.1 Curva degli errori casuali nella misurazione di una grandezza fisica. La misura, affetta da errore, di una qualunque grandezza fisica puo essere vista come la somma del valore esatto della grandezza e dell’errore di misurazione, chee una variabile aleatorai, in quanto misure diverse forniscono in generale valori diversi. La variabile aleatoria X = ”errore di misurazione” ha come tipica densita di probabilita una curva a campana: l’errore puo essere per eccesso o per difetto, percio X puo assumere valori positivi o negaivi, in modo simmetrico; l’errore sara in genere abbastanza piccolo, quindi la curva sara rapidamente decrescente. Il fatto che, tra le infinite curve con questa proprieta, la normale rappresenti bene questo tipo di errori fu messo in evidenza da Gauss. Se gli errori hanno media nulla, si dice che c’e solo errore casuale. Piu grandee σ, maggiore sara l’inaccuratezza della misura. Se poi il valor medio μ none nullo, si dice che siamo anche in presenza di un errore sistmetico μ che si somma all’errore casuale. Piu grandee σ, maggiore sara l’inaccuratezza della misura. Se poi il valor medio μ none nullo, si dice che siamo anche in presenza di un errore sistematico μ che si somma all’errore casuale. Piu grandee |μ|, maggiore e l’imprecisione della misura. Si osservi che l’errore sistematicoe una costante, mentre l’errore casuale `e una variabile aleatoria.

7.4.2 Distribuzione di una caratteristica quantitativa di una popolazione, che presenta oscillazioni casuali attorno a una media.

Molte grandezze antropometriche, come la statura, il peso, ecc., all’intenro di una popolazione omogenea sono rap- presentabili da una distribuzione gaussiana. Il valor medio μ della distribuzione e il valor medio della grandezza nella popolazione in esame; la varianza σ^2e ragionevolmente piccola, se la popolazione `e stata scelta in modo omogeneo. Anche altre misure di tipo fisiologico e biologico hanno un comportamento del tipo qui descritto.

8 Teoria elementare dei campioni

8.1 stime puntuali e stime per intervallo

per i parametri di una popolaziione `e possibile calcolare due tipi di stima: una stima puntuale e una stima per intervallo

8.1.1 Definizione 1 Se la stima di un parametro della popolaziuone e data da un singolo numero, tale valoree detto stima puntuale del parametro. Se invece la stima di un parametro della popolazione fornisce gli estremi di un intervallo fra i quali si puo supporre, con un cetro grado di fiducia che il parametro sia compreso, tale stimae detta stima per intervallo del parametro.

8.1.2 Definizione 2 Se la media di una distribuzione campionaria di una statistica e uguale al corrispondente parametro della popolazione, la statisticae detta stimatore corretto o non distorto del parametro.

8.1.3 Definizione 3 Se due statistiche sono entrambe stimatori corretti di un parametro, la statistica per cui la varianza della sua distribuzione campionaria e minoree detta stimatore pi`u efficente

9 Tesi di ipotesi

9.1 Introduzione

per l’analisi statistica e importante utilizzari dati provenienti da un campio per fare inferenza sulla popolazione da cuie stato tratto il campione. Esistono problemi in cui si sottopone a test un’ipotesi su un parametro di una popolazione con lo scopo di decidere, esaminando un campione tratto dalla popolazione, se l’affermazione riguardante il parametro `e vera o falsa.

9.1.1 Definizione 1

Un’ipotesi formulata in termini di parametri di una popolazione, come media o varianza, `e detta ipotesi statistica. Il procedimento che consente di rifiutare o accettare un’ipotesi statistica utilizzando i dati di un campione, viene chiamato test di ipotesi.

9.2 Ipotesi statistiche

9.2.1 Regole per la scelta delle ipotesi Un problema importante el presiporre un testi di ipotesi e la scelta delle ipotesi. Non c’e purtroppo una risposta semplice alla domanda, perche la scelta dipende anche da fattori soggettivi: chi effettua il test ha in genere convinzioni e idee personali su quanto intende mostrare. Tuttavia si possono indicare alcune linee guida; facciamo riferimento per comodita a un test sulla media di una singola popolazione, ma gli stessi principi si possono applicare a goni test riguardante uno o pi`u parametri.

9.2.2 Tipi di errore e livello di significativita Dopo aver formulato le ipotesi, occorre specificare quale risultato del campione portera al rifiuto dell’ipotesi nulla. Ricordiamo che le statistiche campionarie media e varianza sono stimatori corretti del corrispondente parametro della popolazione. Poiche il valore della statisticae calcolato da un campione, anche se l’ipotesi nulla e vera,e pero molto probabile che la statistica differisca di una certa quantita dal valore del parametro della popolazione, per effetto del caso; cio nonostante, se l’ipotesi nulla e vera, ci aspettiamo che la statistica campionaria sia vicina al parametro della popolazione. La statistica del teste una statistica che viene calcolata dai dati del campione e puo assumere tanti valori quanti sono i possibili campioni estraibili dalla popoalzione, quindi il particolate valore calcolato dipende dal campione estratto.

Z =

X − μ 0 √^ σ n La distribuzione di campionamento della statistica del test e, di solito, una distribuzione nota, come la distribuzione normale o la distribuzione t, e ricorriamo a queste distribuzioni per sottoporre a verifica un’ipotesi nulla; ad esempio la statistica test Z ha la distribuzione normale standardizzata. Utilizzando le proprieta della distribuzione di campio- namento della statistica soggetta a test, si pi`o identificare un intervallo di valori di quella statistica che verosimilmente

non si presentano se l’ipotesi nulla e vera. La distribuzione di campionamento della statistica teste divisa in due regioni, una regione di rifiuto e una regione di accettazione, delimitate da uno o pi`u valori, detti valori critici.

9.2.3 Definizione 2

La regione di rifiuto corrisponde all’insieme dei valori di una statistica test che conducono al rifiuto dell’ipotesi nulla. L’insieme dei valori che portano invece all’accettazione dell’ipotesi nulla si chiama regione di accettazione. I valori critici sono i valori della statistica test che separano le regioni di rifiuto e di accettazione. I test di ipotesi possono essere classificati in due gruppi: test a una coda (o test unilaterale) e test a due code (o test bilaterale) Quando la regione di rifiuto e costituita da un intervallo, il testi si dice a una coda. Quando la regione di rifiutoe costituita da due intervalli, il test si dice a due code.

9.2.4 Definizione 3 Se l’ipotesi H 0 e vera, ma viene erroneamente rifiutata, si commetto un errore del I tipo; la probabilita di commettere tale errore e indicata con α Se l’ipotesi H 0e falsa, ma erroneamente non viene rifiutata, si commette un errore del tipo II; la probabilita di commettere questo tipo di erroree indicata con β

9.2.5 Definizione 4 La probabilita α di commettere un errore del I tipo, ossia di rifiutare un’ipotesi nulla vera,e detta livello significativa:

9.2.6 Definizione 5 La probagilit`a di commettere un errore del II tipo, indicata con β, viene anche chiamata rischio del consumatore.

9.3 Test di ipotesi sulla media (varianza nota)

Si descrive il procedimento per eseguire un test di ipotesi sulla media di una popolazione avente varianza σ^2 nota

Z =

X − μ 0 √^ σ n

in cui n e l’ampiezza del campione e μ 0e il valore dlela media assunto nell’ipotesi nulla.

9.3.1 Definizione 6

In un test di ipotesi, dopo aver effetuato il campionamento e aver calcolato il valore della statistca test necessario per eseguire il test, si dice p − value il piu piccolo valore del livello di significativita α per cui i dati campionari consentono di rifiutare l’ipotesi nulla.

9.4 Test di ipotesi sulla media

Preso in considerazione il campione usato per effettuare il test proviene da una popolazione di cui non e nota la varianza σ^2 , qualora σ non sia noto, ma il campionee grande, si puo sostituire σ con il valore s dello scarto quadratico medio del campione. Se invece il campionee piccolo, e la popolazione da cui proviene il campione ha distribuzione normale, il teorema ovvero: T =

X − μ √^ S n

e una variabile aleatorai avente distribuzione t con grado di liberta v = n − 1

9.5 Test di ipotesi sulla proporzione

Qualora si volesse risolvere il problema della verifica di ipotesi sulla proporzione di una popolazione, si deve, in alcuni casi, prendere in considerazione l’ipotesi che tale proporzione assuma un determianto valore p 0 Per risolvere problemi di questo tipo si conta il numero X di volte in cui la caratteristica osservata si presenta nel campione di ampiezza n e si calcola la proporzione campionaria: in altre parole si osserva il numero di successi in n prove o proporzione di successi; si ha quindi a che fare con la distribuzione binomiale e si fa un test di ipotesi sul parametro p di una popolazione binomiale. Quando il numero n di elementi del campione e sufficientemente grande, il test di ipotesi sulla proporzione puo essere basato sulla distribuzione normale. E’ infattio noto che, indicando con p la proporzione di successi in n prove bernoulliane, se si verifica che np ≥ 5 e n(1 − p) ≥ 5, la distribuzione binomiale di parametri n e p pu`o essere approssimata con la distribuzione normale. Per sottoporre a test l’ipotesi nulla

H 0 : p = p 0