Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Introduzione alla Statistica: Variabili Casuali, Distribuzioni e Stima - Prof. Longobardi, Schemi e mappe concettuali di Statistica Inferenziale

Probabilità, variabili, stima puntuale ed intervallare

Tipologia: Schemi e mappe concettuali

2022/2023

Caricato il 24/06/2023

mirianalucignano2001
mirianalucignano2001 🇮🇹

5

(1)

2 documenti

1 / 43

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
LEZIONE 1: LA PROBABILITÀ
E’ il grado di incertezza connesso al risultato scaturito da una prova.
ESEMPIO: numero che appare sulla faccia superiore del dado dopo averlo lanciato.
Il lancio di un dado è una PROVA è un esperimento che ha due o più possibili risultati.
Dalla prova possono scaturire degli EVENTI uno dei possibili risultati della prova.
La PROBABILITÀ è un numero compreso tra 0 ed 1 che misura il grado di incertezza sul verificarsi di
un evento.
Tali definizioni possono essere riassunte in tale modo:
IN UNA DATA PROVA, L’EVENTO “E” SI VERIFICA CON PROBABILITÀ P(E)
L’evento può essere
ELEMENTARE
uno dei possibili risultati di una prova.
ESEMPIO: nel lancio di un dado i possibili eventi elementari
sono (1,2,3,4,5,6)
NON ELEMENTARE
evento che può essere a sua volta scomposto in più eventi
elementari.
ESEMPIO: nel lancio di un dado, l’evento esce un numero pari
comprende più eventi elementari (2,4,6)
Gli eventi formano un’ALGEBRA DI BOOLE.
In quest’ultima si considerano 3 operazioni fondamentali:
La NEGAZIONE
dell’evento A, ossia A
(segnato) che non si verifica
INTERSEZIONE (A B)
tra due eventi A e B:
si verificano entrambi
contemporaneamente.
UNIONE (A B) tra
due eventi A e B:
si verifica almeno uno
dei due eventi.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b

Anteprima parziale del testo

Scarica Introduzione alla Statistica: Variabili Casuali, Distribuzioni e Stima - Prof. Longobardi e più Schemi e mappe concettuali in PDF di Statistica Inferenziale solo su Docsity!

LEZIONE 1: LA PROBABILITÀ

E’ il grado di incertezza connesso al risultato scaturito da una prova.

ESEMPIO: numero che appare sulla faccia superiore del dado dopo averlo lanciato.

Il lancio di un dado è una PROVA ➙ è un esperimento che ha due o più possibili risultati.

Dalla prova possono scaturire degli EVENTI ➙ uno dei possibili risultati della prova.

La PROBABILITÀ è un numero compreso tra 0 ed 1 che misura il grado di incertezza sul verificarsi di

un evento.

Tali definizioni possono essere riassunte in tale modo:

IN UNA DATA PROVA, L’EVENTO “E” SI VERIFICA CON PROBABILITÀ P(E)

L’evento può essere

ELEMENTARE

uno dei possibili risultati di una prova.

ESEMPIO: nel lancio di un dado i possibili eventi elementari

sono (1,2,3,4,5,6)

NON ELEMENTARE

evento che può essere a sua volta scomposto in più eventi

elementari.

ESEMPIO: nel lancio di un dado, l’evento esce un numero pari

comprende più eventi elementari (2,4,6)

Gli eventi formano un’ALGEBRA DI BOOLE.

In quest’ultima si considerano 3 operazioni fondamentali:

La NEGAZIONE

dell’evento A, ossia A

(segnato) che non si verifica

INTERSEZIONE (A ∩ B)

tra due eventi A e B:

si verificano entrambi

contemporaneamente.

UNIONE (A ∪ B) tra

due eventi A e B:

si verifica almeno uno

dei due eventi.

L’insieme di tutti i possibili eventi elementari che possono scaturire da una prova è definito:

SPAZIO CAMPIONARIO e viene indicato con il simbolo Ω ( OMEGA ).

Gli eventi possono essere:

La PROBABILITÀ è una funzione di insieme che associa ad ogni evento un numero reale.

La probabilità sarà indicata con P (Ei) ed è importante distinguere:

POSTULATO 2 ➙ P (A) ≥ 0

POSTULATO 3 ➙ P (Ω) = 1

POSTULATO 4 ➙ se (A ∩ B = ∅) allora: [P(A ∪ B) = P(A) + P(B)]

Secondo l’ approccio classico o tradizionalista , la probabilità è data dal rapporto tra il numero dei casi

favorevoli all’evento ed il numero di casi possibili, purché siano tutti ugualmente possibili.

ESEMPIO : il lancio di un dado e la probabilità che si verifichi l’evento faccia del dado 5 sarà:

Secondo l’approccio frequentista o empirico, la probabilità di un evento “E” si ottiene come frequenza

relativa di “E”, ossia come rapporto tra il numero di prove nelle quali si è verificato l’evento “E” ed il

numero di prove effettuate.

Si basa, inoltre, sulla ripetitibilità della prova nelle medesime condizioni.

IMPOSSIBILE

E’ l’evento che non può mai

verificarsi e può essere definito

come l’intersezione fra un

qualsiasi evento e la sua

negazione.

CERTO

E’ l’evento che si verifica sempre in quanto

comprende tutti i possibili risultati

dell’esperimento.

Può essere definito come la negazione

dell’evento impossibile.

INCOMPATIBILE

Se A ∩ B mi da l’evento

impossibile.

Ei E

LEZIONE 2: LE VARIABILI CASUALI

Quantità numerica il cui valore non è noto a priori ma è determinato dal caso (processo di cui non

conosciamo gli esiti).

ESEMPI:

  • numero di ingressi in un museo in un dato giorno;
  • Numero di clienti in un hotel
  • Risultato del lancio di due dadi (non conosco la quantità numerica che esce, ma mi affido al risultato

casuale)

La variabile casuale può essere:

LANCIO DI DUE DADI

LA FUNZIONE DI PROBABILITÀ

La funzione di probabilità di una VARIABILE CASUALE DISCRETA X associa ad ogni valore possibile

della variabile casuale, la probabilità che esso si verifichi (se ho un lancio di un dato, avrò 6 valori).

La funzione di probabilità può anche essere rappresentata graficamente.

DISCRETA

Può assumere un valore

finito e reale (numero

intero)

CONTINUA

Può assumere valori compresi in un

intervallo reale, pertanto tutti i numeri

reali compresi i decimali.

Si noti che una variabile casuale discreta è completamente nota se sono noti i valori che questa può assumere

e le corrispondenti probabilità.

In alcune situazioni, potremmo essere interessati non alla probabilità che la variabile casuale X assuma uno

specifico valore, bensì alla probabilità che essa assuma un valore minore o uguale ad un dato valore “Xi”.

In tal caso, occorre considerare le probabilità cumulate P (X ≤ xi) che si riferiscono alla probabilità degli

intervalli (-∞; xi).

Data una variabile casuale discreta X , la funzione che fa corrispondere ai valori x le probabilità cumulate

P (X ≤ x) viene detta FUNZIONE DI RIPARTIZIONE ed è indicata:

I VALORI CARATTERISTICI di una variabile casuale discreta sono:

➙ la media, definita come VALORE ATTESO E (X), dato dalla sommatoria di Xi moltiplicato per la

Probabilità;

➙ la VARIANZA di una variabile continua discreta X è definito come:

La media è un qualcosa di già osservato;

Il valore atteso è qualcosa da osservare.

che si verifichiquel valore o uno inferiore.

VARIABILE DI BERNOUILLI

Le prove che producono solo 2 possibili risultati (dicotomica) generano un particolare tipo di variabile

casuale definito V.C. DI BERNOUILLI

ESEMPIO: lancio di una moneta, sesso di un nascituro.

Può assumere:

La sua funzione di probabilità è espressa come:

ESEMPIO:

Valore 1 con probabilità π Valore 0 con probabilità 1-π

È un esempio di variabile discreta

in quanto assume due valori.

Calcolare la funzione di probabilità che:

ESEMPIO 2:

0

= 8;

128

i P/xi

0 0,

1 0,278 1-0,

E(x)

= xi.P(xi)

= 0.0,

1.0,

= 0,

VARIABILE BINOMIALE

La somma di n variabili casuali di Bernoulli, indipendenti ed identicamente distribuite dà luogo ad una

variabile casuale denominata VARIABILE CASUALE BINOMIALE.

Essa permette di calcolare la probabilità di ottenere in “n” prove, un numero X = 0,1,2.. di successi.

La funzione è definita come:

ESEMPIO :

SARASEMPRE

  • X

10! I

10.9.8.7.6.5.4.3.2.

= 90

8!

7.6.5. 4.3.2.

*=lancio moneta

m

= 5; x

= 2;

4 = 0, QUALELAPROBABIUTACHESI VERIFICH 2 VOLTE TESTA?

P x

2

=

Px

2 =

!

2! 15

  • 2)!

P(x

= 2 =e =

e= 2! 3!

P(x

=

=

P(x

=

= 10.0,25.0,

= 0,

= 31,

LEZIONE 3 : VARIABILE CASUALE NORMALE

Si è osservato che la maggior parte dei fenomeni reali si approssima in modo adeguato con una particolare

funzione di densità, denominata FUNZIONE DI DENSITÀ NORMALE.

La VARIABILE CASUALE NORMALE fu sviluppata nel 1733 da De Moivre e successivamente è stata

resa famosa da Gauss per l’analisi di dati astronomici tanto da essere denominata anche VARIABILE

CASUALE GAUSSIANA.

  • La variabile casuale normale X è una variabile casuale continua che può assumere valori su tutto

l’asse reale.

  • La funzione di densità che la definisce assume una forma a campana, la cui particolarità è la

simmetria poiché la parte di destra è uguale alla parte di sinistra. Essa è data da:

La variabile casuale normale si indica con in quanto i parametri che la caratterizzano sono:

  • il VALORE ATTESO E(X) = μ
  • la VARIANZA V(X) = σ 2

→ MEDIA ←

→ VARIANZA ←

Media e Varianza di un campione Media e Varianza di una

popolazione

Parametri popolazione → ALFABETO GRECO

Stime dei parametri → ALFABETO LATINO

X si distribuisce come la N, che sta per variabile normale.

50 % di probabilità

50% di probabilità

di trovare persone ditrovare persone più olte.

più basse.

PROBABILITA

POSSONO ASSUMERE VALORI COMPRESI TRA -0 E

s

LAVARIANZA SARA' SEMPRE O

ACCENTO VARIABILE

CIRCONFLESSO NORMALE

TiRDE

ex

0 S

uguaglianza

tra loro.

In base ai parametri che la caratterizzano e a come essi variano, la campana può essere disegnata in modi

diversi:

Al variare di μ , il grafico resta inalterato nella sua forma,

ma si modifica solo la sua localizzazione:

al crescere di μ , la posizione della curva si sposta a

destra ;

al diminuire di μ , la posizione della curva s i sposta a

sinistra.

Al variare di σ , il grafico resta inalterato nella

sua localizzazione, ma si modifica nella sua

forma:

al crescere di σ , la curva è più schiacciata

rispetto al centro ;

al diminuire di σ , la curva è più appuntita.

ESEMPIO

Immaginiamo di avere un collettivo con:

➙ MEDIA = 500

➙ VARIANZA = 100

Se la sua varianza è 100, la sua deviazione standard sarà 10.

Dunque, in media, le persone si discostano dalla media di 10 punti.

E

A CURVA

Più ADXo

SX.

HO TANTECAMPANE AL VARIA_

RE DEL VALOREMEDIO.

ESEMPIO:

MEDIA=50;VARIANEA= 100

2

52 102

ESEMPIO:

Immaginiamo di avere un collettivo di X~N (70,25) e di voler calcolare la probabilità che un individuo

presenti un peso compreso tra 60 e 80:

ciò avviene attraverso l’operazione di standardizzazione:

Immaginiamo di avere un peso inferiore ad 80:

~

N(70,

X 1

Quesito

= Pr ( x

Es ~ Es i

Pr

60-

x

  • 70 1

80

  • 70

25

60 70

80

Pr

  • 2

    z = 2

~ N 70,

qual'è

la probabilità

che x 80?

si PASSA ALLASTANDARDIZZATA

  • e E =

o

E

80

  • 70

    2

by

QUINDI :

e

Pr z

= 2 = ?

  • 2 0 2

prz

2

0,

UTILIZZO DELLE TAVOLE

  • RIGA si estende da 0.00 a 0.09, e qui troviamo il valore intero;
  • COLONNA , sulla quale vi è la seconda cifra decimale.

La tavola, fissato un valore di Z, mi fornisce informazioni sulla probabilità che Z sia inferiore ai valori

presenti nella tavola.

ESEMPIO

individuare la probabilità che:

• (Z < 1,68) = 0,

• (Z < 0,03) = 0,

• (Z < 0,80) = 0,

DEVO CONOSCERELAP 1 15?

E =

In

E =

15,

8

1,

S

  • 1,75 1,

P E = 1, = 0,

SERVONO PER FISSARE I VALORI SOGUA.

I due PRINCIPALI PARAMETRI utilizzati per descrivere una popolazione finita sono:

ESEMPIO :

Consideriamo una popolazione composta da N = 7 grandi aziende (unità statistiche) operanti in un certo

settore economico del paese. Il carattere oggetto di studio è X = fatturato annuo.

I valori di X osservati sulle 7 unità della popolazione sono i seguenti in milioni di euro:

• X1 = 52; X2 = 49; X3 = 65; X4 = 74; X5 = 56; X6 = 62; X7 = 45

μ= 52+49+65+74+56+62+45/7 = 57,

σ2= 2704+2401+4225+5476+3136+3844+

STATISTICA CAMPIONARIA

Sia X1, X2….Xn un campione casuale di n osservazioni appartenenti ad una popolazione finita o infinita.

Una statistica campionaria è una funzione a valori reali delle osservazioni campionarie.

Statistiche di uso comune sono le seguenti:

Le statistiche campionarie non vanno confuse con i parametri della popolazione. Quest’ultimi si riferiscono

all’intera popolazione, mentre le statistiche dipendono solamente dalle osservazioni campionarie e poiché

queste sono variabili casuali, anche le statistiche saranno variabili casuali.

MEDIA DELLA POPOLAZIONE

VARIANZA DELLA POPOLAZIONE

SIMBOLOGIA

N ➙ numero di unità della popolazione

n ➙ numero di unità del campione

MEDIA CAMPIONARIA VARIANZA CAMPIONARIA

LEZIONE 6: LA STIMA PUNTUALE

L’inferenza permette di stimare i parametri della popolazione utilizzando le informazioni derivanti da un

campione (dati campionari).

La STIMA PUNTUALE è l’insieme dei metodi inferenziali che permettono di attribuire un valore ad un

parametro ignoto della popolazione, utilizzando i dati di un campione casuale osservato.

STIMA = MEDIA

PUNTUALE = VALORE PRECISO DELLA MEDIA

ESEMPIO :

Si vuole stimare il parametro “media del reddito delle famiglie di Milano”. Pertanto, si procede ad estrarre

un campione, ad esempio, 100 famiglie di Milano e si calcola il reddito medio delle stesse. In questo modo,

ottengo il calcolo della media campionaria.

Dalla media campionaria occorre risalire alla media della popolazione, e quindi, al reddito medio di tutte le

famiglie di Milano.

dal CAMPIONE ➙ al PARAMETRO DELLA POPOLAZIONE.

DEFINIZIONI

  • PARAMETRO (indicato con la lettera greca THETA θ ): è il valore ignoto nella popolazione che si

vuole stimare, come ad esempio la media della popolazione.

  • STIMATORE (indicato con la lettera maiuscola dell’alfabeto T ): è la variabile di cui ci vogliamo servire

per risalire al parametro ignoto della popolazione, come ad esempio la media campionaria X.

  • STIMA (indicata con la lettera minuscola dell’alfabeto t ): è il valore preciso dello stimatore osservato

all’interno del campione.

La DIFFERENZA tra il parametro e la stima, pertanto θ-t = ERRORE DI CAMPIONAMENTO.

Lo stimatore , dipendendo dal campione, è una variabile casuale , e quindi possiede una distribuzione

campionaria la cui conoscenza permette di capire se lo stimatore scelto produrrà con elevata probabilità

stime “vicine al valore vero del parametro”

CALCOLO DELLA MEDIA CAMPIONARIA

Se la popolazione è distribuita come una Normale N(μ, σ2) allora anche la media campionaria si distribuisce

come una Normale.

si

RiSALE

DEVE FORNIRE UN VALORE

QUANTO Più VICINO A THETA.

U o

2

1

2 1

3

2

3

LEZIONE 7: STIMA INTERVALLARE

Il principale svantaggio della stima puntuale è legato alla casualità delle osservazioni campionarie. Infatti,

anche utilizzando uno stimatore con proprietà ottimali, la stima puntuale sulla base di un campione può essere

molto diversa dal valore vero del parametro.

Per ovviare a questo limite, si preferisce calcolare un intervallo di valori plausibili entro cui può essere

compreso il parametro ignoto della popolazione con una certa probabilità decisa a priori , definito STIMA

INTERVALLARE.

Esso è costruito sulla base (intorno) della stima puntuale a cui associamo un determinato livello di affidabilità

o fiducia, generalmente fissato al 90-95-99%.

DEFINIZIONI

- L’intervallo che contiene il parametro ignoto della popolazione con una certa probabilità decisa a priori è

definito INTERVALLO DI CONFIDENZA o DI FIDUCIA****.

- La probabilità decisa a priori è detta LIVELLO DI CONFIDENZA o DI FIDUCIA (1 - α) - La probabilità che l’intervallo non contenga il parametro ignoto della popolazione, cioè la probabilità di

commettere l’errore nella stima, è definito LIVELLO DI SIGNIFICATIVITÀ (α).

STIMA INTERVALLARE DELLA MEDIA (VARIANZA NOTA)

Sia X una variabile casuale che rappresenta un carattere osservato su una popolazione. Supponiamo che la

variabile casuale sia distribuita come una Normale con varianza nota. Allora sappiamo che una qualsiasi

variabile normale X può essere trasformata in una standardizzata Z:

A tal punto, si può costruire un intervallo di confidenza per “Z” , quindi:

INTERVALLO DI CONFIDENZA

PER LA MEDIA DELL’UNIVERSO

Si SOSTITUISCE

Si DEVE POI COSTRUIREUN INT. DI CONF

PER LAMEDIA DELLUNIVERSO IL MU CHE DOVR ESSEREisOLATO AL

CENTRO DELL'INTERVALLO.