Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Appunti "Statistica", Appunti di Statistica

Una introduzione alla Statistica, definendo i concetti di fenomeno, unità statistiche, caratteri qualitativi e quantitativi, variabili statistiche, popolazione e indagine campionaria. Viene poi spiegato come costruire una distribuzione di frequenza e una distribuzione di frequenza congiunta di due caratteri. Infine, vengono presentati gli indici di posizione, ovvero la media aritmetica, la mediana e la moda.

Tipologia: Appunti

2021/2022

In vendita dal 09/05/2022

yourfriendlyclassmate
yourfriendlyclassmate 🇮🇹

1 / 91

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
2 STATISTICA TEORIA
STATISTICA: studio di fenomeni che si manifestano su una pluralità di soggetti.
Fenomeno: oggetto di studio (es. reddito, spesa per consumo, titolo di studio…)
UNITA’ STATISTICHE: soggetti su cui si manifesta il carattere
Il carattere d’interesse, in generale, si manifesta in modo diverso su unità diverse (non viviamo in
un mondo perfettamente uguale)
Il valore che un carattere assume in corrispondenza di una certa unità lo chiameremo MODALITA’
DEL CARATTERE (per l’unità considerata)
TIPOLOGIE DI CARATTERI -> classificazione dei caratteri
-Caratteri qualitativi sconnessi: l’unica operazione è il confronto tra le modalità
-caratteri qualitativi ordinati: il confronto mi dice anche qual è il più piccolo e quale il più grande
perchè tra loro vi è un ordine. Vi è un ordine tra le modalità. Quando confronto due unità posso
non solo dire se le loro modalità sono uguali o diverse, ma anche se un’unità possiede modalità
più piccola o più grande di un’altra unità
-caratteri quantitativi: le modalità sono numeri su cui è possibile effettuare operazioni aritmetiche
(addizione e moltiplicazione con le loro inverse sottrazione e divisione)
Come sinonimo, per i caratteri qualitativi si usa il termine “mutabili statistiche
Come sinonimo, per i caratteri quantitativi si usa “variabili statistiche”
VARIABILI STATISTICHE (caratteri quantitativi):
-variabili statistiche (o caratteri quantitativi) discrete: se le modalità possibili sono un insieme
discreto. Un insieme è discreto quando è finito o infinito numerabile.
-variabili statistiche (o caratteri quantitativi) continue: le modalità possibili sono un insieme
continuo. Un insieme continuo è un segmento di numeri reali, una semiretta o l’intera retta reale.
Es. la statura, il peso.
POPOLAZIONE (o COLLETTIVO): l’insieme delle unità su cui si manifesta un dato carattere statistico
La statistica descrittiva studia il modo in cui uno o più caratteri statistici si manifestano su una
popolazione di unità
INDAGINE CAMPIONARIA: osservazione delle singole unità della popolazione
Alla fine del processo di osservazione delle modalità di un carattere sulle unità di una popolazione,
si ottiene un ELENCO DI UNITA’ ciascuna con la sua modalità.
X1= modalità dell’unità 1
X2= modalità dell’unità 2
……………
n= numero di unità della popolazione
xn= modalità dell’unità n
DISTRIBUZIONE UNITARIA DEL CARATTERE (o DISTRIBUZIONE PER UNITA’-MODALITA’)
unità
modalità
1
x1
2
x2
n
xn
Per rendere leggibile la distribuzione unitaria devo effettuarne una sintesi
DISTRIBUZIONE DI FREQUENZA: primo tipo di sintesi che esaminiamo.
Insieme delle unità statistiche: 1,2,…,n
xj= modalità dell’unità j (j=1,…,n)
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b

Anteprima parziale del testo

Scarica Appunti "Statistica" e più Appunti in PDF di Statistica solo su Docsity!

2 STATISTICA TEORIA

STATISTICA: studio di fenomeni che si manifestano su una pluralità di soggetti. Fenomeno: oggetto di studio (es. reddito, spesa per consumo, titolo di studio…) UNITA’ STATISTICHE: soggetti su cui si manifesta il carattere Il carattere d’interesse, in generale, si manifesta in modo diverso su unità diverse (non viviamo in un mondo perfettamente uguale) Il valore che un carattere assume in corrispondenza di una certa unità lo chiameremo MODALITA’ DEL CARATTERE (per l’unità considerata) TIPOLOGIE DI CARATTERI - > classificazione dei caratteri

  • Caratteri qualitativi sconnessi: l’unica operazione è il confronto tra le modalità
  • caratteri qualitativi ordinati: il confronto mi dice anche qual è il più piccolo e quale il più grande perchè tra loro vi è un ordine. Vi è un ordine tra le modalità. Quando confronto due unità posso non solo dire se le loro modalità sono uguali o diverse, ma anche se un’unità possiede modalità più piccola o più grande di un’altra unità
  • caratteri quantitativi: le modalità sono numeri su cui è possibile effettuare operazioni aritmetiche (addizione e moltiplicazione con le loro inverse sottrazione e divisione) Come sinonimo, per i caratteri qualitativi si usa il termine “mutabili statistiche” Come sinonimo, per i caratteri quantitativi si usa “variabili statistiche” VARIABILI STATISTICHE (caratteri quantitativi):
  • variabili statistiche (o caratteri quantitativi) discrete: se le modalità possibili sono un insieme discreto. Un insieme è discreto quando è finito o infinito numerabile.
  • variabili statistiche (o caratteri quantitativi) continue: le modalità possibili sono un insieme continuo. Un insieme continuo è un segmento di numeri reali, una semiretta o l’intera retta reale. Es. la statura, il peso. POPOLAZIONE (o COLLETTIVO): l’insieme delle unità su cui si manifesta un dato carattere statistico La statistica descrittiva studia il modo in cui uno o più caratteri statistici si manifestano su una popolazione di unità INDAGINE CAMPIONARIA: osservazione delle singole unità della popolazione Alla fine del processo di osservazione delle modalità di un carattere sulle unità di una popolazione, si ottiene un ELENCO DI UNITA’ ciascuna con la sua modalità. X 1 = modalità dell’unità 1 X 2 = modalità dell’unità 2 …………… n= numero di unità della popolazione xn= modalità dell’unità n DISTRIBUZIONE UNITARIA DEL CARATTERE (o DISTRIBUZIONE PER UNITA’-MODALITA’) unità modalità 1 x 1 2 x 2 n xn Per rendere leggibile la distribuzione unitaria devo effettuarne una sintesi DISTRIBUZIONE DI FREQUENZA: primo tipo di sintesi che esaminiamo. Insieme delle unità statistiche: 1,2,…,n xj= modalità dell’unità j (j=1,…,n)

R modalità distinte: m 1 , m 2 , …, mk. (es. voti di statistica= 1,2…30L) Frequenza assoluta delle mi il numero di modalità della popolazione che possiedono modalità mi. (es. numero di persone che hanno preso 30). SI CHIAMA ni : numero di unità della popolazione che possiedono modalità mi. Modalità distinte Frequenza assoluta m 1 m 2 … mk n 1 n 2 …. nk n 1 +n 2 +nR=n Somma delle frequenze assolute= numero di unità della popolazione Per caratteri continui si usa spesso il raggruppamento in classi (di modalità). Ogni classe di modalità è un intervallo. Proprietà: ogni unità deve appartenere a una e una sola classe. Ciò significa che le classi devono essere:

  • disgiunte (non si possono sovrapporre)
  • contigue (non possono esserci buchi tra le classi) FREQUENZA ASSOLUTA DI UNA CLASSE: numero di unità la cui modalità appartiene alla classe Es. Voti esame Frequenza assoluta 0 - 17 20 17 - 18 30 26 - 28 10 29 – 31 10 70 Canale B Canale D L’unica differenza è dovuta al diverso numero di unità della popolazione ma la proporzione è la stessa Frequenza relativa di una modalità= frequenza assoluta/ numero di unità della popolazione fi= ni/n Voti esame Frequenza assoluta 0 - 17 40 17 - 18 60 26 - 28 20 29 – 31 20 140

ISTOGRAMMA

DENSITA’ ASSOLUTA

Hi= ni/Ai Cos’è dal punto di vista intuitivo? Numero di unità che cadono in ciascun intervallo di spazio 1 in cui divido la classe, nell’ipotesi che le modalità delle unità siano uniformi dentro la classe (dalla più piccola alla più grande). Supponiamo che la classe abbia ampiezza Ai =5 (5 intervalli di ampiezza 1) e frequenza ni= 15 Hi= 15/3= 5

DISTRIBUZIONI DI FREQUENZA CONGIUNTE DI DUE CARATTERI

Supponiamo che su ciascuna unità della popolazione si rivelano le modalità non di uno solo ma di due caratteri (A, B). Ai= modalità del carattere A per l’unità i Bi= modalità del carattere B per l’unità i La distribuzione unitaria si costruisce così: 1 A,^2 A, …,^ hA modalità del carattere A 1 B,^2 B, …,^ kB modalità del carattere b nij=numero di unità che possiedono modalità (^) iA del carattere A e contemporaneamente modalità jB del carattere B^ =>questa si chiama^ frequenza assoluta^ congiunta^ delle modalità^ iA^ (es. colore degli occhi verdi) e (^) jB (es. titolo di studio licenza media). Le frequenze nij possono essere tutte poste nella c.d. tabella di contingenza. Se sommiamo tutte le frequenze congiunte della prima riga otteniamo la frequenza marginale della modalità 1 A (si legge A uno), la seconda riga della modalità 2… Se sommiamo nel senso delle colonne le frequenze congiunte otteniamo la frequenza marginale di 1 B.

PROPRIETA’ DELLA MEDIA ARITMETICA

Y così ottenuta è una trasformazione lineare di X. MEDIA ARITMETICA DI Y Y= aX+b Y= 1/n+ (y 1 +y 2 +…,yn) =1/n ( (ax 1 +b) + (ax 2 +b) + … + (axn+b) =1/n (ax 1 + ax 2 + …+ axn + b +b+ …+b) N volte =1/n ( a(x1+ x2+ …+ xn) + nb =a·1/n (x1+x2+…+xn)+ 1/n · nb =aX+b

  1. Se alla modalità di ogni unità si sostituisce la media aritmetica X, allora la “nuova” media aritmetica è ancora uguale alla vecchia X 3 ) Scarto dell’unità i dalla media aritmetica è la differenza tra la modalità della unità i e la media aritmetica xi-x= modalità dell’unità i – media aritmetica La somma degli scarti dalla media aritmetica è uguale a 0

=nX-nX= MEDIANA Consideriamo la solita distribuzione unitaria unità 1 2 … n Modalità di X X 1 x 2 … xn Per calcolare la mediana, poniamo in via preliminare le unità in ordine crescente di modalità X ( 1 )= modalità dell’unità con modalità più piccola X ( 2 )= modalità dell’unità con seconda modalità più piccola …. X (n)= modalità dell’unità con modalità più grande n= X 1 = X 2 = X 3 = X 4 = X 5 = Ordiniamoli dal più piccolo al più grande: 1 (x 1 ) 2 (x 2 ) 2 (x 3 ) => valore che occupa il posto centrale nei dati ordinati 3 (x 4 ) 6 (x 5 ) I dati statistici sono ordinati dal più piccolo al più grande Se n è il numero di unità della popolazione, definiamo:

  1. Definiamo scarto dell’unità i dalla media la differenza tra la modalità dell’unità i e la mediana= Xi - Med(x) Allora il numero di scarti positivi è uguale al numero di scarti negativi 17.02. Misure (indici) di VARIABILITA’
  • varianza s^2 - deviazione standard 𝝈 = √𝒔𝟐 - coefficiente di variazione cv= 𝝈 𝝁

× 𝟏𝟎𝟎

- Range (CAMPO DI VARIAZIONE) INDICE DI POSIZIONE POCO INFLUENZATO DA VALORI ESTREMI: mediana INDICE DI VARIABILITA’ POCO INFLUENZATO DA VALORI ESTREMI: quartile Consideriamo un insieme di n unità statistiche su cui sono osservate le modalità di un carattere d’interesse x DISTRIBUZIONE UNITARIA UNITA’ 1,2,… ,i, ... n modalità x 1 ,x 2 ,…xi … xn Abbiamo già definito la mediana come la sequenza nella graduatoria ordinata dei dati ha posizione centrale Definiamo primo quartile (Q 1 ): il valore che lascia (nella graduatoria dei dati ordinati dal più piccolo al più grande) lascia a sinistra il 25% dei dati più piccoli e a destra il 75% dei dati più grandi PROFONDITA’ DELLA MEDIANA= (n+1)/ PROFONDITA’ DEL PRIMO QUARTILE: prof(Q 1 )= prof mediana+1)/ Dove con x indico la parte intera del numero x. Cioè il più grande intero minore o uguale a x 3,25= 10,99=  2 = Se x è intero, x=x Es. se n= 15 Prof (mediana)= (15+1)/2= Prof (Q 1 )= ( 8 +1)/2= 9/2= 4, Se n= Prof mediana= 16+1)/2=8, Prof (Q 1 )= (8,5+1)/2=4,

Definiamo Q 1 (=primo quartile) come il valore che nella graduatoria dei dati ordinati dal più piccolo al più grande:

  • occupa il posto prof (Q 1 ) se la profondità è intero Q 1 (=primo quartile) è la semisomma dei valori che nella graduatoria dei dati ordinati dal più piccolo al più grande occupano i posti prof (Q 1 ) e prof(Q 1 )+ Supponiamo che n= E che i dati siano: 8 1 3 9 1 2 2 7 5 7 7 9 4 2 2 =>prima di tutto li ordiniamo dal più piccolo al più grande 1 1 2 2 2 2 3 4 5 7 7 7 8 9 9 Qual è il primo quartile? La prof (Q 1 ) = (8+1) / 2 = 4, Quindi il primo quartile Q 1 = (2+2) /2 = 2. (perchè 2 e 2 sono al posto 4 e 5) In generale se x 1 x 2 xi xn sono i dati ordinati dal più piccolo al più grande, il primo quartile è il dato che occupa il posto di profondità del primo quartile se la prof (Q1) è intero. Invece Q 1 = xprof (Q1)+ x (^) prof(Q1)+1 Praticamente sarebbe la semisomma IL SECONDO QUARTILE E’ LA MEDIANA (MED oppure Q 2 ) TERZO QUARTILE (Q 3 ). È il valore che sempre nella graduatoria dei dati ordinati dal più piccolo al più grande con a sx il 75% dei dati più piccoli e a destra il 25% dei dati più grandi. Q 3 è calcolato come il primo quartile, ma la graduatoria dei dati è percorsa al contrario cioè dal più grande al più piccolo Nell’es. precedente il secondo e il terzo sette sono al posto 5 e 4 Q 3 = (7+7)/2= 7 Primo e terzo quartile sono poco sensibili a valori estremi cioè molto grandi o molto piccoli (si prendono sempre quelli in mezzo). Il primo e il terzo quartile sono ROBUSTI rispetto alla presenza di valori estremi. Misura di variabilità: scarto (o differenza) interquartile DQ= Q 3 - Q 1. E’ una misura di variabilità perchè lo scarto interquartile va a vedere la differenza tra Q 3 e Q 2 (la loro lontananza). Se sono vicini significa che diminuisce la variabilità e viceversa. Lo scarto interquartile è maggiore o uguale a zero perchè il terzo quartile è sempre maggiore o uguale al primo quartile. Se le n unità hanno tutte la stessa modalità, allora Q 1 =Q 2 e lo scarto interquartile DQ è =0. Se DQ=0 non è detto che tutte le unità abbiano la stessa modalità. Es. n= 0 1 1 8 1 1 1 1  Ordiniamoli 0 1 1 1 1 1 1 8 Prof (med)= (8+1)/2= 4, Prof (Q 1 )= (4,5+1)/2= (4+1)/2= 2, Vado al posto 2 e 3 da sx=> (Q 1 = 1+1)/2= 1

Le osservazioni dentro il recinto interno le chiamiamo osservazioni nella norma, quelle fuori dal recinto interno le chiamiamo distanti dal centro. I dati oltre il recinto esterno li chiamiamo molto distanti dal centro Diagramma a barre (caratteri di natura qualsiasi) Si considerano le modalità e per ciascuna di esse si costruisce un rettangolo con altezza proporzionale alla frequenza della modalità corrispondente modalità frequenza a a … ak n n … nk

PROBABILITA’

Tutti noi siamo chiamati a prendere decisioni in condizioni di incertezza: ovvero, la decisione può avere diverse condizioni possibili. L’esito della decisione può essere l’uno o l’altro di diversi risultati. Es. scelta di un investimento finanziario, scelta di una politica di marketing. L’incertezza riguarda l’esito del fenomeno, cioè il risultato. I fenomeni di interesse del calcolo delle probabilità sono caratterizzati da incertezza e sono formalizzati tramite la nozione di esperimento casuale. Chiameremo ESPERIMENTO CASUALE un qualunque fenomeno che può dar luogo a più “esiti”, a più risultati possibili. Quindi l’incertezza riguarda l’esito dell’esperimento casuale 22.02. ESPERIMENTO CASUALE: qualunque fenomeno sul cui esito c’è incertezza (es. andare a un esame universitario): ossia può avere l’uno o l’altro di diversi possibili esiti. I possibili esiti di un esperimento casuale sono detti “eventi elementari”. Indicheremo con S l’insieme di tutti i possibili eventi elementari di un esperimento casuale. S= spazio degli eventi

EVENTO= qualunque insieme di eventi elementari =qualunque sottoinsieme dello spazio degli eventi Esempio; consideriamo un Hotel. L’esperimento casuale consiste in questo: si chiede a un cliente di valutare la qualità dei servizi ricevuti da un hotel mediante un numero intero, da 1 (il minimo livello di qualità) a 7 (il massimo livello di qualità). S= 1,2,3,4,5,6,7. Ciascuno di questi numeri è un evento elementare. (evento) A=1,2,3 “poco soddisfatto” B=4,5,6 “abbastanza soddisfatto” C= 7  “molto soddisfatto” Esempio; consideriamo l’esperimento consistente nel lancio di un dado a 6 facce, in ognuna delle quali appare un numero di puntini da 1 a 6. Indichiamo lo spazio degli eventi come composto da: S= e 1 ,e 2 ,e 3 ,e 4 ,e 5 ,e 6  A= e 1 ,e 3 ,e 5  “evento in cui si ottiene un numero dispari di punti” B= e 2 ,e 4 ,e 6  “si ottiene numero pari di punti” In generale, per rappresentare gli eventi ricorriamo alla teoria degli insiemi. L’assunto di base è che ogni evento è un sottoinsieme dello spazio S degli eventi. S è il “più grande insieme che possiamo considerare” Gli elementi (“punti”) che costituiscono ciascun evento sono gli eventi elementari. Un evento A “si verifica” se il risultato dell’esperimento casuale è un evento elementare in A Sugli eventi definiamo le operazioni comuni che consideriamo sugli insiemi OPERAZIONI:

  • UNIONE A, B eventi A U B= evento formato dagli eventi elementari in A o in B Ogni evento elementare in AUB si trova in A o in B A U B si verifica se e solo se o si verifica A o si verifica B (cioè il risultato dell’esperimento casuale è in A o in B)
  • INTERSEZIONE A, B eventi AB= intersezione di eventi elementari che si trovano sia in A che in B

Consideriamo n eventi A 1 , A 2 , …, An Sono NECESSARI se la loro unione è lo spazio degli eventi S (se A 1 U A 2 U … U An= S) Sono INCOMPATIBILI se la loro intersezione  non è formata da nessun evento elementare (se la loro intersezione è vuota) Se è l’evento che si verifica SEMPRE (S è anche detto EVENTO CERTO) La negazione di S (S periodico)= evento che non si VERIFICA MAI. = 0 evento impossibile) A e B sono incompatibili se AB= 0 Un’ultima relazione importante (MOLTO!) A,B eventi A= (AB) U (ABperiodico). QUESTI DUE EVENTI SONO INCOMPATIBILI Dove ABperiodico= A\B DEFINIAMO LA PROBABILITA’ non semanticamente, ma con le sue proprietà. Diamole la forma matematica giusta, ovvero quella assiomatica. S= spazio degli eventi A= evento (sottoinsieme di S) P(A) probabilità dell’evento A(NUMERO CHE QUANTIFICA IL “GRADO DI POSSIBILITA’” DI A) ASSIOMI (o postulati) DELLA PROBABILITA’ => ci dicono quali proprietà ha la probabilità senza dire cosa è la probabilità. I ASSIOMA= la probabilità di un evento è di un numero maggiore o uguale a zero qualunque sia l’evento A contenuto in S. P(A) maggiore o uguale a 0. II ASSIOMA= la probabilità dell’evento certo è 1. P(S)= III ASSIOMA= se A e B sono due eventi incompatibili (cioè se AB= 0 ) Allora P(A U B)= P(A)+ P(B) Il postulato 3 si estende a più di due eventi A,B,C EVENTI Se AB=0, AC=0, e BC= 0 Allora P(A U B U C)= P(A)+ P(B)+ P(C)p

Se A1, A2, …, An sono n eventi tali che due qualunque di essi sono incompatibili (A1, A2,…,An sono “due a due incompatibili”, ovvero tutte le coppie sono incompatibili) allora P(A1 U A2 U… U An)=P(A1)+P(A2)+…+P(An) NOTA: consideriamo due eventi A e B Abbiamo già visto che A = (AB) U (ABperiodico) Questi due eventi sono incompatibili Dal postulato 3 quindi discende che: P(A)= P((AB) U (ABperiodico))= =P(AB)+P(ABperiodico) Es. numerico Un ristorante è aperto o a pranzo o a cena. Indichiamo con A l’evento “il cliente ordina vino” e con B “il cliente va a pranzo” indichiamo con la negazione di B “il cliente va a cena” La probabilità che un cliente che va a pranzo e ordini vino è 0, P(AB)=0, La probabilità che un cliente va a cena e ordina vino è 0, P(ABperiodico)=0, Come calcolare P(A) cioè la probabilità che un cliente (a pranzo o a cena non importa) ordini vino? La relazione che usiamo è: A= (AB) U (ABperiodico) e questi due eventi sono incompatibili (se va a pranzo non va a cena) Quindi se usiamo il terzo postulato: P(A)=P(AB)+ P(ABperiodico)= 0,13+0,26=0, PROPRIETA’ DELLA PROBABILITA’

  1. P(Aperiodico)= 1-P(A) Dimostrazione: consideriamo A e la sua negazione Aperiodico. Essi sono incompatibili. Se li unisco ottengo A U Aperiodico=S quindi P(S)= P(AUAperiodico)= P(A) + P(Aperiodico) ossia P(A)+P(Aperiodico)= 1  P(Aperiodico)=1- P(A)
  2. P( 0 )= La probabilità dell’evento impossibile è zero. Dimostrazione: l’evento impossibile è la negazione dell’evento certo S P( 0 )= 1- P(S)= 1-1=
  3. Se A è un qualunque evento certo, P(A) è minore o uguale a 1 Dimostrazione: P(Aperiodico)= 1-P(A) e per il 1 postulato, la probabilità di Aperiodico è maggiore o uguale a 0. Quindi 1-P(A) maggiore o uguale a 0  P(A)minore o uguale a 1 SE UNISCO POSTULATO 1 E 3: per ogni evento A abbiamo che 0 minore uguale a P(A) minore uguale a 1
  4. Se A e B sono due eventi qualsiasi, allora P(A U B)= P(A) + P(B) – P(AB)

si è verificato l’evento B. La domanda è: come si modifica la probabilità di A sapendo che si è verificato B? P(A|B)  la probabilità dell’evento A condizionata a B Cioè: la probabilità di A essendo noto che si è verificato B DEFINIZIONE= P(A|B) = P(AB) / P(B) Al numeratore: eventi elementari che sono sia in A che in B Al denominatore: eventi elementari in B Questo è vero purché P(B) sia maggiore di 0 Nota: P(AB) = P(A|B) x P(B) = P(B|A) x P(A) Facciamo un esempio numerico. In un caso di omicidio ci sono due sospetti (A e B). La polizia li considera come “ugualmente probabili di essere colpevoli”, cosicché la probabilità che P (A colpevole) = P (B colpevole) = 0,5. Dopodiché la polizia trova sulla scena del delitto un reperto su cui ci sono tracce di DNA. P (risult test DNA|A colpevole) = 0, P (result test DNA|B colpevole) = 0, Cosa ci interessa? La probabilità che A sia colpevole avendo l’informazione sul test del DNA P(Acolpevole|risultato test DNA) e che B sia colpevole dato il risultato del test del DNA P(B colpevole|risultato test DNA). CALCOLIAMOCI QUESTE DUE P(A colpevole|risult test DNA)= P(A colpevolerisult test DNA)/ P(risult DNA) e lo stesso per B. P(A colpevolerisult test DNA)= P(A colpevole) x P (risult DNA|A colpevole) Cioè = 0,5 x 0,8= 0, P(B colpevolerisult test DNA)= P(B colpevole) x P (risult DNA)|B colpevole)= =0,5 x 0,5= 0, Osservazione: Acolpevole periodico (la negazione di A colpevole) significa dire B colpevole e viceversa RisultDNA= (risult DNA  A colp) U (risult DNA  A colpevole periodico) = (risult DNA  A colp) U (risult DNA  B colpevole periodico) QUESTI DUE EVENTI SONO INCOMPATIBILI DUNQUE P(risultDNA)= P(risult DNA  A colpevole) + P (risult DNA  B colpevole)= 0,40+0,25=0, P (A colp|risult DNA)= P (A colpevolerisultDNA) / P (risultDNA) = 0,40/0,65= 0, P (B colp|risult DNA)= 0,25/ 0,65= 0, DEFINIZIONE= due eventi A e B sono indipendenti se P(AB)= P(A) x P(B) Cosa significa?

Se A e B sono indipendenti, si ha che P(A|B)= P(AB) / P(B). Ma se sono indipendenti, al numeratore avrà P(A) x P(B). Quindi semplifico P(B) sopra e sotto e mi rimane =P(A). P(B|A) = P(AB) / P(A)= P(A) x P(B) / P(A) = P(B) Osservazioni:

  1. Se A e B sono indipendenti anche A e Bperiodico sono indipendenti
  2. Se A e B sono indipendenti anche Aperiodico e B sono indipendenti
  3. Se A e B sono indipendenti anche Aperiodico e Bperiodico sono indipendenti DUE EVENTI INCOMPATIBILI POSSONO ESSERE INDIPENDENTI? NO: due eventi sono incompatibili se non hanno eventi elementari comuni. Quindi due eventi incompatibili non possono essere logicamente indipendenti perchè uno esclude l’altro. LEGGE DELLE PROBABILITA’ TOTALI Consideriamo un evento A e k ulteriori eventi B1,B2,Bk tali che sono due a due incompatibili e la loro unione sia uguale allo spazio degli eventi s (sono necessari) IMMAGINI In generale, se B1, B2,…, Bk sono due a due incompatibili e tali che B1 U B2 U Bk= S, allora A= (AB1) U (AB2) U… U (ABk) Conseguenza P= P(AB1) + P(AB2) U… U P(ABk) IMMAGINE LEGGE DELLE PROBABILITA’ TOTALI Richiede che B1, B2,…, Bk siano due a due incompatibili e tali che B1 U B2 U…U Bk= S Teorema di Bayes Supponiamo che A sia l’evento e che B1,B2,…, Bk k eventi due a due incompatibili e tali che B1 U B2 U … U Bk=S. si ha allora, per ogni i da 1 a k,: immagine e lo stesso per B2 e B IMMAGINE dimostrazione P(Bi|A)= P(A Bi) / P(A) = P(Bi) x P(A|Bi) / P(A) Usiamo le legge delle probabilità totali (la prob di A= somma j da 1 a k della probabilità di…) IMMAGINi A= effetto, cioè un fatto osservato es. sintomi malattia