Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Calcolo combinatorio e probabilità, Appunti di Psicometria

Calcolo combinatorio e probabilità

Tipologia: Appunti

2024/2025

Caricato il 25/05/2026

chiaragiachero41
chiaragiachero41 🇮🇹

3 documenti

1 / 22

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
ELEMENTI DI PROBABILITA’
Calcolare una probabilità vuol dire calcolare il grado di avverabilità di un evento.
Es. lanciare una moneta e chiedersi quale se sequenza del lancio può essere più probabile
Ci basiamo sulla definizione secondo la quale siamo in grado di conoscere a priori tutti gli eventi possibili,
cioè lo spazio campionario: nel caso della moneta lo spazio campionario è costituito dalle due facce possibili
quindi o testa o croce, nel caso del dado è costituito dalle 6 possibili facce. Ognuno di questi esiti possibili è
detto EVENTO (esito).
Ci aspettiamo che tutte le facce del dado abbiano la stessa probabilità di estrazione quindi definiamo la
probabilità come
p =
!"#$%& () $*$!+) ,-*&%$*&.)
!"#$%& () $*$!+) /&00)1).)
= !"#$%& () $*$!+) ,-*&%$*&.)
0/-2)& 3-#/)&!-%)&
Gli eventi si dividono in:
- Semplici à sono eventi singoli (es. nelle carte una singola carta all’interno del mazzo)
- Compositi à quando do una condizione che è soddisfatta da più eventi, un insieme di eventi singoli
(es. carta di fiori)
Principi di probabilità:
1. La probabilità è un evento sempre compreso fra 0 e 1 senza però che lo 0 e l’1 siano compresi nel
concetto di probabilità perché un evento con probabilità 0 è un evento impossibile e un evento che ha
probabilità 1 è certo, quindi questi valori non rappresentato elementi di interesse
0 < p(V) < 1
2. Nel momento in cui definiamo la probabilità di un evento; quindi, la probabilità che un evento s -i
verifichi, automaticamente definiamo anche la probabilità che quell’evento non si verifichi perché la
somma della probabilità che l’evento si verifichi e della probabilità che l’evento non si verifichi è
sempre uguale a 1 indipendente dal tipo di evento
p(V) + p(P) = p(non V) = 1,00
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16

Anteprima parziale del testo

Scarica Calcolo combinatorio e probabilità e più Appunti in PDF di Psicometria solo su Docsity!

ELEMENTI DI PROBABILITA’

Calcolare una probabilità vuol dire calcolare il grado di avverabilità di un evento. Es. lanciare una moneta e chiedersi quale se sequenza del lancio può essere più probabile Ci basiamo sulla definizione secondo la quale siamo in grado di conoscere a priori tutti gli eventi possibili, cioè lo spazio campionario: nel caso della moneta lo spazio campionario è costituito dalle due facce possibili quindi o testa o croce, nel caso del dado è costituito dalle 6 possibili facce. Ognuno di questi esiti possibili è detto EVENTO (esito). Ci aspettiamo che tutte le facce del dado abbiano la stessa probabilità di estrazione quindi definiamo la probabilità come p = !"#$%& () $$!+) ,-&%$&.) !"#$%& () $$!+) /&00)1).)

!"#$%& () $$!+) ,-&%$*&.) 0/-2)& 3-#/)&!-%)& Gli eventi si dividono in:

  • Semplici à sono eventi singoli (es. nelle carte una singola carta all’interno del mazzo)
  • Compositi à quando do una condizione che è soddisfatta da più eventi, un insieme di eventi singoli (es. carta di fiori) Principi di probabilità:
  1. La probabilità è un evento sempre compreso fra 0 e 1 senza però che lo 0 e l’1 siano compresi nel concetto di probabilità perché un evento con probabilità 0 è un evento impossibile e un evento che ha probabilità 1 è certo, quindi questi valori non rappresentato elementi di interesse 0 < p(V) < 1
  2. Nel momento in cui definiamo la probabilità di un evento; quindi, la probabilità che un evento s - i verifichi, automaticamente definiamo anche la probabilità che quell’evento non si verifichi perché la somma della probabilità che l’evento si verifichi e della probabilità che l’evento non si verifichi è sempre uguale a 1 indipendente dal tipo di evento p(V) + p(P) = p(non V) = 1,

Fino ad adesso abbiamo applicato il principio classico della probabilità che è stato sviluppato nel ‘600 a partire dall’interesse del Cavaliere de Méré che aveva coinvolto Blaise Pascal. Tutti questi calcoli vengono fatti perché noi conosciamo a priori tutte le possibilità e quindi tutto lo spazio campionario. Come faccio a calcolare una probabilità che non è basata sul fatto che quegli eventi che io sto studiando siano noti a priori? C’è anche una definizione di probabilità a posteriori (frequentista) nella quale questa probabilità viene aggiornata nel tempo sulla base dei dati che osserviamo. Es. lancio un dato e mi aspetto che le facce del dado escano tutte con la stessa probabilità, però anche se il dado fosse perfettamente onesto non mi sorprenderebbe non vedere tutte le facce nei primi sei lanci (allo stesso modo non mi aspetto che lanciando una moneta venga 5 volte testa e 5 volte croce). Quindi osserviamo già un qualcosa che avrà a che fare con la statistica inferenziale:

  • Probabilità che un certo evento si verifichi senza che siamo in grado di saperne lo spazio campionario a priori
  • Che cosa succede nel lungo periodo perché, se il dado è onesto non lo vedo con soli 6 lanci ma probabilmente con 10000 lanci Se il dato è onesto ci sta che con pochi lanci ci siano delle facce che per qualche motivo casualmente escono con maggiore frequenza delle altre, ma nel lungo periodo ci aspettiamo che le facce escano tutte con la frequenza di 4 5

Allo stesso tempo se un dato è truccato per fare uscire il 50% delle volte la faccia 6 e una faccia a caso le restanti volte non lo riesco a osservare quando i lanci sono pochi; infatti, in questo caso la situazione tra il dado onesto e quello truccato potrebbero essere indistinguibili. Al contrario sul lungo periodo noteremo che la faccia 6 esce con maggiore probabilità delle altre. Quindi la probabilità che noi andiamo a calcolare quando facciamo l’analisi dei dati di tipo inferenziale è legata al fatto che noi facciamo un’analisi di quello che succederà nel lungo periodo. La probabilità è composta da una serie di vari principi:

  • Principio della somma (per eventi disgiunti) à quando parliamo di eventi disgiunti facciamo un’affermazione che prevede che più fenomeni possano verificarsi e quello che ci aspettiamo è che si verifichi uno qualunque di questi.
  • Principio della probabilità disgiunta = l’evento favorevole è definito da più eventi distinti all’interno dello spazio campionario
  • Uso la congiunzione “o”
  • Andiamo a sommare le probabilità degli eventi semplici
  • ESERCIZIO
  • ESERCIZIO
  • ESERCIZIO

Questi tipi di ordinamenti prendono il nome di permutazioni semplici Importante:

  • 1! = 1
  • 0! = 1 Nel caso in cui le persone da ordinare siano disposte in cerchio si parla di permutazioni circolari. Es. ho una cena e devo ordinare 3 persone intorno a un tavolo, se usassi la formula precedente gli elementi all’interno della permutazione sarebbero gli stessi ma non la loro disposizione. Devo quindi usare (n-1)! Quindi non n! Devo usare la formula delle permutazioni circolari La maggior parte delle volte però non siamo interessati a sapere in quanti modi possiamo ordinare tutti gli elementi ma vogliamo sapere quanti diversi gruppi k elementi dall’insieme di n noi possiamo realizzare Quando faccio questi gruppi devo sapere se questi vanno distinti solo per la composizione oppure devono essere distinti anche per l’ordine degli elementi all’interno. Questa caratteristica distingue le disposizioni dalle combinazioni.
  1. Nelle DISPOSIZIONI i gruppi sono distinti sia dalla composizione, quindi gli elementi che lo compongono, sia dall’ordine in cui queste elementi sono ordinati Es. quante diverse parole di due lettere è possibile formare con la parola AMO? In questo caso non importa solo la composizione della parola ma anche l’ordine delle lettere (AM ≠ MA). Disposizioni semplici: numero di diverse classi ordinate di ampiezza k che è possibile formare da un insieme di n elementi (dove k ≤ n) distinti. In ciascuna disposizione figurano k oggetti senza ripetizione e ogni disposizione è distinta dall’altra sia per gli elementi che per l’ordine degli elementi all’interno della disposizione Nel caso delle disposizioni semplici si prende il fattoriale di tutti gli elementi n e si divide per il fattoriale della differenza fra numero di elementi e l’ampiezza del sottogruppo Se ho tre lettere da raggruppare in parole da raggruppare in parole da due lettere mi calcolo
  1. Se invece non mi importa dell’ordine degli elementi all’interno del sottogruppo, ma mi basta che ogni sottogruppo di k elementi sia distinto dagli altri per la composizione ho delle COMBINAZIONI Combinazioni semplici: numero di diverse classi di ampiezza k che è possibile formare da un insieme di n elementi (dove k ≤ n) distinti. In ciascuna combinazione figurano k oggetti senza ripetizione e ogni combinazione è distinta dall’altra solo per gli elementi all’interno della combinazione. Si calcolano con la formula delle disposizioni moltiplicata per 4 6! Es. in quanti modi possiamo ottenere 6 T su dieci lanci della moneta?

A livelli di fiducia maggiori corrispondono intervalli più ampi, a livelli di fiducia minori intervalli più ristretti. Posso calcolarmi gli intervalli di fiducia di qualsiasi valore: Sulla base di questi valori z e delle informazioni che ho sul campione sono in grado di calcolarmi i limiti inferiore e superiore dell’intervallo di fiducia del valore che mi interessa nella popolazione. Questo tipo di applicazione si può fare con qualsiasi parametro. Una cosa che sappiamo è che per la legge dei grandi numeri aumentando l’ampiezza campionaria diminuisce l’errore standard: è la deviazione standard del campione diviso la radice quadrata dell’ampiezza campionaria meno 1 che è la stima dell’errore standard a partire dal campione. Se noi manteniamo fissi i valori di M e di deviazione standard del campione quindi M = 21 e s = 3, e manteniamo fissa la percentuale del livello di fiducia dell’intervallo quindi 95% con z = 1,96, quello che può variare in questo caso statisti stico è il valore di n. Quindi all’aumentare di n il valore dell’errore standard non può che diminuire. All’aumentare dall’ampiezza campionaria la stima che io faccio dei livelli di fiducia diventa via via più precisa perché l’intervallo di fiducia si riduce. Quando n diventa infinito l’errore standard diventa 0 e quindi non ha neanche più l’intervallo di fiducia per quel preciso valore della popolazione stimato a partire da quello della popolazione.

Caso di popolazioni finite Se la popolazione fosse finita e ne conoscessimo l’ampiezza per calcolare gl estremi dell’intervallo di fiducia dovremmo applicare il fattore di correzione per popolazioni finite. Posso fare anche il contrario quindi partire dai dati della popolazione e calcolare l’intervallo di fiducia della media campionaria. A cosa mi serve un’operazione di questo tipo? Io so delle informazioni sulla popolazione, cosa posso aspettarmi dal campione che potenzialmente sia rappresentativo di questa popolazione? Con lo stesso procedimento di prima siamo in grado di calcolare l’intervallo di fiducia che possiamo aspettarci nel campione. Es. ho un campione di 36 partecipanti, μ = 21 e σ = 3, che media posso aspettarmi dei punteggi al test di questa popolazione? Se poi la media che osservo io non ricade all’interno di questi intervalli vuol dire che probabilmente quel campione non è così rappresentativo della popolazione come mi aspettavo perché, se io prendo un campione rappresentativo della popolazione la media campionaria mi deve cadere all’interno degli intervalli, se non ci cade io sono comunque in grado di sapere qual è la probabilità che io ho di aver fatto un errore. p = 1- livello di fiducia Popolazioni finite Quando conosciamo anche l’ampiezza della popolazione dobbiamo applicare o la stima dell’errore standard partendo dai dai dati campionari o partendo dai dati della popolazione. È il procedimento che ci permette di calcolarci gli intervalli di fiducia un certo valore.

  • p(T) = 1 se è certo che esca testa
  • p(T) = ,50 se la moneta è onesta Cosa ci dice questo valore di probabilità? In gergo della statistica viene definito p-value, ci dice che supponendo che la moneta sia onesta la probabilità che mi vengano 10 teste su 10 lanci è dello 0,1%. A questo punto se per me la probabilità è troppo bassa posso rifiutare le ipotesi e validare invece il concetto che la moneta sia truccata in favore di croce. La decisione probabilistica non è mai certamente corretta, noi facciamo assunzioni che non sono basate sulle nostre aspettative, su ciò che è più logico intendersi, ma che devono essere basate su un dato oggettivo che, se quell’assunzione fosse vera dovremmo inevitabilmente osservare. Se io volessi studiare se una moneta è onesta o meno non posso partire dall’idea che la moneta in realtà non sia onesta perché, quando poi vado a fare i calcoli io devo studiare qual è la probabilità che esca testa e non posso mettere un valore a caso che, secondo me, va bene, devo mettere un valore del quale sarei certo. Qual è l’unica situazione di cui sarei ceto nel caso della moneta? So per certo che, quando la moneta è onesta la probabilità di testa è uguale alla probabilità di croce, senza margini di soggettività. Quindi quando faccio i calcoli devo partire dall’assunzione che la moneta sia onesta. Ma se lanciando 100 volte la moneta mi uscisse 70 volte testa, posso ancora considerare la moneta onesta? Posso calcolare la probabilità che data la moneta testa otteniamo effettivamente 70 volte testa su 100 lanci e quindi viene il p-value cioè il valore di probabilità sul quale baseremo la nostra decisione. A questo punto questo valore di probabilità lo dobbiamo confrontare con il valore che ho già stabilito in precedenza che è il livello di significatività α che ci consente di prendere una decisione. Se la probabilità calcolata è maggiore o uguale al livello di significatività α non posso rifiutare le assunzioni da cui siamo partiti. Se invece questo valore è più basso di α non vuol dire che la moneta è disonesta ma che la moneta onesta per produrre quell’esito che abbiamo osservato ha una probabilità davvero bassa, quindi quando una cosa è davvero improbabile ci viene da pensare che ci sia una spiegazione alternativa, posso rifiutare le premesse. Accetterò la spiegazione alternativa che la moneta non sia onesta. Prendiamo una decisione di tipo probabilistico quindi non siamo certi che la decisione sia corretta. La decisione probabilistica è sempre soggetta ad errore:
  • dire che la moneta è truccata quando non lo è
  • dire che la moneta è onesta quando non lo è il problema non è quanto riusciamo ad avvicinarci alla certezza ma quanto riusciamo ad allontanarci da una decisione presa a caso. Quando diciamo che un certo evento è più probabile di altri non vuol dire che succede

nella maggior parte dei casi, ma che è più probabile che succeda rispetto alla probabilità opposta (nel 90% dei casi). Es. scegli un’urna da cui estrarre ed estrai una pallina. Se estrai una pallina nera vinci 25. Da quale urna vorresti estrarre? Nell’urna A ci sono 25 palline e una nera, nell’urna B ci sono 25 palline e due nere. Da quale urna vorreste estrarre? La probabilità aumenta di poco ma sarei comunque portato a scegliere l’urna B. Quando facciamo la verifica delle ipotesi dobbiamo fare delle assunzioni da cui partire per fare i calcoli quindi dobbiamo decidere qual è il valore del parametro se le cose stessero in un certo modo, e questo valore deve essere certo. Questa assunzione prende il nome di ipotesi nulla.

  • L’ipotesi nulla si ha quando si formula un’ipotesi in bas3 a quanto è noto nella popolazione o è ragionevole pensare in base alle informazioni in nostro possesso
  • L’ipotesi alternativa si ha quando si formula un’altra ipotesi, che è quella che dovremmo accettare se la probabilità che i dati osservati siano il risultato di un’ipotesi nulla vera è troppa bassa Quando faccio verifica delle ipotesi parto sempre dall’ipotesi nulla, stabilisco che nella popolazione il valore di parametro che mi interessa sia un valore preciso. Sulla base di questa assunzione calcolo il valore con le formule e in base a questo valore di probabilità decido se accettare o meno le ipotesi. Le ipotesi si fanno sui parametri (e quindi sulle popolazioni) e non sulle statistiche (e quindi non sui campioni!). Es. Es.

Se l’ipotesi è monodirezionale prendiamo in considerazione α in una sola coda. Se invece l’ipotesi è bidirezionale devo prendere in considerazione 8 9 sia sulla coda di sinistra sia sulla coda di destra. Il livello di significatività α rappresenta la probabilità di rifiutare un’ipotesi nulla vera. Come si fa a decidere il valore di α? Il livello classico a cui si fissa α è 0,05 o 5%. Nella distribuzione esistono delle regioni in cui i dati seppur con probabilità diverse possono essere stati generati sia da H₀ sia da H₁. Quindi quando io vado a stabilire la zona di rifiuto di H₀ vuol dire che, quando il valore di probabilità cade nella zona rossa rifiuto H₀, quando non cade nella zona rossa accetto H₀. La zona di H₀ che non è rossa comprende anche una parte di area blu dove è probabile che H₁ abbia generato i dati, devo quindi stare attento a non stabilire un valore di α che sia troppo basso per aumentare la zona blu in cui dovrei accettare H₁ ma in realtà non la accetto perché devo accettare H₀. Fissare un valore di α bassissimo fa alzare di molto l’area blu relativa ai dati generati da H₁. Allo stesso modo nel prendere un valore di α troppo alto l’errore di accettare H₀ quando invece non è accettata diventa troppo alto. Il valore di α quindi dovrebbe essere scelto come compromesso ideale tra i due tipi di errore.

Infatti, gli errori che possiamo commettere quando prendiamo una decisione sulla base della verifica delle ipotesi sono di due tipi:

  1. Errore di I tipo à corrisponde ad α, consiste nel rifiutare l’ipotesi nulla quando invece dovremmo accettarla. Significa ritenere che esista un fenomeno che invece non esiste

2. Errore di II tipo à corrisponde a ᵦ, consiste nel non rifiutare l’ipotesi nulla quando andrebbe rifiutata.

Significa ritenere inesistente un fenomeno che invece esiste Sappiamo però quantificare la probabilità che abbiamo di sbagliare in un senso e nell’altro nel lungo periodo. Quando si parla di lungo periodo si fa riferimento al fatto che molto spesso uno studio viene condotto una volta sola quando in realtà è il fatto che venga replicato nel tempo che ci permette di prendere una decisione e fare delle affermazioni che si avvicinino di più allo stato reale delle cose. Noi siamo in grado di quantificare sia la probabilità di commettere errori di primo tipo sia di commettere errori di secondo tipo nel momento in cui stabiliamo i valori di α. Agli errori di primo tipo in ambito scientifico più ampio corrispondono i falsi positivi, mentre agli errori di secondo tipo corrispondo i falsi negativi. Questo problema lo ritroviamo quando analizzando i punteggi dei test andiamo a fare delle operazioni di screening che ci portano a individuare le persone a rischio o non a rischio di un certo disturbo. Solo con i test noi non siamo in grado di stabilire se una persona ha un disturbo,a se è più probabile che sviluppi un disturbo. Da cosa deriva il livello di significatività del 5%? Ronald Fisher è stato uno dei primi a pubblicare un’analisi statistica e in quella del 1926 compare per la prima la verifica delle ipotesi sviluppata da Fisher stesso Nessuno in cento anni è mai riuscito a smentire questa ipotesi di Fisher. Però Rosnow e Rosenthal affermano anche che Quando si trovano delle stelline di fianco ai parametri queste indicano il livello di significatività per cui quel fato valore risulta statisticamente significativo.

  • Una stellina indica che, quando è stata fatta la verifica delle ipotesi e quindi calcolato p-value, questo valore è venuto inferiore di ,