Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


4. Appunti sulla Probabilità, Schemi e mappe concettuali di Analisi Dei Dati

Appunti della lezione sulla probabilità

Tipologia: Schemi e mappe concettuali

2021/2022

Caricato il 14/04/2023

marta-saldarini
marta-saldarini 🇮🇹

4.8

(5)

12 documenti

1 / 5

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
05.10.2022
Francesco Della Beffa
PROBABILITÀ
La probabilità è una misura della possibilità che un evento possa verificarsi.
Definizione frequentista (quando il numero di prove tende a infinito):
[Il risultato per definizione è un numero compreso da 0 e 1].
p = 1 evento certo
p = 0 evento impossibile
La domma delle probabilità di tutti gli eventi possibili è 1: p = 1
DISTRIBUZIONI di probabilità
Le distribuzioni di frequenza sono in genere basate su dati osservati (campionari).
Le distribuzioni di probabilità sono i corrispondenti modelli teorici di riferimento.
Ne esistono moltissime, per modellare fenomeni diversi.
Per trattare le distribuzioni di probabilità bisogna distinguere i due casi: i casi relativi alla distribuzione
di variabili discrete e i casi relativi alle variabili continue. Questo è l’unico caso in cui la distinzione tra
discrete e continue è molto importante, in quanto vi è una differenza sostanziale.
Variabile discreta distribuzione discreta (hanno dei “buchi”) es. numero di sigarette fumate
(perché il numero di sigarette fumate è unitario)
Variabile continua distribuzione continua (possono assumere qualunque valore) — es. altezza
(perché quello che conta è la caratteristica che si sta misurando e, in questo caso, l’altezza può
assumere qualsiasi valore, come 160 cm, ma non sarà esattamente quella la cifra esatta).
bisogna pensare alla caratteristica intrinseca del fenomeno che si sta misurando.
DISTRIBUZIONI DI PROBABILITÀ DISCRETE
Per esempio: la probabilità di un possibile lancio di un dado.
-Lancio di un dado
-Lancio di due dadi (somma)
-Lancio di due dadi (max) ?
(da aggiungere la spiegazione)
1
pf3
pf4
pf5

Anteprima parziale del testo

Scarica 4. Appunti sulla Probabilità e più Schemi e mappe concettuali in PDF di Analisi Dei Dati solo su Docsity!

PROBABILITÀ

La probabilità è una misura della possibilità che un evento possa verificarsi. Definizione frequentista (quando il numero di prove tende a infinito): [Il risultato per definizione è un numero compreso da 0 e 1]. p = 1 → evento certo p = 0 → evento impossibile La domma delle probabilità di tutti gli eventi possibili è 1: ∑p = 1 DISTRIBUZIONI di probabilità

  • Le^ distribuzioni di frequenza^ sono in genere basate su dati^ osservati^ (campionari).
    • Le^ distribuzioni di probabilità^ sono i corrispondenti^ modelli teorici^ di riferimento. Ne esistono moltissime, per modellare fenomeni diversi. Per trattare le distribuzioni di probabilità bisogna distinguere i due casi: i casi relativi alla distribuzione di variabili discrete e i casi relativi alle variabili continue. Questo è l’unico caso in cui la distinzione tra discrete e continue è molto importante, in quanto vi è una differenza sostanziale. Variabile discreta → distribuzione discreta (hanno dei “buchi”) es. numero di sigarette fumate (perché il numero di sigarette fumate è unitario) Variabile continua → distribuzione continua (possono assumere qualunque valore) — es. altezza (perché quello che conta è la caratteristica che si sta misurando e, in questo caso, l’altezza può assumere qualsiasi valore, come 160 cm, ma non sarà esattamente quella la cifra esatta). → bisogna pensare alla caratteristica intrinseca del fenomeno che si sta misurando. DISTRIBUZIONI DI PROBABILITÀ DISCRETE Per esempio: la probabilità di un possibile lancio di un dado.

- Lancio di un dado

- Lancio di due dadi (somma)

- Lancio di due dadi (max)?

(da aggiungere la spiegazione)

[I valori della probabilità si concentrano nei possibili valori che la variabile può assumere; in questo caso la variabile può assumere valori interi tra 1 e 6]. ESEMPI di distribuzioni discrete (call center) Modello teorico :

  • Successo: prendere la linea/trovare la persona
  • Tentativi ripetuti
  • I tentativi sono indipendenti
  • La probabilità^ è^ la stessa a ogni tentativo (es. p = 0,2) Eventi , distribuzioni , probabilità
  1. Probabilità di prendere la linea/trovare la persona con un tentativo solo
  2. Probabilità di dover chiamare n volte per prendere la linea, cioè di riuscire la prima volta al tentativo n-esimo
  3. Probabilità di trovare k persone in n tentativi
  4. Probabilità di dover fare n tentativi per trovare k persone
  5. ecc… La caratteristica fondamentale delle distribuzioni discrete è che la probabilità è concentrata nei possibili valori (altrove è 0). DISTRIBUZIONI CONTINUE
  • Per^ variabili discrete^ la probabilità^ è^ concentrata nei^ punti ;
  • Per^ variabili continue^ la probabilità^ è^ l’area sotto la^ curva. massimo (^) DADO ROSSO 1 2 3 4 5 6 D A D O B L U 1 1 1 2 3 4 5 6 2 2 2 2 3 4 5 6 3 3 3 3 3 4 5 6 4 4 4 4 4 4 5 6 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6
  • (^) Probabilità della probabilità (es. preferenze politiche) USO DELLE DISTRIBUZIONI DI PROBABILITÀ La conoscenza di una distribuzione teorica permette di rispondere a domande come:
    • Qual’è^ la probabilità^ di valori^ tra a e b?
    • Qual’è^ la probabilità^ di valori^ maggiori^ (o minori)^ di a? Nei problemi applicativi si cerca di ricondurre la distribuzione campionaria osservata a una distribuzione teorica nota. ESEMPIO di applicazione della normale (solo per capire, non è un esercizio possibile all’esame): Supponiamo di sapere che il numero di clienti al giorno in un punto vendita ha una distribuzione approssimativamente normale con μ = 750 e σ = 100. clienti / giorno ∼ N (750; 100^2 ) → qual’è la probabilità che in un giorno ci siano più di 700 clienti? → qual’è la probabilità che in una N (750; 100^2 ) sia x > 700? L’area a destra di 700 si può calcolare via software:
  • Excel^ fornisce l’area a sinistra (!) di 700: DISTURBI.NORM.N(700; 750; 100; VERO)=0, Prob (x > 700) = 1 — Prof (x < 700) = 1 — 0,3085 = 0, - StatDistributions.com DISTRIBUZIONE NORMALE STANDARD N (0; 1) Se μ = 0 e σ = 1 la distribuzione è una normale standard. Qualunque variabile casuale normale x ∼ N (μ; σ^2 ) può essere convertita in una variabile standard z ∼ N (0; 1) mediante l’operazione di standardizzazione (dividere per σ serva a far diventare 1 la deviazione standard):

ALCUNI VALORI CONVENZIONALI 95% e 99% In una distribuzione N (0; 1) il 95% dei valori è compreso (approssimativamente) tra - 2 e + 2. Il 99% dei valori è compreso tra -2.57 e +2.