Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Probabilità e Statistica, Appunti di Probabilità e Statistica

Appunti creati da me, strutturati e suddivisi per argomento. comprende definizioni, esempi brevi, spiegazioni e formule Anno accademico : 2026 Docente : Alberto Di Iorio Università : Roma tre Facoltà : ing. gestionale

Tipologia: Appunti

2025/2026

In vendita dal 10/06/2026

alessia-lombardo-40
alessia-lombardo-40 🇮🇹

16 documenti

1 / 105

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Alessia Lombardo 1° Anno ing. Gestionale 2//02/2026
INDICE:
1. Statistica descrittiva:
Concetti introduttivi: Caratteri statistici e scale di misura. Distribuzioni semplici.
Rappresentazioni tabellari e grafiche. Funzione di ripartizione empirica.
Indici di dimensione: Moda. Mediana. Quantili. Medie.
Indici di Variabilità: Scostamenti medi. Varianza. Coefficiente di variazione. Differenza
interquartile.
Cenni su concentrazione
Asimmetria di una distribuzione
Cenni su serie temporali e numeri indice
Distribuzioni statistiche doppie, marginali e condizionate. I momenti delle distribuzioni
doppie, l'associazione e l'indipendenza.
2. Calcolo delle probabilità:
Definizione assiomatica di probabilità. Probabilità condizionata. Indipendenza. Teorema
di Bayes. Variabili aleatorie undimensionali discrete. Funzione di probabilità, di densità,
di ripartizione. Momenti di variabili aleatorie. Principali distribuzioni di probabilità
discrete: binomiale, Poisson, uniforme.
Principali distribuzioni di probabilità continue: uniforme, normale, esponenziale. Cenni
alle distribuzioni di Student e Fisher
Variabili aleatorie multiple: funzioni di probabilità marginali e condizionate,
indipendenza e correlazione.
Proprietà delle distribuzioni di probabilità: combinazioni lineari di variabili aleatorie,
convergenza, legge dei grandi numeri, teorema del limite centrale e disuguaglianza di
Chebyshev.
3. Inferenza Statistica:
Cenni su popolazione e campione: popolazioni finite e infinite; campione casuale da
popolazioni finite e infinite; distribuzione di probabilità del campione casuale.
Statistiche campionarie e loro distribuzioni: distribuzione campionaria della media;
distribuzione campionaria della varianza.
Stima dei parametri: proprietà degli stimatori; intervallo di confidenza per i principali
parametri della popolazione
Verifica di ipotesi: elementi di teoria dei test: errori di prima e di seconda specie;
verifica di ipotesi per i principali parametri della popolazione
Cenni su regressione: Regressione lineare semplice stima e verifica d'ipotesi sui
parametri della retta di regressione
--APPUNTI STATISTICA E PROBABILITÀ
STATISTICA
Cosa è? Scienza che quantitrifca fenomeni colletivi
cioè fenomeni per studi di un insieme di unità(es. come l’età media delle persone
dell’aula di ing gestionale)
estraiamo informazioni da un insieme
si rappresenta in numeri
cosa osserviamo di un colletivo? I caratteri
collettivo = insieme di unità (età, residenza, titoli di scuola di superiore
ecc..)
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Anteprima parziale del testo

Scarica Probabilità e Statistica e più Appunti in PDF di Probabilità e Statistica solo su Docsity!

Alessia Lombardo 1° Anno ing. Gestionale 2//02/ INDICE:

1. Statistica descrittiva: Concetti introduttivi: Caratteri statistici e scale di misura. Distribuzioni semplici. Rappresentazioni tabellari e grafiche. Funzione di ripartizione empirica. Indici di dimensione: Moda. Mediana. Quantili. Medie. Indici di Variabilità: Scostamenti medi. Varianza. Coefficiente di variazione. Differenza interquartile. Cenni su concentrazione Asimmetria di una distribuzione Cenni su serie temporali e numeri indice Distribuzioni statistiche doppie, marginali e condizionate. I momenti delle distribuzioni doppie, l'associazione e l'indipendenza. 2. Calcolo delle probabilità: Definizione assiomatica di probabilità. Probabilità condizionata. Indipendenza. Teorema di Bayes. Variabili aleatorie undimensionali discrete. Funzione di probabilità, di densità, di ripartizione. Momenti di variabili aleatorie. Principali distribuzioni di probabilità discrete: binomiale, Poisson, uniforme. Principali distribuzioni di probabilità continue: uniforme, normale, esponenziale. Cenni alle distribuzioni di Student e Fisher Variabili aleatorie multiple: funzioni di probabilità marginali e condizionate, indipendenza e correlazione. Proprietà delle distribuzioni di probabilità: combinazioni lineari di variabili aleatorie, convergenza, legge dei grandi numeri, teorema del limite centrale e disuguaglianza di Chebyshev. 3. Inferenza Statistica: Cenni su popolazione e campione: popolazioni finite e infinite; campione casuale da popolazioni finite e infinite; distribuzione di probabilità del campione casuale. Statistiche campionarie e loro distribuzioni: distribuzione campionaria della media; distribuzione campionaria della varianza. Stima dei parametri: proprietà degli stimatori; intervallo di confidenza per i principali parametri della popolazione Verifica di ipotesi: elementi di teoria dei test: errori di prima e di seconda specie; verifica di ipotesi per i principali parametri della popolazione Cenni su regressione: Regressione lineare semplice stima e verifica d'ipotesi sui parametri della retta di regressione --APPUNTI STATISTICA E PROBABILITÀ

  • STATISTICACosa è? Scienza che quantitrifca fenomeni colletivi ▪ cioè fenomeni per studi di un insieme di unità (es. c ome l’età media delle persone dell’aula di ing gestionale)
  • estraiamo informazioni da un insieme
  • si rappresenta in numeri ◦ cosa osserviamo di un colletivo? I caratteri ◦ collettivo = insieme di unità (età, residenza, titoli di scuola di superiore ecc..)

insieme di unità omogene definita da una definizione/certa caratteristica ▪ es. insieme di unità omogene la possiamo chiamare popolazione, noi siamo la popolazione di roma tre di ing. Gestionale perchè apparteniamo tutti a quella definizione che è gli studenti di ing. Gestionale di roma tre ▪ es. processi indusustriali in cui tutti i prodotti vengono prodotti da quel machinario

  • sono dei insiemi ben definiti
  • CARATTERE ▪ è la caratteristica osservata sulle unità (età,residenza, titolo di studio ecc..) ▪ Ogni carattere sulla popolazione può asssumere diversi valori chiamati modalità ▪ MODALITÀ = delle età sono i numeri che vanno da 0 a 130
  • modalità del carattere genere sono M e F
  • modalità di titoli di studio licenzia elementare, media, laurea, ecc…
  • modalità di peso da 0 a 300 in chili
  • CARATTERE ◦ QUANTITATIVI = numerici 1. numeri discreti = assumono valori separati, es. voto esame di statistica da 18 a 30) 2. continui = possono assumere qualsiasi valore in un intervallo es. altezza in cm da 140 a ecc…. ◦ QUALITATIVI = NON NUMERICI es. religione come ebreo, musulmano, cristiano, caratteristiche fisiche come occhi azzuri, etichetta blu, rossa ecc… ▪ **possono essere:
  1. sconessi = non c’è un ordine tra le modalità es.** come occhi azzuri o neri ecc… 2. ordinati = le modalità hanno un ordine es. carattere stabilisci ordine come giudizio sul gradimento del corso(poco, per niente, molto) ◦ DISTRIBUZIONEEsistono diversi tipi come: 1. DISTRIBUZIONE UNITARIA = prendo la popolazione il mio collettivo e faccio l’elenco di tutte e le caratteristiche es. studente 1 età 21, studente 2 età 19 ecc… per tutti i 400 studenti → in un collettivo molto grandie mi faccio un’idea della situazione ma non è sintetico ▪ come sintetizzo? Ho bisogno di un numero che riassume 2. DISTRIBUZIONE DI FREQUENZE = freuquenze assolute(ni) cioè il numero di unita che si ripetono, cioè quanti anni 19 anni? Quanti 20? ◦ ni = frequenze assolute = numero di unità per ogni modalità
  • es. età 18 ha 1 persona, 30 persone hanno 21
  • es. genere, quante donne? Quanti uomini?
  • es. colore dei occhi blu,verde 4 N = ∑ n!

L’intervallo che copriamo ha 10 cm lo dividiamo in classi tutte uguali ma NON si fa sempre così

  • Le classi rendono i dati più sintetici e genstibili
  • si perde un po' di precisione ma si semplica l’analisi es. si può dividere in comuni piccoli, grandi, medi con una GRANDEZZA COMUNI ABITANTI [1,5000] = PICCOLO [5000,5000] = MEDIO > = 50000 = GRANDE
  • Ampiezza delle classi diverse e con delle differenze, cioè l’ultimo estremo non è superiormente superiore ◦ dobbiamo cercare di porre un limite raggionevole es. => 50000 abitanti ma la città più grande è di 3000000 quindi potremmo fare [5000,3000000] con un estremo superiore, sapendo che la popolazione dei comuni non supera quel valore ▪ LE CLASSI non devono per forza avere la stessa ampiezza ma DEVONO comprire tutto L’INTERVALLO SENZA SOVRAPPORSII GRAFICI usati in statistica sono facilmente capibili per chi non ha informazioni techniche ▪ ISTOGRAMMA = rappresenta distribuzioni per classi con rettangoli
  • es. tempo di fermo di una macchina per la riparazione Tempi Ni = quanti [0,10] 30 [10,20] 25 [20,60] 30 [60,120] 15 ◦ L’ISTOGRAMMA sono dei grafici semplici che rappresenta con rettangoli una ◦ frequenza della classe con voti e istrogramma VOTO Ni = quanti fi [18;22) 50 0, [22,26) 200 0, [26;30) 150 0, I Due Ni di 30 sono uguali? No perchè hanno dei tempi diversi, vanno considerati diversamente , più una classe è ampia più ha margine più osservazione ci sono dentro. Quando guaridiamo le classi e sono divise in maniera non equa osserviamo una scelta soggetiva NON un evento oggettivo, perché INCLUDE tante cose, è più denso il fenomeno rispetto ad un tempi più lungo con una classe più ampia.

Voto Ni Fi [18,26) 250 250/400 = 0, [26,30] 150 150/400 = 0,

  • DENSITà = Hj ◦ base per altezza ◦ A = b x h = 8 x 0,00078 = densità ▪ FORMULE Hj = densità assoluta = nj/ aj(ampiezza intervallo Hj = densità relativa = fj/aj - si divide per la base (ampiezza )per fare dei confronti sensati/coretti - aj = ampeizza dell’intervallo ESERCIZIO 1 [18;22) [22,26) [26;30) 0 50 100 150 200 250 300 350 400 450 Ni = quanti [18,26) [26,30] 0 50 100 150 200 250 300 Ni Fi

120 IMPRESE,

Fatturato mensile in euro Densità = Hj Aj Nj Fj [0,10) 0,0333 10 40=0,3333 x 120 0, [10,15) 0,04444 27 0, [15,30) 0,0222 40 0, [30,60) 0,0037 13 0, Calcolo prima fj pk ci serve per calcolare nj Somma = 1 Fj = ni / N → nj = fj x N

  • FREQUENZE COMULATE = sono il numero di unità con modalità pari o infeiore a quella che osserviamoFREQUENZA COMULATA ASSOLUTAFormula → Nj = Nj-1 +nj - frequenza comulata precedente + frequenza attuale - N1 = n - l’ultimo vale Nk = N (cioè coincode con il totale)FREQUENZA CUMULATA RELATIVA = si ottiene DIVIDENDO per il totale o sommando le frequenze relativeFj = F-1 + fj = precendente relativa j-esimo 100/400 + 30/ ▪ la prima vale F1 = fl’ultima vale Fk = 1in % → Pk = 100%Le frequenze cumulate si possono fare solo per CARATTERI ORDINATI (quantitativi o qualitativi ordinati) ▪ su cui è possibile mettere un grado es. soddisfazione ▪ NON si possono fare per caratteri qualitativi sconessila prima frequenza relativa e assoluta sono sempre uguali a se stessi cioè N1 = n Fi = fi - Le frequenze xomulate si possono fare solo per CARATTERI ORDINATI non SCONESSI(e non qualitativi sconessi) ESEMPI DI FREQUENZE COMULATE CON CARATTERE ORDINATE GRADO DI SODD. NJ = f comulate fj Fj Non sodd. 30 30 30/400=0,0075 0, Poco sodd. 100 100 + 30 = 130 100/400=0,25 100/400 + 30/400= 0, Sodd. 270 130 + 270 = 400 270/400=0,675 400/400= Tot. 400 400 400/400= 1 400

Nj = Nj -1 + nj Fj = Fj -1 + fj N1 = n F1 = f F1 = f Nk = N Fk = 1LE FREQUENZE CUMULATE si possono fare solo per CARATTERI ORDINATI (quantitativi o qualitativi ordinati) (es. la soddisfazione) ▪ NON si possono fare per caratteri qualitativi sconessi

  • FUNZIONE RIPARTIZIONE = è il grafico che rappresenta la tabella con Fj=frequenza comulate relative(Fj) ◦ sull’asse orizzontale si mette il carattere (es. età) ◦ sull’asse verticale si mette Fj ▪ Rappresenta la proporzione di un’unità con valore minore o uguale a un certo valore ▪ è un modo grafico per rappresentare la tabella delle frequenze comulate ESERCIZIO Età Nj = frequenz a assoluta fj=freque nza relativa Pj= frequenza percentuale * 100 Nj Fj Pj 18 1 1/400 1/400 * 100% = 0,25% 1 1/400 00,25% 19 101 101/400 101/400 * 100% = 1+101=102 1/400 + 101/400 =

Età Nj (freq. assoluta) fj = Nj/400 Pj (%) Nj cumulata Fj cumulata Pj cumulata (%) 23 5 5/400 = 0,0125 1,25% 400 400/400 = 1 100% TOT 400 1 100% 400 1 100% qual’è che rappresenta fj uguale o meno di 18? 18 con nj 1 ▪ qual’è proporzione rappresetano età 19? 102/ ▪ è un modo di rappresentare la tabella in forma grafica sotto forma di funzioneINDCATORE PER DISTRIBUZIONE DI FREQUENZE = quando vogliamo un solo numero che riassume tutta la distribuzione, usiamo un INDICATORE

  • MEDIA , quando osserviamo una tabella e vogliamo 1 solo indicatore che ci da il senso di tutta la distribuzione, cosa faccio? La media ◦ è l’indicatore più usato ◦ si può calcolare solo per caratteri quantitiati NON per qualitativi ◦ per i qualitativi si usa la MODA ▪ mi serve un indicatore che sintetizza tutto MA esistono diverse medie 1. MEDIA ARTIMETICA es. osserviamo il tempo che impiego per arrivare all’università, faccio diverse prove con bici e bus ◦ posso calcolare la media su un carattere qualitativo? NO, ma si può fare la moda ▪ se alcuni valori si ripetono si può usare la distribuzione di frequenza: es. 21 compare 3 volte → 3 x 21 es. 20 compare 2 volte → 2 x 20

BUS BICI

▪ in generale MEDIA = (1/N) x somma dei valoriOppure con la frequenza Media = (1/N) x somma (xj * nj) ◦ la media si usa su caratteri QUANTITATIVI non QUALITATIVI ▪ nel caso che ho più volte lo stesso numerop posso fare 3x21 o 2x

  • quindi se facevo la distribuzione di freqeunza 21 con che freqeunza si presentava? 3, se avessi fatto al posto della distriubuzione unitaria quella di freqeunza avrei indicato quante volte compariva quel dato ◦ CARATTERI NUMERICO DIVISO IN CLASSI = quando i dati sono raggrupati in classi, per calcolare la media bisogna usare un valore rappresentativo della classe
  • Si usa il dentro della classe (cj) cioè? VALORE MEDIO DELL’INTERVALLO DEL CENTRO CLASSE ◦ FORMULA del centro cj = (estremo inferiore + estremo superiore)/ es. intervallo [0,10] cj = (0 + 10)/2= 5
  • Se la classe è aperta (es > o uguale di 250) si assume un valore massimo ragionevole per poter calcolare il centro

• INDICI DI POSIZIONE =

sono misure statistiche che indicano dove si colloca un valore “centrale” all’interno di una distribuzione di dati. (i principali sono media aritmemtica, mediana e moda)A cosa servono? Riassumere molti dati con un solo valore rappresentativo ◦ Esempio di MEDIA (valore centrale) ▪ la media aritematica è la somma di tutti i valori divisa per il numero di osservazioni

  • formula: Xi = valori osservati n = numero totale di osservazioni ◦ RETRIBUZIONE LORDA in un’azienda e supponiamo di rilevare 2 aziende.. Aziende Persone C = valore centrale [0,4000) 4 2000 [4000,10000) 6 7000 Centro della classe C è il valore medio dell’intervallo. Formula: C=estremo inferiore + estremo superiore/ C= 0 + 4000/2 = 2000

Qual’è il valore centrale? X = 2000 * 4 + 7000 * 6/10 = 50000/10 = 5000 NON arrotondare valore se non è necessario ◦ MEDIANA = La mediana è il valore che divide la distribuzione ordinata in due parti ugualicosa vuol dire?

  • 50% dei valori è minore o uguale alla mediana
  • 50% dei valori è maggiore o uguale alla medianaCARATTERI QUANTITATIVI ORDINATI NON SCONESSI
  • ES. {2,3,5,7,6, 8 } → x = 5, N.B. ha una caratteristica importante = la mediana è poco influenzata dai valori estremisensibile ai valori estremi {2,3,5,6,7, 20 }→ x = 7, ◦ se c’è un valore molto più alto rispetto agli altri la media cambia e aumenta anche se la maggior parte dei numeri sono bassi ▪ La media cambia molto, mentre la mediana quasi no
  • esempio reale: 350 pwersone alte 1,60 m 50 persone alte 2 metri ù la media cresce anche se la maggioranza delle perssone è bassa
  • CALCOLO DELLA MEDIANA ◦ Prima regola: i dati devono essere ordinati nel caso che non lo siano es. 175, 176, 178, 179, 180, 183, 185 numero di osservazioni = 7 ◦ CASO 1: n dispari → la mediana è il valore centrale formula: MEDIANA = x n+1/ es. x 7+1/2 = x mediana= 179 ◦ CASO 2:n PARI ▪ La mediana è la media dei due valori centrali: formula: MEDIANA = xn/2 + xn/2+1 / 2 ▪ Es di mediana 175,176,178, 179 ,180,183,
  • quando il numero è dispari la mediana sarà sempre il valore centrale
  • se n è dispari allora la mediana è la modalità quindi x (n+1/2) = x(7+1/2)= x(4)
  • se n è pari? Si approssima con la media dei due valori centrali Negozio 1 2 3 4 5 6 Capi venduti 6 11 15 18 20 27
  • ES. lo stesso esercizio di prima ma calcolato con le frequenze <= elementari Media Diploma professionale Maturit à Laurea NORD 15,4% 47% 55,6% 84,6% 100% SUD 20,3% 55,3% 57,6% 88,1% 100% → La mediana lascia il 50% della sua distribuzione prima e dopo di lei ▪ si trova guardando la frequenza comulata e cercando dove si supera il 50% delle osservazioni

• MEDIANA PER CARATTERI QUANTITATIVI DIVISI IN CLASSI

Classse dipendenti [0,1) [1,5) [5,10) [10,20) [20,30) Tot Aziende 7 18 45 25 30 125 Pj percentuale comulata

Si perde un po' di informazioni ma si calcola la classe mediana ◦ la mediana andrà approsimata ◦ N + ½ = 126/2 = 63 => CLASSE median ìa è [5,10)queste 45 aziende sono distribuite in modo omogeneo e lo capiamo grazie alla mediana è approsimativamente così … mediana Im è (0,5 – Fm-1/Fm – Fm-1) ΔM Im = estremo inferiore classe mediana Fm -1= freqeuznad i una classe percentuale precedenrte dell classe mediana Fm = frequenza comulata della classe mediana Im = estremo inferiore classe mediana Δm = ampiezza classe Mediana = 5 + (0,5 – 20%/0,56 – 0,20) * 5 = 9,16 è la mediana ed è compresa tra l’osservazione minima e massima come la media e non può andare fuori → LA MEDIANA DEVE SEMPRE ESSERE TRA IL MINIMO E IL MASSIMO DELLA DISTRIBUZIONE

  • MODA = è il valore o la modalità che compare più frequentemente, può essere calcolato per: ◦ calcolata per caratteri qualitativi e quantitativi ◦ ha uno spettro più ampio ◦ è la modalità più frequente Colore occhi Blu verde nero nj 100 200 400
  • Se facciamo la distribuzione viene con frequenze basse se vado a calcolare la moda sarebbe su modalità molte ampie poco rappresentativa
  • è un buon indicatore ma se su 400 solo 2 hanno la stessa altezza sarebbe poco rappresentativo
  • la frequenza più alta è la moda, l ’unica problematica sarebbe se è suddivisa in classi ..CARATTERISTICHE DIVISE IN CLASSI ▪ per istogrammi si calcola la densità che è un accorgimento usato nelel classi con molta ampiezza avendo tante cose dentro che sarebbe poi la moda se usassimo il conto così come è ▪ classi ampie corrispondono a frequenze più elevate e la moda può essere distorta da ciò ▪ MODA CON DATI DIVISI IN CLASSI
  • il problema è che classi più grandi hanno spesso frequenze più alte
  • densità: formula: hj = nj/ampiezza classe

ESEMPIO: tavolo misurato da due persone, questo processo di misura è uguale? Avendo lo stesso tavolo 1 2 99 120 99 80 100 110 101 115 101 75 Media = 100 ◦ variabilità di una distribuzione = assume diverse modalità del carattere ▪ tende a essere più variabile, con osservazioni più o meno vicine ▪ un buon indicatore deve avere valore minimo quando le variabilità sono uguali ▪ LA VARIANZA = somma dei scarti al quadrato dalla media artìitemtica (tende ad assumere diversi con diverse misure)

  • indicatore che ci dice più è alto più i valori si distanziano dalla media(120,80,110,75ecc..)
  • si confrontano dalla media
  • la somma di quadrati non può essere negativi e > di 0 NO NEGATIVO
  • SOMMA DI QUADRATI = quantità positiva = 0 o più
  • DEVIAZIONE STANDARD = è la radice quadrata della varianza formula: è molto usata perché ha la stessa unità di misura dei dati
  • se avessimo distributori potremmo calcolare la devienza? Possiamo calcolare sfruttando i distributori? La soma viene semplificataa? La VARIANZA si può se ho una distribuzioni di frequenze
  • esempiotempi di assemblaggio 5 lotti 10,12,9,11,8 unità media = 10 Xi = tempi (xi – x) = scarti (xi – x)^2 scarti al quadrato 8 8-10=-2 (-2)^2 9 9-10 = -1 (-1)^2 10 10-10 = 0 02 11 11-10 = 1 12 12 12-10 = 2 22 tot 0 10 → che vuol dire scarti? Sono la differenza tra ogni valore osservato e la media della distribuzione. A cosa servono? A capire quanto ogni dato si discosta (cioè si allontana) dal valore medio Definiscione → lo scarto di un valore xi dalla media x è: scarto = xi – x xi=valore osservato x=media dei dati

→ SIGNIFICATO DELLO SCARTO

Indica la distanza dalla media: se lo scarto è positivo → il valore è maggiore dalla media se lo scarto è negativo → il valore è minore della media se lo scarto è 0 → il valore è uguale alla media Esempio x 0 20 1 15 2 10 3 5 X è il numero di difetti in un lotto di bulloni quanti difetti troviamo all’interno dei lotti? 20 + 15 + 10 + 5 = 50 X = 0 * 20 + 1 * 15 + 2 * 10 + 3 * 5/50 = 1 a^2 = 1/5’ 1= media della distribuzione → GLI SCARTI servono per calcolare gli indici di variabilità cioè? Quanto i dati sono sparsi. es. varianza e deviazione standard perché si usano? Se sommiamo gli scarti semplice : (−2)+(−1)+0+1+2=0 si annulano tra loro, per evitare questo problema si usano gli scarti al quadro cioè (xi - x)^2 Xi = tempi (xi – x) = scarti (xi – x)^2 scarti al quadrato

N

0 0-1=-1 (-1)^2 = 1 20

1 1-1=0 0^2 = 0 15

2 2-1=1 1^2 = 1 10

3 3-1=2 2^2 = 4 5

Si fa 0-1 pk 1 è ka media della distribuzione Più gli scarti sono grandi → maggiore è la variabilità dei dati → gli scarti sono le distante tra ogni valore e la media della distribuzione

  • 2 Propietà
  • DEVIAZIONE STANDARD è usata per calcolare cosa? ◦ è l'indicatore principale utilizzato per misurare la dispersione o la variabilità dei dati rispetto alla loro media. ▪ In parole semplici: serve a capire quanto i tuoi dati siano "sparpagliati" o quanto, invece, siano vicini al valore centrale.