Prepara i tuoi esami
Ottieni punti
Guide e consigli
Vendi su Docsity
Docsity AI

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Guide e consigli

Vendi su Docsity

Accedi Registrati

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Cerca documenti

Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity

Cerca la tua università

Trova i documenti specifici per gli esami della tua università

Preparati con lezioni e prove svolte basate sui programmi universitari!

Rispondi a reali domande d’esame e scopri la tua preparazione

Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali

Studia con prove svolte, tesine e consigli utili

Esplora domande

Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te

Argomenti di studio

Esplora i documenti più scaricati per gli argomenti di studio più popolari

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Condividi documenti

Per ogni documento caricato

Rispondi alle domande

per ogni risposta data (max 1 al giorno)

Tutti i modi per ottenere punti gratis

Ottieni punti subito

Scegli un piano Premium con tutti i punti di cui hai bisogno

Opportunità di studio

Scegli il tuo prossimo programma di studio

Entra in contatto con le migliori università del mondo e scegli il tuo percorso di studi

Classifica delle migliori università

Scopri le migliori università italiane secondo gli studenti

Community

Chiedi alla community

Chiedi aiuto alla community e sciogli i tuoi dubbi legati allo studio

Guide Gratuite

I nostri eBook salva studente

Scarica gratuitamente le nostre guide sulle tecniche di studio, metodi per gestire l'ansia, dritte per la tesi realizzati da tutor Docsity

Probabilità e Statistica, Appunti di Probabilità e Statistica

Universita degli Studi Roma Tre (UNIROMA3)Probabilità e Statistica

Appunti creati da me, strutturati e suddivisi per argomento. comprende definizioni, esempi brevi, spiegazioni e formule Anno accademico : 2026 Docente : Alberto Di Iorio Università : Roma tre Facoltà : ing. gestionale

Tipologia: Appunti

2025/2026

In vendita dal 10/06/2026

alessia-lombardo-40 🇮🇹

16 documenti

1 / 105

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1

Alessia Lombardo 1° Anno ing. Gestionale 2//02/2026

INDICE:

1. Statistica descrittiva:

Concetti introduttivi: Caratteri statistici e scale di misura. Distribuzioni semplici.

Rappresentazioni tabellari e grafiche. Funzione di ripartizione empirica.

Indici di dimensione: Moda. Mediana. Quantili. Medie.

Indici di Variabilità: Scostamenti medi. Varianza. Coefficiente di variazione. Differenza

interquartile.

Cenni su concentrazione

Asimmetria di una distribuzione

Cenni su serie temporali e numeri indice

Distribuzioni statistiche doppie, marginali e condizionate. I momenti delle distribuzioni

doppie, l'associazione e l'indipendenza.

2. Calcolo delle probabilità:

Definizione assiomatica di probabilità. Probabilità condizionata. Indipendenza. Teorema

di Bayes. Variabili aleatorie undimensionali discrete. Funzione di probabilità, di densità,

di ripartizione. Momenti di variabili aleatorie. Principali distribuzioni di probabilità

discrete: binomiale, Poisson, uniforme.

Principali distribuzioni di probabilità continue: uniforme, normale, esponenziale. Cenni

alle distribuzioni di Student e Fisher

Variabili aleatorie multiple: funzioni di probabilità marginali e condizionate,

indipendenza e correlazione.

Proprietà delle distribuzioni di probabilità: combinazioni lineari di variabili aleatorie,

convergenza, legge dei grandi numeri, teorema del limite centrale e disuguaglianza di

Chebyshev.

3. Inferenza Statistica:

Cenni su popolazione e campione: popolazioni finite e infinite; campione casuale da

popolazioni finite e infinite; distribuzione di probabilità del campione casuale.

Statistiche campionarie e loro distribuzioni: distribuzione campionaria della media;

distribuzione campionaria della varianza.

Stima dei parametri: proprietà degli stimatori; intervallo di confidenza per i principali

parametri della popolazione

Verifica di ipotesi: elementi di teoria dei test: errori di prima e di seconda specie;

verifica di ipotesi per i principali parametri della popolazione

Cenni su regressione: Regressione lineare semplice stima e verifica d'ipotesi sui

parametri della retta di regressione

--APPUNTI STATISTICA E PROBABILITÀ

•STATISTICA

◦Cosa è? Scienza che quantitrifca fenomeni colletivi

▪cioè fenomeni per studi di un insieme di unità(es. come l’età media delle persone

dell’aula di ing gestionale)

•estraiamo informazioni da un insieme

•si rappresenta in numeri

◦cosa osserviamo di un colletivo? I caratteri

◦collettivo = insieme di unità (età, residenza, titoli di scuola di superiore

ecc..)

pf3

pf4

pf5

pf8

pf9

pfa

pfd

pfe

pff

pf12

pf13

pf14

pf15

pf16

pf17

pf18

pf19

pf1a

pf1b

pf1c

pf1d

pf1e

pf1f

pf20

pf21

pf22

pf23

pf24

pf25

pf26

pf27

pf28

pf29

pf2a

pf2b

pf2c

pf2d

pf2e

pf2f

pf30

pf31

pf32

pf33

pf34

pf35

pf36

pf37

pf38

pf39

pf3a

pf3b

pf3c

pf3d

pf3e

pf3f

pf40

pf41

pf42

pf43

pf44

pf45

pf46

pf47

pf48

pf49

pf4a

pf4b

pf4c

pf4d

pf4e

pf4f

pf50

pf51

pf52

pf53

pf54

pf55

pf56

pf57

pf58

pf59

pf5a

pf5b

pf5c

pf5d

pf5e

pf5f

pf60

pf61

pf62

pf63

pf64

Scopri Appunti di Probabilità e Statistica Universita degli Studi Roma Tre (UNIROMA3)

Documenti correlati

Appunti Calcolo delle Probabilità

(2)

esercizi di probabilità e statistica svolti

(1)

Calcolo della probabilità

Introduzione alla probabilità

La parte pratica della probabilità

Appunti di probabilità e statistica

Formulario esame probabilità e statistica

Formulario Probabilità e Statistica Matematica

(1)

Esercizi di Probabilità

Combinatoria, Probabilità e Probabilità Condizionata

probabilità condizionata

Probabilità condizionata e densità di probabilità

Anteprima parziale del testo

Scarica Probabilità e Statistica e più Appunti in PDF di Probabilità e Statistica solo su Docsity!

Alessia Lombardo 1° Anno ing. Gestionale 2//02/ INDICE:

1. Statistica descrittiva: Concetti introduttivi: Caratteri statistici e scale di misura. Distribuzioni semplici. Rappresentazioni tabellari e grafiche. Funzione di ripartizione empirica. Indici di dimensione: Moda. Mediana. Quantili. Medie. Indici di Variabilità: Scostamenti medi. Varianza. Coefficiente di variazione. Differenza interquartile. Cenni su concentrazione Asimmetria di una distribuzione Cenni su serie temporali e numeri indice Distribuzioni statistiche doppie, marginali e condizionate. I momenti delle distribuzioni doppie, l'associazione e l'indipendenza. 2. Calcolo delle probabilità: Definizione assiomatica di probabilità. Probabilità condizionata. Indipendenza. Teorema di Bayes. Variabili aleatorie undimensionali discrete. Funzione di probabilità, di densità, di ripartizione. Momenti di variabili aleatorie. Principali distribuzioni di probabilità discrete: binomiale, Poisson, uniforme. Principali distribuzioni di probabilità continue: uniforme, normale, esponenziale. Cenni alle distribuzioni di Student e Fisher Variabili aleatorie multiple: funzioni di probabilità marginali e condizionate, indipendenza e correlazione. Proprietà delle distribuzioni di probabilità: combinazioni lineari di variabili aleatorie, convergenza, legge dei grandi numeri, teorema del limite centrale e disuguaglianza di Chebyshev. 3. Inferenza Statistica: Cenni su popolazione e campione: popolazioni finite e infinite; campione casuale da popolazioni finite e infinite; distribuzione di probabilità del campione casuale. Statistiche campionarie e loro distribuzioni: distribuzione campionaria della media; distribuzione campionaria della varianza. Stima dei parametri: proprietà degli stimatori; intervallo di confidenza per i principali parametri della popolazione Verifica di ipotesi: elementi di teoria dei test: errori di prima e di seconda specie; verifica di ipotesi per i principali parametri della popolazione Cenni su regressione: Regressione lineare semplice stima e verifica d'ipotesi sui parametri della retta di regressione --APPUNTI STATISTICA E PROBABILITÀ

STATISTICA ◦ Cosa è? Scienza che quantitrifca fenomeni colletivi ▪ cioè fenomeni per studi di un insieme di unità (es. c ome l’età media delle persone dell’aula di ing gestionale)
estraiamo informazioni da un insieme
si rappresenta in numeri ◦ cosa osserviamo di un colletivo? I caratteri ◦ collettivo = insieme di unità (età, residenza, titoli di scuola di superiore ecc..)

◦ insieme di unità omogene definita da una definizione/certa caratteristica ▪ es. insieme di unità omogene la possiamo chiamare popolazione, noi siamo la popolazione di roma tre di ing. Gestionale perchè apparteniamo tutti a quella definizione che è gli studenti di ing. Gestionale di roma tre ▪ es. processi indusustriali in cui tutti i prodotti vengono prodotti da quel machinario

sono dei insiemi ben definiti
CARATTERE ▪ è la caratteristica osservata sulle unità (età,residenza, titolo di studio ecc..) ▪ Ogni carattere sulla popolazione può asssumere diversi valori chiamati modalità ▪ MODALITÀ = delle età sono i numeri che vanno da 0 a 130
modalità del carattere genere sono M e F
modalità di titoli di studio licenzia elementare, media, laurea, ecc…
modalità di peso da 0 a 300 in chili
CARATTERE ◦ QUANTITATIVI = numerici 1. numeri discreti = assumono valori separati, es. voto esame di statistica da 18 a 30) 2. continui = possono assumere qualsiasi valore in un intervallo es. altezza in cm da 140 a ecc…. ◦ QUALITATIVI = NON NUMERICI es. religione come ebreo, musulmano, cristiano, caratteristiche fisiche come occhi azzuri, etichetta blu, rossa ecc… ▪ **possono essere:

sconessi = non c’è un ordine tra le modalità es.** come occhi azzuri o neri ecc… 2. ordinati = le modalità hanno un ordine es. carattere stabilisci ordine come giudizio sul gradimento del corso(poco, per niente, molto) ◦ DISTRIBUZIONE ▪ Esistono diversi tipi come: 1. DISTRIBUZIONE UNITARIA = prendo la popolazione il mio collettivo e faccio l’elenco di tutte e le caratteristiche es. studente 1 età 21, studente 2 età 19 ecc… per tutti i 400 studenti → in un collettivo molto grandie mi faccio un’idea della situazione ma non è sintetico ▪ come sintetizzo? Ho bisogno di un numero che riassume 2. DISTRIBUZIONE DI FREQUENZE = freuquenze assolute(ni) cioè il numero di unita che si ripetono, cioè quanti anni 19 anni? Quanti 20? ◦ ni = frequenze assolute = numero di unità per ogni modalità

es. età 18 ha 1 persona, 30 persone hanno 21
es. genere, quante donne? Quanti uomini?
es. colore dei occhi blu,verde 4 N = ∑ n!

L’intervallo che copriamo ha 10 cm lo dividiamo in classi tutte uguali ma NON si fa sempre così

Le classi rendono i dati più sintetici e genstibili
si perde un po' di precisione ma si semplica l’analisi es. si può dividere in comuni piccoli, grandi, medi con una GRANDEZZA COMUNI ABITANTI [1,5000] = PICCOLO [5000,5000] = MEDIO > = 50000 = GRANDE
Ampiezza delle classi diverse e con delle differenze, cioè l’ultimo estremo non è superiormente superiore ◦ dobbiamo cercare di porre un limite raggionevole es. => 50000 abitanti ma la città più grande è di 3000000 quindi potremmo fare [5000,3000000] con un estremo superiore, sapendo che la popolazione dei comuni non supera quel valore ▪ LE CLASSI non devono per forza avere la stessa ampiezza ma DEVONO comprire tutto L’INTERVALLO SENZA SOVRAPPORSI ◦ I GRAFICI usati in statistica sono facilmente capibili per chi non ha informazioni techniche ▪ ISTOGRAMMA = rappresenta distribuzioni per classi con rettangoli
es. tempo di fermo di una macchina per la riparazione Tempi Ni = quanti [0,10] 30 [10,20] 25 [20,60] 30 [60,120] 15 ◦ L’ISTOGRAMMA sono dei grafici semplici che rappresenta con rettangoli una ◦ frequenza della classe con voti e istrogramma VOTO Ni = quanti fi [18;22) 50 0, [22,26) 200 0, [26;30) 150 0, I Due Ni di 30 sono uguali? No perchè hanno dei tempi diversi, vanno considerati diversamente , più una classe è ampia più ha margine più osservazione ci sono dentro. Quando guaridiamo le classi e sono divise in maniera non equa osserviamo una scelta soggetiva NON un evento oggettivo, perché INCLUDE tante cose, è più denso il fenomeno rispetto ad un tempi più lungo con una classe più ampia.

Voto Ni Fi [18,26) 250 250/400 = 0, [26,30] 150 150/400 = 0,

DENSITà = Hj ◦ base per altezza ◦ A = b x h = 8 x 0,00078 = densità ▪ FORMULE Hj = densità assoluta = nj/ aj(ampiezza intervallo Hj = densità relativa = fj/aj - si divide per la base (ampiezza )per fare dei confronti sensati/coretti - aj = ampeizza dell’intervallo ESERCIZIO 1 [18;22) [22,26) [26;30) 0 50 100 150 200 250 300 350 400 450 Ni = quanti [18,26) [26,30] 0 50 100 150 200 250 300 Ni Fi

120 IMPRESE,

Fatturato mensile in euro Densità = Hj Aj Nj Fj [0,10) 0,0333 10 40=0,3333 x 120 0, [10,15) 0,04444 27 0, [15,30) 0,0222 40 0, [30,60) 0,0037 13 0, Calcolo prima fj pk ci serve per calcolare nj Somma = 1 Fj = ni / N → nj = fj x N

FREQUENZE COMULATE = sono il numero di unità con modalità pari o infeiore a quella che osserviamo ◦ FREQUENZA COMULATA ASSOLUTA ▪ Formula → Nj = Nj-1 +nj - frequenza comulata precedente + frequenza attuale - N1 = n - l’ultimo vale Nk = N (cioè coincode con il totale) ◦ FREQUENZA CUMULATA RELATIVA = si ottiene DIVIDENDO per il totale o sommando le frequenze relative ▪ Fj = F-1 + fj = precendente relativa j-esimo 100/400 + 30/ ▪ la prima vale F1 = f ▪ l’ultima vale Fk = 1 ▪ in % → Pk = 100% ◦ Le frequenze cumulate si possono fare solo per CARATTERI ORDINATI (quantitativi o qualitativi ordinati) ▪ su cui è possibile mettere un grado es. soddisfazione ▪ NON si possono fare per caratteri qualitativi sconessi ▪ la prima frequenza relativa e assoluta sono sempre uguali a se stessi cioè N1 = n Fi = fi - Le frequenze xomulate si possono fare solo per CARATTERI ORDINATI non SCONESSI(e non qualitativi sconessi) ESEMPI DI FREQUENZE COMULATE CON CARATTERE ORDINATE GRADO DI SODD. NJ = f comulate fj Fj Non sodd. 30 30 30/400=0,0075 0, Poco sodd. 100 100 + 30 = 130 100/400=0,25 100/400 + 30/400= 0, Sodd. 270 130 + 270 = 400 270/400=0,675 400/400= Tot. 400 400 400/400= 1 400

Nj = Nj -1 + nj Fj = Fj -1 + fj N1 = n F1 = f F1 = f Nk = N Fk = 1 ◦ LE FREQUENZE CUMULATE si possono fare solo per CARATTERI ORDINATI (quantitativi o qualitativi ordinati) (es. la soddisfazione) ▪ NON si possono fare per caratteri qualitativi sconessi

FUNZIONE RIPARTIZIONE = è il grafico che rappresenta la tabella con Fj=frequenza comulate relative(Fj) ◦ sull’asse orizzontale si mette il carattere (es. età) ◦ sull’asse verticale si mette Fj ▪ Rappresenta la proporzione di un’unità con valore minore o uguale a un certo valore ▪ è un modo grafico per rappresentare la tabella delle frequenze comulate ESERCIZIO Età Nj = frequenz a assoluta fj=freque nza relativa Pj= frequenza percentuale * 100 Nj Fj Pj 18 1 1/400 1/400 * 100% = 0,25% 1 1/400 00,25% 19 101 101/400 101/400 * 100% = 1+101=102 1/400 + 101/400 =

Età Nj (freq. assoluta) fj = Nj/400 Pj (%) Nj cumulata Fj cumulata Pj cumulata (%) 23 5 5/400 = 0,0125 1,25% 400 400/400 = 1 100% TOT 400 1 100% 400 1 100% qual’è che rappresenta fj uguale o meno di 18? 18 con nj 1 ▪ qual’è proporzione rappresetano età 19? 102/ ▪ è un modo di rappresentare la tabella in forma grafica sotto forma di funzione ◦ INDCATORE PER DISTRIBUZIONE DI FREQUENZE = quando vogliamo un solo numero che riassume tutta la distribuzione, usiamo un INDICATORE

MEDIA , quando osserviamo una tabella e vogliamo 1 solo indicatore che ci da il senso di tutta la distribuzione, cosa faccio? La media ◦ è l’indicatore più usato ◦ si può calcolare solo per caratteri quantitiati NON per qualitativi ◦ per i qualitativi si usa la MODA ▪ mi serve un indicatore che sintetizza tutto MA esistono diverse medie 1. MEDIA ARTIMETICA es. osserviamo il tempo che impiego per arrivare all’università, faccio diverse prove con bici e bus ◦ posso calcolare la media su un carattere qualitativo? NO, ma si può fare la moda ▪ se alcuni valori si ripetono si può usare la distribuzione di frequenza: es. 21 compare 3 volte → 3 x 21 es. 20 compare 2 volte → 2 x 20

BUS BICI

▪ in generale MEDIA = (1/N) x somma dei valori ▪ Oppure con la frequenza Media = (1/N) x somma (xj * nj) ◦ la media si usa su caratteri QUANTITATIVI non QUALITATIVI ▪ nel caso che ho più volte lo stesso numerop posso fare 3x21 o 2x

quindi se facevo la distribuzione di freqeunza 21 con che freqeunza si presentava? 3, se avessi fatto al posto della distriubuzione unitaria quella di freqeunza avrei indicato quante volte compariva quel dato ◦ CARATTERI NUMERICO DIVISO IN CLASSI = quando i dati sono raggrupati in classi, per calcolare la media bisogna usare un valore rappresentativo della classe
Si usa il dentro della classe (cj) cioè? VALORE MEDIO DELL’INTERVALLO DEL CENTRO CLASSE ◦ FORMULA del centro cj = (estremo inferiore + estremo superiore)/ es. intervallo [0,10] cj = (0 + 10)/2= 5
Se la classe è aperta (es > o uguale di 250) si assume un valore massimo ragionevole per poter calcolare il centro

• INDICI DI POSIZIONE =

sono misure statistiche che indicano dove si colloca un valore “centrale” all’interno di una distribuzione di dati. (i principali sono media aritmemtica, mediana e moda) ◦ A cosa servono? Riassumere molti dati con un solo valore rappresentativo ◦ Esempio di MEDIA (valore centrale) ▪ la media aritematica è la somma di tutti i valori divisa per il numero di osservazioni

formula: Xi = valori osservati n = numero totale di osservazioni ◦ RETRIBUZIONE LORDA in un’azienda e supponiamo di rilevare 2 aziende.. Aziende Persone C = valore centrale [0,4000) 4 2000 [4000,10000) 6 7000 Centro della classe C è il valore medio dell’intervallo. Formula: C=estremo inferiore + estremo superiore/ C= 0 + 4000/2 = 2000

Qual’è il valore centrale? X = 2000 * 4 + 7000 * 6/10 = 50000/10 = 5000 NON arrotondare valore se non è necessario ◦ MEDIANA = La mediana è il valore che divide la distribuzione ordinata in due parti uguali ▪ cosa vuol dire?

50% dei valori è minore o uguale alla mediana
50% dei valori è maggiore o uguale alla mediana ▪ CARATTERI QUANTITATIVI ORDINATI NON SCONESSI
ES. {2,3,5,7,6, 8 } → x = 5, N.B. ha una caratteristica importante = la mediana è poco influenzata dai valori estremi ◦ sensibile ai valori estremi {2,3,5,6,7, 20 }→ x = 7, ◦ se c’è un valore molto più alto rispetto agli altri la media cambia e aumenta anche se la maggior parte dei numeri sono bassi ▪ La media cambia molto, mentre la mediana quasi no
esempio reale: 350 pwersone alte 1,60 m 50 persone alte 2 metri ù la media cresce anche se la maggioranza delle perssone è bassa
CALCOLO DELLA MEDIANA ◦ Prima regola: i dati devono essere ordinati nel caso che non lo siano es. 175, 176, 178, 179, 180, 183, 185 numero di osservazioni = 7 ◦ CASO 1: n dispari → la mediana è il valore centrale formula: MEDIANA = x n+1/ es. x 7+1/2 = x mediana= 179 ◦ CASO 2:n PARI ▪ La mediana è la media dei due valori centrali: formula: MEDIANA = xn/2 + xn/2+1 / 2 ▪ Es di mediana 175,176,178, 179 ,180,183,
quando il numero è dispari la mediana sarà sempre il valore centrale
se n è dispari allora la mediana è la modalità quindi x (n+1/2) = x(7+1/2)= x(4)
se n è pari? Si approssima con la media dei due valori centrali Negozio 1 2 3 4 5 6 Capi venduti 6 11 15 18 20 27

ES. lo stesso esercizio di prima ma calcolato con le frequenze <= elementari Media Diploma professionale Maturit à Laurea NORD 15,4% 47% 55,6% 84,6% 100% SUD 20,3% 55,3% 57,6% 88,1% 100% → La mediana lascia il 50% della sua distribuzione prima e dopo di lei ▪ si trova guardando la frequenza comulata e cercando dove si supera il 50% delle osservazioni

• MEDIANA PER CARATTERI QUANTITATIVI DIVISI IN CLASSI

Classse dipendenti [0,1) [1,5) [5,10) [10,20) [20,30) Tot Aziende 7 18 45 25 30 125 Pj percentuale comulata

◦ Si perde un po' di informazioni ma si calcola la classe mediana ◦ la mediana andrà approsimata ◦ N + ½ = 126/2 = 63 => CLASSE median ìa è [5,10) ◦ queste 45 aziende sono distribuite in modo omogeneo e lo capiamo grazie alla mediana è approsimativamente così … mediana Im è (0,5 – Fm-1/Fm – Fm-1) ΔM Im = estremo inferiore classe mediana Fm -1= freqeuznad i una classe percentuale precedenrte dell classe mediana Fm = frequenza comulata della classe mediana Im = estremo inferiore classe mediana Δm = ampiezza classe Mediana = 5 + (0,5 – 20%/0,56 – 0,20) * 5 = 9,16 è la mediana ed è compresa tra l’osservazione minima e massima come la media e non può andare fuori → LA MEDIANA DEVE SEMPRE ESSERE TRA IL MINIMO E IL MASSIMO DELLA DISTRIBUZIONE

MODA = è il valore o la modalità che compare più frequentemente, può essere calcolato per: ◦ calcolata per caratteri qualitativi e quantitativi ◦ ha uno spettro più ampio ◦ è la modalità più frequente Colore occhi Blu verde nero nj 100 200 400
Se facciamo la distribuzione viene con frequenze basse se vado a calcolare la moda sarebbe su modalità molte ampie poco rappresentativa
è un buon indicatore ma se su 400 solo 2 hanno la stessa altezza sarebbe poco rappresentativo
la frequenza più alta è la moda, l ’unica problematica sarebbe se è suddivisa in classi .. ◦ CARATTERISTICHE DIVISE IN CLASSI ▪ per istogrammi si calcola la densità che è un accorgimento usato nelel classi con molta ampiezza avendo tante cose dentro che sarebbe poi la moda se usassimo il conto così come è ▪ classi ampie corrispondono a frequenze più elevate e la moda può essere distorta da ciò ▪ MODA CON DATI DIVISI IN CLASSI
il problema è che classi più grandi hanno spesso frequenze più alte
densità: formula: hj = nj/ampiezza classe

◦ ESEMPIO: tavolo misurato da due persone, questo processo di misura è uguale? Avendo lo stesso tavolo 1 2 99 120 99 80 100 110 101 115 101 75 Media = 100 ◦ variabilità di una distribuzione = assume diverse modalità del carattere ▪ tende a essere più variabile, con osservazioni più o meno vicine ▪ un buon indicatore deve avere valore minimo quando le variabilità sono uguali ▪ LA VARIANZA = somma dei scarti al quadrato dalla media artìitemtica (tende ad assumere diversi con diverse misure)

indicatore che ci dice più è alto più i valori si distanziano dalla media(120,80,110,75ecc..)
si confrontano dalla media
la somma di quadrati non può essere negativi e > di 0 NO NEGATIVO
SOMMA DI QUADRATI = quantità positiva = 0 o più
DEVIAZIONE STANDARD = è la radice quadrata della varianza formula: è molto usata perché ha la stessa unità di misura dei dati
se avessimo distributori potremmo calcolare la devienza? Possiamo calcolare sfruttando i distributori? La soma viene semplificataa? La VARIANZA si può se ho una distribuzioni di frequenze
esempio ◦ tempi di assemblaggio 5 lotti 10,12,9,11,8 unità media = 10 Xi = tempi (xi – x) = scarti (xi – x)^2 scarti al quadrato 8 8-10=-2 (-2)^2 9 9-10 = -1 (-1)^2 10 10-10 = 0 02 11 11-10 = 1 12 12 12-10 = 2 22 tot 0 10 → che vuol dire scarti? Sono la differenza tra ogni valore osservato e la media della distribuzione. A cosa servono? A capire quanto ogni dato si discosta (cioè si allontana) dal valore medio Definiscione → lo scarto di un valore xi dalla media x è: scarto = xi – x xi=valore osservato x=media dei dati

→ SIGNIFICATO DELLO SCARTO

Indica la distanza dalla media: se lo scarto è positivo → il valore è maggiore dalla media se lo scarto è negativo → il valore è minore della media se lo scarto è 0 → il valore è uguale alla media Esempio x 0 20 1 15 2 10 3 5 X è il numero di difetti in un lotto di bulloni quanti difetti troviamo all’interno dei lotti? 20 + 15 + 10 + 5 = 50 X = 0 * 20 + 1 * 15 + 2 * 10 + 3 * 5/50 = 1 a^2 = 1/5’ 1= media della distribuzione → GLI SCARTI servono per calcolare gli indici di variabilità cioè? Quanto i dati sono sparsi. es. varianza e deviazione standard perché si usano? Se sommiamo gli scarti semplice : (−2)+(−1)+0+1+2=0 si annulano tra loro, per evitare questo problema si usano gli scarti al quadro cioè (xi - x)^2 Xi = tempi (xi – x) = scarti (xi – x)^2 scarti al quadrato

N

0 0-1=-1 (-1)^2 = 1 20

1 1-1=0 0^2 = 0 15

2 2-1=1 1^2 = 1 10

3 3-1=2 2^2 = 4 5

Si fa 0-1 pk 1 è ka media della distribuzione Più gli scarti sono grandi → maggiore è la variabilità dei dati → gli scarti sono le distante tra ogni valore e la media della distribuzione

2 Propietà
DEVIAZIONE STANDARD è usata per calcolare cosa? ◦ è l'indicatore principale utilizzato per misurare la dispersione o la variabilità dei dati rispetto alla loro media. ▪ In parole semplici: serve a capire quanto i tuoi dati siano "sparpagliati" o quanto, invece, siano vicini al valore centrale.