


































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Formulario di statistica con relativi grafici.
Tipologia: Schemi e mappe concettuali
1 / 42
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!



































STATISTICA DESCRITTIVA
La Statistica Descrittiva è la branca della statistica che studia i criteri di rilevazione, classificazione, sintesi, rappresentazione dei dati appresi dallo studio di una
popolazione, o di una parte di essa detta campione.
Le unità statistiche sono le entità su cui vengono misurate una o più variabili d’interesse.
Scala di misura: insieme dei possibili valori che la variabile può assumere.
I fenomeni di interesse sono molteplici, ma si possono classificare in 4 tipologie:
Fenomeni QUALITATIVI Fenomeni QUANTITATIVI
Si manifestano attraverso modalità NON numeriche. Nel
caso in cui fossero numeri, non avrebbero il senso
intrinseco di “numero”.
Si manifestano attraverso modalità numeriche. Sono
numeri con il significato intrinseco di “numero” (numero
non come “etichetta”).
Qual. SCONNESSI
Qual. ORDINABILI,
Qual. ORDINARI,
Qual. RETTILINEI
Quant. DISCRETI Quant. CONTINUI
Presentano modalità non
ordinabili secondo un ordine
oggettivo.
(es. genere M/F , stato civile).
È possibile assegnare una cifra
numerica alle modalità (es.
M=0, F=1), ma la sostituzione
non va a significare che il
fenomeno si trasforma in
quantitativo (a causa della
mancanza di significato
intrinseco di “numero”).
Le modalità sono ordinabili
secondo un ordine oggettivo.
(es. grado d’istruzione , livello
di soddisfazione di un
prodotto).
Sono misurati su una scala
ordinale.
Derivano da una operazione
di enumerazione o di
conteggio (es. numero di
figli ).
Derivano da una operazione
di misurazione (es. durata
delle lampadine, reddito del
personale ).
I Quantitativi Continui poi…
Scala per intervalli (°C)
Lo 0 è un valore
convenzionale (nella scala per
intervalli ha senso fare le
differenze).
Scala per rapporto (K)
Lo 0 è assenza di momento,
non è un valore convenzionale
ma ha un significato proprio.
Gli intervalli sono detti contigui perché nel punto in cui ne termina uno inizia il successivo.
Le rappresentazioni grafiche sono un modo alternativo alla tabella di sintesi per rappresentare i dati.
Tipi di variabile diversi implicano grafici diversi:
Qualitativa sconnessa Diagramma a barre / Diagramma a torta
Qualitativa rettilinea Diagramma a barre (accostate per differenziare)
Quantitativa discreta Diagramma a bastoncini
Quantitativa continua Istogramma di frequenza
Per rappresentare graficamente la distribuzione di un fenomeno continuo raggruppato per classi, occorre introdurre la densità di frequenza , data dal rapporto tra
la freq. assoluta/relativa/relativa-percentuale e l’ampiezza della classe.
𝒊
𝒊
𝒊
𝒊
𝒊
𝒊
Dove 𝑎
!
!
!%"
è l’ampiezza della classe i-esima.
La relazione tra densità di frequenza assoluta e densità di frequenza relativa è data da:
𝒊
𝒊
Gli istogrammi di frequenza possono essere usati anche per stabilire la proporzione di unità statistiche che presentano modalità minore o uguale ad un valore x.
Questa, è data dall’area sottesa all’istogramma a sinistra di x. Questo vale però sotto l’ipotesi di distribuzione uniforme delle unità statistiche all’interno delle classi.
Quando x cade nell’intervallo (ℎ !
!&"
], l’area a sinistra di x è:
𝒊&𝟏
𝒊
𝒊
I quartili possono essere rappresentati attraverso un grafico detto boxplot.
Per i caratteri qualitativi rettilinei si descrive solo il calcolo della mediana, distinguendo due casi:
sarà la modalità associata all’unità statistica di posizione (𝑛 + 1 )/ 2. Sia a sinistra che a destra di tale unità statistica si trovano esattamente
(𝑛 − 1 )/ 2 unità statistiche, quindi la mediana è la modalità con posizione centrale.
sarà la modalità associata alle unità statistiche di posizione 𝑛/ 2 e (𝑛/ 2 ) + 1 solo se le modalità coincidono, altrimenti è indeterminata. Sia a
sinistra di 𝑛/ 2 , sia a destra di (𝑛/ 2 ) + 1 ci sono esattamente (𝑛 − 1 )/ 2 osservazioni, quindi la mediana (quando determinabile) è la modalità con posizione
centrale.
Per i caratteri quantitativi discreti , la formula generale per il calcolo del quantile di ordine 𝑝 , 𝑥 /
_, per 0 𝒑 e 𝑭
𝒊%𝟏
< 𝒑, allora il quantile 𝑥
/
è proprio 𝒙
𝒊
Per trovare il quantile di ordine “p” si scorre la colonna delle frequenze relative cumulate a partire da 𝐹
"
e si arriva alla prima frequenza relativa cumulata 𝐹
!
i
𝒙 𝒊
1 𝒙 𝒊"𝟏
𝟐
p
i
Può essere calcolata solo per i caratteri quantitativi.
𝒊
𝒏
𝒊#𝟏
L’indicatore di precisione della media è lo scarto quadratico medio ( 𝒔K ) , definito come la radice quadrata della varianza.
Si può anche essere interessati a valutare l’attitudine del carattere a variare (assumere modalità distinte). Per questo, serve utilizzare gli indici di variabilità per le
variabili quantitative. Esempi sono il Range (R, basato sulle due osservazioni più estreme), differenza interquartile, scarto interquartile.
𝟐
𝟐
𝒊
𝟐
𝒏
𝒊#𝟏
𝒊
𝟐
𝒊
𝟐
𝒏
𝒊#𝟏
𝒊
𝟐
Per proprietà della varianza: slide 87 di “Descrittiva”
Definita come la radice quadrata della varianza.
Regola dei 3-sigma: Date n osservazioni di una variabile quantitativa, almeno l’ 89 % di esse, si trova nell’intervallo [ 𝒙\ − 𝟑𝒔K ; 𝒙\ + 𝟑𝒔^]
𝑿𝒀
𝑿𝒀
𝒊
𝒊
𝒏
𝒊=𝟏
𝑿𝒀
𝒊
𝒊
𝒏
𝒊=𝟏
Il coefficiente di variazione di un fenomeno X , indicato con CV(X) , è un indice di variabilità relativa, dato da: 𝑪𝑽(𝑿) =
È un numero puro (a differenza di varianza e s.q.m.) e per questa ragione si usa per confrontare la variabilità dello stesso fenomeno in popolazioni/fenomeni diversi.
X è indipendente da Y se e solo se tutte le distribuzioni condizionate relative di X coincidono con la distribuzione relativa marginale di X :
𝒊𝒋
∙𝒋
𝒊∙
Y è indipendente da X se e solo se tutte le distribuzioni condizionate relative di Y coincidono con la distribuzione relativa marginale di Y :
𝒊𝒋
𝒊∙
∙𝒋
Entrambe le condizioni di uguaglianza precedenti implicano che X e Y siano mutualmente indipendenti se e solo se:
𝒊𝒋
𝒊∙
∙𝒋
che diviso tutto per n porta a:
𝒊𝒋
𝒊.
∙𝒋
Tabella che si sarebbe realizzata se ci fosse stata indipendenza. Riporta le stesse distribuzioni marginali della tabella osservata ma è costituita da frequenze congiunte
teoriche di indipendenza :
𝒊𝒋
𝒊∙
∙𝒋
L’indice 𝑿
𝟐
serve come misura di distanza tra la tabella osservata e quella teorica.
Indice ulteriore per valutare la connessione tra due variabili. Più facilmente interpretabile perché sempre compreso tra 0 (indipendenza) e 1 (massima connessione).
𝟐
𝟐
𝟐
𝟐
𝟐
Varianza between (o spiegata): misura la variabilità delle unità statistiche dovuta all’appartenenza a gruppi distinti. Varianza delle medie condizionate.
Varianza within (o residua): misura la variabilità naturale delle unità statistiche all’interno dei vari gruppi. Media delle varianze condizionate:
SCOMPOSIZIONE DELLA VARIANZA ® la varianza marginale è data dalla varianza delle medie condizionate + media delle varianze condizionate :
𝒔
(
𝒀
𝟐
= 𝒔
(
𝑩
𝟐
(
𝑾
𝟐
Indice che misura il grado di dipendenza in media di Y da X (sempre compreso tra 0 e 1 ):
È dato dal rapporto tra covarianza e il prodotto delle due deviazioni standard (sempre compreso tra - 1 e 1 ):
Dati due eventi 𝐴 e 𝐵, con 𝑃(𝐵) > 0 , si definisce la probabilità di A condizionata a B come:
Se 𝑃(𝐴|𝐵) ≠ 𝑃(𝐴) il fatto che 𝐵 si sia verificato modifica la probabilità di 𝐴 (𝐵 influenza la probabilità di 𝐴).
Se 𝑃
= 𝑃(𝐴) c’è indipendenza tra A e B.
C’è indipendenza stocastica di 𝐴 e di 𝐵 se e solo se:
Due eventi A e B sono tra di loro indipendenti se e solo se:
La probabilità della loro intersezione è uguale al prodotto delle due probabilità.
Indipendenza: il verificarsi di uno non modifica il verificarsi dell’altro.
Incompatibilità: i due eventi non possono verificarsi insieme.
n eventi 𝐴 "
6
costituiscono una partizione di Ω se e solo se:
𝒊
𝒏
𝒊#𝟏
𝒊
𝒋
Cioè se la loro unione dà Ω e se sono a due a due incompatibili.
Dato un qualsiasi evento 𝐸 ed una partizione di Ω si può sempre scrivere:
Dato un evento 𝐴 di Ω si può sempre scrivere: