Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Esercizi e quiz di statistica - Prof. Barbiero, Schemi e mappe concettuali di Statistica

Formulario di statistica con relativi grafici.

Tipologia: Schemi e mappe concettuali

2020/2021

In vendita dal 11/04/2023

giuseppesarfio
giuseppesarfio 🇮🇹

4.3

(7)

32 documenti

1 / 42

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Formulario di Statistica
2021
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a

Anteprima parziale del testo

Scarica Esercizi e quiz di statistica - Prof. Barbiero e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!

Formulario di Statistica

STATISTICA DESCRITTIVA

La Statistica Descrittiva è la branca della statistica che studia i criteri di rilevazione, classificazione, sintesi, rappresentazione dei dati appresi dallo studio di una

popolazione, o di una parte di essa detta campione.

Le unità statistiche sono le entità su cui vengono misurate una o più variabili d’interesse.

Scala di misura: insieme dei possibili valori che la variabile può assumere.

I fenomeni di interesse sono molteplici, ma si possono classificare in 4 tipologie:

Fenomeni QUALITATIVI Fenomeni QUANTITATIVI

Si manifestano attraverso modalità NON numeriche. Nel

caso in cui fossero numeri, non avrebbero il senso

intrinseco di “numero”.

Si manifestano attraverso modalità numeriche. Sono

numeri con il significato intrinseco di “numero” (numero

non come “etichetta”).

Qual. SCONNESSI

Qual. ORDINABILI,

Qual. ORDINARI,

Qual. RETTILINEI

Quant. DISCRETI Quant. CONTINUI

Presentano modalità non

ordinabili secondo un ordine

oggettivo.

(es. genere M/F , stato civile).

È possibile assegnare una cifra

numerica alle modalità (es.

M=0, F=1), ma la sostituzione

non va a significare che il

fenomeno si trasforma in

quantitativo (a causa della

mancanza di significato

intrinseco di “numero”).

Le modalità sono ordinabili

secondo un ordine oggettivo.

(es. grado d’istruzione , livello

di soddisfazione di un

prodotto).

Sono misurati su una scala

ordinale.

Derivano da una operazione

di enumerazione o di

conteggio (es. numero di

figli ).

Derivano da una operazione

di misurazione (es. durata

delle lampadine, reddito del

personale ).

I Quantitativi Continui poi…

Scala per intervalli (°C)

Lo 0 è un valore

convenzionale (nella scala per

intervalli ha senso fare le

differenze).

Scala per rapporto (K)

Lo 0 è assenza di momento,

non è un valore convenzionale

ma ha un significato proprio.

= , ¹ = , ¹ , < , > = , ¹ , < , > , + , – , × , /

Variabile quantitativa continua: distribuzione in classi

Gli intervalli sono detti contigui perché nel punto in cui ne termina uno inizia il successivo.

Rappresentazioni grafiche

Le rappresentazioni grafiche sono un modo alternativo alla tabella di sintesi per rappresentare i dati.

Tipi di variabile diversi implicano grafici diversi:

Qualitativa sconnessa Diagramma a barre / Diagramma a torta

Qualitativa rettilinea Diagramma a barre (accostate per differenziare)

Quantitativa discreta Diagramma a bastoncini

Quantitativa continua Istogramma di frequenza

Densità di frequenza - fenomeno continuo raggruppato per classi

Per rappresentare graficamente la distribuzione di un fenomeno continuo raggruppato per classi, occorre introdurre la densità di frequenza , data dal rapporto tra

la freq. assoluta/relativa/relativa-percentuale e l’ampiezza della classe.

𝒊

𝒊

𝒊

𝒊

𝒊

𝒊

Dove 𝑎

!

!

!%"

è l’ampiezza della classe i-esima.

La relazione tra densità di frequenza assoluta e densità di frequenza relativa è data da:

𝒊

𝒊

Istogrammi di frequenza per stabilire una proporzione

Gli istogrammi di frequenza possono essere usati anche per stabilire la proporzione di unità statistiche che presentano modalità minore o uguale ad un valore x.

Questa, è data dall’area sottesa all’istogramma a sinistra di x. Questo vale però sotto l’ipotesi di distribuzione uniforme delle unità statistiche all’interno delle classi.

Quando x cade nell’intervallo (ℎ !

!&"

], l’area a sinistra di x è:

𝒊&𝟏

𝒊

𝒊

I quartili possono essere rappresentati attraverso un grafico detto boxplot.

Per i caratteri qualitativi rettilinei si descrive solo il calcolo della mediana, distinguendo due casi:

  • n è dispari : 𝑥
    • ,.

sarà la modalità associata all’unità statistica di posizione (𝑛 + 1 )/ 2. Sia a sinistra che a destra di tale unità statistica si trovano esattamente

(𝑛 − 1 )/ 2 unità statistiche, quindi la mediana è la modalità con posizione centrale.

  • n è pari : 𝑥
    • ,.

sarà la modalità associata alle unità statistiche di posizione 𝑛/ 2 e (𝑛/ 2 ) + 1 solo se le modalità coincidono, altrimenti è indeterminata. Sia a

sinistra di 𝑛/ 2 , sia a destra di (𝑛/ 2 ) + 1 ci sono esattamente (𝑛 − 1 )/ 2 osservazioni, quindi la mediana (quando determinabile) è la modalità con posizione

centrale.

Per i caratteri quantitativi discreti , la formula generale per il calcolo del quantile di ordine 𝑝 , 𝑥 /

_, per 0 𝒑 e 𝑭

𝒊%𝟏

< 𝒑, allora il quantile 𝑥

/

è proprio 𝒙

𝒊

Per trovare il quantile di ordine “p” si scorre la colonna delle frequenze relative cumulate a partire da 𝐹

"

e si arriva alla prima frequenza relativa cumulata 𝐹

!

1) Colonna delle Fi

2) 1^ modalità dove F

i

³ p

  • se F i

= p?

𝒙 𝒊

1 𝒙 𝒊"𝟏

𝟐

  • se F i

> p ® x

p

= x

i

Media aritmetica

Può essere calcolata solo per i caratteri quantitativi.

S

𝒊

𝒏

𝒊#𝟏

L’indicatore di precisione della media è lo scarto quadratico medio ( 𝒔K ) , definito come la radice quadrata della varianza.

Si può anche essere interessati a valutare l’attitudine del carattere a variare (assumere modalità distinte). Per questo, serve utilizzare gli indici di variabilità per le

variabili quantitative. Esempi sono il Range (R, basato sulle due osservazioni più estreme), differenza interquartile, scarto interquartile.

Varianza ( 𝒔"

𝟐

𝒔U

𝟐

𝒊

− 𝒙S)

𝟐

𝒏

𝒊#𝟏

× 𝒏

𝒊

𝒔U

𝟐

𝒊

𝟐

𝒏

𝒊#𝟏

𝒊

) − 𝒙S

𝟐

Per proprietà della varianza: slide 87 di “Descrittiva”

Scarto quadratico medio (o deviazione standard) ( 𝒔" )

Definita come la radice quadrata della varianza.

Regola dei 3-sigma: Date n osservazioni di una variabile quantitativa, almeno l’ 89 % di esse, si trova nell’intervallo [ 𝒙\ − 𝟑𝒔K ; 𝒙\ + 𝟑𝒔^]

Covarianza ( 𝒔"

𝑿𝒀

𝑿𝒀

𝒊

𝒊

𝒏

𝒊=𝟏

𝑿𝒀

𝒊

𝒊

𝒏

𝒊=𝟏

Il coefficiente di variazione di un fenomeno X , indicato con CV(X) , è un indice di variabilità relativa, dato da: 𝑪𝑽(𝑿) =

𝒔K
|𝒙|

È un numero puro (a differenza di varianza e s.q.m.) e per questa ragione si usa per confrontare la variabilità dello stesso fenomeno in popolazioni/fenomeni diversi.

Frequenze relative condizionate

Indipendenza

X è indipendente da Y se e solo se tutte le distribuzioni condizionate relative di X coincidono con la distribuzione relativa marginale di X :

𝒊𝒋

∙𝒋

𝒊∙

Y è indipendente da X se e solo se tutte le distribuzioni condizionate relative di Y coincidono con la distribuzione relativa marginale di Y :

𝒊𝒋

𝒊∙

∙𝒋

Entrambe le condizioni di uguaglianza precedenti implicano che X e Y siano mutualmente indipendenti se e solo se:

𝒊𝒋

𝒊∙

∙𝒋

che diviso tutto per n porta a:

𝒊𝒋

𝒊.

∙𝒋

Tabella teorica di indipendenza

Tabella che si sarebbe realizzata se ci fosse stata indipendenza. Riporta le stesse distribuzioni marginali della tabella osservata ma è costituita da frequenze congiunte

teoriche di indipendenza :

𝒏X

𝒊𝒋

𝒊∙

∙𝒋

L’indice 𝑿

𝟐

serve come misura di distanza tra la tabella osservata e quella teorica.

Indice di Pearson normalizzato

Indice ulteriore per valutare la connessione tra due variabili. Più facilmente interpretabile perché sempre compreso tra 0 (indipendenza) e 1 (massima connessione).

𝟐

𝟐

𝟐

𝟐

𝟐

= 𝒏 × 𝒎𝒊𝒏(𝒉 − 𝟏; 𝒌 − 𝟏)

Medie e varianze marginali e condizionate

Varianza between e varianza within

Varianza between (o spiegata): misura la variabilità delle unità statistiche dovuta all’appartenenza a gruppi distinti. Varianza delle medie condizionate.

Varianza within (o residua): misura la variabilità naturale delle unità statistiche all’interno dei vari gruppi. Media delle varianze condizionate:

SCOMPOSIZIONE DELLA VARIANZA ® la varianza marginale è data dalla varianza delle medie condizionate + media delle varianze condizionate :

𝒔

(

𝒀

𝟐

= 𝒔

(

𝑩

𝟐

  • 𝒔

(

𝑾

𝟐

Eta quadro

Indice che misura il grado di dipendenza in media di Y da X (sempre compreso tra 0 e 1 ):

Coefficiente di correlazione lineare – (Bravais-Pearson) (r)

È dato dal rapporto tra covarianza e il prodotto delle due deviazioni standard (sempre compreso tra - 1 e 1 ):

  • r = 𝟏 ® relazione lineare perfetta positiva , i dati si allineano lungo una retta inclinata positivamente.
  • r = 𝟎 ® assenza di legame lineare , o non sussiste alcun legame tra le due variabili o pur essendoci un legame questo non è di tipo lineare ( incorrelate ).
  • r = −𝟏 ® relazione lineare perfetta negativa , i dati si allineano lungo una retta inclinata negativamente.

Contingenze = 𝑛

Probabilità condizionata

Dati due eventi 𝐴 e 𝐵, con 𝑃(𝐵) > 0 , si definisce la probabilità di A condizionata a B come:

Se 𝑃(𝐴|𝐵) ≠ 𝑃(𝐴) il fatto che 𝐵 si sia verificato modifica la probabilità di 𝐴 (𝐵 influenza la probabilità di 𝐴).

Se 𝑃

= 𝑃(𝐴) c’è indipendenza tra A e B.

Indipendenza stocastica

C’è indipendenza stocastica di 𝐴 e di 𝐵 se e solo se:

Indipendenza

Due eventi A e B sono tra di loro indipendenti se e solo se:

La probabilità della loro intersezione è uguale al prodotto delle due probabilità.

I CONCETTI DI INDIPENDENZA E INCOMPATIBILITÀ NON VANNO CONFUSI!

Indipendenza: il verificarsi di uno non modifica il verificarsi dell’altro.

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) × 𝑃(𝐵)

Incompatibilità: i due eventi non possono verificarsi insieme.

Partizione

n eventi 𝐴 "

6

costituiscono una partizione di Ω se e solo se:

  • ⋃ 𝑨

𝒊

𝒏

𝒊#𝟏

  • 𝑨

𝒊

𝒋

Cioè se la loro unione dà Ω e se sono a due a due incompatibili.

Dato un qualsiasi evento 𝐸 ed una partizione di Ω si può sempre scrivere:

Dato un evento 𝐴 di Ω si può sempre scrivere: