Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


formulario statistica - Zanarotti, Formulari di Statistica

in questo file potrete trovare tutte le formule e le nozioni principali. Ovviamente il file deve essere accompagnato ad un precedente studio della materia! voto: 30L

Tipologia: Formulari

2020/2021

In vendita dal 15/07/2021

shereen-zangane
shereen-zangane 🇮🇹

4.6

(27)

25 documenti

1 / 7

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA UNIVARIATA
CARATTERI
QUALITATIVI quando le modalità sono rappresentate da parole
ordinati, misurati su scala ordinale presentano un ordinamento non arbitrario
sconnessi, misurati su scala nominale sono tutti quei caratteri tra le cui modalità non
esiste un ordine
QUANTITATIVI quando le modalità sono rappresentate da numeri.
discreti, quando il numero di modalità che può assumere è finito o numerabile
continui, quando il numero di modalità è un’infinità non numerabile (classi)
AMPIEZZA CLASSE ( )𝑎𝑗
- se c’è |- → è incluso l’estremo inferiore della classe
𝑎𝑗= 𝑒𝑠𝑡𝑟𝑒𝑚𝑜 𝑠𝑢𝑝 𝑒𝑠𝑡𝑟𝑒𝑚𝑜 𝑖𝑛𝑓
- se c’è -→ è tutto escluso → 𝑎𝑗= (𝑒𝑠𝑡𝑟𝑒𝑚𝑜 𝑠𝑢𝑝 𝑒𝑠𝑡𝑟𝑒𝑚𝑜 𝑖𝑛𝑓) + 1
FREQUENZE
- assolute: il numero di osservazioni che presentano una particolare modalità → 𝑛𝑗
- relative → 𝑓𝑗=𝑛𝑗
𝑛
- percentuali → 𝑝𝑗= 𝑓𝑗· 100
frequenze relative e percentuali si possono calcolare sempre.
- cumulate assolute → → il primo numero è uguale alla prima frequenza
𝑁𝑗= 𝑛𝑗+ 𝑁𝑗−1
assoluta, il secondo è uguale alla seconda nj + Nj prima.
- cumulate relative → 𝐹𝑗= 𝑁𝑗
𝑛
- cumulate percentuali → 𝑃𝑗= 𝐹𝑗· 100
frequenze cumulate NON si possono calcolare per i caratteri qualitativi sconnessi
NOTAZIONI
pf3
pf4
pf5

Anteprima parziale del testo

Scarica formulario statistica - Zanarotti e più Formulari in PDF di Statistica solo su Docsity!

STATISTICA UNIVARIATA

CARATTERI

QUALITATIVI quando le modalità sono rappresentate da parole

● ordinati, misurati su scala ordinale presentano un ordinamento non arbitrario

● sconnessi, misurati su scala nominale sono tutti quei caratteri tra le cui modalità non

esiste un ordine

QUANTITATIVI quando le modalità sono rappresentate da numeri.

● discreti, quando il numero di modalità che può assumere è finito o numerabile

● continui, quando il numero di modalità è un’infinità non numerabile (classi)

AMPIEZZA CLASSE ( 𝑎 )

𝑗

  • se c’è |- → è incluso l’estremo inferiore della classe →

𝑎 𝑗

  • se c’è - → è tutto escluso → 𝑎 𝑗
FREQUENZE
  • assolute: il numero di osservazioni che presentano una particolare modalità → 𝑛 𝑗
  • relative → 𝑓 𝑗

𝑛𝑗 𝑛

  • percentuali → 𝑝 𝑗

𝑗

frequenze relative e percentuali si possono calcolare sempre.

  • cumulate assolute → 𝑁 → il primo numero è uguale alla prima frequenza 𝑗

𝑗

𝑗−

assoluta, il secondo è uguale alla seconda nj + Nj prima.

  • cumulate relative → 𝐹 𝑗

𝑁𝑗

𝑛

  • cumulate percentuali → 𝑃 𝑗

𝑗

frequenze cumulate NON si possono calcolare per i caratteri qualitativi sconnessi

NOTAZIONI
DISTRIBUZIONI

● di frequenza: ho come prima colonna le X (carattere, con le modalità) e come

seconda colonna le n (frequenze assolute)

● di quantità: ho come prima colonna le X e come seconda colonna le Q (quantità)

● serie storiche: ho come prima colonna la t (il tempo) e come seconda colonna le n

● serie territoriali: le rilevazioni riguardano lo studio di uno o più caratteri nella loro

distribuzione nello spazio

GRAFICI

● caratteri qualitativi:

❖ barre o nastri (la loro altezza è quanto la frequenza corrispondente) → solo

uno degli assi ha significato numerico

❖ torta → angolo al centro associato a ciascuna fetta 𝑔

𝑗

(𝑝𝑗 · 360)

100

● quantitativi discreti:

❖ grafico ad aste: asse ascisse modalità, asse ordinate frequenze.

● quantitativi continui (classi):

❖ istogramma: se le classi hanno ampiezza diversa devo calcolare la densità di

frequenza 𝑑 (modalità ascisse, densità di frequenza ordinate).

𝑗

𝑛𝑗

𝑎𝑗

formule inverse: 𝑛 e 𝑗

𝑗

𝑗

𝑗

𝑓𝑗

𝑎𝑗

● distribuzioni di quantità:

  • barre o nastri
  • a torta

● serie storiche

  • grafico con i picchi e unione puntini. Per confrontare gli andamenti per due

popolazioni diverse: 𝐼 o 𝑡

𝑋𝑡

𝑋𝑜

𝑡−

𝑋𝑡

𝑋𝑡−

● serie territoriali

  • cartogramma
INDICI TENDENZA CENTRALE
❏ MODA

valore tipico della distribuzione

posso individuarla SEMPRE

una distribuzione può avere nessuna, una o più mode

  • carattere qualitativo o quantitativo discreto : Modalità con frequenza assoluta più

grande

  • carattere quantitativo continuo (classi): Valore centrale della classe con densità di

frequenza più grande

Se il carattere è qualitativo dicotomico non ha troppo senso dire qual è la moda.

Se è bimodale (due mode) vuol dire che all’interno di n ci sono due sottogruppi.

4. funzione di perdita

𝑖=

𝑛

𝑖

2

5. proprietà associativa della media aritmetica 𝑋 =

1 𝑛 ℎ=

𝐿

6. trasformazione lineare 𝑌 = 𝑎 + 𝑏𝑋

➔ media ponderata

𝑋 1 ·𝑃1 + 𝑋 2 ·𝑃2 + 𝑋 3 ·𝑃3 + ... + 𝑋𝑛·𝑃𝑛

𝑃1 + 𝑃2 + 𝑃3 + ... + 𝑃𝑛

➔ media armonica

𝑗=

𝑘

𝑛 𝑗 𝑥 𝑗

➔ media geometrica

𝑔𝑒𝑜𝑚𝑒𝑡𝑟𝑖𝑐𝑎

1

2

𝑛

1 𝑛

➔ media potenziale

(𝑆)

1 𝑛 𝑗=

𝑘

𝑗

𝑠

𝑗

1 𝑆 𝑆^1 𝑛 𝑗=

𝑘

𝑗

𝑠

𝑗

𝑆 𝑐ℎ𝑒 𝑡𝑒𝑛𝑑𝑒 𝑎 − ∞ → 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 è 𝑢𝑔𝑢𝑎𝑙𝑒 𝑎𝑙 𝑝𝑖ù 𝑝𝑖𝑐𝑐𝑜𝑙𝑜 𝑑𝑒𝑖 𝑣𝑎𝑙𝑜𝑟𝑖 𝑜𝑠𝑠𝑒𝑟𝑣𝑎𝑡𝑖

𝑆 𝑐ℎ𝑒 𝑡𝑒𝑛𝑑𝑒 𝑎 + ∞ → 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 è 𝑖𝑙 𝑝𝑖ù 𝑔𝑟𝑎𝑛𝑑𝑒 𝑑𝑒𝑖 𝑣𝑎𝑙𝑜𝑟𝑖 𝑜𝑠𝑠𝑒𝑟𝑣𝑎𝑡𝑖

❏ QUARTILI E PERCENTILI
VARIABILITÀ

è l'attitudine di un carattere a manifestarsi in diversi modi, ossia con diverse modalità.

● caratteri quantitativi

➔ range 𝑋 𝑚𝑎𝑥

𝑚𝑖𝑛

➔ range interquartile 𝑄

3

➔ varianza

2

1 𝑛 𝑖=

𝑛

𝑖

2

da cui trovo lo scarto quadratico → σ =

1 𝑛 𝑖=

𝑛

𝑖

2

se si lavora con delle classi non avremo più xj ma al suo posto nella formula

useremo cj (valore centrale di ogni classe).

❖ varianza con frequenze assolute

2

1 𝑛 𝑗=

𝑘

𝑗

2

𝑗

❖ varianza con frequenze relative

2

1 𝑛 𝑗=

𝑘

𝑗

2

𝑛𝑗

𝑛

proprietà della varianza:

  1. σ SEMPRE! → se è 0 vuol dire che non c’è variabilità

2 ≥ 0

2. formula se ho la media con decimali σ

2

1 𝑛 𝑗=

𝑘

𝑗

2

𝑗

2

3. teorema di scomposizione della varianza σ

2

𝑀ℎ

2

2

𝑀(σ → varianza within

2

1 𝑛 ℎ=

𝐿

2

σ → varianza between

𝑀ℎ

2

1 𝑛 ℎ=

𝐿

2

4. proprietà della trasformazione lineare 𝑉𝑎𝑟(𝑌) = 𝑏

2

come confrontare la variabilità?

se hanno unità di misura diversa o grandezze diverse uso

  • coefficiente di variazione

standardizzare

𝑍 =

𝑥

  • la media di Z è sempre 0
  • la varianza di Z è sempre 1

caratteri qualitativi

- indice di Gini

𝐺 = , il risultato sta nel range

𝑘 𝑘− 𝑗=

𝑘

𝑗

𝑗

0 vuol dire che non c’è variabilità (quindi carattere omogeneo)

1 vuol dire che la variabilità è massima (eterogeneo)

STATISTICA BIVARIATA

➔ se 𝑛 (fatto per tutte le frequenze congiunte) allora i due

=

𝑖•

•𝑗

caratteri sono indipendenti → condizione di indipendenza (che è

sempre simmetrica)

➔ se 𝑛 allora i due caratteri sono dipendenti (legame)

𝑖•

•𝑗

questo calcolo è detto in modo sintetico

𝑖•

•𝑗

𝑛

● grado di legame tra i due caratteri

si misura con χ → lo faccio per tutte le frequenze

=

𝑖=

𝑗=

𝑖𝑗

𝑖𝑗

)

2

𝑖𝑗

congiunte.

Il risultato che trovo con il chi-quadro devo classificarlo tra 0 e 1 (0 assenza di

legame e 1 legame forte)

χ

=

2

𝑚𝑎𝑥

2

dove χ

𝑚𝑎𝑥

2

= 𝑛 𝑚𝑖𝑛 𝐾 − 1[ ( ), (𝐻 − 1 )]