Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Misure di Tendenza Centrale e Variabilità: Esercizi e Quiz, Dispense di Statistica

Slides supporto al corso di statistica Cleam

Tipologia: Dispense

2019/2020

Caricato il 15/01/2020

nontisaluto
nontisaluto 🇮🇹

2

(1)

13 documenti

1 / 64

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Cap. 3-1
Capitolo 3
Descrizione Numerica dei Dati
Statistica
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40

Anteprima parziale del testo

Scarica Misure di Tendenza Centrale e Variabilità: Esercizi e Quiz e più Dispense in PDF di Statistica solo su Docsity!

Capitolo 3

Descrizione Numerica dei Dati

Statistica

Dopo aver completato il capitolo, sarete in grado di:

 Calcolare ed interpretare la media, la mediana, e la moda

di un set di dati

 Trovare il campo di variazione, varianza, scarto quadratico

medio, e coefficiente di variazione e conoscere il loro

significato

 Applicare la regola empirica per descrivere la variazione

dei valori della popolazione attorno alla media

 Spiegare la media ponderata e quando usarla

 Spiegare come una retta di regressione ottenuta con il

metodo dei minimi quadrati stima la relazione lineare fra

due variabili

Obiettivi del Capitolo

Argomenti Trattati nel Capitolo  Cinque numeri di sintesi e diagramma a scatola e baffi  Covarianza e coefficiente di correlazione  Problemi con le misure usate per descrivere i dati numericamente e considerazioni etiche (continuazione)

Descrizione Numerica dei Dati Media Aritmetica Mediana Moda Descrizione numerica dei dati Varianza Scarto Quadratico Medio Coefficiente di Variazione Campo di Variazione Differenza Interquartile Tendenza Centrale Tendenza^ Non Variabilità Centrale (Quantili) Quartili Decili Percentili

Media Aritmetica  La media aritmetica (media) è la misura di tendenza centrale più comune

 Per una popolazione di N valori:

 Per un campione di dimensione n:

Dimensione del campione n x x x n x x 1 2 n n i 1 i        ^ Valori osservati N x x x N x μ 1 2 N N i 1 i         Dimensione della popolazione Valori della popolazione

Media Aritmetica

 La misura di tendenza centrale più comune

 Media = somma dei valori diviso il numero di valori

 Influenzata da valori estremi (outlier)

(continuazione) 0 1 2 3 4 5 6 7 8 9 10

Media = 3

0 1 2 3 4 5 6 7 8 9 10

Media = 4

Calcolo della media aritmetica per

una distribuzione discreta

Un caso particolare di media aritmetica ponderata è quella
calcolata a partire da una distribuzione statistica discreta
(calcolo equivalente a quello che si otterrebbe con I dati non
raggruppati).
Supponiamo di osservare k valori distinti xi con rispettive
frequenze assolute f 1 , f 2 ,... fk e relative p 1 , p 2 ,... pk

 

k i 1 i i k i 1 i i

x p

N

x f

  K i 1 dove N fi

  K i 1 dove n fi

Per una popolazione

Per un campione

 

k i 1 i i k i 1 i i

x p

n

x f

x

Calcolo della media aritmetica per

una distribuzione continua

Un altro caso particolare di media ponderata è il calcolo approssimato del calcolo della media aritmetica di una distribuzione continua, con dati raggruppati in classi di intervallo Siano i valori m 1 , m 2 ,.. ., mk i valori centrali (le semisomme degli estremi) delle k classi e siano f 1 , f 2 ,... fk le frequenze assolute e p 1 , p 2 ,... pk le frequenze relative delle k classi:

Per una popolazione

 Per un campione

 

k i 1 i i k i 1 i i

p m

N

f m

 

k i 1 i i k i 1 i i

p m

n

f m

x

   K i 1 dove N fi

  K i 1 dove n fi

Trovare la Mediana

 La posizione della mediana:

 Se il numero di valori è dispari, la mediana è il valore centrale  Se il numero di valori è pari, la mediana è la media dei due valori centrali

 Nota che non è il valore della mediana, ma la

posizione della mediana nella sequenza ordinata

posizione nella sequenzaordinata

Posizione Mediana

n

n  1

Trovare la Mediana: distribuzione in classi di intervallo  Qualora si considerino variabili ricodificate in classi di intervallo, il calcolo della mediana a partire dalla distribuzione non coinciderà più con quello ottenuto dai dati originari.  Le fasi per il calcolo della mediana sono le seguenti:

  1. Individuazione, attraverso la cumulata, della classe mediana, ovvero la classe di intervallo in cui la funzione cumulativa raggiunge o supera il valore 0 , 5.
  2. Per determinare quindi il valore della mediana, si uguaglia a 0 , 5 l’espressione analitica della funzione cumulativa nella classe individuata, oppure si impone che l'area dell'istogramma alla sinistra del valore mediano sia 0 , 5.

Moda  Una misura di tendenza centrale  Valore che occorre più frequentemente  Non influenzata da valori estremi  Usata sia per dati numerici che categorici  Può non esserci una moda  Ci può essere più di una moda  Nel caso di variabile continua per intervalli, la classe modale è quella con massima densità di frequenza e come moda solitamente si prende il valore centrale della classe stessa 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Moda = 9

0 1 2 3 4 5 6

No Moda

 Cinque case su una collina presso una spiaggia Esempio Riepilogativo $2,000 K $500 K $300 K $100 K $100 K Prezzi delle case: $2,000, 500, 300, 100, 100,

 La Media è usata in generale, a meno che ci siano valori estremi (outlier)  La mediana è usata spesso siccome non è influenzata da valori estremi.

 Esempio: Il prezzo mediano delle case

può essere riportato per una regione –

meno sensibile agli outlier

Quale misura di tendenza centrale è la “migliore”?

Misure di tendenza non centrale Tendenza Non Centrale (quantili) Quartili Decili Percentili

 Le misure di tendenza non

centrale forniscono

informazioni sulla

distribuzione delle variabili e

in particolare sulle code della

distribuzione stessa