Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica: nozioni introduttive, distribuzioni statistiche e rappresentazione grafiche - , Appunti di Statistica

Il programma del corso di Statistica per l'anno accademico 2018/2019, con particolare attenzione alle nozioni introduttive, alle distribuzioni statistiche e alle loro rappresentazioni grafiche. Vengono introdotte le definizioni di base, come frequenza assoluta, relativa e percentuale, e le diverse tipologie di caratteri (qualitativi e quantitativi, discreti e continui). Vengono inoltre illustrate le diverse forme di distribuzioni e le rappresentazioni grafiche, come diagrammi a torta, a barre, cartesiani e istogrammi.

Tipologia: Appunti

2019/2020

Caricato il 04/05/2020

sophia-effe-volpi
sophia-effe-volpi 🇮🇹

4.7

(20)

3 documenti

1 / 21

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTCA 2018/2019
Programma:
Nozioni introduttive (Parte 1)"
Distribuzione statistiche e rappresentazione i grafiche (Parte 2)"
Statistica univariata: (Parte 3, 4, 5,)#
- Media#
- Variabillità#
- Altre caratteristiche di una distribuzione statistica"
Numeri indici (Parte 6)"
Statistica bivariata:#
- Dipendenza#
- Regressione#
- Correlazione"
Probabilità "
Inferenza"
_______________________________________________________________________________________"
PARTE 1
Concetti introduttivi"
Rilevazione dei fenomeni statistici:#
- Rilevazione campionarie#
- Questionario e tecniche di somministrazione#
- Fonti statistiche#
- Matrice dei dati"
Statistica descrittiva e interferenza statistica "
CONCETTI INTRODUTTIVI:
Definizione di statistica: è la disciplina che elabora i principi e le metodologie che presiedono:"
-al processo di rilevazione dei dati"
-Alla rappresentazione dei dati"
-All’interpretazione dei risultati"
-Alla generalizzazione delle evidenze osservate"
Fasi dell’indagine statistica:"
1) Formulazione del problema, eventualmente sotto forma d’ipotesi"
2) Individuazione dei dati pertinenti"
3) Programmazione della rivelazione dei dati"
4) Analisi dei dati"
5) Interpretazione dei risultati "
Statistica nelle attività operative:"
-Individuazione dello scopo dell’attività"
-Analisi della situazione di partenza "
-Esami degli strumenti da utilizzare"
-Previsione dei risultati conseguibili"
-Decisione finale"
I quattro termini fondamentali della statistica:"
1) Collettivo o Popolazione"
2) Unità: caso individuale"
UN COLLETTIVO È COMPOSTO DA N UNITÀ STATISTICHE
3) Carattere: aspetto rilevato sulle unità del collettivo"
4) Modalità (di un carattere): uno dei diversi modi con cui il carattere si presente nelle unità del
collettivo."
Es.
Età
Sesso
Titolo di studio
Attività
Peso
Giorgio
37
M
Laurea
Occupato
70
Camilla
20
F
Licenza media
Disoccupato
53
Giordana
26
F
Laurea
Occupato
50
Nicolò
23
M
Diploma
Studente
67
Pagina 1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15

Anteprima parziale del testo

Scarica Statistica: nozioni introduttive, distribuzioni statistiche e rappresentazione grafiche - e più Appunti in PDF di Statistica solo su Docsity!

STATISTCA 2018/

Programma:

Nozioni introduttive (Parte 1)

Distribuzione statistiche e rappresentazione i grafiche (Parte 2)

Statistica univariata: (Parte 3, 4, 5,)

  • Media
  • Variabillità
  • Altre caratteristiche di una distribuzione statistica

Numeri indici (Parte 6)

Statistica bivariata:

  • Dipendenza
  • Regressione
  • Correlazione

Probabilità

Inferenza

_______________________________________________________________________________________

PARTE 1

Concetti introduttivi

Rilevazione dei fenomeni statistici:

  • Rilevazione campionarie
  • Questionario e tecniche di somministrazione
  • Fonti statistiche
  • Matrice dei dati

Statistica descrittiva e interferenza statistica

CONCETTI INTRODUTTIVI:

Definizione di statistica: è la disciplina che elabora i principi e le metodologie che presiedono:

- al processo di rilevazione dei dati

- Alla rappresentazione dei dati

- All’interpretazione dei risultati

- Alla generalizzazione delle evidenze osservate

Fasi dell’indagine statistica:

  1. Formulazione del problema, eventualmente sotto forma d’ipotesi

  2. Individuazione dei dati pertinenti

  3. Programmazione della rivelazione dei dati

  4. Analisi dei dati

  5. Interpretazione dei risultati

Statistica nelle attività operative:

- Individuazione dello scopo dell’attività

- Analisi della situazione di partenza

- Esami degli strumenti da utilizzare

- Previsione dei risultati conseguibili

- Decisione finale

I quattro termini fondamentali della statistica :

  1. Collettivo o Popolazione

  2. Unità: caso individuale

UN COLLETTIVO È COMPOSTO DA N UNITÀ STATISTICHE

  1. Carattere: aspetto rilevato sulle unità del collettivo

  2. Modalità (di un carattere): uno dei diversi modi con cui il carattere si presente nelle unità del

collettivo.

Es.

Età Sesso Titolo di studio Attività Peso

Giorgio 37 M Laurea Occupato 70

Camilla 20 F Licenza media Disoccupato 53

Giordana 26 F Laurea Occupato 50

Nicolò 23 M Diploma Studente 67

Giorgio, Camilla, Giordana e Nicolò sono le unità statistiche

{Giorgio, Camilla, Giordana, Nicolò} = collettivo (popolazione)

Età, sesso, titolo di studio, attività, peso sono i caratteri

37, 20, 26, 23 sono le modalità assunte dalle unità del collettivo per il carattere età

Tipi di caratteri:

Caratteri qualitativi (variabili qualitative, mutabili statistiche) - le modalità sono costituite da espressioni

variabili

Sconnessi: le modalità non sono ordinabili

  • Dicotomici
  • Politomici

Ordinati: le modalità ordinabili

  • Rettilinei
  • Ciclici

Caratteri quantitativi (variabili quantitative) - le modalità sono costituite da numeri

Discreti: le modalità sono quantità distinte

Continui: le. Modalità possono assumere tutti i valori di un intervallo di numeri reali

Trasferibili: un’unità può cedere dall’ammontare posseduto del carattere

Misurazione dei caratteri qualitativi:

  • Osservare e registrare le modalità che si presentano nelle singole unità statistiche
  • Le modalità possono essere predefinite a priori o desunte a posteriori

Carattere sconnesso: Scala nominale

Carattere ordinato: Scala ordinale

Misurazione dei caratteri quantitativi:

Discreti: operazione di conteggio

Continui: operazione di misurazione (con approssimazione)

Carattere discreto: scala proporzionale

Carattere continuo: scala ad intervalli, scala proporzionale

RILEVAZIONE DEI FENOMENI STATISTICI:

Come avviene la rivelazione dei dati:

  • Indagine statistica
  • Esperimento
  • Osservazione sul campo

Rivelazioni totali o parziali:

Nell’indagine statistica, distinguiamo tra:

Rivelazione totale (o censura): su tutto il collettivo

Rilevazioni campionaria: su un sottoinsieme estratto dal collettivo detto campione ->

campionamento

Rilevazione campionarie:

La numerosità (dimensione) del campione viene indicata con n (n<<N).

Frazione di campionamento : si definisce frazione campionamento o anche frazione sonda il

rapporto.

Es. se N = 1000 e n = 10

Tecniche di campionamento:

Campionamento non casuale:

  • Campionamento ragionato (o a scelta ragionata): lezione fatta da un team di esperti
  • Campionamento per quota: selezione fatta su sottogruppi omogenei della popolazione
  • Campionamento di convenienza

Campionamento causale (probabilistico):

Le unità sono selezionate con meccanismo casuale (aleatorio) e hanno tutte una probabilità nota e

non nulla di essere selezionate.

Il campionamento probabilistico ha 2 vantaggi:

  1. oggettività nella selezione delle unità

  2. Possibilità di estendere i risultati all’intera popolazione

f =

n

N

f =

Acquisizione delle informazioni:

L’intervista

Tra i metodi di acquisizione di dati uno dei più di︎usi è l'intervista.

  • Intervista telefonica
  • Intervista diretta o personale
  • Intervista postale
  • Intervista Web-Based

Questionario:

Domande (e relative risposte) vengono raccolte in un questionario

  • Successione ordinata di domande
  • Tutte le domande vanno sottoposte in modo identico ad un collettivo di unità statistiche.

Alcune regole per la redazione di un questionario

1- Brevità

2- Chiarezza delle domande

3- Evitare domande orientate

4- Limitare lo sforzo di memoria

5- Le domande riguardanti i dati socio-demografici dell’intervistato dovrebbe essere alla fine del

questionario

Tipi di domande:

  • Domande semplici (una sola risposta)
  • Domande multiple (più risposte)
  • Domande aperte
  • Domande chiuse
  • Domande miste
  • Domande ︎filtro

Alcuni aspetti sulla formulazione di domande chiuse

La scelta del numero di modalità di risposta può in︎fluire sui risultati.

Anche l'ordine di presentazione delle modalità di risposta infl︎uenza i risultati dell'indagine

(polarizzazione delle risposte).

Nella rilevazione di opinioni e/o atteggiamenti si utilizzano delle scale (dette attitudinali).

Tipi di scale attitudinali

SCALA DI LIKERT:

Misura dell'atteggiamento (negativo o positivo), o di accordo rispetto ad una a︎ ermazione

Es. Le prospettive economiche per l'Italia sono incoraggianti

SCALA DEL DIFFERENZIALE SEMANTICO:

Si sceglie il grado di accordo tra due aggettivi tra loro opposti

Es.

Roma è una città:

Caotica ______ Ordinata

Sporca _______ Pulita

Chiusa _______ Accogliente

SCALA DI STAPEL:

Simile alla precedente, ma con riferimento ad un solo aggettivo

Es.

Roma è una città:

  • Ordinata _____
  • Pulita. _____

Accogliente _____

L’ISTAT

  • L’ISTAT (Istituto Nazionale di Statistica) è l'Ente preposto all'acquisizione dei dati tramite

indagini statistiche.

  • E' al vertice del Sistema Statistico Nazionale (Sistan)
  • Eff︎ettua rilevazioni censuarie e campionarie

Es. di rivelazioni campionarie

Per niente

d’accordo

Poco d’accordo Né d’accordo né in

disaccordo

Abbastanza

d’accordo

Totalmente

d’accordo

  • Indagine sulle forze lavoro (e︎ffettuata ogni 3 mesi)
  • Indagine sui consumi delle famiglie

Censimenti permanenti:

  • A partire dal 2018, i censimenti vengono sostituiti dai censimenti permanenti.

https://www.istat.it/it/censimenti-permanenti

  • I censimenti permanenti avranno cadenza annuale, biennale o triennale e riguarderanno un

campione rappresentativo della popolazione di interesse.

  • Sono estesi a tutte le aree tematiche

popolazione e abitazioni

imprese

istituzioni non profi︎t

istituzioni pubbliche

agricoltura

  • Il Censimento permanente della popolazione e delle abitazioni (partito il 1° ottobre 2018)

riguarda un campione di un milione e quattrocentomila famiglie circa.

  • I dati campionari verranno integrati con le fonti amministrative

Altre fonti statistiche

  • Eurostat (U︎fficio Statistico dell'Unione Europea)
  • Banca d'Italia
  • BCE (Banca Centrale Europea)
  • Censis (Centro Studi Investimenti Sociali)

Matrice dei dati:

  • La matrice dei dati raccoglie le informazioni rilevate sulle unità di un collettivo (o di un

campione) su un insieme di caratteri.

  • Ogni riga si riferisce ad una unità
  • Ogni colonna si riferisce ad un carattere

Cod. ID Sesso Stato

civile

Provincia Titolo di

studio

Profession

e

Numero

comp.

famiglia

Reddito

Lordo

Annuo

1 F Nubile RM Laurea Impiegato 1 35000

2 F Nubile FR Diploma Disoccupat

o

3 10000

3 M Coniugato LT Laurea Impiegato 4 40000

4 F Coniugato FR Laurea Libero

professioni

sta

3 90000

5 M Celibe RI Laurea Libero

professioni

sta

1 90000

6 F Coniugato RM Diploma Casalinga 4 15000

7 M Celibe RM Licenza

media

Pensionato 5 30000

8 F Nubile FR Laurea Disoccupat

o

3 20000

9 F Coniugato FR Laurea Libero

professioni

sta

3 50000

10 M Celibe RM Laurea Pensionato 2 70000

Altri esercizi:

Con gli stessi valori dell'esempio precedente, dimostrare che:

N N N

i = 1 i = 1. i = 1

N N

i = 1 i = 1

Regole per l’arrotondamento:

Arrotondare un numero signi︎ca ridurre il numero di cifre decimali (quelle dopo ︎la virgola︎)

Contenuto PARTE 2

Distribuzioni statistiche disaggregate

Distribuzioni di frequenze:

  • Distribuzioni di frequenze per modalità singole
  • Distribuzioni di frequenze per classi di valori
  • Distribuzioni di frequenze cumulate
  • Densità di frequenza

Altre forme di distribuzioni

Rappresentazioni grafiche:

  • Diagramma a torta
  • Diagramma a barre
  • Diagramma cartesiano Istogramma
  • Cartogramma
  • Funzione di ripartizione

DISTRIBUZIONI STATISTICHE DISAGGREGATE:

Definizione: La distribuzione (statistica) semplice disaggregata di un carattere è l'elenco delle

modalità osservate, unità per unità, nel collettivo in esame.

N.B. E' detta anche:

Distribuzione (statistica) semplice untaria

Serie di osservazionI

( ai * bi ) = /

ai *

bi

a

2

i = /(

ai )

2

Valore originaria 1 decimale 2 decimali

12, 422 12,4 12,

11,237 11,2 11,

11,262 11,3 11,

10,251 10,3 10,

10,257 10,3 10,

10,255 10,3 10,

Unità X

u1 x

u2 x

// //

ui xi

// //

uN xN

Es: Distribuzione unitaria semplice di un collettivo in base all’età

Es. Distribuzione unitaria semplice di un collettivo in base al sesso

Distribuzione statistica multipla disaggregata:

Definizione - Pariamo di distribuzione (statistica) multipla consideriamo più caratteri.

N.B. E' detta anche distribuzione (statistica) unitaria multipla

Unità Età

1 45

2 26

3 37

4 37

5 27

6 64

7 37

8 38

9 49

Unità Sesso

1 M

2 M

3 M

4 F

5 M

6 F

7 M

8 F

9 F

Unità X Y Z

u1 x1 y1 z

u2 x2 y2 z

// // // //

ui xi yi Z

// // // //

uN xN yN zN

Dato il carattere X con k modalità (x1,...,xi,...,xk) osservato su n unità statistiche.

Siano n1,... , ni ,... , nk le frequenze assolute delle k modalità.

Distribuzione di frequenze assolu

Dove: k

i = 1

Esempio: Distribuzione degli immatricolati della Facoltà di Scienze Politiche, Sociologia,

Comunicazione per corso di laurea - a.a. 2016-

Distribuzione di frequenze relative:

Indichiamo con

f1 = n1/N, ..., fi = ni/N, ..., fk = nk/N

le frequenze relative (o proporzioni) delle k modalità.

Distribuzione di frequenze relative

dove:

k

0 ≤ fi ≤ 1

i = 1

Distribuzioni di frequenze percentuali:

Indichiamo con

p1 =f1·100,...,pi =fi ·100,...,pk =fk ·100l

e frequenze percentuali delle k modalità.

Distribuzione di frequenze percentuali

X ni

xi n

// //

xi ni

// //

xK nk

N

n 1 +... + ni +... + nk =

ni = N

X f

x

f

1

= n

1

/N

// //

xi

f

i

=n

i

/N

// //

xk

f

k

=n

k

/N

1

f 1 +... + f i +... + f k =

f i = 1

X pi

x

p

1

=f

1

//

xi

p

i

=f

i

Esempio: Distribuzione di un collettivo di famiglie per numero di fi︎gli

Ad esempio, la percentuale di famiglie con 2 ︎gli è pari al 32%

Esempio: Confronto in termini assoluti e relativi

Residenti per titolo di studio in due aree:

A B

___________________________ __________________________

Titolo di studio. ni Titolo di studio. ni

___________________________ __________________________

Licenza elementare. 759 Licenza elementare 95

Licenza media. 1113 Licenza media. 163

Diploma. 2459 Diploma. 181

Laurea. 1669 Laurea 361

___________________________ __________________________

In termini assoluti ci sono molti più laureati in A che in B.

Residenti per titolo di studio in due aree:

A B

________________________________ __________________________________

Titolo di studio. ni fi Titolo di studio. ni. fi

________________________________ __________________________________

Licenza elementare. 759. 0,13 Licenza elementare 95. 0,

Licenza media. 1113. 0,19 Licenza media. 163. 0,

Diploma. 2459. 0,41 Diploma. 181. 0,

Laurea. 1669 0, 28 Laurea 361. 0,

________________________________ __________________________________

In termini relativi è esattamente il contrario.

Dalla distribuzione unitaria alla distribuzione di frequenze per classi di modalità:

Consideriamo un collettivo di 48 aziende sulle quali è stato osservato il numero di addetti:

Possiamo rappresentare la distribuzione in maniera più sintetica: distribuzione di frequenze per

classi di modalità.

//

xk

pk =fk ·

100

X pi

Figli Famiglia fi pi

0 2 0,09 9

1 8 0,36 36

2 7 0,32 32

3 4 0,18 18

4 1 0,05 5

22 1,00 100

Le famiglie con un consumo superiore o uguale a 1000 e inferiore a 3000euro sono il 65% del

totale.

Frequenze assolute cumulate:

Definizione - La frequenza assoluta cumulata di una modalità del carattere misura il numero di

casi che presentano un valore non superiore a quella modalità:

Ni =n1 +n2 +...+ni, i =1,…,k

Distribuzione di frequenze assolute cumulate.

Frequenze relative cumulate

Fi =f1 +f2 +...+fi, i =1,...,k

Distribuzione di frequenze relative cumulate.

Esempio: Distribuzione di un collettivo di famiglie per numero di figli

77 0,26 26

300 1,00 100

Consumo Famiglie fi pi

X ni

x1 n

N

=n

x2 n

N

=n

+n

// //

xi ni

N

i

=n

+...+n

i

// //

xk nk

N

k

= N

X p1 percentuali Pi cumulate

x1 p P 1

= p 1

x2 p P 2

= p 1

  • p 2

// // //

xi pi P i

=p 1

+...+p i

// // //

xk pk P k

Figli Famiglie fi pi Ni Fi Pi

0 2 0,09 2 0,09 9

Le famiglie che hanno fi︎no a 2 ︎figli sono 17 (77 % del totale).

Esempio: Distribuzione di un collettivo di famiglie per classi di consumo mensile

Le famiglie il cui consumo è di almeno 1000euro al mese sono il 78% del totale.

Ampiezza e densità di frequenza di una classe:

Sia data una generica classe di estremi ci−1 e ci.

Ampiezza della classe: di =ci −ci− 1

Densità di frequenza:

[ni = frequenza assoluta nella classe

di = ampiezza della classe]

La densità di frequenza sono sempre confrontabili tra le classi.

Esempio: Distribuzione degli addetti di un'azienda per classi di età

N.B.

La classe con la frequenza più alta non coincide necessariamente con quella. On la densità di

frequenza più alta.

ALTRE FORME DI DISTRIBUZIONE:

Distribuzione di quantità:

1 8 0,36 10 0,45 45

2 7 0,32 17 0,77 77

3 4 0,18 21 0,95 95

4 1 0,05 22 1,00 100

22 1,00 100

Figli Famiglie fi pi Ni Fi Pi

Consumo Famiglie fi pi Ni Fi Pi

77 0,26 26 261 0,87 87

39 0,13 13 300 1,00 100

300 1,00 100

hi =

ni

di

Classi ni di hi

25 7 3,

20 5 4,

21 10 2,

33 14 2,

120

Definizione - Si parla di serie territoriali (geogra︎fiche o spaziali) quando le modalità rappresentano

entità territoriali ossia rappresentano ad esempio nazioni, regioni, ripartizioni geografi︎che, città,

etc.

Esempio: Popolazione residente in Italia nel 2017, per area geografi︎ca (in migliaia)

RAPPRESENTAZIONE GRAFICHE:

La rappresentazione grafi︎ca di una distribuzione statistica può essere più informativa della

distribuzione stessa

Il tipo di gra︎fico deve essere scelto in base:

  • al tipo di distribuzione
  • al tipo di carattere

Il diagramma a torta (pie chart):

Utilizzo principale

Distribuzione di frequenze:

  • caratteri qualitativi sconnessi
  • serie territoriale

Le “fette della torta” sono calcolate in base alla seguente formula:

ai◦ = 360° x ni = 360° x fi

N

N: numerosità della popolazione

ni: frequenza della i-ma modalità

fi: frequenza relativa della i-ma modalità

a◦: angolo della ︎fetta︎ della i-ma modalità

[Esempio: Popolazione residente in Italia nel 2017, per area geografi︎ca (in migliaia)]

Diagramma a barre:

Utilizzo principale:

Distribuzione di frequenze:

  • caratteri qualitativi (sconnessi o ordinati)
  • caratteri quantitativi discreti
  • serie storica
  • serie territoriale

L'altezza di ciascuna barra è proporzionale alla frequenza della modalità corrispondente.

[Esempio 1 - 2: Spettatori per tipo di evento nel 2017 (in migliaia)]

[Esempio: Distribuzione degli immatricolati della Facoltà di Scienze Politiche, Sociologia,

Comunicazione per corso di laurea - a.a. 2016-17]

[Esempio: Famiglie per numero di ︎figli]

Diagramma cartesiano:

Utilizzo principale:

Distribuzione di frequenza:

  • caratteri quantitativi discreti
  • serie storica

Osservazione: I punti sul piano possono essere uniti da una spezzata, per evidenziare

l'andamento del fenomeno.

Area Popolazione

Nord - ovest 16104

Nord - est 11637

Centro 12068

Mezzogiorno 20781

Isole 6710

[Esempio: Appartamenti per numero di stanze]

[Esempio: Popolazione residente in Italia (in migliaia)]

[Esempio: Percentuale di canzoni di successo di durata inferiore a 2 minuti e mezzo]

Istogramma:

Impiego: Distribuzioni di frequenze per classi di valori di un carattere quantitativo

L'istogramma è composto da rettangoli adiacenti, la cui area è data dalla seguente formula:

base × altezza = ampiezza della classe × densità di frequenza =

di · hi = di · ni = ni = Area

di

[Esempio: Temperature medie / Classi della stessa ampiezza]

[Esempio: Temperature / Classi di ampiezza differente]

Cartogramma:

I cartogrammi sono particolari rappresentazioni grafi︎che per serie territoriali.

[Esempio: Parità di potere di acquisto in Europa (2018)]

Funzione di ripartizione per caratteri quantitativi discreti

Definizione:

Dato un carattere quantitativo discreto X con k modalità, osservato su un collettivo di N unità, la

funzione di ripartizione F(x) è così defi︎nita:

( 0, per x < x

F(x) = { Fi, per xi ≤ x < xi+1 (i=1,…,k−1)

( 1, per x ≥ xk

dove Fi è la frequenza relativa cumulata per la modalità i-ma

[Esempio: Famiglie per numero di ︎figli]

Funzione di ripartizione per caratteri quantitativi continui:

Definizione: Dato un carattere quantitativo continuo X con modalità raggruppate in k classi,

osservato su un collettivo di N unità, la funzione di ripartizione F(x) è così defi︎nita:

( 0, per x < c

F(x) = { Fi-1 +. fi/di (ci - 1) per c ≤ x < c (i=1,…,k)

( 1, per per x ≥ ck

dove Fi−1 è la frequenza relativa cumulata per la classe i − 1.

[Esempio: Quotazioni di titoli azionari]

PARTE 3

Medie analitiche

  • Media aritmetica
  • Proprietà della media aritmetica
  • Media quadratica
  • Media armonica
  • Media geometrica

Media aritmetica per distribuzione di frequenze

Medie lasche

  • La mediana
  • Proprietà della mediana
  • La mediana per distribuzioni di frequenze
  • Quartili
  • I quartili per distribuzioni di frequenze
  • Valore centrale
  • Moda

Motivazioni:

Sintesi della distribuzione di un carattere attraverso una modalità ︎”tipica”︎ con l'obiettivo di:

  1. Equiripartizione -

i = 1

La media aritmetica è la quantità che, se sostituita a ciascuna modalità osservata nel carattere, ne

lascia invariata la somma.

Esempio:

Riprendendo l'esempio precedente: 4 + 3 + 5 + 4 + 2 + 3 = 21 = 6 · 3,

n

  1. La somma algebrica degli scarti dalla media aritmetica è nulla:

i = 1

Esempio:

Riprendendo l'esempio precedente

  1. La somma algebrica degli scarti dalla media aritmetica al quadrato è minima.

n n

i=1 c i=

Esempio:

Per esercizio: sostituire a μ = 3,5 un valore qualsiasi (ad esempio, c=4) e confrontare il risultato

con quello della tabella.

  1. Linearità della media

xi = Nμ

( xi − μ ) = 0

Studente Libri xi - μ

1 4 0,

2 3 -0,

3 5 1,

4 4 0,

5 2 -1,

6 3 -0,

21 0,

( xi − μ )

2

= min

( xi − c )

2

Studente Libri xi − μ

(xi− μ)

1 4 0,5 0,

2 3 -0,5 0,

3 5 1,5 2,

4 4 0,5 0,

5 2 -1,5 2,

6 3 -0.5 0,

21 0,0 5,

Se si trasformano i termini x1,x2,...,xN secondo la funzione:

yi = a + bxi i=1,2,...,N (a e b costanti qualsiasi)

allora:

μY =a+bμX

Esempio:

  • 5 turisti italiani fanno un prelievo da un bancomat all'aeroporto di Fiumicino, prima di partire per

New York.

  • Le somme prelevate sono le seguenti:

Una volta arrivati a destinazione, cambiano gli euro in dollari.

1 - Qual è la media dei prelievi in euro?

2 - Tenuto conto della commissione di 2 dollari per l'operazione e del fatto che il cambio è di 1,2$

per euro, qual è la media in dollari?

  • La media dei prelievi in euro è

μe = 116

  • Per il calcolo della media in dollari, abbiamo due alternative:

(I) Potremmo trasformare tutti i valori secondo la funzione:

y =-2+1,2·x

ottenendo

e poi calcolare la media di questi valori (μ$ = 137,2)

(II) In maniera più diretta, applichiamo alla media la formula vista prima:

μ$ = -2+1,2·μe = 137,

Per esercizio, controllare i calcoli.

  1. Associatività della media:

Dato un collettivo statistico di N unità suddiviso in L sottoinsiemi disgiunti di numerosità

L

N(1),N(2),…,N(L)

l=

E media aritmetiche:

μ1,μ2,…,μL

la media aritmetica del collettivo può essere calcolata con la seguente formula:

(μ1 ·N(1) +μ2 ·N(2) +...+μL ·N(L))

Esempio:

  • La media del reddito è di 2000 euro.
  • Il reddito medio delle 2 donne è 1650 euro, quello dei 4 uomini è 2175.

La media del reddito può essere calcolata in questo modo:

N

(

l ) = N )

N

Sesso Reddito

F 1500

F 1800

M 1500

M 2400

M 3200

M 1600

Tot. 12000

N

F

F

+ N

M

M

N