Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


slides statistica sociologia, Sintesi del corso di Statistica

riassunto elaborato statistica

Tipologia: Sintesi del corso

2024/2025

Caricato il 12/11/2025

tommaso-menichini-2
tommaso-menichini-2 🇮🇹

1 documento

1 / 110

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Daniela Marella
Nozioni introduttive
1
Statistica
La Statistica è la disciplina che elabora i
principi e le metodologie alla base del
processo di rilevazione e raccolta dei dati,
alla rappresentazione sintetica e alla
interpretazione dei dati stessi.
2
Concetti importanti
unità statistica la singola entità portatrice
del fenomeno che si vuole analizzare.
Collettivo statistico/popolazione insieme
delle unità statistiche.
Carattere statistico caratteristica rilevata
sulle unità statistiche.
modalità il modo di manifestarsi di un
carattere statistico.
3
Terminologia
QUALITATIVI
modalità costituite da
espressioni verbali
modalità costituite da
numeri
Tipi di caratteri
QUANTITATIVI
ORDINABILI SCONNESSI
D I S C R E T I
CONTINUI
Modalità
ordinabili
Modalità non
ordinabili
Modalità:
quantità distinte
assumono valori in
un intervallo di
numeri reali
4
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Anteprima parziale del testo

Scarica slides statistica sociologia e più Sintesi del corso in PDF di Statistica solo su Docsity!

Daniela Marella

Nozioni introduttive

1

Statistica

La Statistica è la disciplina che elabora i

principi e le metodologie alla base del

processo di rilevazione e raccolta dei dati,

alla rappresentazione sintetica e alla

interpretazione dei dati stessi.

2

Concetti importanti

 unità statistica la singola entità portatrice

del fenomeno che si vuole analizzare.

 Collettivo statistico/popolazione insieme

delle unità statistiche.

 Carattere statistico caratteristica rilevata

sulle unità statistiche.

 modalità il modo di manifestarsi di un

carattere statistico.

3

Terminologia

QUALITATIVI modalità costituite da espressioni verbali

modalità costituite da numeri

Tipi di caratteri

QUANTITATIVI

ORDINABILI SCONNESSI^ D I S C R E T I

CONTINUI

Modalità ordinabili

Modalità non ordinabili

Modalità: quantità distinte

assumono valori in un intervallo di numeri reali 4

 Qualitativi sconnessi: Genere, Tipo di

diploma, religione professata;

1. Dicotomici: assumono 2 sole modalità;

Genere: Maschio/Femmina

2. Politomici: assumono un numero finito di

modalità distinte;

Tipo di diploma: liceo/commerciale/

magistrale

5

Esempi

 Qualitativi ordinali: livello di qualifica

(I,F,D), titolo di studio (E,M,D,L);

 Quantitativi discreti: numero di figli,

numero vani abitazione;

 Quantitativi continui: altezza, peso.

6

Esempi

Genesi dei dati statistici

indagini statistiche su popolazioni finite

la rilevazione viene effettuata su tutte le unità del collettivo di riferimento

la rilevazione viene effettuata su di un sottoinsieme della popolazione, detto CAMPIONE

censuarie^ campionarie

7

Vantaggio

estensione all’intera popolazione dei risultati ottenuti dal campione (teoria della probabilità).

8

Campionamento casuale o probabilistico

Metodologia che fornisce le regole per la

selezione del campione assegnando alle unità della

popolazione probabilità non nulle di far parte del

campione.

Matrice dei dati

I dati rilevati per poter essere analizzati vengono raccolti in una tabella denominata matrice dei dati. Nella matrice dei dati:

  • ogni riga rappresenta un’unità statistica;
  • ogni colonna rappresenta una variabile.

Matrice dei dati

Consideriamo una popolazione di N unità. -distribuzione statistica disaggregata (unitaria) di un carattere X è l’insieme delle osservazioni relative alle N unità. La distribuzione disaggregata sarà indicata come x 1 , x 2 , , xN ,

x 1=osservazione relativa all’unità identificata dal numero 1, x 2 =osservazione relativa all’unità identificata dal numero 2 e così via.

Distribuzioni statistiche disaggregate

Quanti dipendenti maschi ci sono?

Dalla tabella risulta evidente la prevalenza dei maschi tra i dipendenti dell’azienda A poiché dei 12 dipendenti 9 sono maschi e 3 sono femmine.

Distribuzioni di frequenze

Distribuzione di frequenze associa a ciascuna modalità del carattere X la rispettiva frequenza. Modalità Frequenza x 1 n 1 x 2 n 2

xk nk Totale N dove n 1 , n 2 , , nk sono le frequenze delle modalità x 1 , x 2 , , xk. nk = numero delle unità statistiche in cui è stata osservata la modalità xk.

Distribuzioni di frequenze

 

 frequenze relative o proporzioni : si ottengono rapportando le frequenze assolute a N. Indicheremo con f 1 , f 2 , , fk tali quantità, essendo

 Frequenze percentuali : si ottengono moltiplicando per 100 le frequenze relative.

Frequenze relative e percentuali

i 1 2 k. N

x n f (^) i i i , , , , numerototalediosservazioni

frequenza dellamodalità    

Frequenze relative e percentuali

La frequenza percentuale della modalità:

  • Femmina è
  • Maschio è

100 25 % 12

(^3)  

100 75 % 12

(^9)  

Frequenze relative e percentuali

La frequenza percentuale :

  1. misura il peso relativo di ciascuna modalità rispetto all’insieme;
  2. può essere interpretata come la frequenza assoluta che la modalità avrebbe qualora la popolazione fosse costituita da 100 unità statistiche invece di N;

Frequenze cumulate (caso discreto)

La percentuale di coloro che sono al massimo funzionari è

Qual è la percentuale di coloro che sono almeno funzionari?

Frequenze cumulate (caso discreto)

Le percentuali cumulate si possono calcolare per tutte le modalità della variabile categoria lavorativa e possono essere riportate nella tabella

Frequenze cumulate (caso discreto)

Notiamo che:

  • la frequenza percentuale cumulata relativa alla prima modalità è sempre uguale alla frequenza percentuale;
  • la frequenza percentuale cumulata relativa all’ultima modalità è sempre uguale a 100.

Consideriamo una distribuzione di frequenze secondo un carattere a modalità ordinabili.  Si chiamano frequenze cumulate le quantità Ni = n 1 + n 2 + + ni , i = 1, 2, , k. Ni = il numero delle unità del collettivo nelle quali il carattere X assume un valore non superiore a xi  Si chiamano frequenze percentuali cumulate

Frequenze cumulate

frequenza cumulata fino a (^100) 100, 1, 2, ,. numero totale di osservazioni

i i i P x^ N i k N

  

Distribuzione di frequenze con modalità raggruppate in classi

Supponiamo di voler calcolare la distribuzione di frequenza della variabile Stipendio

Distribuzione di frequenze con modalità raggruppate in classi A tale scopo è necessario procedere all’aggregazione in classi della variabile. Un criterio adottabile è quello di definire le seguenti classi:

  • Classe 1: 1100 -I 1600 (stipendi bassi);
  • Classe 2: 1600-I 2100 (stipendi medi);
  • Classe 3: 2100-I 2600 (stipendi alti).

La presenza del trattino verticale indica che l’estremo è incluso nel (sotto-)intervallo.

Distribuzione di frequenze con modalità raggruppate in classi

Si suddivide l’intervallo in cui variano i dati in classi (preferibilmente di uguale ampiezza) e si assegna ogni osservazione rilevata alla classe corrispondenza.

Stipendio Freq.Ass 1100 -|1660 6 1600 -|2100 4 2100 -|2600 2 Totale 12

Si chiama distribuzione di frequenze di un carattere X suddiviso in classi lo schema con cui si associa a ciascuna classe la rispettiva frequenza:

Classe Frequenza

c 0 - c 1 n 1

c 1 - c 2 n 2

ck – 1 - ck nk

Totale N

Distribuzione di frequenze con modalità raggruppate in classi

 (^) 

 La densità indica quante sono in media

le unità per ogni unità del carattere.

 Tali rapporti possono essere

confrontati tra loro diversamente dalle

frequenze, che sono confrontabili solo

a patto che le classi abbiamo la stessa

ampiezza.

Densità di frequenza

Quindi:

  • per la prima classe
  • per la seconda classe

Quindi 0.1 e 0.05 indicano quante unità ci

sono in media per ogni intervallo di

lunghezza 1. In rapporto all’ampiezza la

frequenza della prima classe è maggiore.

Densità di frequenza

50 h  (^) 1600 1100 0. 50

h  2600 1600 0.

Lunghezza avambraccio (cm) Frequenza^

Ampiezza della classe

Densità di frequenza 40,5-42,5 5 2 2, 42,5-44,5 17 2 8, 44,5-46,5 25 2 12, 46,5-48,5 35 2 17, 48,5-50,5 32 2 16, 50,5-52,5 20 2 10, 52,5-54,5 6 2 3, Totale 140

Distribuzione di frequenze con modalità

raggruppate in classi

Si chiama distribuzione di quantità lo schema con cui si associa a ogni modalità del carattere X il totale dello stesso o di un altro carattere posseduto dalle unità che presentano quella data modalità di X. Lo schema è presentato di seguito per il caso di modalità non raggruppate (parte sinistra) e per il caso opposto.

Distribuzione di quantità

Distribuzione di quantità con modalità non raggruppate

Distribuzione di quantità con modalità raggruppate Modalità Quantità Modalità Quantità

x 1 t 1 c 0 -c 1 t 1

x 2 t 2 c 1 -c 2 t 2

x k tk c k - 1-c k t k

Totale T Totale T

Distribuzione di quantità

Distribuzione di quantità

 Distr. di quantità in cui alla modalità del carattere N. di vani viene associato il numero totale di vani dell’insieme di appartamenti con quel numero di vani

Distribuzione di frequenze Distribuzione di quantità N.di vani N.di appart. N.di vani Totale N. vani 2 4 2 8 3 12 3 36 4 20 4 80 5 32 5 160 6 9 6 54 7 6 7 42 8 3 8 24 Totale 86 Totale 404

Distribuzione di quantità

 Distr. di quantità in cui a ciascuna classe di superficie è associata la superficie complessiva dei comuni appartenenti alla classe.

Distribuzione di frequenze Distribuzione di quantità Classe di Superficie(km2)

N.Comuni Classe di Superficie (Km2)

Superficie Totale Fino a 30,5 6 Fino a 30,5 135, 30,5-40,5 8 30,5-40,5 284, 40,5-70,5 16 40,5-70,5 851, 70,5-100,5 12 70,5-100,5 992, 100,5-200,5 9 100,5-200,5 1392, 200,5 e oltre 8 200,5 e oltre 2678, Totale 59 Totale 6334,

Una serie storica è una sequenza di valori assunti da una variabile su uno stesso aggregato territoriale in istanti di tempo diversi.

Serie storiche

Le rappresentazioni grafiche hanno lo scopo di

illustrare le distribuzioni di frequenze o di quantità. Presentano diversi vantaggi:  Consentono di visualizzare le caratteristiche delle distribuzioni  Agevolano il confronto tra più distribuzioni  M ettendo in rilievo dati anomali, andamenti, relazioni  Sono un efficace strumento per la divulgazione dei dati.

Rappresentazioni grafiche

 La rappresentazione grafica più idonea per una distribuzione di frequenze secondo un carattere discreto è quella cartesiana

 Sull’asse delle ascisse vengono poste le modalità x 1 , x 2 , , xk , sull’asse delle ordinate le frequenze corrispondenti n 1 , n 2 , , nk

 La rappresentazione grafica va sotto il nome di diagramma ad aste

Caratteri quantitativi discreti

Esempio: laureati per numero di esami

sostenuti nel primo anno di corso

L’uso delle frequenze relative (o percentuali) non altera l’immagine della distribuzione fornita dal grafico.

N. esami Frequenza

0 14 1 41 2 83 3 116 4 56 5 5 Totale 315

Caratteri quantitativi continui

divisi in intervalli

La rappresentazione grafica più appropriata è l’ istogramma che si ottiene ponendo sull’asse delle ascisse gli estremi di classe c 0 , c 1 , …, ck e disegnando per ogni classe (ci – 1 , ci), i = 1, 2, …, k, un rettangolo avente per base il segmento dell’asse delle ascisse di estremi ci – 1 e ci e per altezza la densità di frequenza ni /di.

Istogramma Istogramma: esempio

Lunghezza avambraccio (cm) Frequenza

Ampiezza della classe

Densità di frequenza 40,5-42,5 5 2 2, 42,5-44,5 17 2 8, 44,5-46,5 25 2 12, 46,5-48,5 35 2 17, 48,5-50,5 32 2 16, 50,5-52,5 20 2 10, 52,5-54,5 6 2 3, Totale 140

Distribuzione di frequenze della lunghezza dell’avambraccio

Istogramma per la distribuzione

delle lunghezze dell’avambraccio

I caratteri qualitativi vengono generalmente rappresentate con grafici di tipo areale , in cui alle modalità del carattere si fanno corrispondere figure geometriche (rettangoli, quadrati, settori circolari ecc.) con aree proporzionali alle grandezze da rappresentare (possono essere frequenze o quantità). Le figure geometriche più spesso utilizzate sono i rettangoli ( nastri, colonne, settori circolari).

Caratteri qualitativi

grafico a settori circolari versione bidimensionale

Settori circolari distribuzione dei laureati per scuola frequentata

grafico a settori circolari versione tridimensionale

Settori circolari distribuzione dei laureati per scuola frequentata

Per il calcolo degli angoli che definiscono i quattro settori circolari si utilizzano proporzioni.

Per la modalità Liceo classico l’angolo che definisce il corrispondente settore circolare si otterrà dalla seguente proporzione:

In modo analogo si procederà per le altre tre modalità ottenendo:132.84° (Liceo scientifico), 164.52° (Ist.tec.comm.) e 28.44° (altra scuola).

 : 360 ^ 9.5 :

360 9.5 (^) 34. 100

  

Serie storica degli stranieri iscritti all’ università nel periodo 2010-

Serie storiche

Anno Accademico Stranieri 2010 -2011 62074 2011 -2012 64412 2012 -2013 66781 2013 -2014 68584

Graficamente una serie storica può essere rappresentata collocando sull’asse orizzontale la variabile temporale e sull’asse verticale i valori assunti dalla variabile.

Serie storiche

62074

64412

66781

68584

58000

60000

62000

64000

66000

68000

70000

2010-11 2011-12 2012-13 2013-

Serie storiche

Grafico più appropriato fenomeno movimento

Prime iscrizioni di vetture nuove di fabbrica per tipo di alimentazione (dati in migliaia)

Grafico più efficace mostra l’andamento del fenomeno

Serie territoriali

 si rappresentano spesso mediante i cartogrammi. Si tratta di rappresentazioni della distribuzione geografica di un fenomeno.  Il cartogramma può consentire di evidenziare similarità tra aggregati territoriali adiacenti, consentendo di individuare ad occhio macro-aree omogenee ed eventuali andamenti del fenomeno (es. Nord-Sud, zone costiere-zone interne, ecc.).

cartogramma relativo all’indice di vecchiaia per regione

Daniela Marella

Medie

Statistica

 le medie sono lo strumento con cui si sintetizzano i dati statistici.  l’uso della media consente all’individuo di rappresentarsi mentalmente l’“ ordine di grandezza ” di un fenomeno, di effettuare comparazioni tra le manifestazioni di uno stesso fenomeno in tempi, luoghi o situazioni diverse.

Medie

 La media aritmetica di una distribuzione statistica disaggregata è la somma dei termini x 1 , x 2 , …, x N divisa per N

Media aritmetica

i^.

N

i

N (^) x N N

x x x

    1

1 2 ^1

La media aritmetica presenta le seguenti proprietà:

 Se a e b sono il minimo e il massimo dell’insieme x 1 , x 2 , , xN , la media aritmetica è compresa tra queste due quantità, ossia aμb ( internalità)

Con riferimento all’esempio 1 , notiamo che:

  • la modalità più piccola è 5;
  • la modalità più grande è 10. Quindi per la proprietà di internalità la media aritmetica deve essere compresa tra 5 e 10.

Proprietà della media aritmetica

 La somma algebrica degli scarti dalla media aritmetica è uguale a zero

La differenze vengono denominate scarti.

Proprietà della media aritmetica

1

N i i

x  

^ ^ 

( xi  )

Con riferimento all’ esempio 1 , la media aritmetica. Si può facilmente verificare che gli scarti sono

e la loro somma è pari a zero:

Proprietà della media aritmetica

( 5 6 ) 1 ,( 5 6 ) 1

( 6 6 ) 0 ,( 7 6 ) 1 ,( 10 6 ) 4 ,( 5 6 ) 1 ,( 6 6 ) 0 ,

( 5 6 ) 1 ,( 6 6 ) 0 ,( 7 6 ) 1 ,( 5 6 ) 1 ,( 5 6 ) 1 ,

    

         

         

1

( ) 1 0 1 1 1 0 1 4 1 0 1 1 0

N i i

x  

^ ^   ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ 

La somma degli scarti al quadrato dei valori x 1 , x 2 , , xN da una costante c è minima quando c è uguale alla media aritmetica. Con riferimento all’esempio 1 la somma dei quadrati degli scarti è.

quantità inferiore a quella che si ottiene sostituendo alla media 6 un altro numero qualsiasi.

Proprietà della media aritmetica

2 2 2 2 2 2 2 2 2 2 2 2

( 1) (0) (1) ( 1) ( 1) (0) (1) (4) ( 1) (0) ( 1) ( 1) 24

                 

 Se il singolo termine della distribuzione, xi , viene sottoposto alla trasformazione a + bxi , con a costante qualsiasi e b ≠ 0, la nuova media è legata a quella originaria dalla medesima trasformazione ( linearità)

Esempio: Con riferimento all’esempio 1 la media di X è 6. Se consideriamo la trasformazione yi = 2 + 3xi la media di Y è: 2+3(6)=

Proprietà della media aritmetica

 Se un collettivo statistico di N unità viene suddiviso in L sottoinsiemi disgiunti aventi numerosità N (1), N (2), …, N ( L )^ e medie μ (1), μ (2), …, μ ( L ), allora la media aritmetica del collettivo può essere così calcolata ( proprietà associativa )

Proprietà della media aritmetica

1 ( 1 ) ( 1 ) ( 2 ) ( 2 ) ( L ) ( L )

μ ·N μ ·N μ ·N N

μ   

Esempio 2 : Distribuzione per ripartizione territoriale di 300 famiglie e il corrispondente numero medio di componenti.

Nel Nord-Ovest sono presenti 150 famiglie la cui ampiezza media è pari a 2.

Proprietà della media aritmetica