Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Formulario Statistica, Schemi e mappe concettuali di Statistica

Questo formulario contiene tutte principali formule di statistica con la relativa definizione.

Tipologia: Schemi e mappe concettuali

2023/2024

Caricato il 19/12/2025

valeria-cirsone
valeria-cirsone 🇮🇹

3 documenti

1 / 12

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA 23/24
VARIABILE= è una caratteristica d’interesse viene rilevata/misurata/osservata. [anche
chiamata CARATTERE]
MODALITA’= manifestazioni della variabile, possono essere numeriche o non
numeriche.
UNITA’ STATISTICA= è l’unità elementare su cui vengono osservati i caratteri.
Semplice= sono le singole unità, il singolo individuo…
Composta= determinata da un aggregato di più unità semplici legate tra loro da
un elemento distintivo.
Multipla= sono più unità semplici legate tra loro da uno o più vincoli.
FENOMENO COLLETTIVO= è l’aspetto particolare che si studia del collettivo statistico.
COLLETTIVO STATISTICO= insieme degli elementi oggetto di studio, ovvero l’insieme
delle unità statistiche sulle quali viene effettuata la rilevazione delle modalità con le
quali il fenomeno studiato si presenta.
A seconda del tipo di MODALITA’ le VARIABILI possono essere:
a) QUANTITATIVE= esprimibili mediante numeri riferiti ad una unità di misura.
(sono misurabili)
Discrete: assumono un numero limitato o numerabile di valori che hanno
corrispondenza biunivoca con i numeri interi.
Continue: assumono un numero illimitato di valori che hanno
corrispondenza biunivoco con i numeri reali.
b) QUALITATIVE= esprimibili mediante attributi. (non sono misurabili)
Ordinali: ordine naturale di successione.
oRettilinei: con una modalità iniziale e una modalità finale.
oCiclici: ordinabili secondo un ordine chiuso, hanno cioè un ordine
che riporta il carattere a manifestarsi sempre nello stesso modo
con la stessa sequenza.
Sconnesse: nessun ordine tra le modalità.
Dicotomici: sono i caratteri che hanno solo due modalità.
Geografici: sono quei caratteri che attengono ad un aspetto territoriale a
cui va riferirsi il fenomeno oggetto dell’osservazione.
FREQUENZA= numero di volte in cui si presenta ciascuna modalità assunta da una
variabile. [partendo dai dati raccolti conteggiando quante volte si verifica ogni
modalità si arriva alla tabella di frequenza]
Le frequenze ASSOLUTE (=numero di volte che ciascuna modalità si presenta
nella popolazione osservata) non sono confrontabili con altre frequenze assolute
registrate in un collettivo statistico differente.
I confronti si possono fare tra frequenze RELATIVE o tra frequenze
PERCENTUALI.
frequenza relativa
=
frequenza assoluta
N
frequenza percentuale
=
frequenza relativa
100
INTENSITA’= va a qualificare il carattere nella valutazione che esprime la modalità;
esprime l’ammontare di un carattere, cioè, ci dà la misura della modalità del carattere.
N= numero totale
di unità
statistiche
pf3
pf4
pf5
pf8
pf9
pfa

Anteprima parziale del testo

Scarica Formulario Statistica e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!

STATISTICA 23/

VARIABILE= è una caratteristica d’interesse viene rilevata/misurata/osservata. [anche chiamata CARATTERE]  MODALITA’= manifestazioni della variabile, possono essere numeriche o non numeriche. UNITA’ STATISTICA= è l’unità elementare su cui vengono osservati i caratteri.  Semplice= sono le singole unità, il singolo individuo…  Composta= determinata da un aggregato di più unità semplici legate tra loro da un elemento distintivo.  Multipla= sono più unità semplici legate tra loro da uno o più vincoli. FENOMENO COLLETTIVO= è l’aspetto particolare che si studia del collettivo statistico. COLLETTIVO STATISTICO= insieme degli elementi oggetto di studio, ovvero l’insieme delle unità statistiche sulle quali viene effettuata la rilevazione delle modalità con le quali il fenomeno studiato si presenta. A seconda del tipo di MODALITA’ le VARIABILI possono essere: a) QUANTITATIVE= esprimibili mediante numeri riferiti ad una unità di misura. (sono misurabili)  Discrete: assumono un numero limitato o numerabile di valori che hanno corrispondenza biunivoca con i numeri interi.  Continue: assumono un numero illimitato di valori che hanno corrispondenza biunivoco con i numeri reali. b) QUALITATIVE= esprimibili mediante attributi. (non sono misurabili)  Ordinali: ordine naturale di successione. o Rettilinei: con una modalità iniziale e una modalità finale. o Ciclici: ordinabili secondo un ordine chiuso, hanno cioè un ordine che riporta il carattere a manifestarsi sempre nello stesso modo con la stessa sequenza.  Sconnesse: nessun ordine tra le modalità.  Dicotomici: sono i caratteri che hanno solo due modalità.  Geografici: sono quei caratteri che attengono ad un aspetto territoriale a cui va riferirsi il fenomeno oggetto dell’osservazione. FREQUENZA= numero di volte in cui si presenta ciascuna modalità assunta da una variabile. [partendo dai dati raccolti conteggiando quante volte si verifica ogni modalità si arriva alla tabella di frequenza]  Le frequenze ASSOLUTE (=numero di volte che ciascuna modalità si presenta nella popolazione osservata) non sono confrontabili con altre frequenze assolute registrate in un collettivo statistico differente.  I confronti si possono fare tra frequenze RELATIVE o tra frequenze PERCENTUALI.

frequenza relativa =

frequenza assoluta

N

frequenza percentuale = frequenza relativa ⋅ 100

INTENSITA’= va a qualificare il carattere nella valutazione che esprime la modalità; esprime l’ammontare di un carattere, cioè, ci dà la misura della modalità del carattere. N= numero totale di unità statistiche

RAPPORTO STATISTICO= è un quoziente tra frequenze (numero delle osservazioni) o intensità di due fenomeni.  Almeno una delle due grandezze e di natura statistica, ossia riferita ad un fenomeno collettivo. Tra le grandezze vi è una relazione logica.

R =

y (^) t y (^0) ci dice quanta parte dell’intensità del fenomeno compete in media ad ogni unità di intensità del denominatore.  Senza l’impiego dei rapporti statistici, il confronto tra i valori assoluti di due o più caratteri può portare a conclusioni non corrette e non significative. RAPPORTI DI DERIVAZIONE= si usano per confrontare fenomeni che sono uno il presupposto dell’altro. Ossia, sono dati dal rapporto fra due fenomeni di cui quello al denominatore rappresenta il presupposto per il manifestarsi dell’altro (al numeratore).  Si distinguono in: rapporti generici e rapporti specifici, a seconda che il fenomeno posto al denominatore possa considerarsi un presupposto generico o un presupposto specifico.  QUOZIENTI DEMOGRAFICI

  1. Tasso di natalità:

numero dei nati vivi ( anno )

media della popolazione residente

  1. Tasso di mortalità:

numero dei decessi ( anno )

media della popolazione residente

  1. Tasso di fecondità:

numero di nati vivi da donne ∈ età feconda ( 15 − 49 anni )

popolazione residente famminile ∈ età feconda

RAPPORTI DI DURATA= esprime la durata media di permanenza nel collettivo di quelle che sono le unità elementari che vanno a costituire il fenomeno oggetto della nostra osservazione.  Si va quindi a costituire il rapporto tra la consistenza dell’unità in un determinato intervallo di tempo e lo mettiamo in relazione a quello che è il flusso in entrata e in uscita del collettivo.

D =

C M

( E + U )

C M =

(^ C^0 +^ C^1 )

C 1 = C 0 +( E − U )

NUMERI INDICE O RAPPORTI INDICI= pongono a confronto le intensità o le frequenze di uno stesso fenomeno in tempi diversi o in luoghi diversi.  Possiamo quindi avere: a) Numeri indice temporali b) Numeri indice territoriali  Il termine con il quale vengono messi a rapporto (denominatore) si dice base degli indici, che può essere fissa o variabile. [essendo numeri puri è possibile effettuare confronti tra le variazioni di fenomeni diversi]  Si distinguono in: E= unità entrate nel collettivo. U= unità uscite dal collettivo. Cm= consistenza media.

M g =

n √∏ i = 1 s

x i

n (^) i MEDIA ARMONICA  Si utilizza in tutti quei problemi che richiedono la proporzionalità inversa a quelli che sono i singoli termini della distribuzione.  La media armonica è quindi di tipo inverso (sostanzialmente è la media aritmetica al contrario. -Media armonica semplice

M ar =

N

∑ i = 1 N

x i

-Media armonica ponderata

M ar =

N

∑ l˙ = 1

s n

i

x i

MEDIA DI POTENZE

 Considera l’elevazione a potenza di quelli che sono i valori della distribuzione (chiamata anche quadratica se l’indice della potenza è 2). -Media quadratica semplice

M t =

t √ ∑ i = 1 N

x i

t

N

2 √ ∑ i = 1 N

x i

2

N

-Media quadratica ponderata

M t =

t √ ∑ i = 1 s

x i

t

n i

N

2 √ ∑ i = 1 s

x i

2

n i

N

MEDIE LASCHE= sono quei valori medi che si basano solo su alcuni valori della intera distribuzione ordinati dal più piccolo al più grande.  I principali tipi di medie lasche sono:

  1. Valore centrale (V.C.) Esprime il centro di variazione della variabile statistica, si calcola facendo la semisomma dei valori estremi di un collettivo, dopo aver ordinato le osservazioni in ordine non decrescente (il primo valore della classe+ l’ultimo valore della classe/2)

V. C .=

x i + x N

Risente dell’influenza dell’inclusione o meno di valori eccezionalmente bassi o alti. Il V.C. va sempre calcolato quando trattiamo v.s. divise per intervalli e viene utilizzato quale modalità in tutte le formule che riguardano i caratteri quantitativi continui.

  1. Mediana Valore che bipartisce la graduatoria, lasciando un ugual numero di termini da una parte e dall’altra. Ci sono due casi: a) N dispari: il valore coincide con il valore che occupa la posizione centrale nella distribuzione.

M e = X

( N + 1 2 ) b) N Pari: il valore è uguale alla media aritmetica dei due termini che occupano la posizione centrale nella distribuzione dei valori.

M e =

X

( N 2 )

+ X

( N 2 +^1 )

c) Divisa in intervalli: non importa la numerosità del collettivo. Si calcola

N

e lo si confronta con la frequenza accumulata:

N

≤ N i , si individua così

la classe mediana^ x^ i Ͱ^ x^ i +^1

M e = x i +

x i + 1 − x i

n (^) i ( N

− N i − 1

)

  1. Quartili Sono degli indicatori di posizione, cioè, vanno a dividere la distribuzione dei valori in 4 parti eguali. Ci sono tre quartili:

1)^ Q^1 : è quel valore al di sotto del quale ci sono 1/4 dei valori della X e al di

sopra si trovano i 3/4 dei valori della X.

2)^ Q^2 =^ M^ e

3)^ Q^3 : è quel valore al di sotto del quale si trovano i 3/4 dei valori della X e

al di sopra 1/4.

Tra^ Q^1 e^ Q^3 è compreso il 50% dei casi

  1. Moda Si dice valore normale o valore modale o norma o moda il valore xi che si presenta con la massima frequenza all’interno del collettivo considerato. Se la v.s. è divisa per intervalli si individuerà la classe modale attraverso la frequenza o la densità di frequenza a seconda che le classi abbiano o non la stessa ampiezza. Distribuzioni unimodali: hanno un solo valore modale. Distribuzioni plurimodali: ci sono più valori modali. Distribuzioni simmetriche unimodali: il valore della moda coincide con il valore della mediana e coincide altresì con il valore della media aritmetica. Distribuzioni moderatamente asimmetriche: vi è una leggera asimmetria nei valori della distribuzione, il valore della moda in questo caso è uguale a M 0 ≈ μ − (^3) ( μ − M (^) e ). La mediana in questo caso si trova posizionata nell’ambito della distribuzione a 2/3 dalla moda e ad 1/3 dalla media aritmetica.

INDICI DI POSIZIONE ≠ INDICI DI VARIABILITA’ I primi indicano attorno a quale valore

del carattere si accentra la distribuzione; i secondi indicano l’attitudine di un carattere

DEVIANZA= esprime il quadrato del valore delle variazioni tra ciascun termine della distribuzione e il valore medio.  È il numeratore della varianza. -Nel caso di una serie di valori Dⅇv ( x )=∑ i = 1 N (^ x^ i −^ μ^ ) 2 -Nel caso di una distribuzione di valori Dⅇv ( x )=∑ i = 1 N (^ x^ i −^ μ^ ) 2

⋅ n i

VARIANZA= si ottiene dividendo per il numero dei casi la somma delle differenze al quadrato (=devianza).  È il quadrato dello scarto quadratico medio. -Nel caso di una serie di valori

2

∑ i = 1 N (^ x^ i −^ μ^ ) 2

N

-Nel caso di una distribuzione di valori

2

∑ i = 1 N (^ x^ i ⋅^ μ^ ) 2

⋅ n i

N

-La formula abbreviata per il calcolo di sigma al quadrato, ossia per il calcolo della varianza

2

∑ i = 1 s

x i

2

⋅ n i

N

2

= M q

2

2 SCARTI STANDARDIZZATI= sono dei numeri puri che esprimono lo scarto assoluto in unità di scarto quadratico medio. [lo scarto di ciascun valore rispetto al valore medio fratto lo scarto quadratico medio]

z i =

(^ x^ i −^ μ^ )

DIFFERENZA MEDIA= misura la disuguaglianza tra i termini della distribuzione, si

ottiene come somma dei valori assoluti delle differenze tra ogni valore^ x^ i e tutti gli

altri valori^ x^ h.

 La formula di Gini: misura la disuguaglianza media tra i termini della distribuzione.

∑ i = 1 s ⋅ (^) ∑ h = 1 s |^ x^ i −^ x^ h |^ ⋅^ n^ i ⋅^ n^ h

N ⋅ ( N − 1 )

 La formula delle distanze graduali: misura le differenze tra i termini equidistanti dagli estremi.

N ( N − 1 )

⋅ (^) ∑ i = 1 N 2 [^ x^ N − i + 1 −^ x^ i ]^ ⋅^ (^ N^ −^2 ⅈ^ +^1 ) -Nel caso ponderato

N ( N − 1 )

⋅ (^) ∑ i = 1 s

x i ⋅ n i ⋅ ( N − 2 ⅈ + 1 )

 La formula di De Finetti-Paciello: misura le differenze successive ponderate con il prodotto delle distanze dagli estremi.

N ( N − 1 )

⋅ (^) ∑ i = 1 N − 1 [^ x^ i + 1 −^ x^ i ]^ ⋅^ ⅈ^ (^ N^ −^ ⅈ^ ) -Nel caso ponderato

N ( N − 1 )

⋅ (^) ∑ i = 1 s − 1 N (^) i ( N ⋅ N (^) i ) ( x (^) i + 1 − x (^) i ) [I precedenti sono indici di variabilità ASSOLUTA sono, cioè, espressi nella stessa unità di misura dei termini della distribuzione; esistono poi gli indici di variabilità RELATIVA che permettono di eseguire il confronto tra la variabilità di distribuzioni differenti.]

VARIABILITA’ RELATIVA ALLA MEDIA V r =

V a

il rapporto determinato da un indice di variabilità assoluta rispetto al valore aritmetico della media. VARIABILITA’ RELATIVA AL MASSIMO^ V^ r '

V (^) a Max V (^) a il rapporto determinato da un indice di variabilità assoluta rispetto al valore massimo della variabilità.  La variabilità aumenta se gli effetti tendono a concentrarsi sui valori estremi della distribuzione mentre se i valori tendono a concentrarsi su un valore centrale della distribuzione avremo che la distribuzione sarà sotto l’influenza di una causa perturbatrice costante.

 DISTRIBUZIONE MASSIMANTE= le N quantità sono concentrate nei valori x i e

x N che rappresenteranno i valori di minimo

e di massimo della distribuzione dei valori.

x 1 p + x N ( N − p )

N

p =

N (^) [ x (^) N − μ (^) ]

x N − x 1

q =

N (^) [ μ − x (^1) ]

x N − x 1

 Massimo dello scarto medio semplice

Max δ =

(^2) [ μ − x (^1) ] [ x (^) N − μ (^) ]

x N − x 1

 Massimo dello scarto quadratico medio Max σ =√[ μ − x (^1) ] [ x (^) N − μ (^) ]  Massimo della differenza media

Max Δ =

2 N (^) [ μ − x (^1) ] [ x (^) N − μ (^) ] ( N − 1 ) (^) [ x (^) N − x (^1) ] CONCENTRAZIONE= misura il grado di disuguaglianza del carattere rilevato, tra le unità della popolazione, riscontrando situazioni di massima concentrazione quando il carattere è posseduto soltanto da un soggetto che ne detiene tutto l’ammontare e di equidistribuzione quando il carattere è equamente distribuito tra tutte le unità statistiche del collettivo. p= frequenza assoluta relativa al valore minimo della

distribuzione x i

q= frequenza assoluta relativa al massimo della distribuzione

 Nel caso di una distribuzione di valori:

∑ i = 1 s (^ x^ i −^ μ^ ) 3

⋅ n i

N ⋅ σ

3

ESPRESSIONE ALGEBRICA DELLA CURVA NORMALE y =^ N

σ √ 2 π

−( x − μ )^2 2 σ 2

 Operiamo la standardizzazione della variabile z =

x − μ

I parametri saranno definiti: N=1 μ=0 σ= DISTRIBUZIONE IPERNORMALE O LEPTOCURTICA= la distribuzione è più alta della curva normale al centro e nelle code mentre risulta più bassa ai fianchi. DISTRIBUZIONE IPONORMALE O PLATICURTICA= la distribuzione è più bassa della curva normale al centro e nelle code mentre risulta più spessa nei fianchi. INDICI DI DISNORMALITA’  Coefficiente di curtosi di Pearson (coefficiente di eccesso): -Nel caso di una serie di valori

∑ l˙ = 1 N (^ x^ i −^ μ^ ) 4

N × σ

4 −^3

-Nel caso di una distribuzione di valori

∑ l˙ = 1 s (^ x^ i −^ μ^ ) 4

⋅ n i

N ⋅ σ

4 −^3

 Indice di disnormalità di Gini^ I^ =^

2

2 −^ π

RAPPRESENTAZIONE ANALITICA= consiste nel trovare una funzione matematica che possa rappresentare nel modo migliore la distribuzione di un fenomeno osservato.  Si va quindi a sostituire ad una curva empirica (quindi alla distribuzione empirica dei valori osservati) una curva teorica che risponde ad una funzione matematica.

y

¿ = f (^) ( x ; C 0 ; C 1 ; ; C (^) h )

 Se la funzione è data per singoli valori discreti la funzione^ y^

¿ = f (^) ( x (^) i ) rappresenta la frequenza teorica del fenomeno in corrispondenza della modalità

x i

 Se la distribuzione è divisa in classi di valori l’area sotto la curva tra x i ⅇ x i + 1

rappresenta la frequenza teorica della classe x i − x i + 1 :

y i

¿ = (^) ∫ x (^) i x (^) i + 1

f ( x ) ⅆx

 Densità di frequenza (teorica):

y i

¿

ⅆx

= f ( x )

I ⅇ γ 2 = 0  distribuzione

normale

I ⅇ γ 2 > 0  distribuzione

ipernormale

METODO DELLE ORDINATE FISSE= vi deve essere una perfetta rispondenza tra quelli che sono i valori empirici e quelli che sono i valori teorici rispetto a quelli che sono i valori che abbiamo individuato come valori passanti e quindi rappresentativi della distribuzione (ossia le coppie di valori non affette da errori). 

y 1 = y 1

¿

y 2 = y 2

¿

y s = y s

¿

y 1 = a + b x 1

y 2 = a + b x 2

^ y^ i

¿

= a + b x i

METODO DEI MINIMI QUADRATI= basato sulla condizione di accostamento tra le frequenze empiriche e quelle teoriche, la condizione necessaria è che sia minima la somma dei quadrati delle differenze tra le due frequenze.  (^) ∑ i = 1 s (^ y^ i ¿ − y (^) i ) 2

= minimo =

∑ i = 1 s [^ f^ (^ x^ i ;^ C^0 ;^ C^1 ;^ …^ ;^ C^ h )−^ y^ i ] 2

= minimo

 Funzione retta:

sa + b (^) ∑ i = 1 s x (^) i =∑ i = 1 s y (^) i a (^) ∑ i = 1 s x (^) i + b (^) ∑ i = 1 s x (^) i 2 =∑ i = 1 s x (^) i y (^) i  Funzione parabola:

sa + bΣ x i + CΣ x i

2

= ∑ y i

a ∑ x i + b ∑ x i

2

+ c ∑ x i

3

= ∑ x i ⋅ y i

aΣ x i

2

+ bΣ x i

3

+ CΣ x i

4

= ∑ x i

2

⋅ y i

GRADO DI ACCOSTAMENTO= dato dalla differenza tra valori empirici e valori teorici; più è ridotta questa differenza, migliore risulterà la scelta di funzione matematica che rappresenta il fenomeno.  Indici assoluti di accostamento: si ottengono calcolando la media aritmetica o la media quadratica degli scarti in valore assoluto tra i valori empirici e quelli teorici. 

∑ i = 1 s |^ y^ i −^ y^ i ¿ |

s

2

∑ i = 1 s (^ y^ i −^ y^ i ¿ ) 2

s

 Indici relativi di accostamento. 

y i

s

∑ (^) |y (^) i − y (^) i ¿ |

∑ y i

2

y i

2

s

∑ (^) ( y (^) i − y (^) i ¿ ) 2

∑ y i

2