






Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Questo formulario contiene tutte principali formule di statistica con la relativa definizione.
Tipologia: Schemi e mappe concettuali
1 / 12
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!







VARIABILE= è una caratteristica d’interesse viene rilevata/misurata/osservata. [anche chiamata CARATTERE] MODALITA’= manifestazioni della variabile, possono essere numeriche o non numeriche. UNITA’ STATISTICA= è l’unità elementare su cui vengono osservati i caratteri. Semplice= sono le singole unità, il singolo individuo… Composta= determinata da un aggregato di più unità semplici legate tra loro da un elemento distintivo. Multipla= sono più unità semplici legate tra loro da uno o più vincoli. FENOMENO COLLETTIVO= è l’aspetto particolare che si studia del collettivo statistico. COLLETTIVO STATISTICO= insieme degli elementi oggetto di studio, ovvero l’insieme delle unità statistiche sulle quali viene effettuata la rilevazione delle modalità con le quali il fenomeno studiato si presenta. A seconda del tipo di MODALITA’ le VARIABILI possono essere: a) QUANTITATIVE= esprimibili mediante numeri riferiti ad una unità di misura. (sono misurabili) Discrete: assumono un numero limitato o numerabile di valori che hanno corrispondenza biunivoca con i numeri interi. Continue: assumono un numero illimitato di valori che hanno corrispondenza biunivoco con i numeri reali. b) QUALITATIVE= esprimibili mediante attributi. (non sono misurabili) Ordinali: ordine naturale di successione. o Rettilinei: con una modalità iniziale e una modalità finale. o Ciclici: ordinabili secondo un ordine chiuso, hanno cioè un ordine che riporta il carattere a manifestarsi sempre nello stesso modo con la stessa sequenza. Sconnesse: nessun ordine tra le modalità. Dicotomici: sono i caratteri che hanno solo due modalità. Geografici: sono quei caratteri che attengono ad un aspetto territoriale a cui va riferirsi il fenomeno oggetto dell’osservazione. FREQUENZA= numero di volte in cui si presenta ciascuna modalità assunta da una variabile. [partendo dai dati raccolti conteggiando quante volte si verifica ogni modalità si arriva alla tabella di frequenza] Le frequenze ASSOLUTE (=numero di volte che ciascuna modalità si presenta nella popolazione osservata) non sono confrontabili con altre frequenze assolute registrate in un collettivo statistico differente. I confronti si possono fare tra frequenze RELATIVE o tra frequenze PERCENTUALI.
INTENSITA’= va a qualificare il carattere nella valutazione che esprime la modalità; esprime l’ammontare di un carattere, cioè, ci dà la misura della modalità del carattere. N= numero totale di unità statistiche
RAPPORTO STATISTICO= è un quoziente tra frequenze (numero delle osservazioni) o intensità di due fenomeni. Almeno una delle due grandezze e di natura statistica, ossia riferita ad un fenomeno collettivo. Tra le grandezze vi è una relazione logica.
y (^) t y (^0) ci dice quanta parte dell’intensità del fenomeno compete in media ad ogni unità di intensità del denominatore. Senza l’impiego dei rapporti statistici, il confronto tra i valori assoluti di due o più caratteri può portare a conclusioni non corrette e non significative. RAPPORTI DI DERIVAZIONE= si usano per confrontare fenomeni che sono uno il presupposto dell’altro. Ossia, sono dati dal rapporto fra due fenomeni di cui quello al denominatore rappresenta il presupposto per il manifestarsi dell’altro (al numeratore). Si distinguono in: rapporti generici e rapporti specifici, a seconda che il fenomeno posto al denominatore possa considerarsi un presupposto generico o un presupposto specifico. QUOZIENTI DEMOGRAFICI
RAPPORTI DI DURATA= esprime la durata media di permanenza nel collettivo di quelle che sono le unità elementari che vanno a costituire il fenomeno oggetto della nostra osservazione. Si va quindi a costituire il rapporto tra la consistenza dell’unità in un determinato intervallo di tempo e lo mettiamo in relazione a quello che è il flusso in entrata e in uscita del collettivo.
(^ C^0 +^ C^1 )
NUMERI INDICE O RAPPORTI INDICI= pongono a confronto le intensità o le frequenze di uno stesso fenomeno in tempi diversi o in luoghi diversi. Possiamo quindi avere: a) Numeri indice temporali b) Numeri indice territoriali Il termine con il quale vengono messi a rapporto (denominatore) si dice base degli indici, che può essere fissa o variabile. [essendo numeri puri è possibile effettuare confronti tra le variazioni di fenomeni diversi] Si distinguono in: E= unità entrate nel collettivo. U= unità uscite dal collettivo. Cm= consistenza media.
n √∏ i = 1 s
n (^) i MEDIA ARMONICA Si utilizza in tutti quei problemi che richiedono la proporzionalità inversa a quelli che sono i singoli termini della distribuzione. La media armonica è quindi di tipo inverso (sostanzialmente è la media aritmetica al contrario. -Media armonica semplice
∑ i = 1 N
-Media armonica ponderata
∑ l˙ = 1
i
Considera l’elevazione a potenza di quelli che sono i valori della distribuzione (chiamata anche quadratica se l’indice della potenza è 2). -Media quadratica semplice
t √ ∑ i = 1 N
t
2 √ ∑ i = 1 N
2
-Media quadratica ponderata
t √ ∑ i = 1 s
t
2 √ ∑ i = 1 s
2
MEDIE LASCHE= sono quei valori medi che si basano solo su alcuni valori della intera distribuzione ordinati dal più piccolo al più grande. I principali tipi di medie lasche sono:
Risente dell’influenza dell’inclusione o meno di valori eccezionalmente bassi o alti. Il V.C. va sempre calcolato quando trattiamo v.s. divise per intervalli e viene utilizzato quale modalità in tutte le formule che riguardano i caratteri quantitativi continui.
( N + 1 2 ) b) N Pari: il valore è uguale alla media aritmetica dei due termini che occupano la posizione centrale nella distribuzione dei valori.
( N 2 )
( N 2 +^1 )
c) Divisa in intervalli: non importa la numerosità del collettivo. Si calcola
e lo si confronta con la frequenza accumulata:
n (^) i ( N
)
sopra si trovano i 3/4 dei valori della X.
al di sopra 1/4.
del carattere si accentra la distribuzione; i secondi indicano l’attitudine di un carattere
DEVIANZA= esprime il quadrato del valore delle variazioni tra ciascun termine della distribuzione e il valore medio. È il numeratore della varianza. -Nel caso di una serie di valori Dⅇv ( x )=∑ i = 1 N (^ x^ i −^ μ^ ) 2 -Nel caso di una distribuzione di valori Dⅇv ( x )=∑ i = 1 N (^ x^ i −^ μ^ ) 2
VARIANZA= si ottiene dividendo per il numero dei casi la somma delle differenze al quadrato (=devianza). È il quadrato dello scarto quadratico medio. -Nel caso di una serie di valori
2
∑ i = 1 N (^ x^ i −^ μ^ ) 2
-Nel caso di una distribuzione di valori
2
∑ i = 1 N (^ x^ i ⋅^ μ^ ) 2
-La formula abbreviata per il calcolo di sigma al quadrato, ossia per il calcolo della varianza
2
∑ i = 1 s
2
2
2
2 SCARTI STANDARDIZZATI= sono dei numeri puri che esprimono lo scarto assoluto in unità di scarto quadratico medio. [lo scarto di ciascun valore rispetto al valore medio fratto lo scarto quadratico medio]
(^ x^ i −^ μ^ )
DIFFERENZA MEDIA= misura la disuguaglianza tra i termini della distribuzione, si
La formula di Gini: misura la disuguaglianza media tra i termini della distribuzione.
∑ i = 1 s ⋅ (^) ∑ h = 1 s |^ x^ i −^ x^ h |^ ⋅^ n^ i ⋅^ n^ h
La formula delle distanze graduali: misura le differenze tra i termini equidistanti dagli estremi.
⋅ (^) ∑ i = 1 N 2 [^ x^ N − i + 1 −^ x^ i ]^ ⋅^ (^ N^ −^2 ⅈ^ +^1 ) -Nel caso ponderato
⋅ (^) ∑ i = 1 s
La formula di De Finetti-Paciello: misura le differenze successive ponderate con il prodotto delle distanze dagli estremi.
⋅ (^) ∑ i = 1 N − 1 [^ x^ i + 1 −^ x^ i ]^ ⋅^ ⅈ^ (^ N^ −^ ⅈ^ ) -Nel caso ponderato
⋅ (^) ∑ i = 1 s − 1 N (^) i ( N ⋅ N (^) i ) ( x (^) i + 1 − x (^) i ) [I precedenti sono indici di variabilità ASSOLUTA sono, cioè, espressi nella stessa unità di misura dei termini della distribuzione; esistono poi gli indici di variabilità RELATIVA che permettono di eseguire il confronto tra la variabilità di distribuzioni differenti.]
il rapporto determinato da un indice di variabilità assoluta rispetto al valore aritmetico della media. VARIABILITA’ RELATIVA AL MASSIMO^ V^ r '
V (^) a Max V (^) a il rapporto determinato da un indice di variabilità assoluta rispetto al valore massimo della variabilità. La variabilità aumenta se gli effetti tendono a concentrarsi sui valori estremi della distribuzione mentre se i valori tendono a concentrarsi su un valore centrale della distribuzione avremo che la distribuzione sarà sotto l’influenza di una causa perturbatrice costante.
e di massimo della distribuzione dei valori.
N
N (^) [ x (^) N − μ (^) ]
N (^) [ μ − x (^1) ]
Massimo dello scarto medio semplice
(^2) [ μ − x (^1) ] [ x (^) N − μ (^) ]
Massimo dello scarto quadratico medio Max σ =√[ μ − x (^1) ] [ x (^) N − μ (^) ] Massimo della differenza media
2 N (^) [ μ − x (^1) ] [ x (^) N − μ (^) ] ( N − 1 ) (^) [ x (^) N − x (^1) ] CONCENTRAZIONE= misura il grado di disuguaglianza del carattere rilevato, tra le unità della popolazione, riscontrando situazioni di massima concentrazione quando il carattere è posseduto soltanto da un soggetto che ne detiene tutto l’ammontare e di equidistribuzione quando il carattere è equamente distribuito tra tutte le unità statistiche del collettivo. p= frequenza assoluta relativa al valore minimo della
q= frequenza assoluta relativa al massimo della distribuzione
Nel caso di una distribuzione di valori:
∑ i = 1 s (^ x^ i −^ μ^ ) 3
3
σ √ 2 π
−( x − μ )^2 2 σ 2
I parametri saranno definiti: N=1 μ=0 σ= DISTRIBUZIONE IPERNORMALE O LEPTOCURTICA= la distribuzione è più alta della curva normale al centro e nelle code mentre risulta più bassa ai fianchi. DISTRIBUZIONE IPONORMALE O PLATICURTICA= la distribuzione è più bassa della curva normale al centro e nelle code mentre risulta più spessa nei fianchi. INDICI DI DISNORMALITA’ Coefficiente di curtosi di Pearson (coefficiente di eccesso): -Nel caso di una serie di valori
∑ l˙ = 1 N (^ x^ i −^ μ^ ) 4
-Nel caso di una distribuzione di valori
∑ l˙ = 1 s (^ x^ i −^ μ^ ) 4
2
RAPPRESENTAZIONE ANALITICA= consiste nel trovare una funzione matematica che possa rappresentare nel modo migliore la distribuzione di un fenomeno osservato. Si va quindi a sostituire ad una curva empirica (quindi alla distribuzione empirica dei valori osservati) una curva teorica che risponde ad una funzione matematica.
¿ = f (^) ( x ; C 0 ; C 1 ; ⋯ ; C (^) h )
¿ = f (^) ( x (^) i ) rappresenta la frequenza teorica del fenomeno in corrispondenza della modalità
¿ = (^) ∫ x (^) i x (^) i + 1
Densità di frequenza (teorica):
¿
normale
ipernormale
METODO DELLE ORDINATE FISSE= vi deve essere una perfetta rispondenza tra quelli che sono i valori empirici e quelli che sono i valori teorici rispetto a quelli che sono i valori che abbiamo individuato come valori passanti e quindi rappresentativi della distribuzione (ossia le coppie di valori non affette da errori).
¿
¿
¿
¿
METODO DEI MINIMI QUADRATI= basato sulla condizione di accostamento tra le frequenze empiriche e quelle teoriche, la condizione necessaria è che sia minima la somma dei quadrati delle differenze tra le due frequenze. (^) ∑ i = 1 s (^ y^ i ¿ − y (^) i ) 2
∑ i = 1 s [^ f^ (^ x^ i ;^ C^0 ;^ C^1 ;^ …^ ;^ C^ h )−^ y^ i ] 2
Funzione retta:
sa + b (^) ∑ i = 1 s x (^) i =∑ i = 1 s y (^) i a (^) ∑ i = 1 s x (^) i + b (^) ∑ i = 1 s x (^) i 2 =∑ i = 1 s x (^) i y (^) i Funzione parabola:
2
2
3
2
3
4
2
GRADO DI ACCOSTAMENTO= dato dalla differenza tra valori empirici e valori teorici; più è ridotta questa differenza, migliore risulterà la scelta di funzione matematica che rappresenta il fenomeno. Indici assoluti di accostamento: si ottengono calcolando la media aritmetica o la media quadratica degli scarti in valore assoluto tra i valori empirici e quelli teorici.
∑ i = 1 s |^ y^ i −^ y^ i ¿ |
2
∑ i = 1 s (^ y^ i −^ y^ i ¿ ) 2
Indici relativi di accostamento.
∑ (^) |y (^) i − y (^) i ¿ |
2
2
∑ (^) ( y (^) i − y (^) i ¿ ) 2
2