Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Formule statistica base, Schemi e mappe concettuali di Statistica Sociale

Riassunto formule statistica per esame terzo anno

Tipologia: Schemi e mappe concettuali

2021/2022

Caricato il 06/04/2022

sara-rovaris-1
sara-rovaris-1 🇮🇹

4.7

(3)

1 documento

1 / 10

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
DISTRIBUZIONE DI FREQUENZE sul singolo valore
Nome
Definizione
Caratteristiche
Come si calcola?
Esempio
FREQUENZA ASSOLUTA
Data una modalità,
è il numero di volte in cui
essa è presente nel collettivo.
La somma di tutte le
frequenze assolute di ogni
modalità di carattere, mi da il
numero totale del collettivo.
Variabili quantitative
(discreto, continuo)
Variabili qualitative
(ordinabili, sconnesse)
Non mi permette di
confrontare valori tra
insiemi di dati diversi,
perché non hanno una base
comune
Conto quante volte è presente
quella modalità.
Sesso
Femmine
Maschi
Femmine
Femmine
Maschi
frequ. assoluta maschi = 2
freq. assoluta femmine = 3
FREQUENZA RELATIVA
È il rapporto tra la frequenza
assoluta e il collettivo
La somma di tutte le
frequenze relative di un
insieme di dati è sempre 1,
perché tutti i valori sono
compresi tra 0 e 1.
Frequenza assoluta
tutti gli elementi del mio
insieme di dati, collettivo
Frequ. relativa maschi = 2:5 = 0,4
Freq. relativa femmine = 3:5 = 0,6
0,4+0,6= 1
FREQUENZA PERCENTUALE
È la frequenza relativa
espressa in percentuale
La somma di tutte le
frequenze percentuali di un
insieme di dati è sempre
100
Frequenza relativa x 100
Freq. percentuale maschi
= 0,4 x 100 = 40
Freq. percentuale femmine
= 0,6 x 100 = 60
40+60= 100
pf3
pf4
pf5
pf8
pf9
pfa

Anteprima parziale del testo

Scarica Formule statistica base e più Schemi e mappe concettuali in PDF di Statistica Sociale solo su Docsity!

DISTRIBUZIONE DI FREQUENZE sul singolo valore

Nome Definizione Caratteristiche Come si calcola? Esempio FREQUENZA ASSOLUTA Data una modalità, è il numero di volte in cui essa è presente nel collettivo. La somma di tutte le frequenze assolute di ogni modalità di carattere, mi da il numero totale del collettivo. Variabili quantitative (discreto, continuo) Variabili qualitative (ordinabili, sconnesse) Non mi permette di confrontare valori tra insiemi di dati diversi, perché non hanno una base comune Conto quante volte è presente quella modalità. Sesso Femmine Maschi Femmine Femmine Maschi frequ. assoluta maschi = 2 freq. assoluta femmine = 3 FREQUENZA RELATIVA È il rapporto tra la frequenza assoluta e il collettivo La somma di tutte le frequenze relative di un insieme di dati è sempre 1, perché tutti i valori sono compresi tra 0 e 1. Frequenza assoluta tutti gli elementi del mio insieme di dati, collettivo Frequ. relativa maschi = 2:5 = 0, Freq. relativa femmine = 3:5 = 0, 0,4+0,6= 1 FREQUENZA PERCENTUALE È la frequenza relativa espressa in percentuale La somma di tutte le frequenze percentuali di un insieme di dati è sempre 100 Frequenza relativa x 100 Freq. percentuale maschi = 0,4 x 100 = 40 Freq. percentuale femmine = 0,6 x 100 = 60 40+60= 100

FREQUENZE ASSOLUTE e raggruppamenti in classi

Nome Definizione Caratteristiche Come si calcola? Esempio SCELTA ARBITRARIA DELLE CLASSI Scelgo la classe in modo convenzionale In base al tipo di analisi che sto effettuando e dal tipo di descrizione del fenomeno che voglio dare Divido le classi secondo un metodo convenzionale Divido le classi per fascia d’età: 5 - 10 11 - 15 16 - 20 … CLASSI DI PARI AMPIEZZA È la differenza tra l’estremo superiore e inferiore, diviso il numero delle classi che prendo in considerazione Variabili quantitative ordinabili Non posso avere lo stesso valore in più classi (es. 90-100, 101-120, 121 - 130…)

  1. Ordino le modalità in modo crescente
  2. Individuo gli estremi inferiori e superiori (valore più piccolo e valore più grande)
  3. Calcolo la differenza tra i due estremi, trovando il range di variazione
  4. Scelgo il numero di classi che considero
  5. Per identificare ogni classe devo sommare l’estremo inferiore + l’ampiezza della classe. Ampiezza della classe = range N di classi CLASSI DI UGUALE NUMEROSITA’ Collettivo N di unità per classi
  6. Ordino in modo crescente le modalità
  7. Scelgo quante persone mettere in ogni classe (unità per classe)
  8. Calcolo il numero delle classi

MISURE SINTETICHE DI UNA DISTRIBUZIONE: MEDIE ANALITICHE

Nome Definizione Caratteristiche Come si calcola? Esempio MEDIA è un singolo valore numerico che descrive sinteticamente un insieme di dati.

  • Si calcola solo su dati quantitativi
  • Considero nella media tutti i termini del mio insieme di dati
  • È sensibile alla variazione dei dati: se cambia anche solo 1 dei valori del mio collettivo, di conseguenza cambia anche il valore della media
  • È il valore che sostituito alle unità della mia variabile, il totale del mio collettivo non cambia Sommo tutti i valori di ogni unità della mia variabile Numero di unità del collettivo Dati 1 2 3 Collettivo = 6 Media = 6:3 = 2 2+2+2 = 6 MEDIA ARITMETICA Se la variabile è divisa in classi - > la media viene approssimata, ovvero prendo in considerazione il valore centrale Svantaggio - > considera tutti i valori del mio insieme di dati, compresi eventuali valori anomali: outlier Sommo tutti i valori di ogni unità della mia variabile Numero di unità del collettivo Età freq assoluta 0 - 10 2 11 - 20 3 21 - 30 4 Media approssimata 0 - 10 - > 5 - > 5x2 = 10 11 - 20 - > 4,5 - > 4,5 x 3 = 13, 21 - 30 - > 25,5 - > 25,5 x 4 = 102 10+13,5+102=125, 125,5 : 9 = 13,94 media aritm. Appr.

MEDIA ARITMETICA

TRONCATA

Media che esclude le eventuali anomalie presenti nel mio insieme di dati Vantaggio - > contiene l’effetto di uno o più outlier presenti nel mio insieme di dati, i valori anomali potrebbero distorcere e infierire sui miei dati La utilizzo solo se sono convinta che siano presenti outlier, altrimenti non ottengo nessun vantaggio e riduco ancora di più il mio insieme di dati

_ - > media troncata 50% / - > media troncata 90% MEDIA GEOMETRICA La utilizzo quando analizzo le variazioni di un fenomeno nel tempo È poco sensibile a valori anomali Si calcola con la radice n- esima del prodotto degli N numeri tra loro.

MEDIANA

È una misura di sintesi che divide esattamente a metà la distribuzione considerata Si calcola su caratteri quantitativi e qualitativi ORDINABILI (no sconnessi) Non è sensibile agli outlier perché la mediana la identifico come valore centrale, quindi i valori anomali non la condizionano Come prima cosa ordino i miei dati in senso crescente, dal più piccolo al più grande. Identifico nel mio insieme di dati il valore che sta nel mezzo, lasciando 50% di valori a destra e il 50% di valori a sinistra (stessa quantità di valori sia a destra sia a sinistra) Quando identifico la MEDIANA: → se la numerosità del collettivo è dispari : (n+1): → se la numerosità del collettivo è pari : (n:2)+ → Se un carattere è suddiviso in classi posso approssimare la mediana sfruttando i valori della frequenza relativa cumulata oppure se ho distribuzioni di frequenza con valori discreti (numeri naturali). In alcuni casi identifico subito la mediana: numerosità dispari Collettivo 3 Mediana = 2 Lascio 1 numero a destra e 1 numero a sinistra In altri casi la mediana non la riesco a identificare subito, per questo devo intervenire: Collettivo 4 Mediana sarà tra 2 e 3 (4:2)+1 = 2+1= Il primo valore che supera 0, perché la mediana è esattamente a metà e le frequenze cumulate non vanno oltre 1. QUARTILI Sono indici che dividono una distribuzione ordinata in 4 parti uguali:

  1. Da 0 a Q
  2. Da Q1 a Q
  3. Da Q2 a Q
  4. Da Q3 a Q Q1 - > lascia alla sua sinistra il 25% dei termini e a destra il 75% Q2 - > coincide con la MEDIANA, dividendo in 2 parti uguali la distribuzione Q3 - > lascia alla sua sinistra il 75% e alla sua destra il 25%

INDICI DI VARIABILITA’ SU CARATTERI QUANTITATIVI

Nome Definizione Caratteristiche Come si calcola? Esempio VARIANZA Mi permette di analizzare quanto sono distribuiti i miei dati rispetto alla media Indice assoluto Ma pur essendo condizionato dalla variabile di partenza, la sua unità di misura è al quadrato (Ogni elemento del mio insieme – media) al quadrato

Varianza 0 DEVIANZA È la somma degli scarti della media Indice assoluto Ma pur essendo condizionato dalla variabile di partenza, la sua unità di misura è al quadrato Radice quadrata della varianza

Devianza 0 DEVIAZIONE STANDARD È la radice quadrata della varianza ❖ È un indice assoluto: ❖ ha la stessa unità di misura della variabile di partenza ❖ non è possibile confrontare insiemi diversi e variabili con unità di misure diverse

Deviazione 0 COEFFICIENTE DI VARIAZIONE Indice di variabilità relativa - > il coefficiente di variazione è un numero puro quindi lo posso confrontare con variabili differenti e insiemi diversi Deviazione standard │media│

INDICI DI MUTABILITA’ SU CARATTERI QUALITATIVI

=sono indici che mi permettono di sintetizzare in termini numerici il mio insieme di dati

Nome Definizione Caratteristiche Come si calcola? Esempio OMOGENEITA’ Si definisce partendo dalle frequenze relative Il risultato dipende dal numero di modalità del carattere:

  • aumenta se le frequenze hanno poche modalità
  • il valore è massimo quando: una solo modalità ha frequenza relativa = 1 e tutte le altre modalità = 0 Sommo tutte le frequenze relative, di tutte le modalità, al quadrato. INDICE DI OMOGENEITA’ RELATIVO Mi permette di ottenere un indice che posso confrontare con variabili distinte
  • quando tutti i casi si trovano nella stessa categoria = 1
  • quando tutte le modalità hanno uguale frequenza = 0 ENTROPIA = ETEROGENEITA’ Misura l’eterogeneità ≠ Omogeneità Assume valore 0 nel caso di massima omogeneità