Statistica: Media, Disuguaglianza e Associazione tra Variabili | Appunti di Statistica

Tipi di variabile

Variabili (o mutabili) qualitative: sconnessa o ordinale •

Variabili quantitative: discreta o continua •

I valori caratteristici per sintetizzare le distribuzioni di frequenze

a) I valori centrali

I valori centrali sono valori caratteristici che si usano per riassumere le distribuzioni di frequenza •

con un unico valore

1) Moda: è la modalità che presenta la frequenza relativa assoluta più alta ◦

Si può calcolare per tutti i tipi di variabile ‣

2) Mediana: (valore posizionale), bipartisce la distribuzione: è la modalità posseduta ◦

dall’unita’ che occupa il posto centrale in una distribuzione ordinata, per cui metà delle

unità hanno valori uguali o inferiori al valore posseduto dall’unita’ centrale

Si può calcolare per entrambi i tipi di variabile quantitative e per le qualitative ordinate ‣

Si calcola in due modi differenti a seconda che il N numero delle unità sia pari o dispari ‣

3) Media: è la somma dei valori divisi il loro N numero, la media aritmetica è la più usata ◦

Si calcola solo per le variabili quantitative e con operazioni algebriche ‣

Se la distribuzione è divisa in classi, la media si ottiene utilizzando i valori centrali ‣

Proprietà della media: ‣

Presenta sempre la stessa unità di misura dei dati su cui è calcolata •

È sempre un numero compreso tra il valore minimo e il valore massimo delle •

modalità

Sommando gli scarti dalla media avremo sempre 0 (annullamento degli scarti) •

È il valore che sostituito a tutti gli altri ne lascia invariata la somma •

b) I valori di disuguaglianza

I valori di disuguaglianza sono valori caratteristici che si usano per indicare quanto sono diversi i •

casi della distribuzione sulle varie modalità della variabile

I valori di disuguaglianza assumono ◦

valore minimo quando tutti i casi sono uguali e ‣

valore massimo quando ogni caso è diverso dall’altro ‣

Più i valori di disuguaglianza sono alti e meno i valori centrali sono capaci di sintetizzare ◦

adeguatamente la distribuzione

La disuguaglianza viene intesa come dispersione quando: per misurare la ◦

disuguaglianza delle singole modalità rispetto ad un valore centrale, si calcola

determinando gli scostamenti o scarti tra le modalità del carattere e la sua media

La disuguaglianza viene intesa come variabilità quando: fra tutte le modalità considerate ◦

due a due (ovvero la disuguaglianza reciproca), si calcola determinando le differenze medie

N.B.

Indici assoluti: possono assumere qualsiasi valore minimo e massimo, sono espressi nella •

stessa dimensione o unita’ della variabile, ciò rende difficile confrontarli

Indici relativi (indici normalizzati): assumono valori espressi da un minimo di 0 ad un •

massimo di 1, essendo espressi da un numero “privo di dimensione” permettono il confronto tra

distribuzioni diverse

Il campo di variazione (o range): e’ un indice assoluto di variabilità •

Statistica: Media, Disuguaglianza e Associazione tra Variabili, Appunti di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica Statistica: Media, Disuguaglianza e Associazione tra Variabili e più Appunti in PDF di Statistica solo su Docsity!

Tipi di variabile

I valori caratteristici per sintetizzare le distribuzioni di frequenze

a) I valori centrali

◦ 1) Moda : è la modalità che presenta la frequenza relativa assoluta più alta

◦ 2) Mediana : (valore posizionale), bipartisce la distribuzione: è la modalità posseduta

◦ 3) Media : è la somma dei valori divisi il loro N numero, la media aritmetica è la più usata

b) I valori di disuguaglianza

◦ La disuguaglianza viene intesa come dispersione quando: per misurare la

◦ La disuguaglianza viene intesa come variabilità quando: fra tutte le modalità considerate

• Indici assoluti : possono assumere qualsiasi valore minimo e massimo, sono espressi nella

• Indici relativi (indici normalizzati): assumono valori espressi da un minimo di 0 ad un

• Il campo di variazione (o range): e’ un indice assoluto di variabilità

• Gli scostamenti medi : scostamento medio dalla media aritmetica o dalla mediana, il

• La varianza : è una misura di dispersione di un insieme di dati o di una distribuzione di

scostamento quadratico medio (o deviazione standard): è un indice altamente

• Devianza : è il numeratore della varianza

• Il coefficiente di variazione : in genere è espresso in termini percentuali (moltiplicando

• Indice di eterogeneità di Gini :

◦ La concentrazione : esiste una misura della disuguaglianza detta indice di

Analisi delle relazioni tra due caratteri ed indici di associazione

Within , ovvero la devianza interna ai gruppi, la sommatoria di queste due è la Devianza

Le relazioni tra 2 variabili quantitative

• Diagramma a dispersione (o scatter) per relazioni lineari tra due variabili: due variabili

◦ Tra due variabili abbiamo concordanza se al crescere di X cresce anche Y e viceversa se

◦ Abbiamo invece discordanza se al diminuire di X invece, Y cresce o viceversa, si tratta di

• Codevianza : è un indice simmetrico assoluto per misurare il legame tra variabili quantitative

• Covarianza : è la codevianza rapportata alla numerosità del collettivo N, ovvero la media dei

• Rho, coefficente di correlazione lineare : si ottiene rapportando la codevianza al suo

• Il coefficente di regressione : con l’analisi di regressione lineare possiamo individuare

• Metodo dei minimi quadrati : è il metodo di stima che rende minima la sommatoria dei

• Indice di determinazione (Coefficente R2) e bontà del modello : Dopo aver

Dalla descrizione all’inferenza

• La probabilità

‣ Quantificare il grado di incertezza significa associare ai risultati campionari una

◦ Il singolo esito di una prova prende il nome di evento elementare , mentre l’evento

‣ Unione tra due eventi (U), si verifica quando almeno uno dei due eventi avviene

‣ Intersezione fra due eventi (U capovolta), si verifica quando avvengono

‣ Negazione di un evento (ad es. A con una linea in cima) e si verifica quando A non

◦ La distribuzione o variabile casuale Normale : le variabili casuali continue

◦ La Normale standardizzata : standardizzare significa operare una trasformazione in

◦ La T di Student : è il rapporto tra una variabile casuale Normale standardizzata e la

Tipi di campionamento

• Campionamento probabilistico : Le procedure per scegliere il nostro campione si

Stima e stimatori

Test statistici per la verifica delle ipotesi

• Ipotesi statistica : è una congettura riguardante una qualche caratteristica del fenomeno

◦ Abbiamo l’ ipotesi nulla H0 : è l’ipotesi che si vuole sottoporre a verifica con un test

◦ L ’ipotesi alternativa H1 : sarebbe la conclusione che vorremmo trarre dal test

• La verifica di ipotesi : è la metodologia inferenziale che a partire dai dati campionari porta

• Test di ipotesi e statistiche (parametro) :

◦ Un test di ipotesi statistiche è la tecnica attraverso cui si decide se rifiutare o meno

◦ Un parametro invece è una Statistica calcolata nella popolazione

◦ Uno stimatore è una Statistica calcolata sui dati del campione