Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Ripasso elementi di statistica, Schemi e mappe concettuali di Statistica

Ripasso statistica triennale per ripetere più velocemente

Tipologia: Schemi e mappe concettuali

2021/2022

Caricato il 10/10/2024

Cppp7
Cppp7 🇮🇹

3 documenti

1 / 4

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
SCATTER PLOT
Uno scatter plot, o diagramma a dispersione, è uno strumento grafico utilizzato in
statistica per visualizzare la relazione tra due variabili quantitative. In questo tipo di
grafico, ogni punto rappresenta un'osservazione e la posizione del punto è
determinata dai valori delle due variabili.
Caratteristiche principali di uno scatter plot:Assi: Lo scatter plot ha due assi, l'asse
orizzontale (x) e l'asse verticale (y). Ogni asse rappresenta una delle due variabili
quantitative.
Punti: Ogni punto sul grafico rappresenta un'osservazione con una coppia di valori (x,
y). La posizione del punto è determinata dal valore della variabile x sull'asse
orizzontale e dal valore della variabile y sull'asse verticale.
Relazione tra variabili: Il diagramma a dispersione è utile per identificare il tipo di
relazione tra le due variabili. Può mostrare una relazione positiva (quando i punti
tendono a salire da sinistra a destra), una relazione negativa (quando i punti tendono
a scendere da sinistra a destra), o nessuna relazione apparente (quando i punti sono
sparsi casualmente).
Esempio pratico:
Supponiamo di voler esaminare la relazione tra le ore di studio (variabile x) e i
punteggi degli esami (variabile y) di un gruppo di studenti. Ogni punto nel diagramma
a dispersione rappresenterebbe un singolo studente, con la posizione del punto
determinata dal numero di ore di studio sull'asse x e dal punteggio dell'esame
sull'asse y. Un pattern ascendente suggerirebbe che più ore di studio tendono ad
essere associate a punteggi più alti.
Come interpretare uno scatter plot:
Pattern lineare: Se i punti formano una linea retta o quasi retta, suggerisce una
relazione lineare tra le due variabili.
Pattern curvilineo: Se i punti formano una curva, suggerisce una relazione non lineare.
Nessun pattern: Se i punti sono sparsi senza un pattern evidente, potrebbe non esserci
una relazione tra le due variabili.
CERCHIO CORRELAZIONI
Il cerchio delle correlazioni è un grafico utilizzato principalmente nell'analisi delle
componenti principali (PCA - Principal Component Analysis) per visualizzare la
correlazione tra variabili originali e le componenti principali. Questo tipo di grafico è
molto utile per comprendere come le variabili contribuiscono alle componenti
principali e come son o correlate tra loro.
DISTRIBUZIONE F
La distribuzione F è una distribuzione di probabilità continua che è fondamentale in
statistica, particolarmente nelle analisi della varianza (ANOVA), nella regressione
lineare e in molti altri test statistici. Prende il nome dal matematico Ronald Fisher. La
distribuzione F è definita da due parametri, i gradi di libertà del numeratore (d1) e del
denominatore (d2) La distribuzione F assume valori non negativi (da 0 all'infinito).Noi
abbiamo visto la sua applicazione in regressione multipla.
DISTRIBUZIONE T
pf3
pf4

Anteprima parziale del testo

Scarica Ripasso elementi di statistica e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!

SCATTER PLOT

Uno scatter plot, o diagramma a dispersione, è uno strumento grafico utilizzato in statistica per visualizzare la relazione tra due variabili quantitative. In questo tipo di grafico, ogni punto rappresenta un'osservazione e la posizione del punto è determinata dai valori delle due variabili. Caratteristiche principali di uno scatter plot:Assi: Lo scatter plot ha due assi, l'asse orizzontale (x) e l'asse verticale (y). Ogni asse rappresenta una delle due variabili quantitative. Punti: Ogni punto sul grafico rappresenta un'osservazione con una coppia di valori (x, y). La posizione del punto è determinata dal valore della variabile x sull'asse orizzontale e dal valore della variabile y sull'asse verticale. Relazione tra variabili: Il diagramma a dispersione è utile per identificare il tipo di relazione tra le due variabili. Può mostrare una relazione positiva (quando i punti tendono a salire da sinistra a destra), una relazione negativa (quando i punti tendono a scendere da sinistra a destra), o nessuna relazione apparente (quando i punti sono sparsi casualmente). Esempio pratico: Supponiamo di voler esaminare la relazione tra le ore di studio (variabile x) e i punteggi degli esami (variabile y) di un gruppo di studenti. Ogni punto nel diagramma a dispersione rappresenterebbe un singolo studente, con la posizione del punto determinata dal numero di ore di studio sull'asse x e dal punteggio dell'esame sull'asse y. Un pattern ascendente suggerirebbe che più ore di studio tendono ad essere associate a punteggi più alti. Come interpretare uno scatter plot: Pattern lineare: Se i punti formano una linea retta o quasi retta, suggerisce una relazione lineare tra le due variabili. Pattern curvilineo: Se i punti formano una curva, suggerisce una relazione non lineare. Nessun pattern: Se i punti sono sparsi senza un pattern evidente, potrebbe non esserci una relazione tra le due variabili. CERCHIO CORRELAZIONI Il cerchio delle correlazioni è un grafico utilizzato principalmente nell'analisi delle componenti principali (PCA - Principal Component Analysis) per visualizzare la correlazione tra variabili originali e le componenti principali. Questo tipo di grafico è molto utile per comprendere come le variabili contribuiscono alle componenti principali e come son o correlate tra loro. DISTRIBUZIONE F La distribuzione F è una distribuzione di probabilità continua che è fondamentale in statistica, particolarmente nelle analisi della varianza (ANOVA), nella regressione lineare e in molti altri test statistici. Prende il nome dal matematico Ronald Fisher. La distribuzione F è definita da due parametri, i gradi di libertà del numeratore (d1) e del denominatore (d2) La distribuzione F assume valori non negativi (da 0 all'infinito).Noi abbiamo visto la sua applicazione in regressione multipla. DISTRIBUZIONE T

La distribuzione t di Student è una distribuzione di probabilità continua che gioca un ruolo cruciale nelle statistiche inferenziali, in particolare quando si lavora con campioni di piccole dimensioni e la varianza della popolazione è sconosciuta. È utilizzata principalmente per testare ipotesi su medie di popolazioni. In sintesi, la distribuzione t è uno strumento fondamentale per le inferenze statistiche quando si lavora con piccoli campioni e quando la varianza della popolazione è sconosciuta. CHI QUADRATO Il test chi-quadrato (χ²) è una famiglia di test statistici utilizzati per analizzare le distribuzioni di frequenze. Viene utilizzato principalmente per confrontare le distribuzioni osservate con quelle attese in uno o più categorie. Tipi di test chi- quadrato: Test di indipendenza: Obiettivo: Determinare se due variabili categoriali sono indipendenti o associate. Esempio: Supponiamo di voler sapere se c'è una relazione tra il genere (maschio/femmina) e la preferenza per un tipo di film (azione/commedia/dramma). I dati vengono raccolti in una tabella di contingenza, e il test chi-quadrato viene utilizzato per determinare se le differenze osservate nelle frequenze sono significative. Test di adeguatezza (o bontà del fit): Obiettivo: Determinare se una distribuzione osservata di una variabile categoriale si adatta a una distribuzione attesa. VARIANZA La varianza è una misura della dispersione dei dati intorno alla media. Indica quanto i valori di un dataset si discostano dalla media del dataset stesso. Una varianza elevata indica che i dati sono molto sparsi rispetto alla media, mentre una varianza bassa indica che i dati sono vicini alla media. Matematicamente, la varianza di una

La V di Cramer (o Cramér's V) è una misura della forza dell'associazione tra due variabili categoriali in una tabella di contingenza. È una statistica derivata dal test chi- quadrato (χ²) e fornisce un valore compreso tra 0 e 1, dove 0 indica nessuna associazione e 1 indica una forte associazione Dove:  𝜒2 è il valore del test chi-quadrato.  n è il numero totale di osservazioni.  𝑘è il numero di categorie nella variabile con più categorie.  𝑟è il numero di categorie nella variabile con meno categorie.  min(𝑘−1,𝑟−1) rappresenta il minore tra il numero di categorie meno uno della prima variabile e il numero di categorie meno uno della seconda variabile. Interpretazione della V di Cramer: 0: Nessuna associazione tra le variabili. 0 < V ≤ 0.1: Associazione molto debole. 0.1 < V ≤ 0.3: Associazione debole. 0.3 < V ≤ 0.5: Associazione moderata. 0.5 < V ≤ 1: Associazione forte