


Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Ripasso statistica triennale per ripetere più velocemente
Tipologia: Schemi e mappe concettuali
1 / 4
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!



Uno scatter plot, o diagramma a dispersione, è uno strumento grafico utilizzato in statistica per visualizzare la relazione tra due variabili quantitative. In questo tipo di grafico, ogni punto rappresenta un'osservazione e la posizione del punto è determinata dai valori delle due variabili. Caratteristiche principali di uno scatter plot:Assi: Lo scatter plot ha due assi, l'asse orizzontale (x) e l'asse verticale (y). Ogni asse rappresenta una delle due variabili quantitative. Punti: Ogni punto sul grafico rappresenta un'osservazione con una coppia di valori (x, y). La posizione del punto è determinata dal valore della variabile x sull'asse orizzontale e dal valore della variabile y sull'asse verticale. Relazione tra variabili: Il diagramma a dispersione è utile per identificare il tipo di relazione tra le due variabili. Può mostrare una relazione positiva (quando i punti tendono a salire da sinistra a destra), una relazione negativa (quando i punti tendono a scendere da sinistra a destra), o nessuna relazione apparente (quando i punti sono sparsi casualmente). Esempio pratico: Supponiamo di voler esaminare la relazione tra le ore di studio (variabile x) e i punteggi degli esami (variabile y) di un gruppo di studenti. Ogni punto nel diagramma a dispersione rappresenterebbe un singolo studente, con la posizione del punto determinata dal numero di ore di studio sull'asse x e dal punteggio dell'esame sull'asse y. Un pattern ascendente suggerirebbe che più ore di studio tendono ad essere associate a punteggi più alti. Come interpretare uno scatter plot: Pattern lineare: Se i punti formano una linea retta o quasi retta, suggerisce una relazione lineare tra le due variabili. Pattern curvilineo: Se i punti formano una curva, suggerisce una relazione non lineare. Nessun pattern: Se i punti sono sparsi senza un pattern evidente, potrebbe non esserci una relazione tra le due variabili. CERCHIO CORRELAZIONI Il cerchio delle correlazioni è un grafico utilizzato principalmente nell'analisi delle componenti principali (PCA - Principal Component Analysis) per visualizzare la correlazione tra variabili originali e le componenti principali. Questo tipo di grafico è molto utile per comprendere come le variabili contribuiscono alle componenti principali e come son o correlate tra loro. DISTRIBUZIONE F La distribuzione F è una distribuzione di probabilità continua che è fondamentale in statistica, particolarmente nelle analisi della varianza (ANOVA), nella regressione lineare e in molti altri test statistici. Prende il nome dal matematico Ronald Fisher. La distribuzione F è definita da due parametri, i gradi di libertà del numeratore (d1) e del denominatore (d2) La distribuzione F assume valori non negativi (da 0 all'infinito).Noi abbiamo visto la sua applicazione in regressione multipla. DISTRIBUZIONE T
La distribuzione t di Student è una distribuzione di probabilità continua che gioca un ruolo cruciale nelle statistiche inferenziali, in particolare quando si lavora con campioni di piccole dimensioni e la varianza della popolazione è sconosciuta. È utilizzata principalmente per testare ipotesi su medie di popolazioni. In sintesi, la distribuzione t è uno strumento fondamentale per le inferenze statistiche quando si lavora con piccoli campioni e quando la varianza della popolazione è sconosciuta. CHI QUADRATO Il test chi-quadrato (χ²) è una famiglia di test statistici utilizzati per analizzare le distribuzioni di frequenze. Viene utilizzato principalmente per confrontare le distribuzioni osservate con quelle attese in uno o più categorie. Tipi di test chi- quadrato: Test di indipendenza: Obiettivo: Determinare se due variabili categoriali sono indipendenti o associate. Esempio: Supponiamo di voler sapere se c'è una relazione tra il genere (maschio/femmina) e la preferenza per un tipo di film (azione/commedia/dramma). I dati vengono raccolti in una tabella di contingenza, e il test chi-quadrato viene utilizzato per determinare se le differenze osservate nelle frequenze sono significative. Test di adeguatezza (o bontà del fit): Obiettivo: Determinare se una distribuzione osservata di una variabile categoriale si adatta a una distribuzione attesa. VARIANZA La varianza è una misura della dispersione dei dati intorno alla media. Indica quanto i valori di un dataset si discostano dalla media del dataset stesso. Una varianza elevata indica che i dati sono molto sparsi rispetto alla media, mentre una varianza bassa indica che i dati sono vicini alla media. Matematicamente, la varianza di una
La V di Cramer (o Cramér's V) è una misura della forza dell'associazione tra due variabili categoriali in una tabella di contingenza. È una statistica derivata dal test chi- quadrato (χ²) e fornisce un valore compreso tra 0 e 1, dove 0 indica nessuna associazione e 1 indica una forte associazione Dove: 𝜒2 è il valore del test chi-quadrato. n è il numero totale di osservazioni. 𝑘è il numero di categorie nella variabile con più categorie. 𝑟è il numero di categorie nella variabile con meno categorie. min(𝑘−1,𝑟−1) rappresenta il minore tra il numero di categorie meno uno della prima variabile e il numero di categorie meno uno della seconda variabile. Interpretazione della V di Cramer: 0: Nessuna associazione tra le variabili. 0 < V ≤ 0.1: Associazione molto debole. 0.1 < V ≤ 0.3: Associazione debole. 0.3 < V ≤ 0.5: Associazione moderata. 0.5 < V ≤ 1: Associazione forte