




Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Appunti dei concetti fondamentali della statistica descrittiva e inferenziale
Tipologia: Schemi e mappe concettuali
1 / 8
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!





GRAFICO: è la visualizzazione della frequenza con cui si presentano le modalità di un carattere statistico. Si ricorre al grafico quando le informazioni statistiche sono difficilmente rappresentabili con una tabella. POPOLAZIONE: insieme degli elementi che sono oggetto di indagine statistica, ovvero l’insieme delle unità statistiche o individui di una popolazione sulle quali viene effettuata la rivelazione di una certa caratteristica (es. persone, animali, piante, cose) CARATTERE O VARIABILE: una proprietà che si possa osservare o studiare in ogni individuo. Caratteri: Quantitativi (variabile) se le modalità sono espresse attraverso una grandezza misurabile o numerabile;
La frequenza relativa è compresa nell’intervallo [0, 1].
MEDIA CAMPIONARIA o aritmetica: MEDIA PONDERATA : pi= frequenza DEVIANZA: somma dei quadrati degli scarti della media SCARTO QUADRTICO MEDIO (o deviazione standard ): radice quadrata della varianza campione popolazione VARIANZA : il quadrato dello scarto quadratico medio campione popolazione VARIANZA CAMPIONARIA PONDERATA : rapporto tra devianza diviso la numerosità del campione - COEFFICINETE DI VARIAZIONE: permette di valutare la dispersione dei valori attorno alla media indipendentemente dall'unità di misura CV% = (deviazione standard / media) * 100% RANGE : XMAX - XMIN
GRAFICO A TORTA: rappresenta la composizione del collettivo rispetto a un carattere qualitativo non ordinato. GRAFICO A NASTRO : per caratteri qualitativi NON ordinati GRAFICI A BARRE : per caratteri qualitativi ordinati linearmente ISTOGRAMMA : per caratteri quantitativi continui. STATISTICA DESCRITTIVA BIVARIATA La statistica bidimensionale o bivariata si occupa dello studio del grado di dipendenza di due caratteri Dette X e Y le due variabili statistiche, la distribuzione delle frequenze delle loro modalità x1, x2, …………….xq e y1, y2, ……………yp può essere rappresentata attraverso una tabella a doppia entrata in cui si associa ad ogni coppia (xi ;yi ) la sua frequenza assoluta detta frequenza congiunta. TABELLA A DOPPIA ENTRATA: X 1 X 2 X 3 … tot Y 1 F1,1 F1,2 F1,3 … F1, Y 2 F2,1 F2,2 F2,3 … F2, Y 3 F3,1 F3,2 F3,3 … F3, yi … … … … Fi, … tot F0,1 F0,2 F0,3 Fo,j f La prima riga è quella delle modalità del carattere x , la prima colonna è quella delle modalità del carattere y. La colonna dei totali e la riga dei totali sono le frequenze marginali della variabile x e della variabile y , sono dette distribuzioni marginali e rappresentano le distribuzioni di ognuno dei due caratteri considerati singolarmente (distribuzioni univariate). fi,j sono le frequenze congiunte. Le colonne e le righe interne della tabella sono le distribuzioni condizionate. DIPENDENZA DI DUE CARATTERI: Due tipologie -Dipendenza logica : se tra due caratteri esistono relazioni di causa ed effetto. -Dipendenza statistica : se tra due caratteri esistono delle regolarità nell’associazione tra le modalità dei caratteri (non un nesso di causalità). Indipendenza logica Indipendenza statistica Obiettivi :
Date due variabili indipendenti in distribuzione, è possibile ricostruire la tabella doppia a partire dalle distribuzioni marginali, dal momento che Vale Se non si è in grado di costruire la frequenza congiunta di un elemento a partire da quelle marginali allora le variabili non sono indipendenti ma connesse. Esiste una dipendenza assoluta tra due caratteri INDIPENDENZA E DIPENDENZA STATISTICA DI DUE VARIABILI Due variabili statistiche sono indipendenti se le modalità di una non influenzano le modalità dell’altra. Per determinare se due variabili statistiche sono dipendenti o indipendenti bisogna utilizzare le distribuzioni marginali delle frequenze della tabella a doppia entrata. La variabile X e la variabile Y sono indipendenti se la frequenza congiunta f i,j ( quella interna alla tabella), è il prodotto delle corrispondenti frequenze marginali, divise per il numero di dati n : f i,j =[fi, 0 f 0 , j ]/n Se tale condizione non è rispettata, le due variabili NON sono indipendenti ma si dicono DIPENDENTI. CONTINGENZE: Per misurare la dipendenza tra due caratteri, occorre studiare le contingenze cij , ossia lo scarto tra la frequenza osservata in una cella e la frequenza teorica che si osserverebbe se le due variabili fossero completamente indipendenti.* La contingenza permette di misurare il grado di dipendenza di due variabili qualitative: il GRADO DI CONNESSIONE delle due MUTABILI. Si dice contingenza la differenza tra le frequenze osservate e quelle teoriche. C(xi;yj) = f(xi,yj) - f’(xi,yj) ( contingenza = freq. osserv. - freq. teorica ) Nel caso di indipendenza, le contingenze sono tutte nulle, mentre cresceranno in valore assoluto, al crescere del grado di dipendenza tra i caratteri. Due caratteri sono connessi se e solo se esiste una cella per cui cij è diversa da zero MASSIMA CONNESSIONE: Tra due caratteri X e Y esiste la massima connessione se, nota una modalità di X, si determina in modo univoco la modalità di Y corrispondente. L’indice che misura il grado di connessione di due variabili qualitative( mutabili) è l’Indice di connessione di Pearson (CHI-QUADRO) χ 2: dove nij sono le frequenze osservate dei caratteri congiunti. Dove σX,Y è la covarianza tra X e Y e σX E σY sono le due deviazioni standard.
È una media ponderata dei rapporti di contingenza in valore assoluto
T-value : il valore assunto dalla statistica test sulla base dei dati osservati. Sarà tanto più grande (per alcuni statistiche test anche più piccolo) quanto più i dati supporteranno il rifiuto dell’ipotesi nulla. p-value : il valore dell’area sottostante alla distribuzione di probabilità della statistica test che può assumere un valore maggiore od uguale (per alcuni statistiche test anche minore od uguale) al T-value DECISIONE : Il processo di decisione segue quattro fasi fondamentali
Distribuzione F di Snedecor con r1e r2 gradi di libertà, di una variabile casuale continua X è rappresentata dalla funzione sopra descritta VERIFICA IPOTESI: L’ipotesi nulla H0 :