













































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Dispensa di Statistica - Università di Firenze - Facoltà di Economia - Prof. Emanuela Dreassi - Anno 22/23. La dispensa contiene gli appunti presi durante le lezioni con esempi sugli esercizi fatti dalla professoressa, fondamentali per effettuare l'esame. Gli appunti sono stati integrati con le slide e il libro fornito dalla prof.
Tipologia: Dispense
1 / 53
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!














































Prof. Emanuela Dreassi - Università di Firenze - Facoltà di Economia 22/02/
La variabilità nei dati si riscontra:
(non fare p.11 scala rapporto e scala intervallo)
Variabili categoriche = qualitative Distribuzione di frequenza -> “frequenza assoluta” è quante volte si ripete una modalità (maschio o femmina). La somma delle frequenze assolute deve dare il totale. Distribuzione statistica disgregata = dati grezzi. Frequenze relative (wi di una modalità xi della variabile X): come trovarle? Frequenza assoluta Frequenza relativa maschi = 5 ⅝ = 0,625100 = 62,5% femmine = 3 ⅜ = 0,375100 = 37,5% totale = 8 totale = 100% E’ la frazione o proporzione di unità statistiche che presentano tale modalità.
Diagrammi a barre e diagrammi a torta sono spesso usati per dati qualitativi. L’altezza delle barre o l’area dei settori circolari rappresenta la frequenza relativa o assoluta di ciascuna categoria. MEGLIO DIAGRAMMA A BARRE
Quando ho tante modalità si crea delle classi e si calcola la frequenza delle classi. Le classi devono essere:
La differenza tra l’istogramma e il diagramma a barre è la distanza tra le barre che c’è nel diagramma a barre. Nel diagramma a barre l’altezza è la frequenza relativa e nell’istogramma l’area è la frequenza relativa. 03/03/ Come raggruppare i dati in classi:
(14/49 = 0.2857 x 100 = 28.57) fr. condizionata per riga (14/17 = 0.8235 x 100 = 82.35) fr. condizionata per colonna Frequenza condizionata = frequenza delle aziende che hanno un livello di rischio alto, dato che hanno come obiettivo la crescita (esempio su qua). Con il diagramma a barre accostate, si rappresenta la stessa modalità della variabile, ogni barra è l’incrocio delle modalità. Paradosso di simpson -> il 32% è morto in elicottero, il 24% è morto in ambulanza ma questo non basta.
Moda = modalità che vedo più frequentemente (anche per variabili qualitative e quantitative). Non influenzata da valori estremi. Può non esserci una moda e ci può essere più di una moda. Riassumendo: Mediana = 5+½ = 3° posizione = $300. Media e mediana non coincidono perché la media è maggiore della mediana. Media geometrica (es. sul qua)
Il grafico ha stessa media e stessa mediana ma variabilità diversa. La curva di distribuzione più bassa è più variabile rispetto a quella più alta.
Campo di variazione = differenza che osservo tra il valore più grande e il valore più piccolo. Ignora il modo in cui i dati sono distribuiti ed è molto sensibile agli outlier. Quartili = dividono la sequenza ordinata dei dati in 4 segmenti contenenti lo stesso numero di valori. 1° quartile = ¼ 2° quartile = 2/4 cioè la mediana 3° quartile = ¾ 4° quartile = 4/4 cioè 100% Come si divide in quartili: (esempio sul qua)
Si usa per confrontare la variabilità del fatturato di aziende di piccole e grandi dimensioni. Approssimazione per classi: si crea una tabella con i valori centrali delle classi e le loro frequenze assolute, poi si fa una media ponderata delle classi, la deviazione standard (S) si fa con la radice del (valore centrale x fr. assoluta - media classi)^2 / tot. fr. assolute (es. sul qua)
all’interno degli intervalli ci sta almeno tot. proporzioni di dati. Per un insieme di dati qualunque con media mu e deviazione standard sigma, si sceglie un valore K >= 1 Disegno su qua
K = 2 almeno il 75%
simmetriche (campanulare) e non da un limite inferiore ma un circa. K = 2 circa il 95% Es. su qua
mu = media sigma quadro = S^2 = varianza sigma = S = scarto quadratico medio o dev. stand. Addizione di una costante a media + costante varianza e scarto rimangono inalterati
Una correlazione forte non determina la causalità, es. l’analisi tra le nascite e le cicogne nell’unità statistica degli stati del sud america, non vuol dire che sono le cicogne a portare i bambini ma l’unità statistica che lega le due variabili è la ruralità. Esempio di relazione lineare crescente Spiegazione su qua