










































































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
all'interno troverete tutto ciò che serve per superare al meglio l'esame!
Tipologia: Appunti
1 / 82
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!











































































È una scienza che studia i fenomeni collettivi attraverso la raccolta di dati (informazioni) che vengono analizzati e interpretati (graficamente e non solo) dopo averli inseriti in matrice. La statistica rappresenta sostanzialmente un insieme mondo vasto di strumenti e tecniche che servono poi nelle discipline più disparate (economia, medicina, psicologia…). La statistica è una disciplina al servizio delle altre: infatti in molti casi il contesto applicativo fa si che la statistica si declini in modi particolari, nel senso che a seconda della disciplina in cui viene utilizzata, si affinano alcune tecniche statistiche piuttosto che altre. La statistica stessa si divide in branche (psicometria, biometria…). Alla base di tutte queste metodologie vi sono dei rudimenti fondamentali (strumenti di base su cui vengono costruiti strumenti più sofisticati). Molti dei metodi statistici sono trasversali, soprattutto quelli basilari che saranno oggetto del corso. ATTENZIONE: non confondere la statistica (disciplina) con le statistiche (prodotti dell’elaborazione statistica ossia tabelle, grafici…). TERMINOLOGIA La statistica analizza in termini quantitativi i fenomeni collettivi, ossia i fenomeni il cui lo studio richiede l’osservazione di un insieme di manifestazioni individuali. (ESEMPI:
costruito, non deve succedere che una modalità ne resti esclusa.
classe (le classi devono essere disgiunte e contenere tutte le possibili modalità). Il trattino verticale significa che ciò che sta alla sua destra o sinistra (in questo caso ciò che sta alla sua sinistra dove non vi è il trattino orizzontale) è compreso nella classe. Dove vi è il trattino orizzontale implica che l’estremo è escluso dalla classe. In questo caso lo 0 è incluso nella prima classe mentre 25° è escluso. Se uno guadagna esattamente 250£ ricade nella seconda classe. Il 250£ a sinistra è detto estremo inferiore mentre il 500£ a destra è detto estremo superiore. È un esempio dove non ha senso costruire classi della stessa ampiezza ma ha senso crearle crescenti (non ha senso procedere di 250£ per volta soprattutto quando si giunge a redditi altissimi). Con le grandezze economiche ha senso ampliare le classi. N.B. l’estremo di sinistra è incluso nella classe mentre l’estremo di destra ne è escluso. AMPIEZZA CLASSE = estremo superiore – estremo inferiore. L'aggregazione di modalità di caratteri quantitativi avviene sia per quelli continui (per cui generalmente si lavora con classi) che per quelli discreti. ESEMPIO: Carattere “età” in anni compiuti di una popolazione di maggiorenni che è considerato un carattere quantitativo discreto con un campo di variazione 18-Oltre
Si procede anche in questo caso con una divisione per classi.
Si noti la notazione che corrisponde in questo caso a un semplicissimo trattino orizzontale senza parti verticali come in precedenza. La differenza rispetto a prima è che l’estremo inferiore di una classe non coincide con l’estremo superiore della classe precedente. Non vi è nulla tra 25 e 26 anni perché essendo un carattere discreto segue numeri interi senza intermediari. AMPIEZZA DI CLASSE = in questo caso bisogna considerare quante modalità sono raggruppate in quella classe. Non basta fare la sottrazione come nel caso precedente: 30-26= 4 ma bisogna contare 26, 27, 28, 29 e 30. Quando raggruppo in classi un carattere quantitativo discreto dove l’estremo superiore di ogni classe non coincide con l’estremo inferiore della classe successiva per individuare l’ampiezza della classe dovrò fare: Estremo superiore – estremo inferiore + 1 che mi dice quante distinte modalità sono contenute in ciascuna classe. N.B i due caratteri (reddito ed età) a seguito della classificazione in classi sono diventati formalmente dei caratteri qualitativi ordinali (da quantitativi che erano si sono perse di vista le singole modalità). ATTENZIONE: si può sempre passare da un livello di misura ad un livello di misura inferiore (da qualitativi sconnessi ai qualitativi ordinali e i quantitativi). Posso passare da un livello superiore a uno inferiore ossia: da un quantitativo farlo diventare un qualitativo ordinale o da un qualitativo ordinale a un qualitativo. ESEMPIO: da quantitativo continuo a quantitativo discreto; da quantitativo a qualitativo. Ma non posso fare l’operazione inversa che è ESTREMAMENTE ARBITRARIA e suscettibile di far sì che a seconda di come io effettuo questa trasformazione produco qualcosa che è viziato dal modo in cui ho fatto tale trasformazione. Pertanto i risultati che ottengo sono viziati. La classe non è un numero ma un qualitativo ordinale. Far diventare un qualitativo un quantitativo è un’operazione molto più delicata e complessa perché devo attribuire numeri e valori a delle modalità che non sono numeriche. Questa operazione viene comunque fatta spessissimo perché è molto più facile lavorare con i numeri. COME FACCIO AD ASSOCIARE DEI NUMERI A DELLE MODALITÀ’? ESEMPIO: carattere titolo di studio che è un carattere qualitativo ordinato. Associando dei numeri potrei fare: nessun titolo = 0 licenza elementare = 1 licenza media = 2 ecc… una volta attribuiti i numeri valgono le proprietà numeriche quindi licenza media sarebbe 2 volte la licenza elementare o la metà di qualche altra licenza. Non vi è più solo un ordinamento, e affermare che un titolo di studio sia il doppio dell’altro
La statistica è un insieme di strumenti per analizzare dati, per poterlo fare dobbiamo disporre dei dati, come fare?
Altri produttori di dati in italia: Banca d’Italia Censis Istituti di ricerca privati (Eurispes, ISPO, EURISKO, DEMOSCOPEA, DOXA,…) in europa: ONU UNESCO FAO (Food and Agricoltural Org) WHO (World Health Org) WTO (World Trade Org) FMI • WORLD BANK OCSE/OECD (Organization for Economic Cooperation and Development) IOM (International Org for Migration) ELABORAZIONE DEI DATI Ora Supponiamo di avere i dati e doverli elaborare per avere una descrizione della nostra popolazione. Dobbiamo organizzare i dati con grafici e tabelle (attraverso l’uso di software statistici). Come si presentano i dati? Si presentano tramite la matrice dei dati , insieme di valori organizzati per righe e colonne. Convenzione vuole che in ogni riga vengano riportate le informazioni di un’unità statistica e ogni colonna riporta uno dei caratteri statistici considerati.
Precisiamo la terminologia: Frequenza assoluta è un numero associato ad ogni modalità di un carattere che mi dice quante volte quella modalità si è presentata nel collettivo statistico. Distribuzione di frequenza descrizione (ordinata quando è possibile) delle modalità assumibili da un carattere e delle corrispondenti frequenze. frequenza relativa e frequenza percentuale Abbiamo visto la distribuzione con le frequenze assolute, ma spesso si vuole capire la percentuale di unità statistiche che presenta una certa modalità. Ecco che oltre alle frequenze assolute possiamo costruire delle altre frequenze:
frequenze cumulate Ma potremmo anche chiederci: quante unità statistiche hanno meno di 40 anni? si usano le frequenze cumulate, ovvero quante modalità statistiche presentano una modalità inferiore o pari a quello che sto studiando. (Cumulo le frequenze prima, sommo quelle prima) tra le frequenze cumulate possiamo trovare anche quelle:
Buone norme per la costruzione delle tabelle di frequenza
𝑖= 3 ∑ 𝑥𝑖 = 2 + 5 + 4 = 11 ● 𝑖= 4 ∑ 𝑥𝑖 = 5 + 4 − 2 = 7 ● 𝑖=1 𝑚𝑎 ≠ 4 ∑ 𝑥𝑖 = 2 + 4 − 2 = 4 proprietà delle sommatorie: ● 𝑖=
∑ 𝑥𝑖 · 𝑦𝑖 ≠ 𝑖=
∑ 𝑥𝑖 · 𝑖=
∑ 𝑦𝑖 introduciamo la lettera c, che sta ad indicare una costante. quindi 𝑖= 𝑘 ∑ 𝑐 = 𝑐 + 𝑐 + 𝑐 +.... + 𝑐 𝑘 𝑣𝑜𝑙𝑡𝑒 = 𝑘 · 𝑐 prendiamo in esempio che c= ● 𝑖=
∑ 𝑐 · 𝑥𝑖 = 𝑐 · 𝑖=
∑ 𝑥𝑖 ● 𝑖=
∑ (𝑥𝑖 + 𝑦𝑖) = 𝑖=
∑ 𝑥𝑖 + 𝑖=
∑ 𝑦𝑖 particolari tipi di distribuzioni di frequenza ● Distribuzioni di quantità A volte i caratteri su cui fissiamo l’attenzione sono tali per cui non assoceremo per le diverse modalità delle frequenze, ma ci assoceremo delle quantità. É una situazione frequente nell’ambito economico e produttivo. Anziché delle frequenze, associamo alle distinte modalità del carattere le corrispondenti quantità (ad esempio prodotte, scambiate, trasportate, lavorate….)
esempio Consideriamo la produzione di un’azienda per tipo di mangime prodotto carattere. Tipi di mangime a diverse modalità (tipologie diverse) e associo la quantità prodotta alle diverse tipologie (specificare sempre l’unità di misura). il totale saranno le tonnellate complessive prodotte dall’azienda. ● serie storiche o temporali Le distribuzioni di quantità non sono l’unico caso da trattare in modo particolare. C’è anche il caso in cui i caratteri vengono rilevati nel corso del tempo (es. i dati della pandemia). Questo caso va trattato in modo diverso, si parla di serie storiche o temporali , dove le rilevazioni riguardano lo studio di uno o più caratteri nella loro evoluzione temporale. esempio Immatricolati in scienze politiche in italia dal 1998 al 2002. A destra troviamo il numero di immatricolati e a sinistra le fasce di tempo. ● serie spaziali o territoriali Può capitare di dover considerare le serie spaziali o territoriali. In questo caso le rilevazioni riguardano lo studio di uno o più caratteri nella loro distribuzione nello spazio. esempio Tabella con riferimento ai dati del covid per ogni regione italiana.
Sull'asse delle ascisse inserisco le due modalità (maschio e femmina) e sulle ordinate inserisco le frequenze. In questo caso solo l’asse delle ordinate ha significato numerico, ma posso anche rappresentare il grafico invertendo gli assi (non cambia nulla). Importante: uno solo degli assi deve avere significato numerico. esempio 2 Un caso particolare di grafico a barre. Quando si rappresentano due popolazioni si possono usare sempre i grafici a nastri mettendo le due popolazioni sullo stesso nastro, colorando in modo diverso le barre. Se metto sullo stesso grafico popolazioni diverse devo usare le frequenze percentuali e non assolute!
➔ grafico a torta , in cui costruisco un cerchio e lo suddivido in spicchi, ciascuno sarà corrispondente ad una modalità e avrà una dimensione che dipende dalla relativa frequenza percentuale. Per la costituzione di grafici a torta bisogna fare in modo che l’angolo al centro corrispondente ad ogni fetta rispetti la proporzionalità esistente tra le frequenze. proporzione la frequenza percentuale : 100 = l’angolo al centro della fetta : 360
Dove 𝑔𝑗è l’angolo al centro della fetta corrispondente alla modalità j-esima (cui risulta associata la frequenza percentuale 𝑝𝑗).
risolvo la proporzione
𝑗 360
● per i caratteri quantitativi (dove le modalità sono numeri) utilizzeremo gli assi cartesiani, ma entrambi avranno significato numerico. In questo caso si inseriscono sempre le modalità/ le classi/le intensità sull’asse delle ascisse (X) e le frequenze sull’asse delle ordinate (Y). ★ quantitativi discreti ➔ viene utilizzato un grafico ad aste , dove vado a mettere: sull’asse delle ascisse le distinte modalità, sull’asse delle ordinate metto le frequenze