Scarica Introduzione alla Statistica: Concetti Fondamentali e Rilevazione dei Dati e più Appunti in PDF di Statistica Sociale solo su Docsity!
skidSTATISTICA SOCIALE 2024-2025 Prof. Marco Carradore
MATERIALE DI STUDIO
Le slide usate durante le lezioni non sono materiale didattico, in senso stretto, ma servono a puntualizzare i temi trattati nel corso. F. Mecatti (2015), Statistica di base. Come, quando, perché, McGraw-Hill, Milano I capitoli da studiare ai fini del superamento dell’esame saranno puntualmente indicati nel corso delle lezioni. MODALITÀ D’ESAME L’esame consiste in una prova scritta La verifica è composta da un numero variabile di esercizi e domande di teoria, con domande sia a risposta multipla che a risposta aperta. È obbligatorio portare un righello e una calcolatrice (non è ammesso l’uso dello smartphone). Nello scritto per ogni domanda/esercizio è indicata la valutazione in punti. Esame nello stesso giorno del corso di SOCIOLOGY OF TOURISM LEZIONI Lun 16-19 Aula 1 Rosate Mer 9-12 Aula 3 Rosate Ultima lezione mercoledì 18/ 11/ DA RECUPERARE NOTAZIONE DI BASE
- I fenomeni di interesse sono detti fenomeni statistici X, Y, Z, A, B, C … (lettere maiuscole). Fenomeni che si presentano con una molteplicità di manifestazioni
- I supporti fisici o teorici delle diverse manifestazioni di un fenomeno statistico sono detti unità statistiche (es: i singoli individui) u
- Le singole determinazioni del fenomeno sono dette manifestazioni statistiche x, y, z … (minuscole). Sono le modalità o i valori del fenomeno (U) L’insieme delle unità statistiche sulle quali interessa studiare il fenomeno è chiamato popolazione statistica o universo di riferimento (in inglese: target) → U (es. collettivo di individui sui quali interessa studiare il reddito: es. docenti universitari uniBg) (N) Il numero di unità statistiche che compongono la popolazione statistica di riferimento è chiamato numerosità o dimensione di U → N (es. 350 tra professori e ricercatori) Quindi **- X è un fenomeno,
- x è una modalità (una categoria o un numero)
- U è un insieme
- N è un numero Su U di numerosità N sono presenti le manifestazioni x del fenomeno X** Ossia, sui dipendenti dell’azienda Bianchi di numerosità 568 sono presenti le manifestazioni [licenza media, diploma, laurea] del fenomeno scolarizzazione LE DUE FUNZIONI DELLA STATISTICA È possibile effettuare due analisi differenti in seguito alla raccolta di dati di partenza
- Statistica Descrittiva o Se la rilevazione è esaustiva ( censuaria ) di U, e si dispone di tutti gli N dati osservati presso tutte le unità statistiche, la statistica ha la funzione di descrivere il comportamento di X su U. La statistica descrittiva si classifica in: Univariata/Monovariata , ha per oggetto un solo fenomeno singolarmente rilevato e come obiettivo la descrizione del suo comportamento su U (es. genere) Bivariata , ha per oggetto una coppia di fenomeni rilevati sulla stessa U e come obiettivo l'individuazione delle (eventuali) relazioni (statistiche) tra i due (es. genere e scolarizzazione) Multivariata , i fenomeni rilevati sulla stessa U sono più di due e l’obiettivo è descriverne il comportamento congiunto e studiarne le relazioni (es. genere, scolarizzazione, età)
- Statistica Inferenziale o Se la rilevazione è parziale (campionaria, con n < N) la Statistica continua ad avere come obiettivo la descrizione e la comprensione del comportamento di X su U , ma la sua funzione ora è più ardita. Estendere i risultati dell’elaborazione dei dati campionari all’intera U , e quindi anche alla parte non osservata : si tratta di un’induzione dal particolare al generale ( inferenza statistica ), alla cui base stanno elementi di teoria delle probabilità. ESERCIZIO (I) Un professore di lettere di un liceo milanese vuole indagare sull’interesse per la sua materia da parte dei suoi 23 alunni. Decide di misurare tale interesse contando il numero di libri letti negli ultimi 6 mesi da parte di ciascun alunno. Individuare le unità e la popolazione statistica di riferimento, la numerosità di tale popolazione, il fenomeno e le modalità osservabili su ciascuna unità statistica. 13/ Dati e Informazioni Obbiettivo della statistica è la conoscenza quantitativa dei fenomeni, mediante un processo che quotidianamente compiamo per prendere decisioni (es. comprare un maglione di cachemire, sottoscrivere un servizio di abbonamento, iscriversi ad un corso etc…) Un dato ha un contenuto informativo in quanto viene messo in relazione con altri dati Un dato isolato non serve a nulla (non ha contenuto informativo), anche se può far da base per la valutazione (trasformazione in informazione) di altri dati, diventando anch’esso oggetto di valutazione nel confronto. La costruzione del dato Nozioni di base di metodologia della ricerca sociale Visione ingenua: “i dati parlano da soli” Ci vuole al contrario l’interpretazione Per poter intrepretare i dati (comprensione) è opportuno capire come sono stati “costruiti” La costruzione del dato segue una metodologia
Cosa ci contraddistingue da un giornalista che effettua un’indagine? Le procedure d’uso Il metodo che si utilizza costituisce l’elemento che distingue la ricerca di tipo scientifico da altre forme di indagine Che cos’è un metodo scientifico?
- Il metodo scientifico è una strada.
- Quindi, esistono molti sentieri per raggiungere la meta, e questo significa anche due cose: o che non tutti sono «scientifici» o che molti percorsi possono portare alla stessa meta Che cos’è ‘scientifico’ nella ricerca sociale? Una ricerca per essere scientifica deve avere queste tre caratteristiche: 1) Essere frutto dell’applicazione rigorosa di un metodo di indagine , un insieme di procedure utilizzate per raggiungere una conoscenza dotata di un significato 2) Avere un fondamento empirico: alla base della conoscenza ci sono affermazioni, asserti, che trovano il proprio fondamento in fatti osservabili, cioè non sono solo costrutti mentali del ricercatore 3) Le sue procedure devono essere pubbliche: la conoscenza che pretende di essere scientifica deve anche essere disponibile alla critica, cioè ad essere osservata e analizzata da altri scienziati (Dichiarare in maniera esplicita, per esempio, quale tecnica si è scelta, chi è stato intervistato, chi ha effettuato la rilevazione sul campo) L’opinione pubblica in una società mediatizzata è spesso oggetto di informazioni poco verificabili, imprecise, se non addirittura false.
- Uno degli esempi più evidenti di come l’opinione pubblica possa essere vittima di informazioni infondate scientificamente viene però dal passato: il racconto manzoniano del linciaggio nella città di Milano dei cosiddetti «untori», persone cui la credulità popolare attribuiva il contagio della peste (I promessi sposi, Cap. XXXII).
- Ma non è forse qualcosa di molto simile a quello che è successo nei confronti della comunità cinese ad inizio pandemia? Oltre alle fake news, alle credenze illusorie… ci sono esempi più seri e più insidiosi. Per esempio, le cosiddette «correlazioni spurie»: cioè, la tendenza a individuare un nesso di causalità tra fenomeni (una relazione matematica tra variabili, per esempio) che presentano una correlazione statistica frutto di pura coincidenza.
Cos’è una fonte scientifica? Una volta che è stato formulato il tema della ricerca, si può cominciare a raccogliere le informazioni a riguardo. Il punto di partenza è capire quali informazioni servono (info generali su un’area tematica? Oppure info approfondite? O ancora gli ultimi progressi?) Chiarire natura e finalità della ricerca permetterà di scegliere le fonti più appropriate. Una fonte scientifica è qualsiasi entità (dato, documento, persona, ente ) da cui siano ricavabili informazioni su un determinato argomento, per raccogliere dati, per ricostruire un certo periodo storico, per scoprire e interpretare fatti e comportamenti. METODO : dal greco μέϑοδος, composto di μετα (‘‘in direzione di’’, ‘‘in cerca di’’) e ὁδός (‘‘via’’, ‘‘cammino’’) Esso rappresenta, in contesto scientifico , l’insieme delle procedure utilizzate per raggiungere una conoscenza dotata di un significato TECNICHE : τέχνη indica «la capacità pratica di operare per raggiungere un dato fine, in quanto basata su conoscenza ed esperienza» Gli strumenti della ricerca scientifica attraverso i quali raccogliere i dati, le informazioni che consentono di conoscere la realtà. Quindi: il metodo nelle scienze sociali dipende da come si definisce l’oggetto di studio, dacché il primo e il secondo approccio sono interessati a studiare ‘‘oggetti’’ differenti e quindi useranno un percorso (metodo) diverso per raggiungere il proprio fine (la conoscenza) SPIEGAZIONE E COMPRENSIONE
- Le scienze della natura , a partire dalla Rivoluzione scientifica, hanno cercato di spiegare i fenomeni naturali, cioè, riconducendoli a una legge di tipo universale. Es: la caduta dei gravi e la legge di gravitazione.
- Quando si tratta di comportamenti umani, si può trovare una legge di tipo universale? La risposta dipende dai paradigmi interpretativi che si adottano. Nel paradigma umanista e interpretativo non esistono cose come le leggi universali.
- Il paradigma soggettivista propende per la comprensione circa il significato che gli attori sociali danno alle loro azioni , cioè al significato culturale, di eventi che sono per loro natura individuali e irripetibili.
LA RILEVAZIONE
La rilevazione del fenomeno di interesse X su U è il processo di «costruzione» dei dati. In genere consiste nel recarsi fisicamente presso le unità statistiche per osservare o misurare, e quindi registrare, le diverse N manifestazioni x di X (per es. mediante questionario). Fenomeni:
- X : squadra serie A preferita
- Y : livello conoscenza lingua inglese
- Z : età in anni compiuti
- B : statura in cm TIPI DI VARIABILI Prima distinzione: fenomeni qualitativi (nomi/categorie) e quantitativi (numeri) F. Qualitativi
- X=GENERE
- Y= Squadra di calcio
- Z= titolo di studio F. Quantitativi
- A= Numero accessi sito web
- B= Temperatura - C= età dei visitatori di un museo Seconda distinzione: è possibile individuare un ordine? Cioè: la posizione dell’uno rispetto all’altro Tra i fenomeni quantitativi c’è sempre un ordine (numerico) Tra i fenomeni qualitativi dipende o Ordinali Fenomeni con attributi che si possono ordinare (es. titolo di studio: diploma < laurea < dottorato) o Categoriali Fenomeni che non possono essere ordinare secondo un criterio (es. regione di residenza/ città in cui si è nati o si vive)
Tra i fenomeni quantitativi ci sono fenomeni discreti oppure continui
- Discreti : si possono contare e numerare
- Continui : fenomeni quantitativi che si possono misurare per i quali esistono unità di misura IN SINTESI: FENOMENI E PROPRIETÀ Categorici o qualitativi
- Categoriali (genere, religione)
- Ordinali (titolo di studio) Numerici o quantitativi
- Risultato di un conteggio : discreti (numero di figli, numero di esami, numero di giorni di malattia)
- Risultato di una misura: continui (distanza, reddito, durata, peso) 20/ LA RILEVAZIONE Il processo di costruzione dei dati (meglio di «creazione») è la rilevazione. Gli strumenti della rilevazione sono
- il questionario
- le scale di modalità/di rilevazione il Questionario È il tipico strumento con il quale si effettua la rilevazione. La sua costruzione è una operazione delicata che coinvolge diverse discipline, tra cui la sociologia e la psicologia. La buona costruzione di un questionario è fondamentale per una buona raccolta dati. La scala delle modalità con cui si rileva il fenomeno X rappresenta l’insieme di tutte le possibili manifestazioni di x su X (x = modalità, X = fenomeno) Es: X =tipo di dieta x1 = carnivoro x2 =onnivoro x3 = vegano … Per definire le scale di modalità devono essere rispettati due principi: 1) Esaustività: la scala delle modalità deve prevedere tutte le possibili manifestazioni di X su U, (U = insieme) al fine di poter classificare ogni osservazione circa una unità statistica (es: la risposta “Altro” in un questionario) Come mai una persona non va in vacanza? _- Motivi economici
- Motivi di lavoro/studio
- Mancanza di abitudine
- Già residente in località di villeggiatura
- Motivi di famiglia
- Motivi di salute
- Paura atti terroristici
- Instabilità politica paese destinazione
- Emergenza sanitaria
- Altri motivi (es. paura dei trasporti pubblici)_
**Scale QUALITATIVE, in cui le modalità sono attributi o categorie, qualità (es: genere, titolo di studio, ecc.):
- Sconnesse** , se gli attributi o le categorie non ammettono un ordinamento oggettivo, ma solo un ordinamento casuale o personale a. Tipo particolare di scale sconnesse sono le scale dicotomiche o binarie, formate cioè da due sole modalità: i. M - f ii. Vero - falso iii. Favorevole - contrario 2) Ordinali , se gli attributi o le categorie possono essere ordinati secondo un qualche criterio oggettivo o convenzionalmente accettato (es: il titolo di studio) Scale QUANTITATIVE , in cui le modalità sono numeri (es: età, altezza…) Le scale quantitative sono SEMPRE ordinali, ma si distinguono in 2 origini: 1) Origine assoluta (scale rapporto), se l’origine della scala è il numero 0 e indica la totale assenza del fenomeno (es. n° accessi al sito unibg) NON PRESENTA NUMERI NEGATIVI 2) Origine convenzionale (scale NON rapporto), se l’origine della scala (ancora lo 0) ha significato solamente convenzionale (es. la temperatura). Dalla tipologia di scala dipende il livello di analisi statistica: 1) una scala qualitativa sconnessa (come il genere) ammette solo relazioni di uguaglianza (=) o differenza (≠), o presenza/assenza 2) una scala qualitativa ordinale (tit. studio) ammette anche le relazioni ≥ e ≤ (cioè l’ordine) es: 5 maschi 8 femmine M ≠ F 5 vegani 5 carnivori 6 onnivori **(Vegani = Carnivori) ≠ Onnivori
- scala quantitativa di rapporto (assoluta): a.** ammette tutte le relazioni **(=, ≠, ≥ e ≤), ma anche le 4 operazioni elementari (+, -, × , ÷)
- una quantitativa non rapporto (convenzionale) ammette solo le relazioni ordinali (≥ e ≤) e le operazioni di somma (+) e sottrazione (‒) IN SINTESI La natura qualitativa o quantitativa del fenomeno di interesse ha a che fare con la tipologia di scala delle modalità adottabile per la sua rilevazione. Ma: alcuni fenomeni quantitativo possono essere rilevati attraverso scale qualitative**
- Es. reddito: fen. Quantitativo → scala qualitative (alto, medio, basso)
- Es. esito esame: fen. qualitativo (è un giudizio) → scala quantitativo (da 18 a 30) ESEMPIO / ESERCIZIO Per ogni fenomeno sociale indicato, individuare (1) la popolazione di riferimento; (2) il tipo di dato; (3) la scala di modalità più opportuna; (4) le operazioni effettuabili tra le modalità della scala X: REGIONE DI RESIDENZA E GENERE DEI LAUREATI ITALIANI IN LINGUE NELL’ANNO 2017. Risposte:
- Popolazione rif. = studenti laureati nell’anno 2017 in Italia - Tipo di dato = qualitativo
- Scala di modalità = qualitativo sconnessa
- Operaz. effettuabili = uguaglianza e differenza Y: IMMIGRATI MASCHI IN ITALIA NEL 2015 Risposte - Popolazione rif. = IMMIGRATI MASCHI IN ITALIA NEL 2015 - Tipo di dato = quantitativo - Scala di modalità = quantitativa **RAPPORTO assoluto
- Operaz. effettuabili =** ammette tutte le relazioni **(=, ≠, ≥ e ≤), ma anche le 4 operazioni elementari (+, -, × , ÷) A: VOTO FINALE IN MATEMATICA DEI BAMBINI CHE HANNO FINITO LA 5° ELEMENTARE A BERGAMO NEL 2020 Risposte
- Popolazione rif =** bambini a bergamo diplomati 5°elementare 2020 - Tipo di dato = quantitativo - Scala di modalità = quantitativa **RAPPORTO assoluto
- Operaz. Effettuabili =** ammette tutte le relazioni (=, ≠, ≥ e ≤), ma anche le 4 operazioni elementari (+, -, × , ÷) Notazione k= insieme di diverse modalità previste dalla scala utilizzata per la rilevazione di X su U Usiamo l’indice i per distinguere le diverse modalità x del fenomeno X
- La rilevazione di X su U avviene con la scala di modalità x1, x2, x3 …. xk
- xi , i = 1, …, k (x con i per i che va da 1 a k) Es. GENERE k= 2 = x1 maschio; x2 femmina Es. VOTO ESAME k= 14 (18-19-20-21-22-23-24-25-26-27-28-29-30-30L); xi = da 18 a 31 (31 = 30L) Quindi: k= TUTTE le modalità( x ) previste dalla scala di rilevazione di X su U i= rappresentazione della modalità contenuta in k (xi= i= 1, 2, 3,…k ) x= singola modalità
L’INCHIESTA CAMPIONARIA
L’interrogazione nell’approccio quantitativo o standard conduce alla costruzione di variabili da inserire in una matrice di dati. L’obiettivo è quello di generalizzare i dati raccolti (costruiti), attraverso l’analisi delle relazioni tra variabili. Caratteristiche 1) L’unità di analisi è l’individuo 2) I casi da intervistare sono selezionati tramite tecniche di campionamento statistico 3) Invarianza dello stimolo: stesse domande, formulate nello stesso modo LA SURVEY E IL SONDAGGIO L’impostazione teorica di una survey è il tratto caratteristico che la differenzia da sondaggi di opinione e poll (per es. online).
VARIABILI STATISTICHE
Questo significa innanzitutto che ora, dopo questo processo (tradotto in tavola di frequenza), con 𝑿 indichiamo sia il fenomeno statistico di interesse (prima della rilevazione) sia la v.s. – variabile statistica – (dopo la rilevazione). Il passaggio dai dati grezzi alla v.s. ha “fatto ordine”, nel senso di rendere i dati più organizzati e leggibili. ALTRI TIPI DI FREQUENZA Le frequenze assolute sono solo un tipo di frequenze che si possono costruire a partire dai dati grezzi Ci sono innanzitutto anche le frequenze relative e percentuali. NB : per costruire le freq. % (ciò che siamo abituati a chiamare appunto «percentuali») è indispensabile avere prima costruito le freq. assolute. Se confronto due popolazioni di numerosità differente (per es. 𝑁 1 = 40 e 𝑁 2 = 28) posso confrontare le frequenze assolute? Il valore (assoluto) «2» assunto nella popolazione 1(U1) ha lo stesso significato che nella popolazione 2 (U2)?
- Cioè i 2 studenti che hanno avuto 4 partner nella U1 e i 2 che hanno avuto 4 partner nella U2?
- No. Perché 2/40 è diverso da 2/28 Allora devo costruire le frequenze relative. Per effettuare un confronto devo depurare il dato dall’influenza di 𝑁, cioè dalla numerosità della popolazione. Più grande è 𝑁, maggiore sarà la frequenza (𝑓𝑖 ), perché la somma di tutte le 𝑓𝑖 è proprio 𝑁. Come si fa a depurare il dato rilevato dall’influenza di 𝑁? La frequenza relativa associata alla modalità 𝑥𝑖 è il rapporto tra la frequenza assoluta e la numerosità di 𝑈 (cioè 𝑁) FREQUENZA CUMULATA
NB: Frequenze assolute, relative e percentuali sono costruibili per qualunque tipo di fenomeno X (qual. categoriale, qual. ordinale, quant. discreto, quant. continuo). Quando il fenomeno di interesse è almeno ordinale può essere aumentato il livello di analisi è buona pratica costruire la v.s. ordinando in senso crescente le modalità osservate Le frequenze cumulate ci dicono quante sono le unità statistiche che manifestano una modalità non superiore di una certa xi È buona norma ordinare in senso crescente le modalità osservate:
- Cioè prendere in considerazione i valori minimo e massimo. o Ci aiuta a capire per es. quante sono le unità statistiche (tre le 𝑁) che manifestano una modalità grande fino a… 𝑥𝑖 o Per es. quante persone in Italia hanno almeno t. studio = licenza superiore Basta sommare (cumulare) le frequenze associate alle diverse modalità. Frequenze cumulate assolute: 𝐹𝑖 (f maiuscolo) Frequenze cumulate relative o percentuali: Ф 𝑖 (phi con i) QUINDI xi = indice delle modalità di risposta 𝑓𝑖 = Frequenza assoluta 𝑝𝑖 = Frequenza relativa f%= Frequenza percentuale (f relativa x100) 𝐹𝑖 = (f maiuscolo) Frequenza cumulata assoluta Ф 𝑖 (phi con i)= Frequenza cumulata relativa F%= Frequenza cumulativa percentuale (f relativa x100) DENSITÀ DI FREQUENZA Se la distribuzione è ignota possiamo fare però due ipotesi per ripartire le unità statistiche tra gli intervalli (cioè, densità). Sono ipotesi ragionevoli, che ad ogni modo, non corrispondono alla realtà! 1) Il valore centrale (tra 45 e 55 = 50)
- 𝑥𝑖 : si tratta di una scala qualitativa ordinale, utilizzata nella rilevazione di opinioni/atteggiamenti (scala Likert) In linguaggio formalizzato: tra gli 80 (𝑁) lettori di oroscopo (𝑈), ci sono 5 modalità (𝑘) di risposta. La risposta più frequente è definita moda. La moda ci dice che, in sintesi, l’oroscopo si verifica «occasionalmente». Per meglio intendersi: nell’esempio, 𝑥0 è associato alla frequenza: 35/80 = 0,44 (freq. rel.) = 44% (freq. Perc.). La moda è un valore medio di sintesi calcolabile per qualsiasi 𝑋 (qualitativo o quantitativo, categoriale o ordinale, discreto o continuo). Può anche esistere più di una moda, per es. due mode (fenomeno bimodale). LA MEDIANA Se il fenomeno studiato è quantitativo (o qualitativo ordinale) è possibile identificare la posizione rispetto all’ordine delle sue modalità k. Quante modalità sono > = < a…? Oltre la moda è quindi possibile effettuare una ulteriore sintesi, grazie alla modalità che occupa la posizione centrale. La mediana di 𝑿 (x0,5) è la modalità che, nell’ordinamento, occupa la posizione centrale. Il 50% di unità statistiche presenta valori di 𝑋 inferiori o uguali alla mediana; il 50% valori superiori o uguali. Per calcolare la mediana si scorre la colonna delle frequenze cumulate relative. La mediana (𝑥0 , 5 ) si trova non appena si raggiunge (o eventualmente si supera) lo 0,5 (corrispondente al 50% di 𝑈). Per calcolare la mediana si scorre la colonna delle frequenze cumulate relative. La mediana ( 𝑥 0 , 5 ) si trova non appena si raggiunge (o eventualmente si supera) lo 0,5 (corrispondente al 50% di 𝑈 ) La mediana di 𝑋 ( 𝑥 0 , 5 ) è la modalità che nell’ordinamento occupa la posizione centrale.
- La mediana non si vede «a occhio», è meno semplice della moda (il valore maggiore), offre
un’informazione più chiara. Il 50% di 𝑈 manifesta modalità 𝑥𝑖 ≤ 𝑥 0. 5 Il 50% di 𝑈 manifesta modalità 𝑥𝑖 ≥ 𝑥 0. 5
QUARTILI
Possiamo dividere 𝑈 in 4 gruppi con uguale numerosità, cioè in quarti (ogni gruppo ¼, 0,25; 25%). I quartili di 𝑋 sono le tre modalità:
- 𝑥0. 25 cioè il 25% di 𝑈 (quartile inferiore)
- 𝑥0. 5 cioè il 50% di 𝑈 ( = mediana)
- 𝑥0. 75 cioè il 75% di 𝑈 (quartile superiore) Calcolo quartili: Si ordinano gli 𝑥𝑘 dati assegnati in ordine crescente;
- Posizione del primo quartile (Q1) = (N*1)/
- Posizione del secondo quartile (Q2) (Mediana) = (N*1)/
- Posizione del terzo quartile (Q3) = (N*3)/ Dove "N" rappresenta il numero di dati nel dataset. Es. risposte ad un questionario da 1 a 10 16 risposte 1, 2, 3, 3, 3, 4, 5, 5, 7, 7, 9, 9, 10, 10, 10, 10 PRIMO QUARTILE (prime 4 risposte [impostate in ordine crescente]) 1, 2, 3, 3 (16x1/4 = 4 ) SEC. QUARTILE 3, 4, 5, 5 (16x2/4 = 8 ) TERZO QUARTILE 7, 7, 9, 9 (16x3/4 = 12 ) QUARTO QUARTILE 10, 10, 10, 10 (16x4/4 = 16 ) QUINTILI, DECILI, PERCENTILI Quintili : divido 𝑈 in 5 parti uguali: 1/5, 0,20; 20%: 𝑥0. 2 , 𝑥0. 4 , 𝑥0. 6 , 𝑥0. 8 Decili : divido 𝑈 in 10 gruppi (1/10; 0,10; 10%): 𝑥0. 1 , 𝑥0. 2 , 𝑥0. 3 , 𝑥0. 4 , 𝑥0. 5 , 𝑥0. 6 , 𝑥0. 7 , 𝑥0. 8 , 𝑥0. 9 Percentili : divido 𝑈 in 100 gruppi (1%): 𝑥0. 01 , 𝑥0. 02 … 𝑥0. 1 , … 𝑥0. 25 … 𝑥0. 5 … 𝑥0. 75 … 𝑥0. 99 **Sintesi in 5 Numeri Per un fenomeno almeno ordinale (qualitativo ordinale o quantitativo) la v.s. può essere descritta da 5 numeri:
- Minimo:** 𝑥 **1
- Primo quartile:** 𝑥 **0. 25
- Mediana (2° quartile):** 𝑥 **0. 5
- Terzo quartile:** 𝑥 **0. 75
- Massimo:** 𝑥k
LA MEDIA
La media aritmetica è un valore di sintesi che può essere utilizzato quando si hanno fenomeni quantitativi, in cui non solo le frequenze, ma anche le modalità sono numeri. Si può cioè operare con strumenti matematici su tutta la v.s. (𝒙𝒊 , 𝒇𝒊 ) [cfr. Lez. 14] È la somma dei valori numerici divisa per il numero dei valori considerati Solo con dei fenomeni quantitativi, oppure qualitativi ordinali, ma rilevati con una scala quantitativa (es. i voti universitari) Notazione
Si legge : la media è la sommatoria, per i che va da 1 a k, di ( 𝑥𝑖 ) diviso N I voti ottenuti negli esami, espressi in trentesimi. Qual è la media dei voti? 30+29+27+30+28+30 6 = 174/6 = 29 LA MEDIA PONDERATA Domanda: Prendere 30/30 in un esame da 5 CFU è uguale o diverso da prendere 30/30 in un esame da 10 CFU? Il medesimo voto (30) ha lo stesso peso in relazione a entrambi gli esami? La media ponderata (o media pesata) è una variante della media aritmetica che si usa quando ciascun numero ha una determinata importanza (detta ‘peso’) che influisce sul calcolo. Per calcolare la media ponderata tra più numeri, quindi, è necessario conoscere anche i loro pesi, oltre che i numeri stessi. Il calcolo del voto di laurea: ogni voto ha un valore che deve però essere ponderato (pesato) in base a un criterio (n° CFU). Prendere 30/30 in un esame da 5 CFU è diverso da prendere 30/30 in un esame da 10 CFU. Bisogna quindi sommare i prodotti dei voti per i CFU e dividere per il numero dei CFU totali (poi per 110 e diviso 30). La media ponderata è un tipo particolare di media, dato dalla somma dei prodotti di ogni numero per i rispettivi «pesi» / la somma dei pesi. x₁ ∙ p₁ + x₂ ∙ p₂ + … + xn ∙pn /