Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica sociale - Statistica di base, Appunti di Statistica Sociale

Statistica sociale completo e dettagliato per l'esame

Tipologia: Appunti

2020/2021

Caricato il 08/01/2022

pamgian
pamgian 🇮🇹

5

(5)

10 documenti

1 / 31

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1
ST AT ISTI CA S OC IALE
CAPI TO LO 1: CHE COS’È L A ST AT ISTI CA?
La statistica è un insieme di metodi e di tecniche per la conoscenza quantitativa, l'analisi e la comprensione
di uno o più fenomeni, singolarmente o congiuntamente considerati, che si presentano nella realtà con un
insieme di diverse manifestazioni, osservabili totalmente o parzialmente.
L'etimologia della parola “statistica” deriva da “Stato” e fa riferimento al fatto che le prime informazioni su
fenomeni reali sono state raccolte ed organizzate ad opera degli organismi statali che ne erano anche i
principali utilizzatori. Le tracce più antiche di rilevazioni statistiche ufficiali risalgono ai Sumeri e agli Egizi.
La fase metodologica si fa iniziare con A. Quetelet a fine 700, a cui dobbiamo l'unificazione sotto un'unica
visione di diversi ambiti di ricerca riconducibili alla Statistica (la demografia, la teoria degli errori accidentali
e il calcolo delle probabilità). È da questo momento che la statistica si caratterizza come metodo scientifico.
Fenomeno statistico: fenomeno di interesse X/Y es: reddito
Unità statistiche: supporti fisici/teorici al f. di interesse singoli individui
Manifestazioni statistiche: singole determinazioni del fenomeno x/y reddito di Tizio
U: l’insieme delle unità statistiche sulla quali interessa studiare il fenomeno
N: Il numero di unità statistiche che compongono la popolazione statistica di riferimento
X: fenomeno x: modalità n: campione
Esempio: X (reddito) x (quanto guadagna Tizio) U (popolazione di riferimento) N (n. di persone)
ST AT ISTI CA D ESCRITTIVA
Se la rilevazione è esaustiva (censuaria) di U, la statistica ha la funzione di descrivere il comportamento di X
su U. Può essere:
Univariata: ha per oggetto un solo fenomeno singolarmente rilevato e come obiettivo la descrizione
del suo comportamento su U.
Bivariata: ha per oggetto una coppia di fenomeni rilevati sulla stessa U e come obiettivo l'individuazione
delle eventuali relazioni statistiche tra i due.
Multivariata: ha per oggetto più di due fenomeni rilevati e per obiettivo la descrizione del
comportamento congiunto e studiarne le relazioni
ST AT IS TI CA INFERENZIALE
Se la rilevazione è parziale (campionaria) di U, la statistica ha come obiettivo la descrizione e la comprensione
del comportamento di X su U, ma la sua funzione è quella di estendere i risultati dell'elaborazione dei dati
campionari all'intera U. Si tratta di un'induzione dal particolare al generale (inferenza statistica) che può
essere fatta solo con una ricerca quantitativa.
Il dato ha un contenuto informativo in quanto viene messo in relazione con altri dati. Un dato isolato non
serve a nulla (non ha contenuto informativo), anche se può far da base per la valutazione (trasformazione in
informazione) di altri dati, diventando anch'esso oggetto di valutazione nel confronto.
Procedimento: raccolta di dati elaborazione trasformazione dei dati in informazioni
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f

Anteprima parziale del testo

Scarica Statistica sociale - Statistica di base e più Appunti in PDF di Statistica Sociale solo su Docsity!

STATISTICA SOCIALE CAPITOLO 1: CHE COS’È LA STATISTICA? La statistica è un insieme di metodi e di tecniche per la conoscenza quantitativa , l'analisi e la comprensione di uno o più fenomeni, singolarmente o congiuntamente considerati, che si presentano nella realtà con un insieme di diverse manifestazioni, osservabili totalmente o parzialmente. L'etimologia della parola “statistica” deriva da “Stato” e fa riferimento al fatto che le prime informazioni su fenomeni reali sono state raccolte ed organizzate ad opera degli organismi statali che ne erano anche i principali utilizzatori. Le tracce più antiche di rilevazioni statistiche ufficiali risalgono ai Sumeri e agli Egizi. La fase metodologica si fa iniziare con A. Quetelet a fine 700, a cui dobbiamo l'unificazione sotto un'unica visione di diversi ambiti di ricerca riconducibili alla Statistica (la demografia, la teoria degli errori accidentali e il calcolo delle probabilità). È da questo momento che la statistica si caratterizza come metodo scientifico.

  • Fenomeno statistico: fenomeno di interesse – X/Y – es: reddito
  • Unità statistiche: supporti fisici/teorici al f. di interesse – singoli individui
  • Manifestazioni statistiche: singole determinazioni del fenomeno – x/y – reddito di Tizio U: l’insieme delle unità statistiche sulla quali interessa studiare il fenomeno N: Il numero di unità statistiche che compongono la popolazione statistica di riferimento X: fenomeno x: modalità n: campione Esempio: X (reddito) x (quanto guadagna Tizio) U (popolazione di riferimento) N (n. di persone) STATISTICA DESCRITTIVA Se la rilevazione è esaustiva (censuaria) di U, la statistica ha la funzione di descrivere il comportamento di X su U. Può essere:
  • Univariata : ha per oggetto un solo fenomeno singolarmente rilevato e come obiettivo la descrizione del suo comportamento su U.
  • Bivariata : ha per oggetto una coppia di fenomeni rilevati sulla stessa U e come obiettivo l'individuazione delle eventuali relazioni statistiche tra i due.
  • Multivariata : ha per oggetto più di due fenomeni rilevati e per obiettivo la descrizione del comportamento congiunto e studiarne le relazioni STATISTICA INFERENZIALE Se la rilevazione è parziale (campionaria) di U, la statistica ha come obiettivo la descrizione e la comprensione del comportamento di X su U, ma la sua funzione è quella di estendere i risultati dell'elaborazione dei dati campionari all'intera U. Si tratta di un'induzione dal particolare al generale (inferenza statistica) che può essere fatta solo con una ricerca quantitativa. Il dato ha un contenuto informativo in quanto viene messo in relazione con altri dati. Un dato isolato non serve a nulla (non ha contenuto informativo), anche se può far da base per la valutazione (trasformazione in informazione) di altri dati, diventando anch'esso oggetto di valutazione nel confronto.
  • Procedimento: raccolta di dati → elaborazione → trasformazione dei dati in informazioni

IL METODO SCIENTIFICO Dopo Galilei per parlare di scienza non si potrà più addurre l’autorevolezza del passato (principio di autorità), ma si dovranno portare esperienze oppure esperimenti. Esso permette di raggiungere una conoscenza della realtà oggettiva e verificabile anche attraverso l’ausilio della ragione. La conoscenza umana segue delle procedure pubbliche , controllabili da chiunque. Che cosa significa fare ricerca sociale? Significa indagare un aspetto della realtà sociale. Un insieme di procedimenti attraverso cui cerchiamo di acquisire conoscenze scientifiche sulla realtà. Che cosa differenzia il lavoro di un ricercatore, da altri tipi di indagine? Il metodo che si utilizza costituisce l’elemento che distingue una ricerca di tipo scientifico da altre forme di indagine. Il metodo scientifico è una strada, esistono molti percorsi che possono portare alla stessa meta. Una ricerca per essere scientifica deve:

  • Essere frutto dell’applicazione rigorosa di un metodo di indagine
  • Avere un fondamento empirico
  • Le sue procedure devono essere pubbliche Per metodo intendiamo il fatto che la ricerca scientifica non ne ha uno solo valido per tutte le scienze. Per base empirica intendiamo il fatto che la ricerca deve essere fondata su fatti osservabili, cioè non sono solo costrutti mentali del ricercatore. Differenza tra base empirica e il «senso comune»; per es. l’errata generalizzazione: la «percezione» della rilevanza quantitativa del crimine o di eventi che mettono in discussione la nostra idea di società (il fenomeno migratorio). Per procedure pubbliche intendiamo il fatto che la conoscenza che pretende di essere scientifica deve anche essere disponibile alla critica, cioè ad essere osservata e analizzata da altri scienziati rendendo pubbliche le procedure utilizzate e dichiarando in maniera esplicita la tecnica scelta ad esempio, chi è stato intervistato ecc.. CAPITOLO 2: RIFLESSIONE E UTILITÀ DEL METODO Per metodologia si intende la riflessione scientifica sul metodo della scienza che serve a capire se un dato procedimento possa realmente condurre a risultati validi, o a una validità illusoria. Essa permette di esplicitare le procedure per generalizzare la conoscenza metodologica. L’opinione pubblica è oggetto di informazioni poco verificabili, imprecise e false. Un esempio riguarda le correlazioni spurie : la tendenza a individuare un nesso di causalità tra fenomeni che presentano una correlazione statistica frutto di pura coincidenza. IL METODO E LE TECNICHE Il termine metodo significa “in direzione di” rappresenta, in un contesto scientifico, l’insieme delle procedure utilizzate per raggiungere una conoscenza dotata di un significato. Le tecniche si riferiscono agli strumenti della ricerca quantitativa, l’insieme di regole, principi e procedure specifiche. Sono basate su: - conoscenza - esperienza e riguarda la capacità pratica di operare x raggiungere un dato fine.

RISULTATI

  1. Presentazione dei dati : come vengono presentati i dati raccolti nell’analisi? Nel modello quantitativo all’interno di tabelle.
  2. Generalizzazioni : obiettivo di una ricerca è instaurare relazioni fra variabili. Nel modello quantitativo la tipica generalizzazione è costituita dalla correlazione statistica, l’individuazione di cause dei fenomeni, fino alla costruzione di leggi di validità universale.
  3. Portata dei dati : Nel modello quantitativo la generalizzabilità dei risultati è l’obiettivo principale poter estendere i risultati relativi al campione studiato all’intera popolazione di riferimento. APPROCCIO QUANTITATIVO A livello empirico parliamo di indicatori – correlazioni – casi. Il disegno è strutturato, tipicamente nella indagine campionaria (survey). Uno strumento per rilevare informazioni, interrogando gli individui oggetto della ricerca, appartenenti a un campione rappresentativo, mediante una procedura standardizzata, allo scopo di studiare le relazioni esistenti tra le variabili. I fenomeni sociali sono ridotti a relazioni tra variabili. La variabile è oggettiva , neutrale : misurabilità dei fenomeni sociali. Fasi di ricerca: argomento (concetto) – soggetto (oggetto) – definizione operativa (specifica gente tra 14 e 19 anni) – campione La matrice dei dati: Permette di incrociare le variabili indagate, con i casi concretamente studiati marginali di riga Le indagini statistiche si occupano di tre operazioni distinte:
  • Raccogliere i dati – presentarli - analizzarli VARIABILITÀ

FORMALIZZAZIONE STATISTICA Un professore vuole indagare l’interesse per la sua materia da parte dei suoi 25 alunni. Decide di misurare il loro interesse contando il numero di libri letti negli ultimi 6 mesi da ogni suo studente. Compito: determinare la popolazione statistica di riferimento e le relative unità statistiche, la sua numerosità, il fenomeno di interesse, e le modalità osservabili su ogni unità statistica.

  • U = classe
  • Unità statistica (u) =ogni studente
  • N=
  • Fenomeno di interesse (X)=numero libri letti in unità di tempo
  • Modalità di X osservabili su ogni unità statistica (u) (x) =1, 2, 3, … n CALCOLO DELLE PROBABILITÀ La probabilità matematica di un evento casuale (p) è data dal rapporto tra i casi favorevoli (f) ed i casi possibili (n): p = f / n Quante sono le possibilità che lanciando un dado esca un numero pari? Casi favorevoli: 3; casi possibili: 6. p=3/6, cioè ½, 0,5x100= 50%.La probabilità matematica di un evento impossibile è 0 (quante possibilità che esca 345? 0 su 6, cioè
  1. La probabilità matematica di un evento certo è 1 (quante possibilità che esca un numero da 1 a 6? 6/6 = 1).
  • La tombola: qual è la probabilità che esca un numero pari? 45/90, cioè 0,5 (il 50%).
  • Se effettuo delle estrazioni ottengo una tabella di frequenza. La frequenza relativa è il rapporto tra le volte in cui l’evento si è verificato e il numero di prove effettuate

Classificazione delle scale di modalità: Scala di modalità qualitativa :

  1. Sconnesse : se gli attributi o le categorie non ammettono un ordinamento oggettivo ma solo un ordinamento casuale o personale (es: il genere). Ammette solo relazioni di uguaglianza (=) o differenza o presenza/assenza
  2. Ordinali : se gli attributi o le categorie possono essere ordinati secondo un qualche criterio oggettivo (es: titolo di studio), ammette anche le relazioni ≥ e ≤ (cioè l’ordine) Scala di modalità quantitativa :
  3. Origine assoluta (scale rapporto): se l'origine della scala è il numero 0 e indica l'assenza del fenomeno (n. accessi), ammette tutte le relazioni (=, ≠, ≥ e ≤) ma anche le 4 operazioni elementari (+, - , × , ÷)
  4. Origine convenzionale (scale non rapporto): se l’origine della scala (generalmente ancora lo 0) ha significato solamente convenzionale (es: la temperatura). Ammette solo le relazioni ordinali (≥ e ≤) e le operazioni di somma (+) e sottrazione (‒). ----Esercizi pdf pag 25 cap 3------ NOTAZIONE

k : numero di diverse modalità previste dalla scala utilizzata per la rilevazione di X su U. es: genere →k = 2;

x1 =“maschio”, x2 =“femmina”. (totale modalità)

i : indice per distinguere le diverse modalità x del fenomeno X (quali sono le modalità di un certo fenomeno)

k: 4 (N C V S) n 2 = 7 da 1 a k sono modalità / da 1 a n sono numeri UNITÀ DI ANALISI Le UDA è il tipo di oggetto di cui si occupa la ricerca sociale. Essa è singolare e astratta. (es: le auto vendute o i comuni italiani). Per passare dalle UDA (astrazione) al concreto bisogna prendere in considerazione i singoli casi. Essi sono gli esemplari su cui svolgo la ricerca (Mario, comune di Verdello ecc) Esempio:

  • Voglio fare una ricerca sugli studenti (UDA)
  • Ho fatto una ricerca su Maria, Giacomo ecc (SINGOLI CASI)
  • Oggetto → unità → singolo caso Es: La disoccupazione giovanile→ i giovani tra i 16 e i 34 anni, senza occupazione stabile →Mario

IL CAMPIONAMENTO !!!! La selezione di una porzione di popolazione (cioè una parte di U) per individuare i casi (le future righe della matrice dei dati, u). Solo con una delimitazione spazio-temporale (i giovani di Bergamo, nel 2019) e con il campionamento i risultati della ricerca (sui casi singoli) sono generalizzabili, cioè riferibili all’universo.

  1. L’individuo , è l’unità elementare, non ulteriormente scomponibile di molte ricerche sociali (e la base per UDA di tipo aggregato)
  2. L’aggregato , può riferirsi a:
  • Più individui → famiglia
  • Unità territoriali → una città, un quartiere, una regione
  • Enti → istituzioni, organizzazioni
  1. Eventi sociali (es: le elezioni)
  2. Un prodotto culturale (spesso oggetto di analisi qualitativa, non statistica) CONCETTO Un concetto è rappresentato come una proprietà di una UDA che devo tradurre in una variabile, i cui valori sono empiricamente rilevabili. Sulla matrice potrò così inserire lo stato che ogni caso assume su quella proprietà (per es. 1 o 2 come presenza o assenza). Questa traduzione è la operativizzazione (concetti astratti tradotti in indicatori). Nella ricerca sociale i concetti sono però spesso: generici – estesi – astratti, quindi è IMPOSSIBILE la rilevazione DIRETTA di questi concetti. Se il concetto non ha stati empiricamente rilevabili, si deve trovare un altro concetto che ne abbia, ossia un INDICATORE. Il concetto (C) è rappresentato tramite l’indicatore (I). I è un concetto più specifico di C, e può essere inteso come rappresentazione semantica di C. Poiché C è complesso, si usano spesso più di un I. Es: c: status socioeconomico i: reddito, titolo di studio Per avere una sintesi posso attuare una ricombinazione di più indicatori di un concetto: INDICE. trasforma in variabili Proprietà → indicatori → variabili → definizione operativa Es domanda esame: tabella con “andamento del covid in Ita nel mese di Febbraio 2020” descrivetemi il fenomeno (di tipo quantitativo) e com’è stato costruito il dato. Es: L’UdA è l’individuo, la proprietà è il titolo di studio, è possibile individuare diversi STATI su questa proprietà (gli stati sono tradotti in modalità).
  • Popolazione anziana: «senza titolo», licenza elementare, licenza media, diploma superiore, laurea.
  • Popolazione giovane: s. t., licenza elementare, media, titolo di scuola II di 2°… dottorato. Non c’è corrispondenza biunivoca tra un concetto e la variabile (dipende dal contesto e dalla teoria di riferimento).

STATISTICA DESCRITTIVA MONOVARIATA: LA FREQUENZA I dati grezzi: Il risultato della rilevazione del fenomeno 𝑋 sulla popolazione 𝑈 (numerosità 𝑁) è un insieme di 𝑁 osservazioni. Ciascuna osservazione coincide con una (e una sola) delle 𝑘 modalità 𝑥𝑖 previste dalla scala utilizzata. Es.: il comportamento sessuale degli studenti universitari (60 intervistati, ultimi 12 mesi)

  • 𝑋 : fenomeno quantitativo e discreto (si rileva contando) e le sue modalità 𝑥𝑖 sono i numeri interi 0, 1, … 𝑛
  • la scala delle modalità è quantitativa rapporto (assoluta), cioè: 0, 1, 2, …
  • 𝑈: gruppi studenti M/F
  • 𝑁: 60
  • 𝑋: numero partner negli ultimi 12 mesi Rappresentazione del dato X (es: x 1 = 11 xk ci sono 11 studenti con 0 ) Si dovrà tradurre il dato grezzo in una informazione intellegibile cioè una tabella (o un grafico) che presenta la distribuzione di frequenza (e le variabili statistiche ). Il dato grezzo diceva che il fenomeno 𝑋 aveva 9 (𝒌 =9 ) modalità 𝑥𝑖 differenti: da 0 a 8 (n° dei partner). Possiamo allora contare quante volte le 𝑘 modalità (𝑥1, … 𝑥9) si presentano nel campione… → La somma delle frequenze assolute di x𝑖 è uguale a 𝑁 (60). La tab. nel suo insieme, cioè le k coppie formate da modalità (𝑥𝑖) per frequenza (0, … , 8) è definita variabile statistica. Il numero di volte in cui una modalità 𝑥𝑖 è stata rilevata in 𝑈 si chiama frequenza (assoluta). La somma delle frequenze assolute riproduce la numerosità 𝑁 di 𝑈. La freq. ass. viene indicata con 𝑓𝑖 (i-esima frequenza).
  • Le modalità 𝑥𝑖 a seconda della natura del fenomeno 𝑋 e della tipologia di scala utilizzata, possono essere attributi, categorie, numeri, intervalli.
  • Le frequenze 𝑓𝑖 sono sempre numeri interi.
  • Una v. s. è un insieme di 𝑘 coppie {𝑥𝑖 , 𝑓𝑖}
  • v. s. = { (xi , fi), }
  • Dopo questo con 𝑿 indichiamo sia il fenomeno statistico di interesse (prima della rilevazione) sia la v.s. (dopo la rilevazione) ------Esercizi pdf pag 19- 20 - 21 cap 4 ----- Le frequenze assolute sono solo un tipo di frequenze, ci sono anche le relative e percentuali. Per costruire le freq. % è indispensabile avere prima costruito le freq. assolute. Esempio: se confronto due popolazioni di numerosità differente (per es. 𝑁1 = 40 e 𝑁2 = 28) posso confrontare le frequenze assolute? Il valore (assoluto) «2» assunto nella popolazione 1 ha lo stesso significato che nella popolazione 2?
  • Cioè i 2 studenti che hanno avuto 4 partner nella U1 e i 2 che hanno avuto 4 partner nella U2?
  • No. Perché 2/40 è diverso da 2/28, devo costruire le frequenze relative. FREQUENZE RELATIVE Per effettuare un confronto devo depurare il dato dall’influenza di 𝑁. Più grande è 𝑁, > sarà la frequenza (𝑓𝑖), perché la somma di tutte le 𝑓𝑖 è proprio 𝑁. La frequenza relativa associata alla modalità 𝑥𝑖 è il rapporto tra la frequenza assoluta e la numerosità di 𝑈. Nel nostro caso: freq. rel. = 2/40 = 0,050. Una grandezza relativa è un rapporto che ha al denominatore (40) la grandezza che «disturba» il confronto della quantità (2) che sta al numeratore. Le f.r. in quanto grandezze adimensionali sono sempre confrontabili. Sono sempre comprese fra 0 … 1 0 ≤ 𝑝𝑖 ≤ 1 La somma delle frequenze relative è sempre 1 Sommare tutte le modalità 9 hanno risposto 0, 10 hanno risposto 1 f compreso

DENSITÀ DI FREQUENZA Fenomeni quantitativi continui (numeri e si misurano). Il fenomeno 𝑋 ha 𝑥𝑖 modalità che possono essere considerate intervalli.

  • Cioè all’intervallo tra 𝑥1 e 𝑥2 possono appartenere diverse unità statistiche. Quante?
  • La distribuzione di frequenza all’interno degli intervalli è ignota. Se la distribuzione è ignota possiamo fare però due ipotesi per ripartire le unità statistiche tra gli intervalli (cioè densità). 1. Valore centrale : in medio stat virtus. Si associa a tutte le frequenze il valore centrale dell’intervallo: tra 45 e 55? 50. 2. Distribuzione uniforme : ogni possibilità è alla pari. Tutte le unità sono distribuite in modo uniforme ed equidistante. LEGGERE: LE FONTI STATISTICHE
  1. I dati amministrativi (esaustivi, coprono la popolazione, scarso valore informativo). I dati prodotti dai processi amministrativi nei pubblici registri, prodotti da enti pubblici o privati (camere di commercio, ACI…). Soprattutto: l’ anagrafe comunale:
  • Saldo positivo della popolazione (nascite e immigrazioni)
  • Saldo negativo (morti e emigrazioni)
  1. Censimenti (anche informazione).
  2. Survey (indagini campionarie, alto contenuto informativo) CAPITOLO 5: I VALORI MEDI LA MODA La moda o norma di una variabile statistica è la modalità a cui è associata la frequenza più elevata fra le 𝑘 osservate del fenomeno di interesse. Cioè la modalità più osservata, con maggiore frequenza.
  • La moda di 𝑋 è indicata con 𝑥 0 (x con 0). In linguaggio formalizzato: tra gli 80 (𝑁) lettori di oroscopo (𝑈), ci sono 5 modalità (𝑘) di risposta. La risposta più frequente è definita moda: 𝑥 0 è associato alla frequenza: 35/80 = 0,44 (freq. rel.) = 44% (freq. perc.). È un valore medio di sintesi calcolabile per qualsiasi 𝑋 (qualitativo o quantitativo, categoriale o ordinale, discreto o continuo). Quando si hanno fenomeni continui, con modalità che sono intervalli, 𝑥 0 è indicato come intervallo modale , quello più denso. Può anche esistere più di una moda, per es. due mode (fenomeno bimodale ). Scala qualitativa ordinale Frequenze K=

LA MEDIANA Se il fenomeno studiato è quantitativo (o qualitativo ordinale ) è possibile identificare la posizione rispetto all’ ordine delle sue modalità k. È la modalità che nell’ordinamento occupa la posizione centrale.

  • La mediana di X è indicata con X0. Per calcolare la mediana si scorre la colonna delle frequenze cumulate relative. Si trova non appena si raggiunge (o eventualmente si supera) lo 0,5 (corrispondente al 50% di 𝑈). Esempio: 5 studenti di facoltà umanistica, classificati secondo l’attitudine (X) alla matematica (test attitudinale). Le modalità associate alla variabile (attitudine) sono: scarsa, ottima, buona (𝑘 = 3). Le modalità della variabile possono essere ordinate (in ordine crescente ). ----esercizi pdf pag 22- 23 - 24 cap 5------- GENERALIZZAZIONI DELLA MEDIANA: QUARTILI - DECILI – PERCENTILI I quartili di 𝑋 sono le tre modalità: - 𝑥 0.25 cioè il 25% di 𝑈 (quartile inferiore) - 𝑥 0.5 cioè il 50% di 𝑈 ( = mediana) - 𝑥 0.75 cioè il 75% di 𝑈 (quartile superiore) Quintili: divido 𝑈 in 5 parti uguali: 1/5, 0,20; 20%: - 𝑥 0.2 , 𝑥 0.4 , 𝑥 0.6 , 𝑥 0. Decili: divido 𝑈 in 10 gruppi (1/10; 0,10; 10%): - 𝑥 0.1 , 𝑥 0.2 , 𝑥 0.3 , 𝑥 0.4 , 𝑥 0.5 , 𝑥 0.6 , 𝑥 0.7 , 𝑥 0.8 , 𝑥 0. Percentili: divido 𝑈 in 100 gruppi (1%): - 𝑥 0.01 , 𝑥 0.02 … 𝑥 0.1, … 𝑥 0.25 … 𝑥 0.5 … 𝑥 0.75 … 𝑥 0. La v.s. può essere descritta da 5 numeri:
  • Minimo : 𝑥 1
  • Primo quartile: 𝑥0.
  • Mediana (2° quartile): 𝑥0.
  • Terzo quartile: 𝑥0.
  • Massimo : 𝑥𝑘 ------esercizi pdf pag 30 cap 5----- Dipende dalla quantità di risposte. Bisogna ordinarle e così facendo divide in 2 il campione

LA MEDIA La media aritmetica è un valore di sintesi che può essere utilizzato quando si hanno fenomeni quantitativi , in cui non solo le frequenze , ma anche le modalità sono numeri.

1. La media aritmetica : è la somma dei valori numerici divisa per il numero dei valori numerici considerati. - Notazione: la media di X è X (con linea sopra) se si usano le frequenze relative invece - La media è la sommatoria , per i che va da 1 a k , di 𝑥𝑖 𝑝𝑖 (cioè della frequenza relativa). 2. La media ponderata : è un tipo particolare di media, dato dalla somma dei prodotti di ogni numero per i rispettivi « pesi » / la somma dei pesi. La semplice media aritmetica è una media in cui tutti i pesi sono = 1. SCARTI/DEVIAZIONI DELLA MEDIA Scarto o deviazione di media: (𝑥𝑖 𝑥 con linea sopra) → un valore – la media Scarto ponderato : (𝑥𝑖 𝑥 con linea sopra) 𝑓𝑖 Ma la media è sempre compresa ( internalità ) tra il valore minimo e il valore massimo. Quindi vi saranno k scarti negativi e postivi. Se lo scarto è positivo (𝑥𝑖 𝑥 con linea sopra) > 0 è sopra-media (altrimenti è sotto- media: < 0 ), i valori sopra-media e sotto-media si compensano … cioè se sommiamo tutti i k scarti ponderati si ottiene sempre 0.

  • Proprietà di annullamento degli scarti della media aritmetica: (per togliere + / - ) Lo scarto quadratico serve per eliminare il segno degli scarti (𝑥j − valore medio)^2 𝑓𝑖. La media aritmetica minimizza la somma degli scarti quadratici ponderati. ------esercizi pdf pag 50- 51 - 52 cap 5-------

CAPITOLO 6: LA VARIABILITÀ VARIABILITÀ E DISPERSIONE I valori medi descrivono adeguatamente alcuni fenomeni statistici, ma spesso non sono sufficienti.

  • U= consumatori di pollo
  • N= 10
  • X= numero di polli consumati (fenomeno quant. discreto).
  • k=2 chi mangia e chi non mangia il pollo (uno mangia 10 polli, 9 mangiano 0 polli).
  • La media (𝑥ҧ) dice che ogni u (di U) mangia 1 pollo. La media non coglie un fatto tipico dei fenomeni statistici: la variabilità o dispersione di X. Un fenomeno X tende a manifestarsi sulle u di U in modo diverso e distante. Esempio di variabilità: temperature medie registrate nei 12 mesi in due diverse città:
  • Honolulu: 21, 22, 23, 24, 25, 25, 27, 26, 25, 24, 24, 22.
  • Phoenix: 2, 8, 18, 27, 28, 35, 36, 38, 35, 27, 22, 12. La media è identica: 𝑥̅ = 24°. Ma la media è fuorviante , perché in realtà a Phoenix la temperature scende (o sale) moltissimo, a Honolulu no! RANGE : La prima misura (intuitiva) della variabilità è il range (o campo di variazione ) range di X = xmax – xmin. Una misura della variabilità è un indice sintetico che:
    • Assume valore 0 in assenza di variabilità (X si manifesta su U con una sola modalità, è una v.s. costante o degenere).
    • Assume valori positivi (> 0) quando X si manifesta con modalità differenti (cioè variabilità).
    • Maggiore è la variabilità, maggiore è il valore della misura Esempio di calcolo del range prendendo una serie numerica: Età dei presenti: 19, 20, 21, 28, 22, 23, 27, 19, 21, 20, 25, 24, 20, 30, 22, 23, 45, 24, 21, 20 (N=20).
    1. Occorre ordinarla in modo crescente: 19, 19, 20, 20, 20, 20, 21, 21, 21, 22, 22, 22, 23, 23, 24, 24, 25, 27, 28, 30, 45.
    2. Identificare i valori minimo e massimo (𝑥𝑚𝑖𝑛 = 19, 𝑥𝑚𝑎𝑥 = 45).
    3. Sottrarre il min dal max (45-19=26). Il range delle età della classe è 26 (x 0 : 20; 𝑥̅ : 23,7). X manifesta due modalità (tutto o niente) che sono fra loro massimamente distanti, cioè massima variabilità.

Esempio:

  • Il valore di 𝜎 (= 1,97) misura la variabilità del livello di stress nella popolazione osservata.
  • È ≠ 0 quindi il fenomeno X varia in U (non è una costante).
  • 𝜎 dice che in media i livelli di stress deviano (distano) dal livello medio (6,10) di ± 1,97. VARIANZA La varianza di X (𝝈𝟐):
  • È la formula precedente elevata al quadrato : quindi il vantaggio è quello di fare a meno della radice quadrata
  • La varianza (𝜎2) vale 0 nel caso di nessuna variabilità e aumenta all’aumentare della variabilità. Se i valori sono bassi i dati osservati sono ravvicinati , se i valori sono alti invece sono distanti o distribuiti. DEVIANZA Una seconda misura importante è la devianza , cioè la varianza moltiplicata per N : Ha il senso di semplificare l’analisi, perché elimina N dal denominatore.

IL COEFFICIENTE DI VARIAZIONE Range, IQR, deviazione standard, varianza e devianza sono misure assolute della variabilità. Sono quindi influenzate dall’ordine di grandezza e dall’unità di misura, quindi non sono confrontabili. Ci vuole una misura di variabilità relativa come il coefficiente di variazione (cv): Bisogna rapportare il risultato ottenuto (𝜎) con un valore medio che sintetizzi l’ordine di grandezza del fenomeno analizzato. Il cv ( coefficiente di variazione ) di X si costruisce mettendo la deviazione standard a rapporto con la media aritmetica (𝜎 /𝑥̅ ). Esempio:

  • Calcoliamo quindi il coefficiente di variazione:
  • Valutazione : la variabilità di X è circa il 51,2% dell’età media per i maschi, il 50,7% per le femmine.
  • Confronto : la variabilità è molto simile, ma leggermente maggiore per i maschi (se confrontassi le 𝜎 avrei l’impressione opposta!). Attenzione : Cosa significa che la variabilità nelle femmine è 50,7%? Non che la variabilità delle F è il 50,7%. Ma che la variabilità (cioè la tendenza ad avere età differenti) è la metà circa della media. Più alta è la variabilità di un fenomeno, meno informazioni vengono dalla semplice media aritmetica -------esercizi pdf pag 37- 38 - 39 - 40 - 41 - 42 - 43 - 44 cap 6----------- CAPITOLO 7 : L’ANALISI BIVARIATA Bivariata : la rilevazione congiunta di una coppia di fenomeni statistici sulla stessa popolazione.
  • Come X e Y variano su U.
  • Il loro comportamento congiunto. Obiettivo: capire se e come esiste una relazione statistica tra i due fenomeni. È la base per capire se due fenomeni co-variano e si influenzano. L’analisi bivariata è particolarmente importante nello studio dei fenomeni sociali. È noto per es. che l’occupazione/disoccupazione (X) è fortemente collegata al titolo di studio posseduto (Y). Ciò che emerge è la relazione tra due variabili.