Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


appunti statistica Zanarotti, Appunti di Statistica

Appunti di statistica di Zanarotti. Anno 2023/2024 voto 30

Tipologia: Appunti

2022/2023

Caricato il 29/02/2024

angela-hu-11
angela-hu-11 🇮🇹

3 documenti

1 / 4

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Statistica
Lez. 04/10
Paradosso di Simpson: le relazioni esistenti tra le percentuali dei sottogruppi possono essere stravolte
quando i sottogruppi vengono fusi (es. numeri ammessi tra maschi e femmine sembrava che discriminano i
maschi ma alla fine le femmine hanno fatto domanda a facoltà più difficili), ovvero quando ci sono dei dati
aggregati bisogna disaggregarli (entrare nei dettagli) , sennò i dati sarebbero falsi.
Campo di variazione: indice di variabilità ed è dato dalla differenza tra il valore massimo di una distribuzione
ed il valore minimo.
Mediana: cosa sta in mezzo
Che cos’è? La statistica è una scienza che studia i fenomeni collettivi attraverso la raccolta di dati che
vengono poi analizzati e interpretati graficamente. (Lisa S.).
Analizza in termini quantitativi i fenomeni collettivi , ossia i fenomeni il cui studio richiede
l’osservazione di un insieme di manifestazioni
Mette a disposizione metodi e strumenti per raccogliere informazioni, fornire una rappresentazione
organica dei dati, pervenire ad una sintesi che agevoli la comprensione del fenomeno collettivo e
risponda alle domande di interpretazione, previsione
Una caratteristica è che si tratta di una scienza di un senso particolare, in quanto consiste
Il contesto applicativo fa sì che la statistica si declini
Terminologia: la statistica analizza in termini quantitativi i fenomeni collettivi (caratteri o variabili),
ossia i fenomeni in cui lo studio richiede l’osservazione di un insieme di manifestazioni individuali
(es. Consumo, reddito, statura, pioggia, prezzi ecc…).
La modalità sono i possibili modi in cui ciascun carattere o variabile si manifesta ( es. Reddito
saranno dei numeri positivi in euro).
Unità statistica è l’unità elementare su cui vengono osservati i caratteri oggetto di studio, possono
essere cose diverse (es. Titolo di studio sono le persone, il reddito potrebbe essere singolo individuo
o un aggregato di persone, la pioggia sono i giorni).
Collettivo statistico o popolazione sono insieme di unità statistiche, può essere:
Popolazione finita (es. Una classe di studenti)
Popolazione infinita (es. I giorni della pioggia sono infiniti)
L’elenco delle modalità assumibili da un carattere è detto scala della modalità. Requisiti sono:
Esaustive ( rigorosa esattezza): devono rappresentare tutti i possibili modi di essere del
carattere ( es. Andare in vacanza non può essere solo mare e montagna ma anche città
Mutuamente esclusive: ad ogni unità statistica deve risultare associata una sola modalità
(es. Non si può inserire, a modalità sia capelli castani che scuri pk le due categorie non sono
mutualmente esclusive pk sono sovrapponibili
Distinzione tra:
Caratteri quantitativi: quando le modalità sono rappresentate da numeri (es. Titolo di studio).
Possiamo distinguerli in: Discreti quando il numero di modalità è finito o numerabile (es. Fratelli
possono essere 2 ma non 2,7) e continui quando il numero di modalità è un’infinità non numerabile
( Tutte quelle che hanno una misurazione, es. Bilancia che pesa i microgrammi o altezza)
Caratteri qualitativi: Altrimenti. Posso essere: sconnessi o scala nominale quando non esiste un
ordine univoco, sono ordinati o scala ordinale quando esiste un ordinamento ( es. Prima licenza
elementare poi media…)
pf3
pf4

Anteprima parziale del testo

Scarica appunti statistica Zanarotti e più Appunti in PDF di Statistica solo su Docsity!

Statistica

Lez. 04/ Paradosso di Simpson : le relazioni esistenti tra le percentuali dei sottogruppi possono essere stravolte quando i sottogruppi vengono fusi (es. numeri ammessi tra maschi e femmine sembrava che discriminano i maschi ma alla fine le femmine hanno fatto domanda a facoltà più difficili), ovvero quando ci sono dei dati aggregati bisogna disaggregarli (entrare nei dettagli) , sennò i dati sarebbero falsi. Campo di variazione: indice di variabilità ed è dato dalla differenza tra il valore massimo di una distribuzione ed il valore minimo. Mediana: cosa sta in mezzo Che cos’è? La statistica è una scienza che studia i fenomeni collettivi attraverso la raccolta di dati che vengono poi analizzati e interpretati graficamente. (Lisa S.).  Analizza in termini quantitativi i fenomeni collettivi, ossia i fenomeni il cui studio richiede l’osservazione di un insieme di manifestazioni  Mette a disposizione metodi e strumenti per raccogliere informazioni, fornire una rappresentazione organica dei dati, pervenire ad una sintesi che agevoli la comprensione del fenomeno collettivo e risponda alle domande di interpretazione, previsione  Una caratteristica è che si tratta di una scienza di un senso particolare, in quanto consiste  Il contesto applicativo fa sì che la statistica si declini  Terminologia: la statistica analizza in termini quantitativi i fenomeni collettivi (caratteri o variabili), ossia i fenomeni in cui lo studio richiede l’osservazione di un insieme di manifestazioni individuali (es. Consumo, reddito, statura, pioggia, prezzi ecc…).  La modalità sono i possibili modi in cui ciascun carattere o variabile si manifesta ( es. Reddito saranno dei numeri positivi in euro).  Unità statistica è l’unità elementare su cui vengono osservati i caratteri oggetto di studio, possono essere cose diverse (es. Titolo di studio sono le persone, il reddito potrebbe essere singolo individuo o un aggregato di persone, la pioggia sono i giorni).  Collettivo statistico o popolazione sono insieme di unità statistiche, può essere:  Popolazione finita (es. Una classe di studenti)  Popolazione infinita (es. I giorni della pioggia sono infiniti)  L’elenco delle modalità assumibili da un carattere è detto scala della modalità. Requisiti sono:  Esaustive ( rigorosa esattezza) : devono rappresentare tutti i possibili modi di essere del carattere ( es. Andare in vacanza non può essere solo mare e montagna ma anche città  Mutuamente esclusive : ad ogni unità statistica deve risultare associata una sola modalità (es. Non si può inserire, a modalità sia capelli castani che scuri pk le due categorie non sono mutualmente esclusive pk sono sovrapponibili Distinzione tra:  Caratteri quantitativi : quando le modalità sono rappresentate da numeri (es. Titolo di studio). Possiamo distinguerli in: Discreti quando il numero di modalità è finito o numerabile (es. Fratelli possono essere 2 ma non 2,7) e continui quando il numero di modalità è un’infinità non numerabile ( Tutte quelle che hanno una misurazione, es. Bilancia che pesa i microgrammi o altezza)  Caratteri qualitativi: Altrimenti. Posso essere: sconnessi o scala nominale quando non esiste un ordine univoco, sono ordinati o scala ordinale quando esiste un ordinamento ( es. Prima licenza elementare poi media…)

Es. Voti espressi in giudizi: discreto, buono ecc non si riesce fare media -> carattere qualitativo ordinale Accoppiamo le modalità quando il carattere è quantitativo continuo -> suddivisione in classi Scelta delle classi  Numero delle classi: abbastanza piccolo per ottenere una sintesi. Abbastanza grande per non perdere troppo dei valori originali  Le classi devono essere disgiunte, non sovrapposte  Devono comprendere tutte le modalità (non escluse)  Non è necessario che devono avere la stessa ampiezza, solo quando è possibili sì Es. Carattere reddito mensile  è un carattere quantitativo continuo  campo di variazione 0 - +∞. Il simbolo |-, dove c’è | significa che l’estremo è incluso invece dove c’è

  • è escluso.  Ampiezza classe= estremo superiore - Estremo inferiore Es. Carattere età ( in anni compiuti) di una popolazione adulta (oltre 18)  Carattere quantitativo discreto  Campo di variazione 18 – 1??  L’ampiezza della prima classe è 9 ( 18-25) = Estremo superiore – estremo inferiore + I due caratteri ( reddito ed età) a seguito delle classificazione e sono diventati dei qualitativi ordinali (es. Reddito basso, alto…). Le modalità qualitative posso essere numerate ma sono solo delle etichette se è sconnesso invece se il carattere è ordinato allora si può associare dei numeri Es. Carattere titolo di studio. Nessun titolo=0, licenza elementare=1, media=2. Non ha senso che la licenza elementare è la metà della media, quindi si potrebbe associare dei numeri che tengano conto della durata degli studi (es. Anni per avere la licenza, elementare =5) Statistica descrittiva rileva uno o più caratteri presenti su tutte le unità ( es. In ciascuna unità di popolazione rilevo un carattere, tipo studenti alti/bassi, poi gli compongo e descrivo i dati altezza, ovvero calcolare l’altezza media o fare grafici) Inferenza statistica rileva uno o più caratteri solo su alcune unità della popolazione (campionamento) (es. Chiedo altezza ad un sottoinsieme, tipo quelli seduti nella prima fila), uso delle informazioni parziali per dedurre i dati dell’intera popolazione. A volte prendere dati solo della metà della popolazione può essere più preciso dell’intera. Per disporre dei dati :
  1. Raccogliere “personalmente” i dati: mediante l’uso del questionario, può essere somministrato in vari modi ( intervista diretta ecc…). Attenzione alle mancate risposte, non rispondono tutti, se non si tiene conto provoca una distorsione dei dati
  2. Reperire dati già raccolti da altri le quali possiamo avere accesso: Principale ente che produce dati in Italia è ISTAT e SISTAN, le quali sono tutte reperibili nel loro sito (www.istat.it). Fa indagini censuarie e indagini campionarie (sul lavoro, consumi famiglie, multiscopo…). Altri produttori di dati: banca d’italia, istituti di ricerca privati (eurispes, DOMOSCOPEA, doxa…), ONU, UNESCO, FAO, WHO, WTO, FMI, WORLD BANK, OCSE/OECD, IOM…. Organizzazione dei dati in forma tabellare e grafica

Associamo alle distinte modalità del carattere le corrispondenti in quantità. Es. quantità prodotte in tonnellate per le diverse tipologie di mangime (carattere qualitativo sconnesso) Serie storiche o temporali Le rilevazioni riguardano lo studio di uno o più caratteri nella loro evoluzione temporale, rappresentano una serie storica di valori. Es. Come cambia nel corso degli anni la popolazione Serie territoriali o spaziali Es. Suddivisi per regioni i ricoverati del covid Norme per la costruzione delle tabelle  Titolo chiaro: a chi, a cosa, dove o a quando i dati si riferiscono  Ogni riga ed ogni colonna deve avere un’intestazione chiara  Specificare l’unità di misura utilizzata  Usare delle note  Specificare sempre la fonte dei dati  Allineare le informazioni in modo che sia leggibile  Usare lo stesso numero di cifre decimali  Meglio includere i totali  Usare le classi se ci sono tanti modalità