Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica:sintesi del corso con spiegazione esercizi, Sbobinature di Statistica

Il corso contiene tutto il necessario(esercizi,teoria ecc) per l'esame con la professoressa Bocci. Sono disponibile per chiarimenti e ripetizioni se qualcosa non è chiaro

Tipologia: Sbobinature

2021/2022

In vendita dal 17/04/2024

ragazza_nuvola
ragazza_nuvola 🇮🇹

18 documenti

1 / 160

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Definizione di statistica: è una metodologia che ha come scopo la conoscenza quantitativa dei fenomeni
collettivi ossia dei fenomeni il cui studio richiede l’osservazione di un insieme di manifestazioni individuali
Metodologia: metodo su come affrontare un determinato problema
Conoscenza quantitativa: poiché si basa su numeri(dati statistici)
Osservazione(o misurazione): come si arriva alla conoscenza del fenomeno
Fenomeni collettivi: tutto quello che riguarda ciò che fa riferimento ad accadimenti su diversi elementi
(manifestazioni individuali)
I fenomeni collettivi si dividono in due tipi:
Fenomeni collettivi relativi Fenomeni relativi ad una collettività di osservazioni
ad una collettività di casi singoli di un solo caso o fenomeno
Si usano in ambito sociologico. Si usano soprattutto in ambito scientifico.
Es: stato occupazionale laureati dopo Un elemento dà più informazioni e l’insieme delle informazioni dà
un anno🡪osservo le informazioni individuali conoscenza collettiva e complessiva di un fenomeno
di ogni elemento Es: misurazione pressione
Altri esempi di fenomeni collettivi:
Il fenomeno “clima” può essere declinato con diverse caratteristiche ad esempio temperatura,
precipitazioni, vento ecc
Osservo queste caratteristiche in diverse aree(che sono gli elementi singoli).
Le informazioni che ottengo sono manifestazioni individuali
Le diverse manifestazioni individuali collettivamente formeranno i fenomeni collettivi
I fenomeni collettivi si dividono ulteriormente in
Semplici Complessi o multivariati
Basta una sola C’è bisogno di osservare più caratteristiche
caratteristica per Es: misurazione clima (serve misurare sole,vento,ecc)
delineare il fenomeno
Es: devo misurare l’altezza
degli italiani🡪 basta
l’altezza
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Anteprima parziale del testo

Scarica Statistica:sintesi del corso con spiegazione esercizi e più Sbobinature in PDF di Statistica solo su Docsity!

Definizione di statistica: è una metodologia che ha come scopo la conoscenza quantitativa dei fenomeni collettivi ossia dei fenomeni il cui studio richiede l’osservazione di un insieme di manifestazioni individuali Metodologia: metodo su come affrontare un determinato problema Conoscenza quantitativa: poiché si basa su numeri(dati statistici) Osservazione(o misurazione): come si arriva alla conoscenza del fenomeno Fenomeni collettivi: tutto quello che riguarda ciò che fa riferimento ad accadimenti su diversi elementi (manifestazioni individuali) I fenomeni collettivi si dividono in due tipi: Fenomeni collettivi relativi Fenomeni relativi ad una collettività di osservazioni ad una collettività di casi singoli di un solo caso o fenomeno Si usano in ambito sociologico. Si usano soprattutto in ambito scientifico. Es: stato occupazionale laureati dopo Un elemento dà più informazioni e l’insieme delle informazioni dà un anno🡪osservo le informazioni individuali conoscenza collettiva e complessiva di un fenomeno di ogni elemento Es: misurazione pressione Altri esempi di fenomeni collettivi: Il fenomeno “clima” può essere declinato con diverse caratteristiche ad esempio temperatura, precipitazioni, vento ecc Osservo queste caratteristiche in diverse aree(che sono gli elementi singoli). Le informazioni che ottengo sono manifestazioni individuali Le diverse manifestazioni individuali collettivamente formeranno i fenomeni collettivi I fenomeni collettivi si dividono ulteriormente in Semplici Complessi o multivariati Basta una sola C’è bisogno di osservare più caratteristiche caratteristica per Es: misurazione clima (serve misurare sole,vento,ecc) delineare il fenomeno Es: devo misurare l’altezza degli italiani🡪 basta l’altezza

Fasi metodo di ricerca 1)Formulazione del problema eventualmente sotto forma di ipotesi Es: come si è evoluta la popolazione italiana nel tempo?

  1. Individuazione dati pertinenti Quali informazioni devo raggiungere? Quali sono le caratteristiche attraverso la quale si declina questo fenomeno? Quali sono gli elementi che danno informazioni su questo fenomeno? 3)Programmazione della rilevazione dei dati 4)Analisi dei dati che può essere Primaria Secondaria I dati provengono Prendo dati raccolti da altri dal ricercatore Serve attenzione riguardo la qualità dei dati e al significato dei dati, prendo solo ciò che mi interessa dalle ricerche di altri 5)Interpretazione risultati Dati statistici Il dato statistico è l’informazione rappresentata da come una caratteristica si declina su un elemento È una informazione qualitativa e/o quantitativa su una caratteristica posseduta da un elemento oggetto di rilevazione e/o misurazione È importante che il dato statistico sia affidabile (la misurazione deve essere precisa) e deve essere adeguato (deve cogliere l’aspetto che mi interessa) Per quanto riguarda i dati statistici, possiamo raccoglierli in diversi modi noi stessi o possiamo far riferimento alle fonti statistiche ovvero ai dati prodotti da istituti o enti che mettono a disposizione i dati raccolti per le loro ricerche. Perché usare le fonti statistiche? Per impiegare meno tempo e spendere meno. I dati vanno sempre contestualizzati🡪 cosa rappresenta la matrice? Quando sono stati raccolti i dati? Il produttore di dati può rilasciarne due tipi: Microdati Macrodati Dati elementari Elaborazione di dati elementari Fasi che riguard ano la statistic

La statistica usa solo campioni probabilistici ovvero un campione che assegna a tutti gli elementi una probabilità che verrà estratta in maniera causale Un campione non casuale si verifica invece quando io decido chi estrarre escludendo quindi a priori una parte di popolazione Unità statistica: elemento elementale che compone il collettivo. Caso individuale che presenta le caratteristiche oggetti di studio. È un’entità reale (persona, animale, oggetto, territorio), suscettibili di misura che presenta le caratteristiche oggetto di studio Esempio: studio vendita di quotidiani. Unità statistica: diverse testate giornalistiche Esempio 2: Studio sui consumi delle famiglie Unità statistica: Ogni famiglia Sinonimo unità statistica: elemento, soggetto, oggetto, caso, individuo Carattere: ogni aspetto elementare oggetto di rilevazione nelle unità statistiche del collettivo. Una delle possibili manifestazioni del fenomeno, viene rilevata sulle unità statistiche Sono definite a priori. L’oggetto delle rilevazioni statistiche è proprio lo studio della manifestazione del carattere Modalità: diversi modi con cui un carattere si presenta nelle unità statistiche del collettivo Ogni carattere ha un elenco di modalità in cui si manifesta Indichiamo con: ● X (x grande) 🡪 Generico carattere

● u (u corsivo)🡪 Unità statistica

● x (x piccola)🡪 modalità con cui il carattere si manifesta nelle unità statistiche

Es: definiamo una persona come u

Una caratteristica che vogliamo considerare di u è il genere, che indichiamo con X, il genere si

presenta in una delle modalità x maschio o femmina Le modalità hanno molto spesso una lista che deve essere esaustiva (devo considerare tutte le modalità

possibili in modo da non escludere delle u) e non deve avere modalità sovrapposte ovvero ogni u

deve riconoscersi in una e una sola modalità, le diverse modalità non devono “accavallarsi” Esistono diversi tipi di modalità : Qualitativa e quantitativa

Le modalità qualitative (o mutabili) sono quelle che riguardano gli attributi e i numeri non cardinali Alcuni esempi di modalità sono i generi, il tipo di scuola superiore ma anche l’anno di nascita in quanto non rappresenta una quantità) Si dividono in ordinabili e nominali(o sconnessi) ovvero non ordinabili Le modalità qualitative ordinabili sono quelle ordinabili dalla più piccola alla più grande (o viceversa) Alcune modalità qualitative ordinabili sono l’età, il titolo di studio ecc Le modalità q. ordinabili di un’unità statistica tra loro possono essere quindi uguali, diversi, maggiori o minori Le modalità qualitative nominali non sono ordinabili Alcuni esempi sono il genere e il tipo di diploma. Le modalità q. nominali possono essere solo uguali o diverse fra loro Le modalità q. nominali possono essere tra l’altro Dicotomici Politomici Ci sono solo 2 modalità Ci sono più modalità Es: maschio/femmina sì/no Per quanto riguarda le modalità quantitative (o variabili statistiche) esse riguardano i numeri cardinali. Alcuni esempi di modalità quantitative possono essere il numero dei CFU, i voti e l’età Si dividono in modalità quantitative: Intere (o discrete) Continue(numeri reali) Numeri senza virgola possono avere la virgola ed essere negativi (es voto diploma) (medie, gradi ecc) Si dividono entrambe ulteriormente in: Scala di intervallo Scala proporzionale Lo 0 è un valore, un punto Lo 0 indica assenza di quantità

La distribuzione di frequenza è l’elencazione delle modalità diverse con cui si manifesta la variabile e del numero delle volte che una data modalità della variabile viene osservato nel collettivo Fasi per arrivare alla distribuzione di frequenza: ● Vedo tutte le modalità diverse con il quale il carattere si manifesta (IMPORTANTE! Se le modalità sono ordinabili non vanno messe casualmente ma vanno sempre prima di tutto ordinate)

● Metto nelle righe queste modalità e conto nella colonna quante u presentano queste modalità

● Il risultato si chiama frequenza assoluta, ed è un numero cardinale maggiore di 0 ● La modalità K rappresenta invece tutte le modalità possibili (esempio genere, k=2) Notazione Carattere: X Modalità: x1,x2, x3, Xk Modalità generica: Xi Ultima modalità: xK Frequenza assoluta(numeri che sono risultati dal conteggio) : n1, n2, n

Totale u (n1+n2+n3): N

ESEMPIO:

u

Tipo diploma Voto di laurea

a ( u1) Scientifico^105

b(u2) Tecnico^101

c(u3) Scientifico^108

d(u4) Scientifico^105

e(u5) Tecnico^101

f(u6) Classico^103

g(u7) Classico^108

h(u8) Scientifico^101

i(u9) Classico^108

x NON ORDINABILI QUINDI LE STUDIO COME VOGLIO

Importante: la somma delle n deve essere pari a N altrimenti sto perdendo qualche u

Studiamo ora il voto di laurea

u

Importante: leggere sempre bene il problema, a volte le unità sono espresse in migliaia ES

La distribuzione occupati (u) per settore di attività economica nel Lazio (migliaia di unità)

Settore Distribuzione Agricolo 54 Economico 12 Industriale 93

Frequenze relative(f) e frequenze percentuali(fp): a prescindere dal numero totale delle u mi dà la

composizione del collettivo in percentuale consentendo così di generalizzare Dopo che ho fatto la tabella di distribuzione aggiungo altre due colonne calcolandomelo in questo modo Fi: Frequenza assoluta/ N , divide in fette di unità il collettivo Caratteristiche: numero che fa sempre da 0 a 1 (sempre 0, qualcosa) La somma delle frequenze relative è sempre uguale a 1 Fp: fX Caratteristiche: numero da 0 a 100 La somma delle frequenze percentuali è sempre uguale a 100 Quando le usiamo? Ci consentono di confrontare collettivi diversi Contro dell’usare questo metodo: se N non viene rappresentato e si studiano solo le frequenze relative e percentuali quanto è rappresentativo il collettivo? Esempio Studiamo ora il voto di laurea

u

Tipo diploma Voto di laurea

a ( u1) Scientifico^105

b(u2) Tecnico^101

c(u3) Scientifico^108

d(u4) Scientifico^105

e(u5) Tecnico^101

f(u6) Classico^103

g(u7) Classico^108

h(u8) Scientifico^101

i(u9) Classico^108

l(u10) Tecnico^101

N=10 K=3 K=

Il carattere voto di laurea è ordinabile quindi: x1= 101 n1= x2=103 n2= x3= 105 n3= x4=108 n4= 3 F1: 4:10= 0.4 Fp: 0.4x100= F2 1:10=0.1 fp: 1 F3 2:10=0.2 fp: F4 3:10=0.3 fp: Domande possibili di esame: Calcolare F. assolute da F.relative Decimali: Importante lavora sempre con almeno 3-4 cifre decimali e controlla sempre che la somma sia 1 o 100 Esempio: Studio A

Migliorato 50 N= 150 Gruppo B(Pillola placebo) Effetti n Peggiorato 53 Invariato 14 Migliorato 33 N= 100

fA fB

Frequenze cumulate

Ha frequenza cumulata associata alla modalità xi del carattere rappresenta il numero di u che presentano

una modalità non superiore a xi Ci serviranno per calcolare mediana e quartili e mi danno quindi i livelli della distribuzione Esistono frequenze assolute cumulate (FAC), Frequenze relative cumulate(FRC) e Frequenze percentuali cumulate. Le frequenze cumulate si usano solo per caratteri qualitativi ordinali o carattere quantitativi

Le frequenze cumulate si possono anche formulare attraverso la sommatoria che si indica con Σ

La sommatoria indica in modo sintetico la somma di un insieme di numeri x Esempio Sia x1=3, x2=5, x3=1, x4=9, x5=15 la sommatoria sarà 5

i=

FAC (si indica con N) FRC(si indica con F) FPC(Si indica con P) N1=n1 F1=f1 P1=p N2=n1+n2 F2= f1+f2 P2=p1+p N3=n1+n2+n3 F3= f1+f2+f3 P3=p1+p2+p NK= N FK= 1 PK= SI LASCIA VUOTO SI LASCIA VUOTO SI LASCIA VUOTO Esempio: Distribuzione di frequenza studenti frequentanti l’uni nel 2001/02 secondo la soddisfazione nella scelta Soddisfazione ni Ni Per nulla 4 4 Poco 34 38 (34+4) Abbastanza 185 223 (4+34+185 oppure 38+185) Pienamente 60 283 (4+34+185+60 oppure 223+60) Totale 283 Esempio 2 Studio su due scuole superiori sulla frequenza con cui gli studenti caricano contenuti sui social Liceo A Frequenza Frequenza assoluta Mai 16 Qualche volta al mese 24 1-3 volte alla settimana 33 4-6 volte alla settimana 32 Tutti i giorni 40 Totale 165

Essendo le modalità tutte differenti non ha senso fare una distribuzione di frequenza in quanto non

verrebbe fuori nessuna sintesi. In questo caso bisogna quindi suddividere il carattere in classi (ovvero dei gruppi scelti dal ricercatore) di modalità e calcolarne poi le n

  • l(u10) Tecnico
  • N=10 K=
  • x1= scientifico n1(frequenza assoluta) =
  • x2=tecnico n2=
  • x3= classico n3=
    • a ( u1) Scientifico Tipo diploma Voto di laurea
    • b(u2) Tecnico
    • c(u3) Scientifico
    • d(u4) Scientifico
    • e(u5) Tecnico
    • f(u6) Classico
    • g(u7) Classico
    • h(u8) Scientifico
    • i(u9) Classico
    • l(u10) Tecnico
    • N=10 K=3 K=
  • x1= 101 n1= Il carattere voto di laurea è ordinabile quindi:
  • x2=103 n2=
  • x3= 105 n3=
  • x4=108 n4=
    • L 95.
    • M 80.
    • N 87.
    • O 91.
    • N=
      1. u
  • Classe 1: La classe che va da 70 ad Dopo aver ordinato le modalità creiamo le classi:
  • Classe 2 Classe che va da 80 a
  • Classe 3 classe che va da 90 a

Ovviamente lo stesso valore non può trovarsi in due classi differenti quindi dobbiamo aggiungere una notazione che indichi se l’80 appartenga o no alla prima classe. Indichiamo con [] oppure con I-I valore compreso e con () oppure –I valore non compreso In questo caso indichiamo con: Classe 1: [70,80] oppure 70 I-I 80 Classe 2: (80,90] oppure 80 –I 90 Classe 3: (90,96] oppure 90 –I 96 Ovviamente la scelta delle classi condiziona i risultati Si chiama distribuzione di frequenza di un carattere x suddiviso in classi lo schema con cui si associa a ciascuna classe la rispettiva frequenza ES Classi n [70,80] 5 (80,90] 5 (90-96] 3 TOT 13 Si usano le classi reali (-0.5/+0.5) nei casi non discreti per dare più continuità ovvero per “attaccare le classi”. In questo modo le classi sono continue e non sovrapposte. Distribuzione di quantità Descrive l’ammontare di un carattere o più caratteri e come l’ammontare si distribuisce rispetto alla modalità di un altro carattere Si acquisisce con 2 operazioni:

Classificazione: Suddivido le u in gruppetti che presentano le stesse modalità.

Misurazione: sommo i caratteri Importante: Il carattere y è sempre trasferibile Es: ammontare vendite online per settore attività economica Settore (X) Ammontare vendite online (milioni di €)--> (Y) Agricoltura 1.

Vedi altri esempi su moodle Serie storiche

Distribuzioni di carattere quantitativo riferito a u particolari ovvero ad istanti temporali (ore, minuti, anni,

secoli ecc) ES: Numero di divorzi dal 2003 al 2009

Anno (u)

Numero divorzi (Variabile X) 2003 43856 (ammontare) 2004 45097 2005 47036 2006 49534 2007 50669 2008 54381 2009 54483 Es 2 Popolazione residente dal 2005 al 2009 Anno Residenti 2005 58462 2006 58752 2007 59131 2008 59616 2009 60045 Per rappresentare le serie storiche useremo il piano cartesiano dove l’asse orizzontale sarà il tempo e l’asse verticale la variabile X Es

Serie territoriali

L’ u è il territorio (inteso come geografico amministrativo, provinciale, regionale, di quartiere ecc...)

Può rappresentare sia distribuzioni di quantità sia di frequenza Es Popolazione residente in Italia per ripartizione territoriale

Ripartizioni territoriali (u)

Popolazione residente Italia Nord-occidentale 16120067 Italia Nord- orientale 11643194 Italia centrale 11950322 Italia meridionale 14186373 Italia insulare 6726486 Totale 60626442 Si rappresentano con il cartogramma ovvero una carta geografica di quel territorio suddivisa in porzioni e ciascuna area la coloro con intensità differente a seconda del valore della variabile corrispondente all’area Più il colore è intenso più il valore è alto Es: