Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Analisi Univariata e Bivariata con Excel: Esercizi Pratici, Appunti di Criminologia

Appunti del primo modulo di Laboratorio di ricerca criminologica. Spiegazioni con ogni passaggio su come effettuare analisi univariata, analisi bivariata, rapporti statistici, serie storiche, campionamento e stime con Excel.

Tipologia: Appunti

2021/2022

In vendita dal 23/11/2023

Angelicabruni32
Angelicabruni32 🇮🇹

4.4

(18)

33 documenti

1 / 9

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
LABORATORIO
FILE EXCEL
Prima colonna: variabile qualitativa non ordinabile
Seconda colonna: qualitativa non ordinabile
Terza colonna: quantitativa continua
Quarta colonna: quantitativa discreta (no decimali)
Quinta colonna: qualitativa ordinabile
ANALISI UNIVARIATA
Creare distribuzioni di frequenza
1. Selezionare la prima cella (A1)
2. Inserisci
3. Tabella Pivot (da tabella/intervallo)
4. Okay
Abbiamo ora ottenuto un nuovo foglio
5. Selezionare a destra “profitto” e spostarlo su righe
6. somma valori ma noi vogliamo conteggio, non somma Freccetta Impostazioni campo valore
conteggio
Copia e incolla
Voglio spostare la tabella su un altro foglio
1. Selezionare ultima cella e salire tenendo premuto
2. Tasto destro Copia
3. + e vado sul nuovo foglio
4. Tasto destro Incolla 1 2 3 oppure incolla speciale e selezionare valori
Sistemo
Il totale sono le Frequenze assolute (ni)
Rinominare il foglio: tasto destro rinomina
Calcolare le frequenze relative (fi)
fi = ni/N
1. scrivere = (ogni volta che devo inserire una formula si comincia con =)
2. selezionare la cella ni (B3)
3. scrivere /
4. selezionare la cella N (B26)
5. blocco la cella schiacciando f4 (dovrebbe comparire $ prima e dopo la seconda lettera) riferimento
assoluto
6. uso trascinamento/completamento automatico: trascino quadratino verde in basse a destra fino in fondo
Calcolare le frequenze percentuali (pi)
pi = fi * 100
1. scrivere =
2. selezionare fi
3. cambio formato della cella: selezionare simbolo % in home, numeri oppure generale e % in home,
numeri
pf3
pf4
pf5
pf8
pf9

Anteprima parziale del testo

Scarica Analisi Univariata e Bivariata con Excel: Esercizi Pratici e più Appunti in PDF di Criminologia solo su Docsity!

LABORATORIO

FILE EXCEL

 Prima colonna: variabile qualitativa non ordinabile  Seconda colonna: qualitativa non ordinabile  Terza colonna: quantitativa continua  Quarta colonna: quantitativa discreta (no decimali)  Quinta colonna: qualitativa ordinabile ANALISI UNIVARIATA Creare distribuzioni di frequenza

  1. Selezionare la prima cella (A1)
  2. Inserisci
  3. Tabella Pivot (da tabella/intervallo)
  4. Okay Abbiamo ora ottenuto un nuovo foglio
  5. Selezionare a destra “profitto” e spostarlo su righe
  6. somma valori ma noi vogliamo conteggio, non somma  Freccetta  Impostazioni campo valore  conteggio Copia e incolla Voglio spostare la tabella su un altro foglio
  7. Selezionare ultima cella e salire tenendo premuto
  8. Tasto destro Copia
    • e vado sul nuovo foglio
  9. Tasto destro Incolla 1 2 3 oppure incolla speciale e selezionare valori Sistemo Il totale sono le Frequenze assolute (ni) Rinominare il foglio: tasto destro  rinomina Calcolare le frequenze relative (fi) fi = ni/N
  10. scrivere = (ogni volta che devo inserire una formula si comincia con =)
  11. selezionare la cella ni (B3)
  12. scrivere /
  13. selezionare la cella N (B26)
  14. blocco la cella schiacciando f4 (dovrebbe comparire $ prima e dopo la seconda lettera)  riferimento assoluto
  15. uso trascinamento/completamento automatico: trascino quadratino verde in basse a destra fino in fondo Calcolare le frequenze percentuali (pi) pi = fi * 100
  16. scrivere =
  17. selezionare fi
  18. cambio formato della cella: selezionare simbolo % in home, numeri oppure generale e % in home, numeri
  1. trascino fino in fondo Se voglio aumentare decimali simbolo in home, numeri con freccetta e 0, Aggiungere un grafico
  2. Selezionare le due colonne
  3. Inserisci
  4. Scelgo grafico
  5. Scelgo sempre prima colonna di modelli Correggere grafico
  6. Tasto destro
  7. Seleziona dati
  8. Rimuovo la riga che non mi serve
  9. Premo modifica in etichette asse orizzontale
  10. Seleziono sul foglio le celle che contengono i valori che voglio sull’asse orizzontale (profitto)
  11. Seleziono profitto in voci legenda
  12. Premo modifica in voci legenda
  13. Seleziono freccetta in valori serie, seleziono le frequenze assolute e seleziono freccetta
  14. Okay Su un rettangolo tasto destro Aggiungi etichetta dati (compare la frequenza assoluta corrispondente) Il grafico deve essere un istogramma perché la variabile è continua: Doppio clic su un rettangolo  mettere larghezza spaziatura 0% Esercizio: fare la stessa cosa per confezioni vendute Calcolare le frequenze cumulate relative (Fi)
  15. Scrivere = nella prima cella
  16. Selezionare la prima fi
  17. Scrivere = nella seconda cella
  18. Selezionare la seconda fi
  19. Scrivere +
  20. Selezionare la prima Fi (la cumulata precedente)
  21. Seleziono solo la seconda cella e la trascino fino in fondo ma prima del totale L’ultima Fi deve essere 1: abbiamo preso nell’ultimo gruppo tutte le unità Calcolare il valore minimo, il valore massimo, la moda, la mediana, la media, la varianza  Valore minimo (min)  Valore massimo (max)  Moda  Mediana  Media  Varianza (var.p)  Scarto quadratico medio (sqm)  Radice quadrata (radq)  Varianza campionaria (Var.c) è la varianza del campione (divide per N-1) Ci sono 3 modi di inserire una funzione Primo modo:
  22. Scrivere = e scrivere la funzione (es. minimo)

Valore di significatività, chiamato p medio. Esso dice se i risultati ottenuti possono essere accettati o no. L’errore massimo è 3%, ovvero 0,03. 0,68 è molto più alto, il che significa che l’errore è troppo alto e la regressione su queste variabili non va bene. L’intervallo di confidenza dà un limite superiore e un limite inferiore. Il primo intervallo è accettabile al 95%, il secondo al 97%. Per calcolare gli intervalli bisogna fare la differenza tra intervallo superiore e intervallo inferiore. È più grande l’ampiezza del 97%; vuol dire che vi è un ventaglio più grande di possibilità tra cui scegliere per cui è meno preciso. Se aumenta l’affidabilità dell’intervallo l’ampiezza diventa più grande e l’intervallo è meno preciso. Miglioro l’affidabilità ma peggioro la precisione. La regressione è una retta che è uguale a y = a + bx La b è la pendenza, la a è l’intercetta. Sono i due coefficienti. Servono a capire se il profitto dipende dalle confezioni o no. R al quadrato (indice di adattamento) indica quanto il modello di regressione è buono. È un numero compreso tra 0 e 1. Se è vicino all’1 è un buon modello. R multiplo è il coefficiente di correlazione lineare ed è compreso tra -1 e 1. Se è vicino a -1 o 1 c’è correlazione, se è vicino allo 0 non c’è correlazione. Il profitto previsto sono i profitti che trovo in base alla x usando il modello. I residui sono le differenze tra i profitti trovati usando il modello e quelli di partenza. Il profitto previsto si trova facendo = 187+19*45  a+bx Il residuo si trova facendo =450- PRIMI PASSI PER CONOSCERE LE FONTI STATISTICHE Le fonti statistiche sono degli enti o delle istituzioni che hanno il compito di raccogliere dati e distribuirli al pubblico. Chi partecipa alla raccolta dati partecipa attivamente e si tratta di fonti statistiche primarie. Le fonti statistiche secondarie utilizzano dati raccolti da un’altra fonte. Nel secondo caso il vantaggio è che non dobbiamo investire soldi e tempo, ma lo svantaggio è che abbiamo solo i dati che le fonti primarie decidono di darci. La statistica descrittiva vuole descrivere un fenomeno, inferenziale vuole invece fare delle ipotesi e accettarle o confutarle sulla base dei dati. Esercizio i.stat è una banca dati dell’ISTAT. Indicare la frequenza con cui si incontrano gli amici nel tempo libero in relazione alla posizione professionale. Cercare la banca dati e andare in fondo “dati, analisi e prodotti”. Cliccare su banche dati: noi useremo banche dati generali (i.stat e serie storiche) e banche dati settoriali (censimenti, demo). Se per l’esercizio servono informazioni di tanti anni differenti si usa serie storiche, altrimenti i.stat. in questo caso usiamo i.stat. A sinistra selezioniamo vita quotidiana, al cui interno sport e amici, al cui interno incontro con amici-condizione e posizione nella professione. A quel punto compare la tabella. Bisogna controllare che i dati non siano percentuali: freccetta in alto, seleziono valori in migliaia. Su selezione del periodo dice gli anni disponibili. Alla fine, selezionare esporta, poi excel. In basso si apre il file di excel. Sistemare in base a ciò che ci interessa Grafico di colonne lontane

  1. Seleziono una colonna
  2. tengo premuto control
  3. seleziono le celle che mi servono
  4. inserisci grafico

oppure

  1. vado su cella vuota
  2. inserisci, grafico (istogramma)
  3. tasto destro
  4. seleziona dati
  5. aggiungi
  6. nome serie: seleziono la cella con il nome
  7. valori serie: seleziono le celle
  8. aggiungo tutte le serie che mi servono
  9. okay Modificare le etichette asse orizzontale
  10. modifica
  11. freccetta
  12. seleziono la colonna con le etichette Demo (demo.istat.it) Si usa demo se nell’esercizio si chiedono informazioni sulla popolazione classificate per genere, età o stato civile. Esercizio: si completi la tabella seguente riferita alla distribuzione per classi di età della popolazione del Comune di Milano al 01/01/2010. Vado su demo. In fondo a sinistra c’è ricostruzione della popolazione 2002-2010. Seleziono l’anno, cittadinanza tutte, metto il luogo. Seleziono la prima classe di valori da 0 a 14. Faccio la stessa cosa per le altre classi. Noi Italia (www.noi-italia.istat.it) Esercizio: indicare la percentuale di fattori della salute classificati per sesso e classi di età nel 2016 per la popolazione italiana. Vado su salute, sanità e salute. Seleziono download e guardo i file per trovare i dati che mi servono. Trovo un file adatto ma mi servono i dati di tutta Italia quindi schiaccio freccetta vicino a territorio e tolgo il filtro selezionando solo Italia. Copio quello che mi interessa (fattori di rischio e 2016) e incollo su excel Coni (www.coni.it) Esercizio: individuare quali sono in Italia i primi 5 sport per numero di atleti tesserati presso le Federazioni Sportive Nazionali nel 2013. Cercare la pubblicazione adeguata a fornire la risposta, costruendo una tabella. Seleziono numeri dello sport in fondo. Inail (www.inail.it) Esercizio: confrontare il numero di denunce per infortunio nelle province della Lombardia nel luglio 2019 e

Vado in fondo e seleziono open data. Seleziono infortuni. Guardo tabella con cadenza mensile, Lombardia CapitaleUmano.Stat Es 3 uso istat

SERIE STORICHE

Sono valori che ordiniamo attraverso la modalità tempo, quindi in successione temporale. Rappresentazione grafica La linea rossa è l’andamento generale della serie storica, mentre quella blu è l’andamento stagionale Analisi delle variazioni Si utilizza un rapporto statistico detto numero indice che confronta due modalità in istanti temporali diversi. Se il denominatore della serie storica è sempre lo stesso per tutti i rapporti allora si dice che il numero indice ha base fissa; se il numeratore cambia il numero indice è a base mobile Esercizio 1 Per il numero indice con base fissa la base fissa è il valore del 1976 (9000). Dunque, devo dividere i valori di ogni anno per il valore del 1976. Poiché c’è scritto 76=100 i valori ottenuti vanno moltiplicati per 100. Per il numero indice a base mobile bisogna dividere il valore di un anno fratto il valore dell’anno precedente. Per questo il primo valore non si può calcolare. Rappresentazione grafica: doppio clic in basso, in unità principale inserisco 1 perché gli anni non hanno decimali. Doppio clic a sinistra per mettere valore minimo 8000, in modo che si legga meglio il grafico. Altri esercizi: quando si parla di serie storiche usare istat, serie storiche Es 2: (x2014-x2004) / x2004. Altrimenti avrei potuto fare 113-100= 13%. Dunque, posso o applicare la regola o usare i numeri indice.

CAMPIONAMENTO

Campionamento casuale semplice Campionamento con reinserimento rischio che riesca lo stesso soggetto e quindi che si ripeta più volte un’unità.

  1. Dati
  2. Analisi dati
  3. Campionamento
  4. Intervallo di input: seleziono freccetta nera e selezioni la prima colonna (popolazione) fleggando etichette se seleziono anche l’etichetta nella prima riga.
  5. Selezionare casuale e inserire numero di campione
  6. Fleggo intervallo di output
  7. Schiaccio freccetta nera
  8. Seleziono una cella in cui voglio far comparire i risultati Per associare i valori corrispondenti di un’altra colonna
  9. Accanto scrivo =cerca verticale
  10. Seleziono il numero del campione (primo valore di quelli che ho incollato) scrivo ;
  11. Seleziono tutta la tabella, escluse le etichette, scrivo ;
  12. Scrivo 2 perché il valore che sto cercando si trova nella seconda colonna
  13. Seleziono falso perché cerco una corrispondenza esatta
  14. Blocco con f4 oppure inserisco $ davanti ai caratteri rossi
  15. Invio
  16. Trascino per avere tutti i dati Campionamento senza reinserimento non c’è la possibilità che un’unità si ripeta.
  17. Inserisco nuova colonna
  18. Scrivo nella prima riga =casuale
  19. Trascino in basso
  20. Li seleziono tutti, Tasto destro, copia
  21. Torno sulla prima riga, incollo speciale, valori (1,2,3)
  22. Seleziono le 3 colonne
  23. Dati
  24. Ordina
  25. Ordina per: seleziono la colonna casuale
  26. Ordine: dal più piccolo al più grande
  27. Seleziono le prime 7 unità
  28. Copio e incollo Popolazione: media dei test (parametro) Campione: media test campionaria (stimatore) Il valore ottenuto dalla media del campione si chiama stima: la calcolo (=media) Errore Passando dalla popolazione al campione si commette un errore (calcolo media della popolazione per verificare). L’errore è la media della popolazione – la media del campione.