





Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Appunti del primo modulo di Laboratorio di ricerca criminologica. Spiegazioni con ogni passaggio su come effettuare analisi univariata, analisi bivariata, rapporti statistici, serie storiche, campionamento e stime con Excel.
Tipologia: Appunti
1 / 9
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!






Prima colonna: variabile qualitativa non ordinabile Seconda colonna: qualitativa non ordinabile Terza colonna: quantitativa continua Quarta colonna: quantitativa discreta (no decimali) Quinta colonna: qualitativa ordinabile ANALISI UNIVARIATA Creare distribuzioni di frequenza
Valore di significatività, chiamato p medio. Esso dice se i risultati ottenuti possono essere accettati o no. L’errore massimo è 3%, ovvero 0,03. 0,68 è molto più alto, il che significa che l’errore è troppo alto e la regressione su queste variabili non va bene. L’intervallo di confidenza dà un limite superiore e un limite inferiore. Il primo intervallo è accettabile al 95%, il secondo al 97%. Per calcolare gli intervalli bisogna fare la differenza tra intervallo superiore e intervallo inferiore. È più grande l’ampiezza del 97%; vuol dire che vi è un ventaglio più grande di possibilità tra cui scegliere per cui è meno preciso. Se aumenta l’affidabilità dell’intervallo l’ampiezza diventa più grande e l’intervallo è meno preciso. Miglioro l’affidabilità ma peggioro la precisione. La regressione è una retta che è uguale a y = a + bx La b è la pendenza, la a è l’intercetta. Sono i due coefficienti. Servono a capire se il profitto dipende dalle confezioni o no. R al quadrato (indice di adattamento) indica quanto il modello di regressione è buono. È un numero compreso tra 0 e 1. Se è vicino all’1 è un buon modello. R multiplo è il coefficiente di correlazione lineare ed è compreso tra -1 e 1. Se è vicino a -1 o 1 c’è correlazione, se è vicino allo 0 non c’è correlazione. Il profitto previsto sono i profitti che trovo in base alla x usando il modello. I residui sono le differenze tra i profitti trovati usando il modello e quelli di partenza. Il profitto previsto si trova facendo = 187+19*45 a+bx Il residuo si trova facendo =450- PRIMI PASSI PER CONOSCERE LE FONTI STATISTICHE Le fonti statistiche sono degli enti o delle istituzioni che hanno il compito di raccogliere dati e distribuirli al pubblico. Chi partecipa alla raccolta dati partecipa attivamente e si tratta di fonti statistiche primarie. Le fonti statistiche secondarie utilizzano dati raccolti da un’altra fonte. Nel secondo caso il vantaggio è che non dobbiamo investire soldi e tempo, ma lo svantaggio è che abbiamo solo i dati che le fonti primarie decidono di darci. La statistica descrittiva vuole descrivere un fenomeno, inferenziale vuole invece fare delle ipotesi e accettarle o confutarle sulla base dei dati. Esercizio i.stat è una banca dati dell’ISTAT. Indicare la frequenza con cui si incontrano gli amici nel tempo libero in relazione alla posizione professionale. Cercare la banca dati e andare in fondo “dati, analisi e prodotti”. Cliccare su banche dati: noi useremo banche dati generali (i.stat e serie storiche) e banche dati settoriali (censimenti, demo). Se per l’esercizio servono informazioni di tanti anni differenti si usa serie storiche, altrimenti i.stat. in questo caso usiamo i.stat. A sinistra selezioniamo vita quotidiana, al cui interno sport e amici, al cui interno incontro con amici-condizione e posizione nella professione. A quel punto compare la tabella. Bisogna controllare che i dati non siano percentuali: freccetta in alto, seleziono valori in migliaia. Su selezione del periodo dice gli anni disponibili. Alla fine, selezionare esporta, poi excel. In basso si apre il file di excel. Sistemare in base a ciò che ci interessa Grafico di colonne lontane
oppure
Vado in fondo e seleziono open data. Seleziono infortuni. Guardo tabella con cadenza mensile, Lombardia CapitaleUmano.Stat Es 3 uso istat
Sono valori che ordiniamo attraverso la modalità tempo, quindi in successione temporale. Rappresentazione grafica La linea rossa è l’andamento generale della serie storica, mentre quella blu è l’andamento stagionale Analisi delle variazioni Si utilizza un rapporto statistico detto numero indice che confronta due modalità in istanti temporali diversi. Se il denominatore della serie storica è sempre lo stesso per tutti i rapporti allora si dice che il numero indice ha base fissa; se il numeratore cambia il numero indice è a base mobile Esercizio 1 Per il numero indice con base fissa la base fissa è il valore del 1976 (9000). Dunque, devo dividere i valori di ogni anno per il valore del 1976. Poiché c’è scritto 76=100 i valori ottenuti vanno moltiplicati per 100. Per il numero indice a base mobile bisogna dividere il valore di un anno fratto il valore dell’anno precedente. Per questo il primo valore non si può calcolare. Rappresentazione grafica: doppio clic in basso, in unità principale inserisco 1 perché gli anni non hanno decimali. Doppio clic a sinistra per mettere valore minimo 8000, in modo che si legga meglio il grafico. Altri esercizi: quando si parla di serie storiche usare istat, serie storiche Es 2: (x2014-x2004) / x2004. Altrimenti avrei potuto fare 113-100= 13%. Dunque, posso o applicare la regola o usare i numeri indice.
Campionamento casuale semplice Campionamento con reinserimento rischio che riesca lo stesso soggetto e quindi che si ripeta più volte un’unità.