Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Variabilità e Distribuzioni Statistiche: Misure di Tendenza Centrale e Dispersione, Appunti di Statistica

Una sintesi sui concetti di variabilità, distribuzioni e frequenze, modalità, omogeneità, varianza, media e misure di tendenza centrale come media aritmetica, mediana e interquartili. Vengono inoltre introdotti concetti come scarto quadratico medio, campo di variazione e deviazione standard. Il documento include anche informazioni su distribuzioni specifiche come uniforme continua, Poisson e normale.

Tipologia: Appunti

2019/2020

Caricato il 01/11/2021

Cico8888
Cico8888 🇮🇹

4.3

(12)

26 documenti

1 / 9

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
SIMULAZIONE ESAME
VARIABILI
1- Per una variabile quantitativa, qual è l’indice più opportuno? La media aritmetica.
2- Quali variabili hanno il più alto contenuto normativo? Variabili di rapporti.
3- Nell’ambito di variabilità di una distribuzione esprime: l’attitudine di un carattere ad assumere
modalità diverse.
4- Nell’ambito delle variabili nominali, la variabilità si esprime con: l’eterogeneità.
5- Per quale tipologia di variabili è possibile calcolare la varianza? Solo per caratteri quantitativi.
6- Come si calcola il valore medio di una variabile causale discreta x? Sommando tutti i prodotti fra le
modalità della variabile causale x e la probabilità P(x).
7- Per le variabili ordinali quale valore medio è opportuno utilizzare? La mediana.
8- Variabili qual. La dipendenza prende il nome di: connessione.
9- Una variabile causale normale standardizzata possiede valore medio 0 e varianza 1? Si sempre.
10- Che cos’è la variabile causale media campionaria? Una statistica campionaria.
11- Procedura di operativizzazione delle diverse variabili:
Nominale (o qualitative sconnesse) = classificazione
Ordinale (o qualitative ordinate/ rettilinee o cicliche) = ordinamento
Intervalli e rapporti (o quantitative/ discrete o continue) = misurazione
12- Cosa implica l’assenza di indipendenza tra due variabili? Un legame bidirezionale.
13- Una variabile è discreta quando: può assumere solo un numero finito o un’infinità numerabile di
valori.
14- Una variabile causale si dice discreta quando? Si può calcolare la sua varianza.
15- Sintesi sulle misure di tendenza centrale:
TIPO DI VARIABILE MISURE DI TENDENZA
CENTRALE CALCOLABILI
MISURE DI TENDENZA
CENTRALE SUGGERITE
NOMINALE MODA MODA
ORDINALE MODA E MEDIANA MEDIANA
INTERVALLI MODA, MEDIANA, MEDIA
ARITMETICA, GEOMETRICA E
ARMONICA
MEDIA ARITMETICA
16- Variabile causale normale standardizzata: N=0 Varianza (sigma quadro) = 1
17- Quando in statistica, si dice che due variabili sono indipendenti? Se la conoscenza della modalità
di una ci permette di fare ipotesi sulle modalità dell’altra.
CAMPIONE e STIMA
18- Che cosa si intende per campione? Sottoinsieme del collettivo da studiare o della popolazione.
19- Che cos’è la stima? Il valore assunto dallo stimatore in corrispondenza di una determinata
realizzazione campionaria (campione).
20- Che cosa accade nella stima dei parametri all’aumentare della numerosità campionaria? La
precisione delle stime aumenta.
21- La media campionaria è uno stimatore: corretto.
22- Proprietà degli stimatori: correttezza, efficienza, consistenza, correttezza asintotica.
23- Che cos’è uno stimatore? Una funzione matematica dei dati del campione.
24- Tecniche di campionamento non probabilistico? A scelta ragionata, per quote, a valanga, tramite
testimoni privilegiati.
pf3
pf4
pf5
pf8
pf9

Anteprima parziale del testo

Scarica Variabilità e Distribuzioni Statistiche: Misure di Tendenza Centrale e Dispersione e più Appunti in PDF di Statistica solo su Docsity!

SIMULAZIONE ESAME

VARIABILI

1- Per una variabile quantitativa, qual è l’indice più opportuno? La media aritmetica. 2- Quali variabili hanno il più alto contenuto normativo? Variabili di rapporti. 3- Nell’ambito di variabilità di una distribuzione esprime : l’attitudine di un carattere ad assumere modalità diverse. 4- Nell’ambito delle variabili nominali, la variabilità si esprime con: l’eterogeneità. 5- Per quale tipologia di variabili è possibile calcolare la varianza? Solo per caratteri quantitativi. 6- Come si calcola il valore medio di una variabile causale discreta x? Sommando tutti i prodotti fra le modalità della variabile causale x e la probabilità P(x). 7- Per le variabili ordinali quale valore medio è opportuno utilizzare? La mediana. 8- Variabili qual. La dipendenza prende il nome di: connessione. 9- Una variabile causale normale standardizzata possiede valore medio 0 e varianza 1? Si sempre. 10- Che cos’è la variabile causale media campionaria? Una statistica campionaria. 11- Procedura di operativizzazione delle diverse variabili: Nominale (o qualitative sconnesse) = classificazione Ordinale (o qualitative ordinate/ rettilinee o cicliche) = ordinamento Intervalli e rapporti (o quantitative/ discrete o continue) = misurazione 12- Cosa implica l’assenza di indipendenza tra due variabili? Un legame bidirezionale. 13- Una variabile è discreta quando: può assumere solo un numero finito o un’infinità numerabile di valori. 14- Una variabile causale si dice discreta quando? Si può calcolare la sua varianza. 15- Sintesi sulle misure di tendenza centrale: TIPO DI VARIABILE MISURE DI TENDENZA CENTRALE CALCOLABILI

MISURE DI TENDENZA

CENTRALE SUGGERITE

NOMINALE MODA MODA

ORDINALE MODA E MEDIANA MEDIANA

INTERVALLI MODA, MEDIANA, MEDIA

ARITMETICA, GEOMETRICA E

ARMONICA

MEDIA ARITMETICA

16- Variabile causale normale standardizzata: N=0 Varianza (sigma quadro) = 1 17- Quando in statistica, si dice che due variabili sono indipendenti? Se la conoscenza della modalità di una ci permette di fare ipotesi sulle modalità dell’altra. CAMPIONE e STIMA 18- Che cosa si intende per campione? Sottoinsieme del collettivo da studiare o della popolazione. 19- Che cos’è la stima? Il valore assunto dallo stimatore in corrispondenza di una determinata realizzazione campionaria (campione). 20- Che cosa accade nella stima dei parametri all’aumentare della numerosità campionaria? La precisione delle stime aumenta. 21- La media campionaria è uno stimatore: corretto. 22- Proprietà degli stimatori: correttezza, efficienza, consistenza, correttezza asintotica. 23- Che cos’è uno stimatore? Una funzione matematica dei dati del campione. 24- Tecniche di campionamento non probabilistico? A scelta ragionata, per quote, a valanga, tramite testimoni privilegiati.

25- Tecniche di campionamento probabilistico a probabilità costanti? Semplice con ripetizione, semplice senza ripetizione, stratificato, a grappoli, sistematico, a più stadi. 26- Che cos’è un parametro? Una grandezza non nota della popolazione che può essere stimata mediante le osservazioni campionarie. 27- Campionamento sistematico: probabilistico con probabilità costanti. 28- In quale dei seguenti campionamenti non si può fare inferenza? Per quote. 29- Quando è opportuno il campionamento a grappoli? Quando la popolazione è naturalmente divisa in gruppi di unità contigue. 30- Nel campionamento sistematico in quale momento si inserisce la casualità? Nello stabilire la prima unità che entra nel campione. DISTRIBUZIONI e FREQUENZE e MODALITA’ 31- Per quale tipologia di distribuzione si può calcolare la mediana? Per tutte le tipologie di distribuzioni purchè le modalità siano ordinabili. 32- La distribuzione binomiale è: discreta. 33- In una distribuzione doppia cosa sono le … nainall? La somma delle frequenze di una delle due variabili. 34- L’ultima modalità di una distribuzione di frequenze, viene in generale indicata con il simbolo : X_k. 35- Le frequenze marginali indicano : la somma delle frequenze di una singola variabile. 36- Una distribuzione condizionata si compone di: la modalità di una variabile e le frequenze relative a una modalità di un’altra variabile. 37- In una distribuzione doppia, di cosa è composta una distribuzione condizionata? Le modalità di una variabile e le frequenze relative a una sola modalità dell’altra variabile. 38- Si ricorre alle modalità raggruppate in classi quando : i valori sono troppi e infiniti. 39- Le frequenze relative sono utili per: confrontare 2 distribuzioni aventi numerosità diversa. 40- Se una distribuzione ha le modalità divise in classi, prima di calcolare la media: calcola la semisomma degli estremi di ogni classe, si sintetizza ciascuna classe mediante il valore centrale. 41- Per calcolare l’omogeneità quali frequenze servono? Relative. 42- Distribuzioni di frequenza : somma dei quadrati degli scarti fra il valore della variabile e la sua media aritmetica, tutto ponderato con le frequenze. 43- Distribuzioni di probabilità: somma dei quadrati degli scarti tra il valore della variabile e il suo valore atteso, tutto ponderato con le probabilità. 44- Distribuzione di Bernoulli : si inserisce nello schema di una prova il cui esito e dicotomico cioè con sole 2 possibilità del tipo si/no, vero/falso. 45- Distribuzione binomiale: è discreta. Si parte da n variabili causali di Bernoulli indipendenti e aventi la stessa distribuzione (cioè stesso parametro pi greco) e se ne fa la somma. 46- Distribuzione di Poisson : numero di eventi che si possono verificare in un dato intervallo di tempo. Assume qualunque valore intero X>0. 47- Distribuzione uniforme continua : è una variabile causale che segue la stessa logica della variabile causale uniforme discreta, ma i parametri che definiscono la funzione di densità sono gli estremi dell’intervallo. Assume valori reali in un intervallo limitato [a;b]. 48- Distribuzione normale : nota anche come curva di Gauss. Il termine normale si riferisce al fatto che molti fenomeni naturali hanno una distribuzione empirica che si avvicina alla curva a forma di campana. Normale perché rappresenta la norma per molte distribuzioni presenti in natura. 49- Distribuzione chi quadrato : è continua e asimmetrica. È definita da valori reali maggiori o pari a 0: X>0. L’unico parametro che caratterizza la sua funzione di densità è i gradi di libertà, un numero intero positivo. Per valori crescenti di gl la distribuzione chi quadrato tende ad una normale. Assume valori nell’intervallo 0, +infinito.

77- Da cosa è determinato il segno del coefficiente di regressione? Dalla covarianza tra X e Y. 78- Se il coefficiente di correlazione di Pearson è uguale a 0.92, i valori X e Y coincidono? Mai. 79- Se una retta ha pendenza positiva, il coefficiente di regressione è: maggiore di 0. 80- Sintesi sulle misure di variabilità TIPO DI VARIABILE MISURE DI VARIABILITA’ CALCOLABILI

INDICI DI VARIABILITA’

SUGGERITI

NOMINALE OMOGENEITA’ 01,

ORDINALE OMOGENEITA’ E DISPERSIONE D

INTERVALLI OMOGENEITA’, DISPERSIONE,

CAMPO DI VARIAZIONE,

SCARTO QUADRATICO MEDIO,

VARIANZA, DIFFERENZE MEDIE

SCARTO QUADRATICO MEDIO

(sigma) VARIANZA (sigma quadrato) DEVIANZA (dev) DIFFERENZE MEDIE ISTOGRAMMA 81- In un istogramma, la densità di frequenza che viene riportata in ordinata come si ottiene? Hi=ni/bi. (dividendo per ogni classe della distribuzione, la frequenza dell’ampiezza della classe). 82- Un istogramma è: rappresentazione grafica dei caratteri quantitativi divisi in classi. VERIFICA DELLE IPOTESI 83- In un test di verifica delle ipotesi, quando si rifiuta l’ipotesi nulla? Quando il test è significativo. 84- Nella verifica delle ipotesi statistiche se il valore della statistica test cade nella regione di rifiuto, cosa si fa? Si rifiuta l’ipotesi nulla. 85- L’ipotesi nulla riguarda? Caratteristica della popolazione. QUESTIONARIO 86- Quale delle seguenti non è una fase nella costruzione di un questionario? Pre test. Fasi: modello concettuale e-r e albero delle aree; redazione del questionario, verifica del questionario. Questionario è lo strumento di rilevazione dei dati più noto e utilizzato (strumento di misura e strumento standardizzato. 87- Una domanda filtro, in un questionario serve a: indirizzare chi risponde a sezioni specifiche del questionario. INTERVALLO DI CONFIDENZA 88- A Parità di altre condizioni, cosa accade all’ampiezza di un intervallo di confidenza per la media al diminuire della deviazione standard? Diminuisce l’ampiezza (ampiezza direttamente proporzionale alla deviazione standard). 89- Cosa accade ad un intervallo di confidenza se aumenta il livello di confidenza uno meno alfa? L’ampiezza dell’intervallo aumenta. 90- Nella costituzione di un intervallo di confidenza quale delle seguenti proposizioni è falsa? Si definisce un’affermazione su un parametro della popolazione. DEFINIZIONI 91- SCARTO QUADRIATICO MEDIO: variabilità assoluta.

92- VALORE ATTESO: valore medio che una variabile causale può assumere in un numero elevato di prove. E(x) 93- UN PARAMETRO: è un valore che definisce una caratteristica costante di una funzione o popolazione. 94- MODA: corrisponde al valore che si manifesta con maggiore frequenza. 95- VARIANZA: variabilità di una variabile causale. È sempre non negativa (positiva). È un indice di dispersione. 96- DEVIANZA: numeratore della varianza. 97- CHE COS’E’ LA MEDIA ARITMETICA? Quale valore che lascia invariato l’ammontare complessivo del carattere tra le n unità della popolazione. 98- SCOSTAMENTO QUADRIATICO MEDIO o DEVIANZA STANDARD : radice quadrata della varianza. 99- UNA SERIE STORICA: è la classificazione delle osservazioni di un fenomeno rispetto al tempo. 100- DIPENDENZA SPAZIALE: indica che la criminalità osservata in un’area è connessa a quella delle aree circostanti. Si parla di autocorrelazione, cioè di una correlazione di una variabile con se stessa ma in luoghi diversi. Può essere positiva, negativa o nulla. 101- STATISTICHE CENTROGRAFICHE: offrono degli indici di sintesi che esprimono un valore generale di sintesi spaziale dei dati sulla criminalità. (centro medio, deviazione standard, ellissi di deviazione standard). CENTRO MEDIO: descrizione complessiva della distribuzione dei dati geografici, rappresenta il punto focale centrale. E’ dato dalle coordinate medie degli eventi criminali. DISTANZA STANDARD: fornisce un’indicazione sulla dispersione dei dati attorno al centro focale. Si calcola come il rapporto della radice quadrata della sommatoria delle distanze al quadrato di ogni punto dal centro medio per il numero di punti. ELLISSI DI DEVIAZIONE STANDARD: Considera anche la nuvola dei punti. Ha già assi passanti per il centro medio. La maggiore grandezza dell’ellissi suggerisce una maggiore dispersione dei punti. La direzione dell’asse più lungo indica l’allineamento predominante della dispersione dei dati. 102- NEAREST NEIGHBOUR INDEX: fornisce una misura di autocorrelazione spaziale. Può mostrare, in presenza più variabili, se esiste una significativa clusterizzazione di una variabile. 103- CRIME MAPPING: riguarda la rilevazione di ciò che potenzialmente contribuisce al crimine (caratteristiche del mondo fisico, sociale ed economico). 104- HOTSPOT: sono piccole aree in cui il verificarsi di reati è così frequente che è più prevedibile rispetto ad altre zone dello stesso territorio. In essi è plausibile ipotizzare il verificarsi di nuovi reati. La loro esistenza è indice che la criminalità non è distribuita casualmente sulla superficie presa in esame. E’ segnale dell’esistenza di fattori che favoriscono o facilitano reati. Per essere definita hotspot, non basta che ci sia un’alta incidenza di reati, ma è necessario che sia superiore alla media dell’intera area di analisi e che la differenza sia statisticamente significativa. 3 tipologie:

  1. Generatori del crimine: alto volume, bassa frequenza;
  2. Attrattori del crimine: alto volume, alta frequenza (bisogna scoraggiare i trasgressori)
  3. Attivatori del crimine: basso volume, bassa frequenza (bisogna rafforzare la gestione dei controlli). 105- GIS : insieme complesso di componenti per acquisire, memorizzare, processare e analizzare dati con riferimenti spaziali. Integrazione di informazioni provenienti da diversi livelli informativi. Ciascun livello fornisce un tema e i diversi temi sono messi in correlazione tra loro. 106- Quale non è un componente del GIS? Il layer. 107- FORME DI DEMOCRAZIA: Presidenziale la partecipazione dei cittadini è limitata alla scelta dei candidati selezionati dai loro partiti o da coalizioni. Sarà il presidente a decidere tutti i cittadini.

METODO DELPHI E SHANG

112- METODO DELPHI: consente a un insieme di persone di dare opinioni su un problema come se lavorassero in gruppo ma senza gli effetti di distorsione generati dalla contemporanea presenza nello stesso luogo (faccia a faccia). Fasi:

  1. Scelta dei partecipanti al panel (campione non probabilistico)
  2. Preparazione del questionario della prima iterazione
  3. Somministrazione del questionario della prima interazione
  4. Elaborazione dei dati della prima iterazione
  5. Stesura del questionario della seconda iterazione
  6. Elaborazione dei dati del questionario della seconda iterazione
  7. Stesura del questionario della terza iterazione. 113- METODO SHANG:
  • I partecipanti sono invitati a formulare stime numeriche del fenomeno studiato (una minima e una massima). Avremo 2 distribuzione di valori: di queste sono calcolate le sintesi (medie aritmetiche o mediane) determinando 2 soli valori di sintesi, che costituiranno i vincoli per il round successivo.
  • Si calcola un valore centrale dell’intervallo c0.
  • Per ogni evento si sottopone al panel il valore c0 senza specificare come è stato ottenuto e quale significato assume. Ogni partecipante confronta il valore c0 con quello che ritiene più esatto rispondendo maggiore o minore. Se prevalgono i >c0 questo diviene il minimo di un nuovo intervallo di variazione e si ricalcola il nuovo valore centrale. Se prevalgono i <c0, il nuovo intervallo sarà c0;m0.
  • Si procede calcolando nuovi intervalli e nuovi valori centrali giungendo rapidamente a individuare un intervallo molto contenuto per la stima cercata. A ogni round si dimezza l’intervallo di variazione delle valutazioni. SPATIAL DELPHI E SPATIAL SHANG sono 2 derivati de metodo Delphi (di zio). 114- Una delle differenze tra Delphi e Shang risiede nel fatto che: la velocità di convergenza è meglio dello Shang. 115- La struttura in round Delphi consente di: iterazione tra gli esperti in tempi diversi/ riesaminare i giudizi dati almeno una volta. 116- L’anonimato di Delphi consente di: impedire a chiunque di associare le diverse opinioni a chi le ha espresse. VERO/FALSO 117- Quale delle seguenti affermazioni è falsa? Lo scarto quadratico medio è il quadrato della varianza Affermazioni vere:
  • Lo scarto quadratico medio è la radice della varianza.
  • La devianza è il numeratore della varianza.
  • La varianza si esprime con il quadrato dell’unità di misura. 118- Quale fra le seguenti affermazioni è errata? Una variabile ordinale è sempre discreta. Affermazione vere:
  • Le variabili nominali e ordinai sono anche dette qualitative.
  • Una variabile quantitativa è discreta o continua.
  • Una variabile continua ha infinite modalità. ALTRE DOMANDE 119- Fra le seguenti, quale non è una statistica centrografica? L’indice I di Moran. 120- Che cos’è il singolo evento? Uno dei possibili risultati di una prova. 121- Evento intersezione: a e b si verificano simultaneamente. 122- Unione: uno dei due eventi a e b. 123- Come si può misurare l’autocorrelazione spaziale? Indice I di Moran. 124- Quali dei seguenti metodi può essere usato per rilevare fabbisogni e desiderata? Budget game. 125- Cos’è l’autocorrelazione spaziale? Correlazione di una variabile con se stessa, ma in luoghi diversi. 126- Quale delle seguenti è considerata una misura di dispersione? Deviazione standard. 127- Si considerino i dati x1, x2… xn, se la corrispondente varianza vale 0 allora : i dati sono necessariamente tutti uguali. 128- I diagrammi di Venn sono una rappresentazione grafica utile per visualizzare : le misure di probabilità degli eventi. 129- Cosa sono i diagrammi di Venn? Rappresentazioni grafiche di insiemi elementari. 130- Si ha una reazione positiva quando a valori crescenti di X corrispondono valori crescenti di Y? Sempre. 131- Quale fra le seguenti affermazioni non riguarda il postulato delle probabilità composte? L’unione di due o più eventi. 132- Nella stima del modello di regressione lineare, cosa si intende per residuo? La differenza tra valore osservato e corrispondente valore teorico. 133- Quando due eventi sono indipendenti? Quando il verificarsi di uno non condiziona la probabilità del verificarsi dell’altro. 134- In che unità di misura viene espresso il valore dello scarto quadratico medio di una variabile x? Nella stessa unità di misura del carattere osservato. 135- Da cosa è determinato il segno del coefficiente di regressione? Dalla covarianza tra X e Y. 136- Quando si rifiuta un’ipotesi statistica si afferma che: La statistica test rientra nell’intervallo di rifiuto e il test è significativo. 137- Cos’è la differenza interquantiluca? Differenza tra terzo e primo quartile. 138- Per il carattere sesso è lecito calcolare? Moda. 139- Il campo di variazione (range) di una distribuzione si ottiene? Facendo la differenza tra valore massimo e valore minimo. 140- Come viene definita la probabilità di un evento secondo l’approccio classico? Rapporto tra casi favorevoli sui casi probabili, nell’ipotesi che questi ultimi siano equiparabili. 141- Se il carattere osservato ha le modalità raggruppate in classi, come si calcola la media aritmetica? Sarà necessario sintetizzare ciascuna classe mediante il valore centrale. 142- Come si ottiene la covarianza? Dividendo per N la codevianza (X;Y) ESERCIZI 143- Un’urna contiene 1 pallina blu e 9 palline nere. Si estraggono 2 palline con reimmissione. Qual è la probabilità di estrarre 2 palline blu? 1/10.