Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Esercizi di Statistica: Misure di Tendenza Centrale e Variabilità, Prove d'esame di Statistica

Una serie di esercizi di statistica che riguardano le misure di tendenza centrale (media, mediana, moda) e le misure di variabilità (varianza, deviazione standard, coefficiente di variazione, range interquartile). Gli esercizi sono progettati per aiutare gli studenti a comprendere e applicare i concetti chiave della statistica descrittiva. Il documento include anche alcune definizioni e spiegazioni per facilitare la comprensione dei concetti.

Tipologia: Prove d'esame

2023/2024

Caricato il 04/02/2025

laricercadidory
laricercadidory 🇮🇹

4.6

(6)

18 documenti

1 / 73

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
NOZIONI PRELIMINARI
1. Per quale tipo di distribuzione la media è generalmente più piccola della mediana quando si
misurano dati numerici unimodali continui?
Scegli un'alternativa:
A. distribuzione obliqua a sinistra
B. distribuzione continua uniforme
C. distribuzione obliqua a destra
D. distribuzione simmetrica
2. Quale tra i seguenti grafici ha un’asimmetria positiva?
A. Il primo
B. Il secondo
C. Il terzo
D. Tutti e tre
2. In una grande azienda, la maggior parte dei dipendenti guadagna da $ 22.000 a $ 32.000
all'anno. I dipendenti del middle management guadagnano tra $ 32.000 e $ 52.000 all'anno,
mentre il top management guadagna tra $ 54.000 e $ 104.000 all'anno.
Quale delle seguenti forme avrebbe un istogramma di tutti gli stipendi?
A. Concentrato a destra
B. Simmetrico
C. Uniforme
D. Concentrato a sinistra
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49

Anteprima parziale del testo

Scarica Esercizi di Statistica: Misure di Tendenza Centrale e Variabilità e più Prove d'esame in PDF di Statistica solo su Docsity!

NOZIONI PRELIMINARI

1. Per quale tipo di distribuzione la media è generalmente più piccola della mediana quando si misurano dati numerici unimodali continui? Scegli un'alternativa: A. distribuzione obliqua a sinistra B. distribuzione continua uniforme C. distribuzione obliqua a destra D. distribuzione simmetrica 2. Quale tra i seguenti grafici ha un’asimmetria positiva? A. Il primo B. Il secondo C. Il terzo D. Tutti e tre 2. In una grande azienda, la maggior parte dei dipendenti guadagna da $ 22.000 a $ 32. all'anno. I dipendenti del middle management guadagnano tra $ 32.000 e $ 52.000 all'anno, mentre il top management guadagna tra $ 54.000 e $ 104.000 all'anno. Quale delle seguenti forme avrebbe un istogramma di tutti gli stipendi? A. Concentrato a destra B. Simmetrico C. Uniforme D. Concentrato a sinistra

3. Quanto vale la moda della seguente distribuzione? A. 0 B. 17 C. 2 D. 16 3. Considerando la distribuzione di frequenza per il gradimento di un libro su Amazon illustrato dal seguente grafico (votazione da parte di 13 individui) quale è la moda dei dati? 4 (la media invece è 3,69) A. 3. B. 3. C. 1. D. 4. 4. In un test psicologico, un campione di studenti ha ottenuto i seguenti punteggi… calcolare la media dei punteggi nel test: fare calcolo della media > mediana 8 media 9 *Se è pari per trovare il numero faccio diviso 2 Se è dispari per trovare il numero faccio +1 e poi diviso 2 5. Una domanda in un sondaggio chiede quale sia lo sport preferito dell'intervistato. Quale misura di tendenza centrale dovrebbe essere usata per riassumere questa domanda? Scegli un'alternativa: A. Media aritmetica B. Mediana C. Media geometrica D. Moda *Variabile quantitativa discreta: MEDIA; diagrammi ad aste Variabile quantitativa continua: MEDIA; istogramma Variabile qualitativa ordinale: MEDIANA; grafico a barre e grafico a torta Variabile qualitativa sconnessa: MODA; grafico a barre e grafico a torta

Calcola la moda A. 6 B. 10 C. 7

24. Per questa popolazione: 8 10 6 15 9 6 7 20 11 14 6 Calcola la differenza interquartile A. 8 B. 5 C. 14 25. Poiché la popolazione è sempre più grande del campione, la media di popolazione: A. È sempre maggiore o uguale o minore o uguale alla media campionaria B. È sempre maggiore della media campionaria C. Può essere minore, maggiore o uguale alla media campionaria D. È sempre inferiore alla media campionaria 26. Poiché la popolazione è sempre più grande del campione, la media di popolazione: A. È sempre maggiore o uguale o minore o uguale alla media campionaria B. È sempre maggiore della media campionaria C. Può essere minore, maggiore o uguale alla media campionaria D. È sempre inferiore alla media campionaria 27. Quale delle seguenti affermazioni non è vera? A. l coefficiente di variazione è la misura meno utilizzata come misura tendenza centrale B. Le misure di tendenza centrale sono numeri che descrivono valori tipici nei dati. C. Tutte D. La media è la misura della posizione più utilizzata. *Le misure di tendenza centrale sono: moda, media e mediana Le misure di variabilità: campo di variazione, differenza interquartile, scarto quadratico, varianza e coefficiente di variazione. 28. Il coefficiente di variazione può essere calcolato: A. per caratteri solo quantitativi 29. Se sei interessato a confrontare la variazione delle vendite per negozi piccoli e grandi che vendono prodotti simili, quale delle seguenti è la misura di dispersione più appropriata? A. La deviazione standard B. Il campo di variazione C. Il coefficiente di variazione D. L’intervallo quartile 30. Coefficiente di variazione: esprime lo scarto quadratico medio come una percentuale della media. CV = 𝛔 |𝛍| x 100

31. Varianza: somma degli scarti quadratici/N- 1 ; non è espressa in termini di unità di misura originali (vs. deviazione standard) 32. Deviazione standard: una stima della variabilità media di un set di dati misurata nella stessa unità di misura dei dati originali. 33. Se la varianza è pari a 0 allora : non c’è variabilità 34. Quale dei seguenti indici può assumere solo valori positivi? A. Varianza 35. La variazione della deviazione standard: A. appiattisce o innalza la campana della funzione di densità di probabilità B. causa spostamento a sinistra o destra della campana della funzione di densità di probabilità C. è negativa se la deviazione standard è negativa D. è inversamente proporzionale alla varianza 36. La variazione della media: A. appiattisce o innalza la campana della funzione di densità di probabilità B. Causa spostamento a sinistra o destra della campana della funzione di densità di probabilità C. È negativa se la deviazione standard è negativa D. È inversamente proporzionale alla varianza 37. Quale delle seguenti affermazioni è vera? A. La deviazione standard è una misura della variabilità. B. La mediana è una misura della variabilità. C. La media è una misura della deviazione in un set di dati. *Il campo di variazione è una misura della posizione centrale. 38. Quale delle seguenti non è una misura della variabilità? A. media ponderata B. campo di variazione C. varianza D. intervallo interquartile 39. Quale delle seguenti affermazioni è vera? A. Tutte B. L'intervallo è la misura di variabilità più utile C. Le misure di variabilità sono numeri che descrivono la dispersione dei dati o la misura in cui i valori dei dati sono distribuiti D. La media ponderata è la misura di variabilità più utile 40. Quale delle seguenti affermazioni è vera? A. L’intervallo interquartile si trova prendendo la differenza tra il primo ed il terzo quartile e dividendo tale valore per 2 B. I valori della deviazione standard possono essere positivi o negativi, mentre il valore della varianza sarà sempre positivo

54. Test Stroop: cos’è il TR A. Variabile dipendente continua 55. Test Stroop esperimento: A. discreta = numero di errori commessi – continua (variabile dipendente continua) = tempo di reazione 56. Quale delle seguenti è una variabile quantitativa? A. Il sesso di una persona B. Titolo di studio C. La marca di una lavatrice D. Prezzo di un'auto in migliaia di dollari 57. Variabile manipolata dal ricercatore: A. variabile indipendente 58. Variabili dipendenti: A. Le misurazioni del comportamento utilizzate dai ricercatori per valutare l’effetto della manipolazione sperimentale. 59. Un campione di studenti (N = 30) è arruolato su uno studio di apprendimento. Ai primi 15 soggetti reclutati viene detto che la prova sarà particolarmente difficile mentre agli altri 15 non vengono fornite indicazioni riguardo alla difficoltà. La prova consiste nell’apprendimento di liste di parole: vengono calcolati il numero di parole che il soggetto riesce a rievocare e il numero di intrusioni. Quale è la variabile indipendente dello studio? A. Il numero di interlocutori B. Informazioni sulla difficoltà della prova C. Il numero di parole correttamente ricordate D. La numerosità del campione 60. Uno psicologo esperto di marketing vuole verificare sei generi di musica diversi utilizzati come sottofondo nei supermercati abbiano un effetto Sulla qualità dei prodotti comprati. A tale scopo, prepara sei playlist di diversi generi musicali(classica, pop, jazz, Country, Rock, Blues) e individua un campione casuale di 30 soggetti ai quali si chiede di recarsi al supermercato in 6 diverse giornate E di fare la spesa settimanale. Tutti soggetti sono disposti all'ascolto delle sei diverse playlist. Al termine della spesa ai soggetti è stato chiesto di lasciare allora scontrino per contare il numero di oggetti comprati. Il numero di oggetti comprati è la variabile: A. Indipendente B. Individuale C. Confondente D. Dipendente 61. Quale è la v. indipendente di un gruppo che viene valutato per osservare 2 metodi di apprendimento diversi? A. Metodo di apprendimento

62. Che variabile è QI: A. scala a intervalli equivalenti *Temperatura in °C: scala ad intervalli equivalenti Reddito mensile in euro: scala a rapporti equivalenti Frequenza cardiaca: scala a rapporti equivalenti Calorie contenute in un alimento: scala a rapporti equivalenti Numero di sintomi influenzali: scala a rapporti equivalenti Numero di CFU: scala a rapporti equivalenti Tempo impiegato per correre una gara di 100 metri piani in secondi: scala a rapporti equivalenti Reddito mensile in fascie: scala ordinale 63. Sesso e stato di nascita sono esempi di quale tipo di dati? A. Discreto B. Categoriale C. Ordinale D. Continuo 64. Quale delle seguenti è una variabile categoriale? A. Saldo del conto bancario B. Colore degli occhi C. Vendite giornaliere in un negozio D. Pressione dei pneumatici 65. Una variabile è classificata come ordinale se: A. Esiste un ordinamento naturale delle categorie B. Non esiste un ordinamento naturale delle categorie C. I dati derivano da misurazioni continue D. La variabile viene tracciata per un periodo di tempo 66. La variabile interveniente serve a: A. Fornire la chiave per comprendere la relazione tra variabili 67. Variabile binaria: una variabile categoriale che ha solo due categorie mutuamente esclusive (es. vivo o morto) 68. Cos’è una variabile confondente? A. Una variabile che influenza la variabile dipendente in maniera simile a/o al posto della variabile indipendente B. Una quantità che non è stata misurata C. Una variabile manipolata dallo sperimentatore D. Una variabile costituita solamente da categorie 69. Variabile confondente: A. variabile che può incidere sull’esito di uno studio

85. La funzione di probabilità è: A. la probabilità di estrarre casualmente dalla popolazione un individuo con la caratteristica x

  • **La probabilità di ogni risultato deve essere compresa tra 0 e 1 (inclusi)
  1. La funzione di probabilità è** : la probabilità che una variabile casuale assuma valori uguali ad un generico valore P(X=x) 87. Quale affermazione è vera sull’inferenza statistica: A. è oggetto della statistica descrittiva B. i dati a disposizione sono sulla popolazione C. comporta sempre rischi di errore D. elabora i dati e li trasforma in informazioni 88. Determinare se, per ottenere le seguenti informazioni, sia necessaria la statistica descrittiva o inferenziale. Un grafico che illustra il numero di bottiglie difettose prodotte nell'arco di una settimana. Scegli un'alternativa: A. Descrittiva B. Inferenziale 89. L’odds ratio: è un rapporto tra rischi 90. Quale delle seguenti misure è una misura di associazione: Odds ratio 91. Una distribuzione che attribuisce la stessa probabilità a tutti i punti appartenenti ad un dato intervallo è chiamata: A. Distribuzione uniforme B. Funzione di ripartizione. C. Distribuzione della varianza campionaria. D. Valore atteso. 92. La forma della distribuzione di probabilità uniforme è: A. Distorta positivamente B. A forma di campana C. Distorta negativamente D. Rettangolare 93. Statistica: caratteristica del campione 94. Parametro: caratteristica della popolazione 95. La vostra università effettua un’indagine tra gli studenti per determinare il tempo medio settimanale di collegamento a internet. Da un campione causale di 174 studenti è risultato un tempo medio di 6.1 ore. Qual è la statistica? A. Il tempo medio di permanenza su internet B. Gli studenti in università C. I 174 studenti astratti

96. Supponiamo che venga effettuato un sondaggio su 300 studenti delle scuole superiori su un totale di 1.000 studenti. Questo gruppo è probabilmente un: A. Processo B. Sistema C. Popolazione D. Un campione 97. Campione: un piccolo ma rappresentativo gruppo di unità di una popolazione usato per determinare verità sulla popolazione 98. Popolazione: si riferisce ad un gruppo di unità alla quale vogliamo generalizzare le scoperte o il modello statistico. 99. Affidabilità: l’abilità di una misura di produrre risultati consistenti dove le stesse entità sono misurate in diverse condizioni 100. Affidabilità split-half: una misura dell’affidabilità ottenuta dividendo gli item in due metà ed ottenendo un punteggio da ciascuna metà scala; la correlazione è basata su solo metà degli item 101. Affidabilità test-retest: abilità di una misura di produrre risultati consistenti quando le stesse entità sono testate in momenti diversi. 102. Coefficiente casuale: un coefficiente o parametro di un modello che è libero di variare a seconda della situazione o di un contesto 103. Controbilanciamento: un processo di variazione sistematica nell’ordine in cui le condizioni sperimentali si presentano 104. Randomizzazione: assegnazione casuale dei partecipanti alle differenti condizioni di trattamento 105. Italiani vs francesi: A. tutte corrette

6. Che tipo di grafico utilizzeresti per valutare la moda di una distribuzione? A. Diagramma 3D B. Istogramma C. Box plot D. Scatter plot 7. La larghezza di ciascuna barra in un istogramma corrisponde a: A. i limiti della classe B. numero di osservazioni nella classe C. percentuale di osservazioni in classe D. punto medio della classe 8. Quale dei seguenti è l'analogo grafico di una tabella di frequenza? A. grafico a dispersione B. istogramma C. tabella delle contingenze D. grafico delle serie temporali 9. Quale tra i seguenti grafici è adatto a rappresentare un carattere X quantitativo in classi: A. grafico a torta B. grafico a dispersione C. box plot D. grafico istogramma 10. A che tipo di grafico assomiglia uno stelo e una foglia quando viene girato verticalmente? A. grafico a torta B. grafico a dispersione C. grafico a linee D. istogramma 106. Qual è un metodo di analisi esplorativa dei dati alternativo all’istogramma? A. Grafico a dispersione B. Funzione di frequenza C. Ogiva D. Diagramma ramo-foglia 11. Che grafico è rappresentato? A. Istogramma a gruppi

12. Che tipo di grafico è rappresentato nella figura seguente? A. Bar Plot B. Dot Plot C. Scatter Plot D. Box Plot 13. Nel box plot è possibile visualizzare anche le seguenti caratteristiche: A. campo di variazione dei valori, la mediana, i quartili inferiore e superiore, la simmetria della distribuzione *nel disegno possiamo notare che la distribuzione è simmetrica Ci sono pochi outliers La mediana del grafico superiore è maggiore della mediana del grafico inferiore 14. Quali dei seguenti grafici illustra visivamente dove cade il 50% centrale dei dati (scarto interquartile)? A. Diagramma boxplot B. Dot Plot C. Bar Plot D. Scatter plot 15. Il boxplot: si può rappresentare per sintetizzare i dati riferiti ad una variabile almeno di tipo ordinale

**20. Grafico a barre per gruppi

  1. Qual è l’obiettivo di un grafico a barre per gruppi?** Permette un rapido confronto tra le medie di diversi gruppi 22. Che tipo di grafico è rappresentato in figura A. Scatter Plot B. Line Plot C. Bar Plot or Diagramma a barre D. Box Plot 23. Obiettivo line plot: utile quando abbiamo lo stesso gruppo di soggetti che partecipa a misurazioni ripetute, per vedere come varia un certo effetto nel tempo 24. Che tipo di grafico è rappresentato in figura? A. Scatter Plot B. Line Plot C. Bar Plot or Diagramma a barre D. Box Plot

25. Scatter plot per gruppi: *La relazione tra le variabili è abbastanza lineare **26. Nel seguente grafico (scatter plot) si può notare che la relazione tra variabili è lineare

  1. Nel seguente grafico (scatter plot) si puà notare che la relazione tra le variabili non è lineare
  2. Nel seguente grafico la relazione tra le variabili non è lineare
  3. Scatter plot:** consente di rappresentare congiuntamente solo variabili quantitative.

LEZIONE 2: INTRODUZIONE AI GRAFICI

o Layers: costruzione a strati o Geom: elementi grafici o Aes: proprietà estetiche o facet_wrap (~ x) esegue diverse sfaccettature del grafico a seconda del valore di una variabile. o fill dice che il colore che riempie le curve smussate dev’essere selezionato in base al livello della variabile o stat summary indica una grandezza statistica (media, barre di errore…) o position dodge si pongono le barre una di fianco all’altra o geom_smooth produce una linea che fitti i punti (banda grigia: banda di confidenza); si fa riferimento alla linea di regressione o color : grafica i punti con un colore che dipende da una variabile. o Qnorm: i quantili della distribuzione normale o Qt: quantili della distribuzione t o geom density : istogramma smussato o pwr.r. test : potenza statistica o stat_function (fun=dnorm, args=list(mean=, sd=): per rappresentare la curva normale o stat.desc: quantificare la normalità numericamente o df_clean : è la funzione che serve per eliminare del tutto i casi con valori mancanti o Cor.test: correlazione bivariata (correlazione semplice tra variabili) o rcorr: matrice di correlazione o Contr. treatment : ricodifica internalmente alla variabile categoriale i livelli in termini di dummy variables ; un contrasto nel quale ogni categoria è confrontata da una categoria baseline decisa da un utente o Adj_means : le medie della variabile dipendente nei diversi gruppi sperimentali corrette per l’effetto della covariata o r contrast: per calcolare dimensione degli effetti nei contrasti pianificati o mes: per calcolare dimensione degli effetti specifici nei contrasti post-hoc o Adj_means$se : deviazioni standard corrette o Polyserial (che appartiene alla libreria polycor ): per calcolare la correlazione biseriale o pcor.test: funzione correlazione parziale o pcor : matrice di correlazione parziali o Contr.poly : contrasti polinomiali o na.action : indica cosa fare con i valori mancanti o Contr.helmert : confronta ciascun gruppo con tutti i gruppi che lo seguono (si capisce meglio al contrario: confronta ciascun gruppo con la media di quelli che lo precedono); contrasto pianificato non ortogonale o Per condure un’analisi di regressione si usa la funzione lm che ha la seguente formula generale o Console: finestra principale di R o CRAN: un archivio virtuale che contiene il software R o La funzione yuen si basa sull’uso della media modificata o “troncata” (trimmed mean); è relativa ad un metodo robusto per medie indipendenti e si esprime:

1. Il grafico della densità è un istogramma smussato, interpolato per dare una visione più **morbida dell’andamento della distribuzione.

  1. Nel box plot rappresentato, che valore è indicato dalla freccia?** A. Mediana *Q3: il 75% dei valori sono sotto Q1: il 25% dei valori sono sotto Non c’è nessun outlier nella parte inferiore della distribuzione Se ci sono outlier il valore più estremo rappresenta il massimo o il minimo