Teoria Statistica: Concetti Chiave e Definizioni | Prove d'esame di Statistica

TEORIA CAPITOLO 1-10

- Il diagramma di dispersione può essere usato per identificare se esiste una

relazione lineare tra le variabili.!

- Per le serie storiche si utilizza il grafico : congiungendo i vari punti con una

spezzata

- Se il coefficiente di correlazione di Pearson è pari a -0.98, le variabili sono

inversamente correlate

-Sesso e stato di nascita sono esempi di dati di tipo categoriale

- Se supponiamo che venga effettuato un sondaggio su 300 studenti delle scuole

superiori su un totale di 1.000 studenti. Questo gruppo è probabilmente un

campione.

- Per una distribuzione obliqua a sinistra la media è generalmente più piccola

della mediana quando si misurano dati numerici unimodali continui

- Il coefficiente di variazione è la misura meno utilizzata come misura tendenza

centrale.

- Le misure di tendenza centrale sono: moda, media e mediana

- Se la media in un campione è inferiore alla mediana la distribuzione è orientata a

sinistra o negativamente asimmetrica.

- Un sondaggio chiede quale sia lo sport preferito dell'intervistato. La misura di

tendenza centrale che deve essere usata per riassumere questa domanda è la

moda.

-Prezzo di un’auto in migliaia di dollari è una variabile di tipo quantitativo.

- Per un set di dati con 10 valori numerici disposti in ordine crescente, la mediana

è la media aritmetica di quinto e sesto valore.

- Le misure di posizione centrale mediana e moda non sono influenzate da valori

di dati estremamente piccoli o estremamente grandi

- Il numero di persone che mangiano in un bar locale tra mezzogiorno e le 14:00 è

un esempio di variabile casuale discreta

- Se un coefficiente di correlazione campionario è uguale a -1,00 , tutti i punti dati

devono cadere esattamente su una linea retta con una pendenza negativa.

- Il colore degli occhi è una variabile categoriale

- La deviazione standard è una misura della variabilità, Le misure di variabilità

valutano la variabilità e la dispersione delle osservazioni rispetto alla media.

Sono: Il campo di variazione, la differenza interquartile, la varianza, lo scarto

quadratico medio e il coefficiente di variazione.

- La media ponderata non è una misura della variabilità

- Una misura riepilogativa calcolata da un campione per descrivere una

caratteristica della popolazione è nota come: Statistica

- L’inferenza statistica comporta sempre rischi di errore

- Uno stelo e una foglia quando viene girato verticalmente assomiglia ad un

istogramma

- Il numero di miglia di autostrade interstatali è una variabile numerica continua

- Una variabile è classificata come ordinale se esiste un ordinamento naturale

delle categorie

- Il miglior grafico per collegare due serie di dati categorici è il grafico a barre.

- Un grafico a linee che collega i punti che rappresentano la percentuale

cumulativa di osservazioni al di sotto del limite superiore di ciascun intervallo di

classe in una distribuzione di frequenza cumulativa è noto come OGIVA

- Il grafico che meglio identifica le principali cause di problemi o difettosità

mostrando la frequenza delle cause di difettosità è il diagramma di Pareto.

- Il diagramma di Pareto NON mostra le barre più frequenti a dx.!

Anteprima parziale del testo

Scarica Teoria Statistica: Concetti Chiave e Definizioni e più Prove d'esame in PDF di Statistica solo su Docsity!

TEORIA CAPITOLO 1-

Il diagramma di dispersione può essere usato per identificare se esiste una relazione lineare tra le variabili .!
Per le serie storiche si utilizza il grafico : congiungendo i vari punti con una spezzata
Se il coefficiente di correlazione di Pearson è pari a -0.98, le variabili sono inversamente correlate
Sesso e stato di nascita sono esempi di dati di tipo categoriale
Se supponiamo che venga effettuato un sondaggio su 300 studenti delle scuole superiori su un totale di 1.000 studenti. Questo gruppo è probabilmente un campione.
Per una distribuzione obliqua a sinistra la media è generalmente più piccola della mediana quando si misurano dati numerici unimodali continui
Il coefficiente di variazione è la misura meno utilizzata come misura tendenza centrale.
Le misure di tendenza centrale sono: moda, media e mediana
Se la media in un campione è inferiore alla mediana la distribuzione è orientata a sinistra o negativamente asimmetrica.
Un sondaggio chiede quale sia lo sport preferito dell'intervistato. La misura di tendenza centrale che deve essere usata per riassumere questa domanda è la moda.
Prezzo di un’auto in migliaia di dollari è una variabile di tipo quantitativo.
Per un set di dati con 10 valori numerici disposti in ordine crescente, la mediana è la media aritmetica di quinto e sesto valore.
Le misure di posizione centrale mediana e moda non sono influenzate da valori di dati estremamente piccoli o estremamente grandi
Il numero di persone che mangiano in un bar locale tra mezzogiorno e le 14:00 è un esempio di variabile casuale discreta
Se un coefficiente di correlazione campionario è uguale a -1,00 , tutti i punti dati devono cadere esattamente su una linea retta con una pendenza negativa.
Il colore degli occhi è una variabile categoriale
La deviazione standard è una misura della variabilità, Le misure di variabilità valutano la variabilità e la dispersione delle osservazioni rispetto alla media. Sono: Il campo di variazione, la differenza interquartile, la varianza, lo scarto quadratico medio e il coefficiente di variazione.
La media ponderata non è una misura della variabilità
Una misura riepilogativa calcolata da un campione per descrivere una caratteristica della popolazione è nota come: Statistica
L’inferenza statistica comporta sempre rischi di errore
Uno stelo e una foglia quando viene girato verticalmente assomiglia ad un istogramma
Il numero di miglia di autostrade interstatali è una variabile numerica continua
Una variabile è classificata come ordinale se esiste un ordinamento naturale delle categorie
Il miglior grafico per collegare due serie di dati categorici è il grafico a barre.
Un grafico a linee che collega i punti che rappresentano la percentuale cumulativa di osservazioni al di sotto del limite superiore di ciascun intervallo di classe in una distribuzione di frequenza cumulativa è noto come OGIVA
Il grafico che meglio identifica le principali cause di problemi o difettosità mostrando la frequenza delle cause di difettosità è il diagramma di Pareto.
Il diagramma di Pareto NON mostra le barre più frequenti a dx.!

Un metodo di analisi esplorativa dei dati alternativo all’istogramma è il diagramma ramo-foglia
L’ogiva è anche chiamata curva delle frequenze cumulate
Secondo la disuguaglianza di Chebychev, la percentuale di osservazioni che dovrebbe trovarsi entro ±1.25 deviazioni standard dalla media è almeno il 36%.
La larghezza di ciascuna barra in un istogramma corrisponde ai limiti della classe.
Le misure di variabilità sono numeri che descrivono la dispersione dei dati o la misura in cui i valori dei dati sono distribuiti.!
La covarianza è una misura standardizzata della relazione lineare tra due variabili.!
La covarianza può essere uguale al coefficiente di correlazione. Coefficiente si calcola covarianza/deviazione standard, se deviazione standard è 1 possono essere uguali.!
Nella correlazione di Pearson se l’indice è < 0 allora sono positivamente correlate. FALSO.
La relazione tra media, mediana e moda in una distribuzione asimmetrica positivamente è che la media è sempre il valore più piccolo.
Considera i seguenti dati: mi piace, nessuna preferenza o antipatia. Quale delle seguenti definizioni descrive meglio questi dati? QUALITATIVO
La regola empirica fornisce una valutazione della percentuale approssimata di osservazioni
Le vendite, gli investimenti, i consumi, i costi e i ricavi sono misure economiche e di business che possono essere rappresentate da variabili casuali continue.
Una variabile all'interno di un intervallo di numeri reali è indicata come una variabile discreta
Se tutti i possibili campioni casuali di dimensione n vengono prelevati da una popolazione e viene determinata la media di ciascun campione, la media della distribuzione del campione è esattamente uguale alla media della popolazione
Una variabile che può assumere un numero finito e numerabile di valori è una variabile discreta
Il valore atteso di una variabile casuale, indicato con mu, è anche chiamato la sua media
La deviazione standard è espressa in termini di unità di misura originali, ma la varianza non lo è.!
Se una distribuzione normale ha una media di 5 ed una deviazione standard di 2. Una seconda distribuzione normale ha una media di 6 ed una deviazione standard di 1. La larghezza della prima distribuzione è più ampia della seconda distribuzione
Poiché la popolazione è sempre più grande del campione, la media di popolazione può essere minore, maggiore o uguale alla media campionaria
I dati nominali non possono essere descritti come quantitativi
Se sei interessato a confrontare la variazione delle vendite per negozi piccoli e grandi che vendono prodotti simili, la misura di dispersione più appropriata è il coefficiente di variazione -. Una variabile casuale che assume non più di un numero numerabile, n, di valori è chiamata variabile casuale discreta
Considera i termini: informazioni, dati e conoscenza. Da un punto di vista statistico, elenca questi termini in ordine crescente di utilità nel prendere decisioni – DATI, INFORMAZIONI E CONOSCENZE

Se la mediana è pari a 3 allora: il primo quartile è sicuramente diverso da 3
Data la variabile età indicare quale delle seguenti affermazioni è corretta: è una variabile quantitativa discreta
La covarianza: è una misura di concordanza tra due variabili
Il Chi-quadro: per essere interpretato correttamente deve essere confrontato con il suo valore massimo.
Se la varianza è pari a 0 allora: non c’è variabilità
Sia score un punteggio di un test che può assumere valori da 0 a 100. Allora la misura di posizione più opportuna è: La media
Il campionamento: operazione di scelta casuale delle unità statistiche della popolazione di riferimento.
Il campionamento: che sia con reinserimento o senza se N è sufficientemente grande i due tipi di campionamento si equivalgono
Scatter plot: consente di rappresentare congiuntamente solo variabili quantitative
Rilevata la variabile “numero di figli per famiglia” su un collettivo costituito dalle famiglie italiane, qual è l’indice di posizione più opportuno da costruire? Media artitmetica
Quando il coefficiente di correlazione tra due variabili quantitative è circa 1? C’è una forte relazione linerae tra le due variabili.
In un esperimento casuale che porta a un risultato che può essere rappresentato da una variabile casuale continua, la media dei valori presi quando il numero di repliche diventa infinitamente grande è chiamata valore atteso.
La geografia del paese in cui vivi è una variabile categoriale
Se due set di dati hanno lo stesso intervallo , allora le distanze dalle osservazioni più piccole a quelle più grandi in entrambi gli insiemi saranno le stesse.
La forza della relazione lineare tra due variabili numeriche può essere misurata da coefficiente di correlazione
La variazione della deviazione standard: a. appiattisce o innalza la campana della funzione di densità di probabilità
La variazione della media causa spostamento a sinistra o destra della campana della funzione di densità di probabilità
Il grafico istogramma è adatto a rappresentare un carattere X quantitativo in classi
L’odds ratio: è un rapporto tra rischi
Quale delle seguenti misure è una misura di associazione: Odds ratio
L’inferenza statistica: comporta sempre dei rischi
Si definisce evento elementare: ciascuno dei possibili esiti di un esperimento casuale.
Si definisce esperimento casuale: un esperimento di cui è possibile solo elencare a priori il set dei possibili esiti
Si definisce evento casuale: un sottoinsieme dello spazio campionario
I parametri ignoti: sono oggetto di studio della statistica inferenziale
Si definisce spazio campionario: l’insieme di tutti i possibili esiti
Per fare correttamente inferenza è necessario che: il campione sia rappresentativo della popolazione
Uno degli obiettivi dell’inferenza è: stimare i parametri ignoti
Le frequenze condizionate: forniscono informazioni su un fenomeno condizionatamente alle modalità di un altro.
Due eventi si dicono statisticamente indipendenti se P(A ∩B) = P(A) * P(B)

La probabilità di osservare la sequenza specifica di risultati discreti si ottiene applicando la regola di moltiplicazione delle probabilità.
Poiché la probabilità di qualsiasi valore specifico è 0 per una variabile casuale continua, i valori attesi per variabili casuali continue vengono calcolati utilizzando il calcolo integrale
La somma del prodotto di ciascun valore di una varia casuale discreta X e la sua probabilità è indicata come suo valore atteso
La rappresentazione della probabilità di tutti i possibili valori che può assumere una variabile è nominata distribuzione di probabilità
Per approssimare la distribuzione binomiale quando il numero di prove n è grande e la probabilità di successo P è piccola tale che nP ≤ 7 di usa la distribuzione di Poisson
Una distribuzione che attribuisce la stessa probabilità a tutti i punti appartenenti ad un dato intervallo è chiamata distribuzione uniforme.
La funzione di ripartizione è la probabilità che la variabile casuale X assuma valori minori o uguali ad un valore generico X
Se un ricercatore ha utilizzato una procedura per selezionare un campione di oggetti da una popolazione in modo tale che ogni membro della popolazione sia scelto rigorosamente per caso, abbia la stessa probabilità di essere scelto e ogni possibile campione di dimensione n abbia la stessa possibilità di selezione, la procedura utilizzata dal ricercatore è nota come campionamento casuale semplice.
In una distribuzione di probabilità, la probabilità di ogni risultato deve essere compresa tra 0 e 1, inclusi.
La variabile casuale continua X è distribuita uniformemente sull'intervallo [a, b]. La media della distribuzione di probabilità di X è (a + b) / 2
La forma della distribuzione di probabilità uniforme è rettangolare
La funzione di probabilità è: la probabilità che una variabile casuale assuma valori uguali ad un generico valore.
La variabile casuale binomiale: è una variabile discreta.
La probabilità che una variabile casuale assuma valori uguali ad un generico valore è detta: funzione di probabilità
La funzione di probabilità di x, è la funzione fx dell’insieme dei reali nei reali positivi, che ad ogni elemento associa la probabilità che la variabile discreta assuma valori UGUALI al reale xi.
La distribuzione di Poisson può essere utilizzata per approssimare le probabilità binomiali quando il numero di prove n è grande e allo stesso tempo la probabilità P è piccola.
L'approccio, per sviluppare la distribuzione di probabilità binomiale, inizia con il modello di Bernoulli.
Per approssimare una distribuzione discreta che ha molti risultati diversi utili, nella maggior parte delle applicazioni utilizziamo la Distribuzione di Poisson
Distribuzione mariginale: serve per approssimare una variabile continua.
Distribuzione normale: serve per approssimare una variabile continua
Distribuzione uniforme: si usa con le variabili continue
Distribuzione di Poisson:Serve per variabili discrete.
La deviazione standard di una variabile aleatoria discreta è la radice quadrata con segno positivo della sua Varianza
L’approssimazione della distribuzione binomiale con la distribuzione normale si usa per grandi campioni
Nella distribuzione binomiale si usa il modello di Bernulli

Poiché la popolazione è sempre più grande del campione, la media di popolazione può essere minore, maggiore o uguale alla media campionaria.
La distribuzione campionaria della media è una distribuzione di statistiche campionarie
Il teorema del limite centrale è importante in statistica perché per un campione di grandi dimensioni n, si dice che la distribuzione campionaria della media campionaria è approssimativamente normale, indipendentemente dalla forma della popolazione.
La distribuzione delle medie campionarie è normale per campioni di qualsiasi dimensione, n, a condizione che la popolazione di partenza abbia una distribuzione normale.!
Un campione di dimensione n è selezionato in modo causale da una popolazione infinita. Al crescere di n, quale delle seguenti affermazioni è corretta? L’errore standard della media campionaria decresce
Al crescere delle dimensioni di un campione, la forma della distribuzione della media campionaria diventa approssimativamente normale
Il teorema del limite centrale può essere applicato sia a variabili aleatorie discrete sia a variabili aleatorie continue.!
Quale distribuzioni viene utilizzata per stimare la media della popolazione da una popolazione normale con varianza sconosciuta? La distribuzione t con n-1 gradi di libertà
Secondo il teorema del limite centrale, la distribuzione della media campionaria può essere approssimata ad una distribuzione normale se l’ampiezza del campione è abbastanza grande
Una statistica campionaria tale che la media di tutti i sui possibili valori sia uguale al parametro della popolazione che la statistica cerca di stimare è uno stimatore imparziale.!
Le stime per intervallo per la varianza di una popolazione normale dipendono dalla variabile aleatoria (𝒏 − 𝟏)𝒔𝟐/𝝈𝟐, che segue una distribuzione chi-quadrato.
Uno stimatore si definisce non distorto se la media della distribuzione campionaria coincide con il parametro della popolazione che deve essere stimato.!
A parità di altre condizioni, maggiore è la dimensione del campione, più precisa è la stima dell'intervallo che riflette l'incertezza sull'effettivo valore di un parametro.!
L'ampiezza dell'intervallo di confidenza è uguale al doppio del margine di errore.
Per i corrispondenti parametri della popolazione quale di queste affermazioni è corretta: la media campionaria è uno stimatore non distorto di 𝜇 b. la varianza campionaria è uno stimatore non distorto di 𝜎2 c. la proporzione campionaria è uno stimatore non distorto di p (tutte)
A parità di altre condizioni, maggiore è la dimensione del campione, più precisa è la stima dell’intervallo che riflette l’incertezza sull’effettivo valore di un parametro.!
Una statistica campionaria tale per cui la media di tutti i suoi possibili valori è uguale al parametro della popolazione che la statistica cerca di stimare è uno stimatore non distorto.!
Quando si calcola l’intervallo di confidenza per la proporzione della popolazione, viene utilizzata la distribuzione t di Student anziché la distribuzione normale. NON è VERO
La quantità 100(1 + α)% viene definita livello di confidenza dell’intervallo. NON è VERO

La funzione di densità della distribuzione normale standard ha una dispersione maggiore rispetto alla distribuzione t di Student. NON è VERO
La deviazione standard campionaria s è uno stimatore non distorto della deviazione standard della popolazione σ.!
Uno stimatore si definisce non distorto se la media della distribuzione campionaria coincide con il parametro della popolazione che deve essere stimato.!
La proporzione campionaria 𝒑̂ è uno stimatore distorto della proporzione della popolazione P. NON è VERO
Qualunque sia il valore della proporzione campionaria, 𝒑̂(𝟏 − 𝒑̂) non può essere inferiore a 0,25. NON è VERO
Per sviluppare un intervallo di confidenza per la differenza tra le medie di due popolazioni che sono distribuite normalmente e hanno varianze uguali, due campioni indipendenti di dimensioni 𝒏𝟏e 𝒏𝟐 vengono selezionati in modo casuale dalle due popolazioni. Qual è la formula utilizzata per determinare il numero di gradi di libertà per la distribuzione t? n1+n2-
Per misurare l'efficacia di un programma di dimagrimento, chi lo segue viene pesato all'inizio e alla fine del programma. Questo è un esempio di campioni indipendenti con varianze delle popolazioni diverse. NON è VERO
Quando si costruisce un intervallo di confidenza per la media delle differenze in dati appaiati, all'aumentare della dimensione del campione, aumenta anche l'ampiezza dell'intervallo. NON è VERO
La varianza campionaria segue una distribuzione chi quadrato
L’intervallo di confidenza per la differenza tra due medie di popolazioni che sono normalmente distribuite le varianze della popolazione sono sconosciute e non si presume siano uguali si basa sull’uso dell’approssimazione di Satterthwaite
Per gli intervalli di confidenza nei test di ipotesi della varianza di una popolazione normale, dove le varianze sono più piccole del previsto sarà più stretto del previsto
Nella verifica di ipotesi, abbina il simbolo con la definizione corretta (Beta) --- la probabilità di un errore di Tipo II
Nella verifica di ipotesi, abbina il simbolo (1- a) con la definizione corretta. --- la probabilità di non rifiutare l'ipotesi nulla quando è vera
Nella verifica di ipotesi, abbina il simbolo α alla definizione corretta --- la probabilità di un errore di tipo I.
il valore z per un test di ipotesi bilaterale (a due code) per una media di popolazione quando la probabilità di rifiutare un'ipotesi nulla vera è uguale a 0,05 è 1.
Il livello di significatività di un test viene indicato con alfa
Il livello di significatività è la probabilità di rifiutare una ipotesi nulla quando è vera
La potenza di un test è la probabilità di rifiutare una ipotesi nulla quando è falsa
P-value è il più piccolo livello di significatività al quale l’ipotesi nulla può essere rifiutata
Quando non si rifiuta l’ipotesi nulla si può concludere che la procedura del test non sia abbastanza forte da rifiutare l’ipotesi nulla
Un’ipotesi nulla viene rifiutata a livello 0.025 ma non viene rifiutata a livello 0.01. Questo significa che il p-value del test si trova tra 0.01 e 0.025.!
Se il livello di significatività è uguale o inferiore al p-value, l’ipotesi nulla non viene rifiutata.!

Teoria Statistica: Concetti Chiave e Definizioni, Prove d'esame di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica Teoria Statistica: Concetti Chiave e Definizioni e più Prove d'esame in PDF di Statistica solo su Docsity!

TEORIA CAPITOLO 1-