Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Teoria Statistica: Concetti Chiave e Definizioni, Prove d'esame di Statistica

I concetti chiave della teoria statistica, presentando definizioni e spiegazioni utili per la comprensione delle variabili, delle misure di tendenza centrale e della variabilità. Include argomenti come diagrammi di dispersione, coefficienti di correlazione, distribuzioni di frequenza e variabili casuali. Una panoramica completa degli strumenti statistici fondamentali, essenziali per l'analisi dei dati e l'inferenza statistica. Approfondisce anche le misure di posizione come media, mediana e moda, e le loro applicazioni in diversi contesti. Infine, esplora concetti avanzati come la covarianza e il coefficiente di variazione, offrendo una solida base per lo studio della statistica.

Tipologia: Prove d'esame

2022/2023

Caricato il 20/10/2025

simona-semprivivo-1
simona-semprivivo-1 🇮🇹

8 documenti

1 / 8

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
TEORIA CAPITOLO 1-10
- Il diagramma di dispersione può essere usato per identificare se esiste una
relazione lineare tra le variabili.!
- Per le serie storiche si utilizza il grafico : congiungendo i vari punti con una
spezzata
- Se il coefficiente di correlazione di Pearson è pari a -0.98, le variabili sono
inversamente correlate
-Sesso e stato di nascita sono esempi di dati di tipo categoriale
- Se supponiamo che venga effettuato un sondaggio su 300 studenti delle scuole
superiori su un totale di 1.000 studenti. Questo gruppo è probabilmente un
campione.
- Per una distribuzione obliqua a sinistra la media è generalmente più piccola
della mediana quando si misurano dati numerici unimodali continui
- Il coefficiente di variazione è la misura meno utilizzata come misura tendenza
centrale.
- Le misure di tendenza centrale sono: moda, media e mediana
- Se la media in un campione è inferiore alla mediana la distribuzione è orientata a
sinistra o negativamente asimmetrica.
- Un sondaggio chiede quale sia lo sport preferito dell'intervistato. La misura di
tendenza centrale che deve essere usata per riassumere questa domanda è la
moda.
-Prezzo di un’auto in migliaia di dollari è una variabile di tipo quantitativo.
- Per un set di dati con 10 valori numerici disposti in ordine crescente, la mediana
è la media aritmetica di quinto e sesto valore.
- Le misure di posizione centrale mediana e moda non sono influenzate da valori
di dati estremamente piccoli o estremamente grandi
- Il numero di persone che mangiano in un bar locale tra mezzogiorno e le 14:00 è
un esempio di variabile casuale discreta
- Se un coefficiente di correlazione campionario è uguale a -1,00 , tutti i punti dati
devono cadere esattamente su una linea retta con una pendenza negativa.
- Il colore degli occhi è una variabile categoriale
- La deviazione standard è una misura della variabilità, Le misure di variabilità
valutano la variabilità e la dispersione delle osservazioni rispetto alla media.
Sono: Il campo di variazione, la differenza interquartile, la varianza, lo scarto
quadratico medio e il coefficiente di variazione.
- La media ponderata non è una misura della variabilità
- Una misura riepilogativa calcolata da un campione per descrivere una
caratteristica della popolazione è nota come: Statistica
- L’inferenza statistica comporta sempre rischi di errore
- Uno stelo e una foglia quando viene girato verticalmente assomiglia ad un
istogramma
- Il numero di miglia di autostrade interstatali è una variabile numerica continua
- Una variabile è classificata come ordinale se esiste un ordinamento naturale
delle categorie
- Il miglior grafico per collegare due serie di dati categorici è il grafico a barre.
- Un grafico a linee che collega i punti che rappresentano la percentuale
cumulativa di osservazioni al di sotto del limite superiore di ciascun intervallo di
classe in una distribuzione di frequenza cumulativa è noto come OGIVA
- Il grafico che meglio identifica le principali cause di problemi o difettosità
mostrando la frequenza delle cause di difettosità è il diagramma di Pareto.
- Il diagramma di Pareto NON mostra le barre più frequenti a dx.!
pf3
pf4
pf5
pf8

Anteprima parziale del testo

Scarica Teoria Statistica: Concetti Chiave e Definizioni e più Prove d'esame in PDF di Statistica solo su Docsity!

TEORIA CAPITOLO 1-

  • Il diagramma di dispersione può essere usato per identificare se esiste una relazione lineare tra le variabili .!
  • Per le serie storiche si utilizza il grafico : congiungendo i vari punti con una spezzata
  • Se il coefficiente di correlazione di Pearson è pari a -0.98, le variabili sono inversamente correlate
  • Sesso e stato di nascita sono esempi di dati di tipo categoriale
  • Se supponiamo che venga effettuato un sondaggio su 300 studenti delle scuole superiori su un totale di 1.000 studenti. Questo gruppo è probabilmente un campione.
  • Per una distribuzione obliqua a sinistra la media è generalmente più piccola della mediana quando si misurano dati numerici unimodali continui
  • Il coefficiente di variazione è la misura meno utilizzata come misura tendenza centrale.
  • Le misure di tendenza centrale sono: moda, media e mediana
  • Se la media in un campione è inferiore alla mediana la distribuzione è orientata a sinistra o negativamente asimmetrica.
  • Un sondaggio chiede quale sia lo sport preferito dell'intervistato. La misura di tendenza centrale che deve essere usata per riassumere questa domanda è la moda.
  • Prezzo di un’auto in migliaia di dollari è una variabile di tipo quantitativo.
  • Per un set di dati con 10 valori numerici disposti in ordine crescente, la mediana è la media aritmetica di quinto e sesto valore.
  • Le misure di posizione centrale mediana e moda non sono influenzate da valori di dati estremamente piccoli o estremamente grandi
  • Il numero di persone che mangiano in un bar locale tra mezzogiorno e le 14:00 è un esempio di variabile casuale discreta
  • Se un coefficiente di correlazione campionario è uguale a -1,00 , tutti i punti dati devono cadere esattamente su una linea retta con una pendenza negativa.
  • Il colore degli occhi è una variabile categoriale
  • La deviazione standard è una misura della variabilità, Le misure di variabilità valutano la variabilità e la dispersione delle osservazioni rispetto alla media. Sono: Il campo di variazione, la differenza interquartile, la varianza, lo scarto quadratico medio e il coefficiente di variazione.
  • La media ponderata non è una misura della variabilità
  • Una misura riepilogativa calcolata da un campione per descrivere una caratteristica della popolazione è nota come: Statistica
  • L’inferenza statistica comporta sempre rischi di errore
  • Uno stelo e una foglia quando viene girato verticalmente assomiglia ad un istogramma
  • Il numero di miglia di autostrade interstatali è una variabile numerica continua
  • Una variabile è classificata come ordinale se esiste un ordinamento naturale delle categorie
  • Il miglior grafico per collegare due serie di dati categorici è il grafico a barre.
  • Un grafico a linee che collega i punti che rappresentano la percentuale cumulativa di osservazioni al di sotto del limite superiore di ciascun intervallo di classe in una distribuzione di frequenza cumulativa è noto come OGIVA
  • Il grafico che meglio identifica le principali cause di problemi o difettosità mostrando la frequenza delle cause di difettosità è il diagramma di Pareto.
  • Il diagramma di Pareto NON mostra le barre più frequenti a dx.!
  • Un metodo di analisi esplorativa dei dati alternativo all’istogramma è il diagramma ramo-foglia
  • L’ogiva è anche chiamata curva delle frequenze cumulate
  • Secondo la disuguaglianza di Chebychev, la percentuale di osservazioni che dovrebbe trovarsi entro ±1.25 deviazioni standard dalla media è almeno il 36%.
  • La larghezza di ciascuna barra in un istogramma corrisponde ai limiti della classe.
  • Le misure di variabilità sono numeri che descrivono la dispersione dei dati o la misura in cui i valori dei dati sono distribuiti.!
  • La covarianza è una misura standardizzata della relazione lineare tra due variabili.!
  • La covarianza può essere uguale al coefficiente di correlazione. Coefficiente si calcola covarianza/deviazione standard, se deviazione standard è 1 possono essere uguali.!
  • Nella correlazione di Pearson se l’indice è < 0 allora sono positivamente correlate. FALSO.
  • La relazione tra media, mediana e moda in una distribuzione asimmetrica positivamente è che la media è sempre il valore più piccolo.
  • Considera i seguenti dati: mi piace, nessuna preferenza o antipatia. Quale delle seguenti definizioni descrive meglio questi dati? QUALITATIVO
  • La regola empirica fornisce una valutazione della percentuale approssimata di osservazioni
  • Le vendite, gli investimenti, i consumi, i costi e i ricavi sono misure economiche e di business che possono essere rappresentate da variabili casuali continue.
  • Una variabile all'interno di un intervallo di numeri reali è indicata come una variabile discreta
  • Se tutti i possibili campioni casuali di dimensione n vengono prelevati da una popolazione e viene determinata la media di ciascun campione, la media della distribuzione del campione è esattamente uguale alla media della popolazione
  • Una variabile che può assumere un numero finito e numerabile di valori è una variabile discreta
  • Il valore atteso di una variabile casuale, indicato con mu, è anche chiamato la sua media
  • La deviazione standard è espressa in termini di unità di misura originali, ma la varianza non lo è.!
  • Se una distribuzione normale ha una media di 5 ed una deviazione standard di 2. Una seconda distribuzione normale ha una media di 6 ed una deviazione standard di 1. La larghezza della prima distribuzione è più ampia della seconda distribuzione
  • Poiché la popolazione è sempre più grande del campione, la media di popolazione può essere minore, maggiore o uguale alla media campionaria
  • I dati nominali non possono essere descritti come quantitativi
  • Se sei interessato a confrontare la variazione delle vendite per negozi piccoli e grandi che vendono prodotti simili, la misura di dispersione più appropriata è il coefficiente di variazione -. Una variabile casuale che assume non più di un numero numerabile, n, di valori è chiamata variabile casuale discreta
  • Considera i termini: informazioni, dati e conoscenza. Da un punto di vista statistico, elenca questi termini in ordine crescente di utilità nel prendere decisioni – DATI, INFORMAZIONI E CONOSCENZE
  • Se la mediana è pari a 3 allora: il primo quartile è sicuramente diverso da 3
  • Data la variabile età indicare quale delle seguenti affermazioni è corretta: è una variabile quantitativa discreta
  • La covarianza: è una misura di concordanza tra due variabili
  • Il Chi-quadro: per essere interpretato correttamente deve essere confrontato con il suo valore massimo.
  • Se la varianza è pari a 0 allora: non c’è variabilità
  • Sia score un punteggio di un test che può assumere valori da 0 a 100. Allora la misura di posizione più opportuna è: La media
  • Il campionamento: operazione di scelta casuale delle unità statistiche della popolazione di riferimento.
  • Il campionamento: che sia con reinserimento o senza se N è sufficientemente grande i due tipi di campionamento si equivalgono
  • Scatter plot: consente di rappresentare congiuntamente solo variabili quantitative
  • Rilevata la variabile “numero di figli per famiglia” su un collettivo costituito dalle famiglie italiane, qual è l’indice di posizione più opportuno da costruire? Media artitmetica
  • Quando il coefficiente di correlazione tra due variabili quantitative è circa 1? C’è una forte relazione linerae tra le due variabili.
  • In un esperimento casuale che porta a un risultato che può essere rappresentato da una variabile casuale continua, la media dei valori presi quando il numero di repliche diventa infinitamente grande è chiamata valore atteso.
  • La geografia del paese in cui vivi è una variabile categoriale
  • Se due set di dati hanno lo stesso intervallo , allora le distanze dalle osservazioni più piccole a quelle più grandi in entrambi gli insiemi saranno le stesse.
  • La forza della relazione lineare tra due variabili numeriche può essere misurata da coefficiente di correlazione
  • La variazione della deviazione standard: a. appiattisce o innalza la campana della funzione di densità di probabilità
  • La variazione della media causa spostamento a sinistra o destra della campana della funzione di densità di probabilità
  • Il grafico istogramma è adatto a rappresentare un carattere X quantitativo in classi
  • L’odds ratio: è un rapporto tra rischi
  • Quale delle seguenti misure è una misura di associazione: Odds ratio
  • L’inferenza statistica: comporta sempre dei rischi
  • Si definisce evento elementare: ciascuno dei possibili esiti di un esperimento casuale.
  • Si definisce esperimento casuale: un esperimento di cui è possibile solo elencare a priori il set dei possibili esiti
  • Si definisce evento casuale: un sottoinsieme dello spazio campionario
  • I parametri ignoti: sono oggetto di studio della statistica inferenziale
  • Si definisce spazio campionario: l’insieme di tutti i possibili esiti
  • Per fare correttamente inferenza è necessario che: il campione sia rappresentativo della popolazione
  • Uno degli obiettivi dell’inferenza è: stimare i parametri ignoti
  • Le frequenze condizionate: forniscono informazioni su un fenomeno condizionatamente alle modalità di un altro.
  • Due eventi si dicono statisticamente indipendenti se P(A ∩B) = P(A) * P(B)
  • La probabilità di osservare la sequenza specifica di risultati discreti si ottiene applicando la regola di moltiplicazione delle probabilità.
  • Poiché la probabilità di qualsiasi valore specifico è 0 per una variabile casuale continua, i valori attesi per variabili casuali continue vengono calcolati utilizzando il calcolo integrale
  • La somma del prodotto di ciascun valore di una varia casuale discreta X e la sua probabilità è indicata come suo valore atteso
  • La rappresentazione della probabilità di tutti i possibili valori che può assumere una variabile è nominata distribuzione di probabilità
  • Per approssimare la distribuzione binomiale quando il numero di prove n è grande e la probabilità di successo P è piccola tale che nP ≤ 7 di usa la distribuzione di Poisson
  • Una distribuzione che attribuisce la stessa probabilità a tutti i punti appartenenti ad un dato intervallo è chiamata distribuzione uniforme.
  • La funzione di ripartizione è la probabilità che la variabile casuale X assuma valori minori o uguali ad un valore generico X
  • Se un ricercatore ha utilizzato una procedura per selezionare un campione di oggetti da una popolazione in modo tale che ogni membro della popolazione sia scelto rigorosamente per caso, abbia la stessa probabilità di essere scelto e ogni possibile campione di dimensione n abbia la stessa possibilità di selezione, la procedura utilizzata dal ricercatore è nota come campionamento casuale semplice.
  • In una distribuzione di probabilità, la probabilità di ogni risultato deve essere compresa tra 0 e 1, inclusi.
  • La variabile casuale continua X è distribuita uniformemente sull'intervallo [a, b]. La media della distribuzione di probabilità di X è (a + b) / 2
  • La forma della distribuzione di probabilità uniforme è rettangolare
  • La funzione di probabilità è: la probabilità che una variabile casuale assuma valori uguali ad un generico valore.
  • La variabile casuale binomiale: è una variabile discreta.
  • La probabilità che una variabile casuale assuma valori uguali ad un generico valore è detta: funzione di probabilità
  • La funzione di probabilità di x, è la funzione fx dell’insieme dei reali nei reali positivi, che ad ogni elemento associa la probabilità che la variabile discreta assuma valori UGUALI al reale xi.
  • La distribuzione di Poisson può essere utilizzata per approssimare le probabilità binomiali quando il numero di prove n è grande e allo stesso tempo la probabilità P è piccola.
  • L'approccio, per sviluppare la distribuzione di probabilità binomiale, inizia con il modello di Bernoulli.
  • Per approssimare una distribuzione discreta che ha molti risultati diversi utili, nella maggior parte delle applicazioni utilizziamo la Distribuzione di Poisson
  • Distribuzione mariginale: serve per approssimare una variabile continua.
  • Distribuzione normale: serve per approssimare una variabile continua
  • Distribuzione uniforme: si usa con le variabili continue
  • Distribuzione di Poisson:Serve per variabili discrete.
  • La deviazione standard di una variabile aleatoria discreta è la radice quadrata con segno positivo della sua Varianza
  • L’approssimazione della distribuzione binomiale con la distribuzione normale si usa per grandi campioni
  • Nella distribuzione binomiale si usa il modello di Bernulli
  • Poiché la popolazione è sempre più grande del campione, la media di popolazione può essere minore, maggiore o uguale alla media campionaria.
  • La distribuzione campionaria della media è una distribuzione di statistiche campionarie
  • Il teorema del limite centrale è importante in statistica perché per un campione di grandi dimensioni n, si dice che la distribuzione campionaria della media campionaria è approssimativamente normale, indipendentemente dalla forma della popolazione.
  • La distribuzione delle medie campionarie è normale per campioni di qualsiasi dimensione, n, a condizione che la popolazione di partenza abbia una distribuzione normale.!
  • Un campione di dimensione n è selezionato in modo causale da una popolazione infinita. Al crescere di n, quale delle seguenti affermazioni è corretta? L’errore standard della media campionaria decresce
  • Al crescere delle dimensioni di un campione, la forma della distribuzione della media campionaria diventa approssimativamente normale
  • Il teorema del limite centrale può essere applicato sia a variabili aleatorie discrete sia a variabili aleatorie continue.!
  • Quale distribuzioni viene utilizzata per stimare la media della popolazione da una popolazione normale con varianza sconosciuta? La distribuzione t con n-1 gradi di libertà
  • Secondo il teorema del limite centrale, la distribuzione della media campionaria può essere approssimata ad una distribuzione normale se l’ampiezza del campione è abbastanza grande
  • Una statistica campionaria tale che la media di tutti i sui possibili valori sia uguale al parametro della popolazione che la statistica cerca di stimare è uno stimatore imparziale.!
  • Le stime per intervallo per la varianza di una popolazione normale dipendono dalla variabile aleatoria (𝒏 − 𝟏)𝒔𝟐/𝝈𝟐, che segue una distribuzione chi-quadrato.
  • Uno stimatore si definisce non distorto se la media della distribuzione campionaria coincide con il parametro della popolazione che deve essere stimato.!
  • A parità di altre condizioni, maggiore è la dimensione del campione, più precisa è la stima dell'intervallo che riflette l'incertezza sull'effettivo valore di un parametro.!
  • L'ampiezza dell'intervallo di confidenza è uguale al doppio del margine di errore.
  • Per i corrispondenti parametri della popolazione quale di queste affermazioni è corretta: la media campionaria è uno stimatore non distorto di 𝜇 b. la varianza campionaria è uno stimatore non distorto di 𝜎2 c. la proporzione campionaria è uno stimatore non distorto di p (tutte)
  • A parità di altre condizioni, maggiore è la dimensione del campione, più precisa è la stima dell’intervallo che riflette l’incertezza sull’effettivo valore di un parametro.!
  • Una statistica campionaria tale per cui la media di tutti i suoi possibili valori è uguale al parametro della popolazione che la statistica cerca di stimare è uno stimatore non distorto.!
  • Quando si calcola l’intervallo di confidenza per la proporzione della popolazione, viene utilizzata la distribuzione t di Student anziché la distribuzione normale. NON è VERO
  • La quantità 100(1 + α)% viene definita livello di confidenza dell’intervallo. NON è VERO
  • La funzione di densità della distribuzione normale standard ha una dispersione maggiore rispetto alla distribuzione t di Student. NON è VERO
  • La deviazione standard campionaria s è uno stimatore non distorto della deviazione standard della popolazione σ.!
  • Uno stimatore si definisce non distorto se la media della distribuzione campionaria coincide con il parametro della popolazione che deve essere stimato.!
  • La proporzione campionaria 𝒑̂ è uno stimatore distorto della proporzione della popolazione P. NON è VERO
  • Qualunque sia il valore della proporzione campionaria, 𝒑̂(𝟏 − 𝒑̂) non può essere inferiore a 0,25. NON è VERO
  • Per sviluppare un intervallo di confidenza per la differenza tra le medie di due popolazioni che sono distribuite normalmente e hanno varianze uguali, due campioni indipendenti di dimensioni 𝒏𝟏e 𝒏𝟐 vengono selezionati in modo casuale dalle due popolazioni. Qual è la formula utilizzata per determinare il numero di gradi di libertà per la distribuzione t? n1+n2-
  • Per misurare l'efficacia di un programma di dimagrimento, chi lo segue viene pesato all'inizio e alla fine del programma. Questo è un esempio di campioni indipendenti con varianze delle popolazioni diverse. NON è VERO
  • Quando si costruisce un intervallo di confidenza per la media delle differenze in dati appaiati, all'aumentare della dimensione del campione, aumenta anche l'ampiezza dell'intervallo. NON è VERO
  • La varianza campionaria segue una distribuzione chi quadrato
  • L’intervallo di confidenza per la differenza tra due medie di popolazioni che sono normalmente distribuite le varianze della popolazione sono sconosciute e non si presume siano uguali si basa sull’uso dell’approssimazione di Satterthwaite
  • Per gli intervalli di confidenza nei test di ipotesi della varianza di una popolazione normale, dove le varianze sono più piccole del previsto sarà più stretto del previsto
  • Nella verifica di ipotesi, abbina il simbolo con la definizione corretta (Beta) --- la probabilità di un errore di Tipo II
  • Nella verifica di ipotesi, abbina il simbolo (1- a) con la definizione corretta. --- la probabilità di non rifiutare l'ipotesi nulla quando è vera
  • Nella verifica di ipotesi, abbina il simbolo α alla definizione corretta --- la probabilità di un errore di tipo I.
  • il valore z per un test di ipotesi bilaterale (a due code) per una media di popolazione quando la probabilità di rifiutare un'ipotesi nulla vera è uguale a 0,05 è 1.
  • Il livello di significatività di un test viene indicato con alfa
  • Il livello di significatività è la probabilità di rifiutare una ipotesi nulla quando è vera
  • La potenza di un test è la probabilità di rifiutare una ipotesi nulla quando è falsa
  • P-value è il più piccolo livello di significatività al quale l’ipotesi nulla può essere rifiutata
  • Quando non si rifiuta l’ipotesi nulla si può concludere che la procedura del test non sia abbastanza forte da rifiutare l’ipotesi nulla
  • Un’ipotesi nulla viene rifiutata a livello 0.025 ma non viene rifiutata a livello 0.01. Questo significa che il p-value del test si trova tra 0.01 e 0.025.!
  • Se il livello di significatività è uguale o inferiore al p-value, l’ipotesi nulla non viene rifiutata.!