Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica: Percentile, Quartile, Boxplot e Probabilità Condizionata, Schemi e mappe concettuali di Statistica

Una panoramica dei concetti chiave della statistica, tra cui percentile, quartile, boxplot e probabilità condizionata. Spiega come questi concetti vengono utilizzati per descrivere la distribuzione dei dati e per identificare eventuali valori anomali. Il documento include anche una sezione sulla statistica inferenziale, che si occupa di trarre conclusioni su una popolazione basandosi su un campione di dati.

Tipologia: Schemi e mappe concettuali

2023/2024

Caricato il 21/12/2024

giovanni-bertini-3
giovanni-bertini-3 🇮🇹

2 documenti

1 / 38

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Punti cruciali del corso di statistica
Percentile e quartile sono concetti statistici utilizzati per descrivere la distribuzione dei dati e individuare
come essi si distribuiscono lungo un intervallo.
Percentile
Un percentile indica la posizione di un valore in una distribuzione di dati ordinata. Se un dato appartiene a
un certo percentile, significa che è superiore o uguale a quella percentuale di dati rispetto all'insieme totale.
Ad esempio:
Il 25° percentile è il valore al di sotto del quale si trova il 25% dei dati. Questo significa che il 25%
dei dati ha un valore inferiore o uguale a questo percentile.
Il 90° percentile è il valore al di sotto del quale si trova il 90% dei dati, quindi solo il 10% dei dati è
maggiore.
Quartile
I quartili sono specifici percentili che dividono i dati in quattro parti uguali:
Il primo quartile (Q1) corrisponde al 25° percentile. Questo significa che il 25% dei dati si trova al di
sotto di questo valore.
Il secondo quartile (Q2) corrisponde al 50° percentile e rappresenta la mediana, cioè il punto
centrale della distribuzione (il 50% dei dati è inferiore o uguale a questo valore).
Il terzo quartile (Q3) corrisponde al 75° percentile, il punto al di sotto del quale si trova il 75% dei
dati.
In breve:
I percentili suddividono i dati in cento parti uguali.
I quartili sono una suddivisione particolare che divide i dati in quattro parti uguali, e corrispondono
ai percentili 25, 50 e 75
Boxplot
La boxplot è uno strumento grafico utilizzato per visualizzare la distribuzione di un
insieme di dati e per evidenziare eventuali valori anomali (outlier). Fornisce un
riepilogo visivo delle caratteristiche principali di un set di dati attraverso cinque valori
chiave: minimo, primo quartile (Q1), mediana (Q2), terzo quartile (Q3) e
massimo.
Componenti principali della boxplot:
1. La scatola (box):
oLa parte centrale della boxplot è un rettangolo che va dal primo quartile
(Q1) al terzo quartile (Q3).
oLa lunghezza della scatola rappresenta l'intervallo interquartile (IQR),
che è la differenza tra il terzo e il primo quartile: IQR=Q3−Q1. Questa è
una misura della dispersione centrale dei dati.
oAl suo interno, la scatola mostra la mediana (Q2), rappresentata da una
linea orizzontale. La mediana è il valore centrale, che separa la metà
superiore dei dati dalla metà inferiore.
2. I baffi:
oI baffi sono linee che si estendono dai lati della scatola e indicano la
variabilità al di fuori dei quartili.
oSi estendono fino al valore massimo e minimo dei dati che non sono
considerati outlier. Di solito, si calcolano in base a 1.5×IQR. Qualsiasi
valore che si trova oltre Q1−1.5×IQR o Q3+1.5×IQR è considerato un
outlier.
3. Outlier:
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26

Anteprima parziale del testo

Scarica Statistica: Percentile, Quartile, Boxplot e Probabilità Condizionata e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!

Punti cruciali del corso di statistica Percentile e quartile sono concetti statistici utilizzati per descrivere la distribuzione dei dati e individuare come essi si distribuiscono lungo un intervallo. Percentile Un percentile indica la posizione di un valore in una distribuzione di dati ordinata. Se un dato appartiene a un certo percentile, significa che è superiore o uguale a quella percentuale di dati rispetto all'insieme totale. Ad esempio:  Il 25° percentile è il valore al di sotto del quale si trova il 25% dei dati. Questo significa che il 25% dei dati ha un valore inferiore o uguale a questo percentile.  Il 90° percentile è il valore al di sotto del quale si trova il 90% dei dati, quindi solo il 10% dei dati è maggiore. Quartile I quartili sono specifici percentili che dividono i dati in quattro parti uguali:  Il primo quartile (Q1) corrisponde al 25° percentile. Questo significa che il 25% dei dati si trova al di sotto di questo valore.  Il secondo quartile (Q2) corrisponde al 50° percentile e rappresenta la mediana, cioè il punto centrale della distribuzione (il 50% dei dati è inferiore o uguale a questo valore).  Il terzo quartile (Q3) corrisponde al 75° percentile , il punto al di sotto del quale si trova il 75% dei dati. In breve:  I percentili suddividono i dati in cento parti uguali.  I quartili sono una suddivisione particolare che divide i dati in quattro parti uguali, e corrispondono ai percentili 25, 50 e 75 Boxplot La boxplot è uno strumento grafico utilizzato per visualizzare la distribuzione di un insieme di dati e per evidenziare eventuali valori anomali (outlier). Fornisce un riepilogo visivo delle caratteristiche principali di un set di dati attraverso cinque valori chiave: minimo , primo quartile (Q1) , mediana (Q2) , terzo quartile (Q3) e massimo. Componenti principali della boxplot:

  1. La scatola (box) : o La parte centrale della boxplot è un rettangolo che va dal primo quartile (Q1) al terzo quartile (Q3). o La lunghezza della scatola rappresenta l' intervallo interquartile (IQR) , che è la differenza tra il terzo e il primo quartile: IQR=Q3−Q1. Questa è una misura della dispersione centrale dei dati. o Al suo interno, la scatola mostra la mediana (Q2) , rappresentata da una linea orizzontale. La mediana è il valore centrale, che separa la metà superiore dei dati dalla metà inferiore.
  2. I baffi : o I baffi sono linee che si estendono dai lati della scatola e indicano la variabilità al di fuori dei quartili. o Si estendono fino al valore massimo e minimo dei dati che non sono considerati outlier. Di solito, si calcolano in base a 1.5×IQR. Qualsiasi valore che si trova oltre Q1−1.5×IQR o Q3+1.5×IQR è considerato un outlier.
  3. Outlier :

o Gli outlier sono valori estremi che cadono al di fuori dei baffi e vengono rappresentati con dei punti (o asterischi). Questi valori sono insolitamente piccoli o grandi rispetto al resto dei dati. Interpretazione di una boxplot:Simmetria dei dati : Se la linea della mediana è equidistante dai bordi della scatola, la distribuzione è relativamente simmetrica. Se è più vicina a uno dei due estremi, la distribuzione è asimmetrica (asimmetria positiva o negativa).  Variabilità : La lunghezza della scatola indica la variabilità dei dati centrali. Una scatola lunga significa che c'è una grande dispersione tra i dati centrali.  Outlier : Gli outlier indicano valori anomali che possono influenzare l'analisi. È importante identificarli e valutarne l'impatto. Esempio di una boxplot:Minimo : Valore più piccolo (non considerato outlier).  Q1 (Primo quartile) : Il 25% dei dati è sotto questo valore.  Mediana (Q2) : Il 50% dei dati è sotto questo valore.  Q3 (Terzo quartile) : Il 75% dei dati è sotto questo valore.  Massimo : Valore più grande (non considerato outlier). La probabilità condizionata è un concetto fondamentale nella teoria delle probabilità e si riferisce alla probabilità che un evento si verifichi, dato che un altro evento è già accaduto

Distribuzioni discrete notevoli

APPROSSIMAZIONE DELLA BINOMIALE

Distribuzioni continue notevoli

La statistica inferenziale è una branca della statistica che si occupa di trarre conclusioni o inferenze su una popolazione basandosi su un campione di dati. A differenza della statistica descrittiva, che si limita a descrivere e sintetizzare i dati di un campione, la statistica inferenziale permette di fare previsioni, testare ipotesi e generalizzare i risultati a un’intera popolazione.  Popolazione : L'insieme totale degli elementi (individui, oggetti, eventi) di interesse.  Campione : Un sottoinsieme della popolazione, selezionato per l'analisi. Deve essere rappresentativo della popolazione.  Stimatore: una funzione che associa ad ogni campione un valore del parametro da stimare.

Intervallo di confidenza per la media di una popolazione normale con σ^2 nota

Intervallo di confidenza per la media di una popolazione normale con σ2 incognita Intervallo di confidenza per la varianza di una popolazione normale

Intervallo di confidenza per la differenza di media tra due popolazioni normali con varianze ignote

Un'ipotesi statistica è un'affermazione o supposizione riguardante una o più caratteristiche di una popolazione statistica. Viene utilizzata nel contesto della verifica di ipotesi per fare inferenze basate sui dati campionari. Le ipotesi statistiche sono formulate in modo tale che possano essere testate empiricamente attraverso i dati raccolti.

Il livello di significatività , denotato comunemente con α\alphaα, è la soglia che un ricercatore fissa per determinare se rifiutare o meno l'ipotesi nulla (H0H_0H0) in un test di ipotesi statistica. Rappresenta la probabilità di commettere un errore di primo tipo (cioè, rifiutare l'ipotesi nulla quando in realtà è vera).