Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica: Organizzazione e rappresentazione dei dati - Prof. Petrucci, Appunti di Statistica

Questo capitolo introduttivo alla statistica spiega come organizzare e rappresentare i dati qualitativi e quantitativi. Vengono presentate le distribuzioni di frequenze assolute e relative, i grafici a barre, a torta, a punti e i loro usi, nonché i possibili errori nella costruzione di questi grafici.

Tipologia: Appunti

2020/2021

Caricato il 09/03/2021

giuliaMo---------
giuliaMo--------- 🇮🇹

4.8

(5)

7 documenti

1 / 2

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA
Capitolo 2
2.1 Organizzare i dati qualitativi
Le osservazioni qualitative forniscono utili misure per classificare gli individui oppure per suddividerli in
gruppi.
Una distribuzione di frequenze assolute elenca tutte le tipologie di modalità riportando il corrispondente
numero di occorrenze osservate. Una distribuzione di frequenze assolute riporta il numero di osservazioni
appartenenti a ciascuna modalità.
La frequenza relativa corrisponde alle proporzioni di osservazioni appartenenti a una determinata
categoria rispetto al totale delle osservazioni; indica la proporzione di osservazioni che appartengono a
ciascuna modalità rispetto al totale. La formula è:
Frequenza relativa= Frequenza assoluta /Somma totale delle frequenze assolute
Una distribuzione di frequenze relative elenca ciascuna categoria o modalità assieme alla corrispondente
frequenza relativa.
12+2+1+2+4+5+2+1+1=30
12/30=0.4
Grafico a barre
Dopo aver ottenuto tutte le informazioni possiamo procedere con la rappresentazione grafica a barre. I
grafici ci permettono di visualizzare i dati e di comprendere il contributo informativo appropriato.
Un grafico a barre verticali (o orizzontali) è costruito indicando ciascuna modalità sull’asse orizzontale (o in
quello verticale) e la corrispondente frequenza assoluta o relativa sull’altro asse. Per ciascuna modalità
disegniamo un rettangolo con altezza pari alla frequenza assoluta o relativa della categoria stessa e con
ampiezza costante per tutte le barre del grafico.
Grafico a barre affiancate
I grafici possono essere utili per confrontare due insieme di dati; se vogliamo vedere e confrontare due anni
è consigliabile un grafico a barre affiancate in modo da valutare bene i numeri e confrontarli. È molto
importante per la vista e ci aiuta a vedere prima i risultati e le varie differenze. Per costruire un grafico a
barre affiancate occorre disegnare una barra per ciascuna categoria di dati, una barra rappresenta dei
relativi dati l’altra altri.
Grafico a barre orizzontali
Solitamente si ricorre a questo genere di grafici quando i nomi delle categorie sono molto lunghi.
Grafico a torta
I grafici a torta sono utilizzati per presentare le frequenze relative di un carattere qualitativo che può essere
nominale o ordinale. I grafici a torta possono essere creati solo se tutte le modalità della variabile
considerata sono rappresentate. Questi grafici sono utili per mostrare tutti i possibili valori di una variabile
qualitativa attraverso la rappresentazione di tutte le sue parti, non è utile per confrontare fra loro due
valori specifici. I grafici a barre sono utili per comparare le differenti parti di una variabile, non
necessariamente rispetto all’interno.
2.2 Organizzare i dati quantitativi: le rappresentazioni più utilizzate
Quando vogliamo analizzare i dati quantitativi dobbiamo determinare se questi sono discreti o continui:
- Se sono discreti e presentano un numero relativamente basso di valori differenti tra loro allora le
modalità saranno le osservazioni stesse.
- Se i dati sono continui ma le variabili assumono un numero insufficientemente elevato di valori
differenti allora i dati dovranno essere accorpati in un intervallo chiamato classe.
Un istogramma di dati discreti si costruisce disegnando un rettangolo per ciascuna classe di dati. L’altezza di
ciascun rettangolo rappresenta la frequenza assoluta della corrispondente classe di dati, mentre l’ampiezza
è uguale per tutte le modalità ed è tale che tutti i rettangoli si tocchino fra loro.
Definiamo classi le categorie cui appartengono i dati, le classi si costruiscono attraverso la creazione di
intervalli numerici. I dati in una tabella sono categorizzati in intervalli numerici; ciascun intervallo
rappresenta una classe. La tabella (pag.43) presenta cinque classi, ciascuna delle quali ha un limite inferiore
e un limite superiore di classe: il limite inferiore è il più piccolo valore contenuto nella stessa classe, il limite
pf2

Anteprima parziale del testo

Scarica Statistica: Organizzazione e rappresentazione dei dati - Prof. Petrucci e più Appunti in PDF di Statistica solo su Docsity!

STATISTICA

Capitolo 2 2.1 Organizzare i dati qualitativi Le osservazioni qualitative forniscono utili misure per classificare gli individui oppure per suddividerli in gruppi. Una distribuzione di frequenze assolute elenca tutte le tipologie di modalità riportando il corrispondente numero di occorrenze osservate. Una distribuzione di frequenze assolute riporta il numero di osservazioni appartenenti a ciascuna modalità. La frequenza relativa corrisponde alle proporzioni di osservazioni appartenenti a una determinata categoria rispetto al totale delle osservazioni; indica la proporzione di osservazioni che appartengono a ciascuna modalità rispetto al totale. La formula è: Frequenza relativa= Frequenza assoluta /Somma totale delle frequenze assolute Una distribuzione di frequenze relative elenca ciascuna categoria o modalità assieme alla corrispondente frequenza relativa. 12+2+1+2+4+5+2+1+1= 12/30=0. Grafico a barre Dopo aver ottenuto tutte le informazioni possiamo procedere con la rappresentazione grafica a barre. I grafici ci permettono di visualizzare i dati e di comprendere il contributo informativo appropriato. Un grafico a barre verticali (o orizzontali) è costruito indicando ciascuna modalità sull’asse orizzontale (o in quello verticale) e la corrispondente frequenza assoluta o relativa sull’altro asse. Per ciascuna modalità disegniamo un rettangolo con altezza pari alla frequenza assoluta o relativa della categoria stessa e con ampiezza costante per tutte le barre del grafico. Grafico a barre affiancate I grafici possono essere utili per confrontare due insieme di dati; se vogliamo vedere e confrontare due anni è consigliabile un grafico a barre affiancate in modo da valutare bene i numeri e confrontarli. È molto importante per la vista e ci aiuta a vedere prima i risultati e le varie differenze. Per costruire un grafico a barre affiancate occorre disegnare una barra per ciascuna categoria di dati, una barra rappresenta dei relativi dati l’altra altri. Grafico a barre orizzontali Solitamente si ricorre a questo genere di grafici quando i nomi delle categorie sono molto lunghi. Grafico a torta I grafici a torta sono utilizzati per presentare le frequenze relative di un carattere qualitativo che può essere nominale o ordinale. I grafici a torta possono essere creati solo se tutte le modalità della variabile considerata sono rappresentate. Questi grafici sono utili per mostrare tutti i possibili valori di una variabile qualitativa attraverso la rappresentazione di tutte le sue parti, non è utile per confrontare fra loro due valori specifici. I grafici a barre sono utili per comparare le differenti parti di una variabile, non necessariamente rispetto all’interno. 2.2 Organizzare i dati quantitativi: le rappresentazioni più utilizzate Quando vogliamo analizzare i dati quantitativi dobbiamo determinare se questi sono discreti o continui:

  • Se sono discreti e presentano un numero relativamente basso di valori differenti tra loro allora le modalità saranno le osservazioni stesse.
  • Se i dati sono continui ma le variabili assumono un numero insufficientemente elevato di valori differenti allora i dati dovranno essere accorpati in un intervallo chiamato classe. Un istogramma di dati discreti si costruisce disegnando un rettangolo per ciascuna classe di dati. L’altezza di ciascun rettangolo rappresenta la frequenza assoluta della corrispondente classe di dati, mentre l’ampiezza è uguale per tutte le modalità ed è tale che tutti i rettangoli si tocchino fra loro. Definiamo classi le categorie cui appartengono i dati, le classi si costruiscono attraverso la creazione di intervalli numerici. I dati in una tabella sono categorizzati in intervalli numerici; ciascun intervallo rappresenta una classe. La tabella (pag.43) presenta cinque classi, ciascuna delle quali ha un limite inferiore e un limite superiore di classe: il limite inferiore è il più piccolo valore contenuto nella stessa classe, il limite

superiore è il valore più elevato contenuto della classe. L’ampiezza della classe è pari alla differenza tra il limite inferiore di quella classe e il limite inferiore della classe successiva. Le classi in una tabella non si devono sovrapporre; è fondamentale per evitare di creare confusione, le classi sono di uguale ampiezza. Si ha una tabella aperta quando non viene fissato il limite inferiore della prima classe o il limite superiore dell’ultima classe. Le scelte del limite inferiore della prima classe e dell’ampiezza delle classi sono piuttosto arbitrarie; non esiste la corretta distribuzione di frequenze per ogni particolare insieme di dati. Costruire un’adeguata distribuzione di frequenze è un’arte. Esiste comunque una distribuzione sbagliata di frequenze. Determinare l’ampiezza della classe : Ampiezza della classe= Valore più elevato – Valore più piccolo/Numero delle classi [Il risultato va arrotondato per eccesso] Grafico a punti -> Si ottiene indicando su retta orizzontale le osservazioni del carattere quantitativo in ordine crescente e ponendo un puntino sopra di esse ogni volta che nei dati si riscontra una frequenza assoluta. Il grafico a puntini può essere utilizzato per rappresentare velocemente i dati. Identificare la forma di una distribuzione Quando si vuole descrivere una variabile un modo possibile è quello di descrivere la forma della sua distribuzione. Questa è tipicamente classificabile in simmetria, asimmetria negativa e asimmetrica positiva.

  1. Distribuzione uniforme – la frequenza relativa per ciascun valore della variabile è distribuita uniformemente tra i valori della variabile stessa.
  2. Distribuzione a campana – la frequenza relativa più elevata si riscontra nel mezzo della distribuzione per poi diminuire in modo simmetrico nelle code di sinistra e destra.
  3. Distribuzione asimmetrica positiva – la forma è caratterizzata da una cosa allungata verso destra, la coda destra del picco è più lunga di quella a sinistra.
  4. Distribuzione asimmetrica negativa – la forma è caratterizzata da una cosa allungata verso sinistra, la coda a sinistra del picco è più lunga di quella a destra. Se i valori della variabile oggetto di studio misurano differenti punti nel tempo, i dati vengono indicati come serie storica. Il grafico di una serie storica si ottiene indicando sull’asse orizzontale il tempo in cui la variabile è misurata e sull’asse verticale il corrispondente valore della variabile, si uniscono i punti tramite segmenti rettilinei. Rappresentare graficamente una serie storica è molto utile per identificare l’andamento o tendenza di fondo (trend) dei dati del tempo. 2.3 Rappresentazioni grafiche errate Spesso la statistica viene accusata di avere l’abilità di poter manipolare i dati per supportare ogni posizione scelta. Un modo per distorcere la verità è l’uso dei grafici. Poiché i grafici hanno un impatto così importante bisogna porre molta attenzione nel costruire un grafico e nell’interpretare i messaggi che esso veicola. I grafici possono risultare fuorvianti o ingannevoli. I grafici sono fuorvianti se determinano un’impressione errata dei dati in modo non intenzionale; i grafici ingannevoli tentano appositamente di fornire un’idea sbagliata dei dati. Un’impressione errata riguardo ai dati da parte del lettore può provocare conseguenze serie; le più comuni sono determinate da una manipolazione delle unità di misura. I designer grafici sono molto interessanti e attirano l’attenzione del lettore piuttosto che far risaltare la realtà dei dati (grafici tridimensionale, pictogrammi)