Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica: Descrizione e rappresentazioni grafiche, Appunti di Statistica

Una introduzione alla statistica descrittiva, inclusi concetti come modalità, frequenze, tabelle statistiche, rappresentazioni grafiche e misura della variabilità. Vengono anche introdotti i concetti di composizione, coesistenza e derivazione di rapporti statistici. Il documento include esempi di diagrammi polari e normali.

Tipologia: Appunti

2019/2020

Caricato il 31/12/2020

rebecca-schino
rebecca-schino 🇮🇹

4 documenti

1 / 4

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
La statistica si occupa dello studio dei fenomeni della raccolta dei dati e il tutto viene riportato su grafici e
tabelle. Gli strumenti sono sia strumenti tecnici che metodologici e si parte dall’osservazione di campioni.
STATISTICA DESCRITTIVA si prendono i fenomeni della popolazioni e si osservano le caratteristiche
N: popolazione X: caratteristica
Le caratteristiche possono essere quantitative o qualitative. La prima si può quantificare le seconde sono
espresse da qualità. Nel caso di quantitativa parleremo di variabile statistica vs nel caso di analisi qualitativa
parleremo di mutabile statistica.
Un carattere quantitativo viene definito discreto quando è possibile rilevare una certa quantità e i caratteri
possono essere ordinabili e non ordinabili. I primi quando ce una conseguenza logica e non ordinabili
quando non ce una conseguenza logica.
Ci sono mutabili statistiche che vengono definite cicliche cioè ciclicamente definiscono lo stesso ordine.
È importante in statistica la frequenza con cui si manifestano il fenomeno
Una volta raccolti i dati per esemplificazione vengono costruite delle tabelle in modo da descrivere il
fenomeno, la tabella è costituita da colonne e si leggono da sinistra verso destra, nella prima colonna ce la
descrizione delle modalità del carattere nella seconda le frequenze.
In una tabella statistica oltre alla modalità del carattere xi alle frequenze ni possiamo calcolare, non solo le
frequenze relative (ogni singolo elemento diviso il totale) e poi le frequenze percentuali (fr. Relativa x 100)
possiamo anche costruire delle frequenze cumulate che esprimono quanto osservazioni si presentano con
la stessa modalità e anche di queste possiamo calcolare le relative e le percentuali.
Esistono i rapporti statistici che si possono costruire con modalità diverse e possono essere di tre tipi:
composizione, coesistenza e derivazione.
Composizione: detti anche parte del tutto, sono quelli in cui una parte viene confrontata con totale e il
risultato è minore di 1
Coesistenza: si mettono a confronto grandezze che appartengono alla stessa popolazione e sono parti di
essa
Derivazione: in cui le due quantità non appartengono alla stessa popolazione ma sono uno il fondamento
dell’altro
RAPPRESENTAZIONI GRAFICHE
Nella statistica descrittiva descrive il fenomeno quantitativo e utilizza le rapp grafiche non si sostituiscono
alla tabella statistica ma sono un completamento per rendere la descrizione più esplicita.
Le rappresentazioni possono essere rappresentate su un riferimento cartesiano in cui ce una coppia xi e ni,
quindi mediante le coordinate dei punti possiamo riportarle su un grafico.
Possiamo avere una linea continua o spezzata cartesiana, ma la cosa fondamentale è rispettare la misura.
Le rappresentazioni possono essere diverse, possiamo avere un diagramma a barre o polare (per le mutabili
cicliche).
Diagramma polare: si prende una ipotetica circonferenza e si suddivide in raggi vettori e il n di questi raggi
vettori dipende dalle modalità che abbiamo. Il primo raggio i vettore è detto asse polare tra il raggio vettore
e l’asse polare si forma un angolo chiamato argomento.
VALORI MEDI:
Dobbiamo essere in grado di manipolare i risultati perché dobbiamo sintetizzare quanto osservato, e allora
possiamo utilizzare i valori medi o indici di esposizione. I valori medi si dividono in due cluster e sono le
medie di calcolo e posizione. Le medie di calcolo sono valori ottenuti fissando una quantità invariante e
dunque una media aritmetica.
Media aritmetica: la somma di tutti i valori e si divide per il numero dei valori
Media geometrica: si fa la radice quadrata dei valori elevati al numero dei valori
Medie di posizione: le medie precedenti hanno un valore matematico le medie di posizione si possono dare
anche valori tipici di ciò che io osservo ed è il caso della MEDIANA ( valore centrale qualora è dispari se è
pari invece si prendono i due valori centrali e si sommano e si dividono per 2)
N.B: si mettono in ordine crescente
pf3
pf4

Anteprima parziale del testo

Scarica Statistica: Descrizione e rappresentazioni grafiche e più Appunti in PDF di Statistica solo su Docsity!

La statistica si occupa dello studio dei fenomeni della raccolta dei dati e il tutto viene riportato su grafici e tabelle. Gli strumenti sono sia strumenti tecnici che metodologici e si parte dall’osservazione di campioni. STATISTICA DESCRITTIVA si prendono i fenomeni della popolazioni e si osservano le caratteristiche N: popolazione X: caratteristica Le caratteristiche possono essere quantitative o qualitative. La prima si può quantificare le seconde sono espresse da qualità. Nel caso di quantitativa parleremo di variabile statistica vs nel caso di analisi qualitativa parleremo di mutabile statistica. Un carattere quantitativo viene definito discreto quando è possibile rilevare una certa quantità e i caratteri possono essere ordinabili e non ordinabili. I primi quando ce una conseguenza logica e non ordinabili quando non ce una conseguenza logica. Ci sono mutabili statistiche che vengono definite cicliche cioè ciclicamente definiscono lo stesso ordine. È importante in statistica la frequenza con cui si manifestano il fenomeno Una volta raccolti i dati per esemplificazione vengono costruite delle tabelle in modo da descrivere il fenomeno, la tabella è costituita da colonne e si leggono da sinistra verso destra, nella prima colonna ce la descrizione delle modalità del carattere nella seconda le frequenze. In una tabella statistica oltre alla modalità del carattere xi alle frequenze ni possiamo calcolare, non solo le frequenze relative (ogni singolo elemento diviso il totale) e poi le frequenze percentuali (fr. Relativa x 100) possiamo anche costruire delle frequenze cumulate che esprimono quanto osservazioni si presentano con la stessa modalità e anche di queste possiamo calcolare le relative e le percentuali. Esistono i rapporti statistici che si possono costruire con modalità diverse e possono essere di tre tipi: composizione, coesistenza e derivazione. Composizione: detti anche parte del tutto, sono quelli in cui una parte viene confrontata con totale e il risultato è minore di 1 Coesistenza: si mettono a confronto grandezze che appartengono alla stessa popolazione e sono parti di essa Derivazione: in cui le due quantità non appartengono alla stessa popolazione ma sono uno il fondamento dell’altro RAPPRESENTAZIONI GRAFICHE Nella statistica descrittiva descrive il fenomeno quantitativo e utilizza le rapp grafiche non si sostituiscono alla tabella statistica ma sono un completamento per rendere la descrizione più esplicita. Le rappresentazioni possono essere rappresentate su un riferimento cartesiano in cui ce una coppia xi e ni, quindi mediante le coordinate dei punti possiamo riportarle su un grafico. Possiamo avere una linea continua o spezzata cartesiana, ma la cosa fondamentale è rispettare la misura. Le rappresentazioni possono essere diverse, possiamo avere un diagramma a barre o polare (per le mutabili cicliche). Diagramma polare: si prende una ipotetica circonferenza e si suddivide in raggi vettori e il n di questi raggi vettori dipende dalle modalità che abbiamo. Il primo raggio i vettore è detto asse polare tra il raggio vettore e l’asse polare si forma un angolo chiamato argomento. VALORI MEDI: Dobbiamo essere in grado di manipolare i risultati perché dobbiamo sintetizzare quanto osservato, e allora possiamo utilizzare i valori medi o indici di esposizione. I valori medi si dividono in due cluster e sono le medie di calcolo e posizione. Le medie di calcolo sono valori ottenuti fissando una quantità invariante e dunque una media aritmetica. Media aritmetica: la somma di tutti i valori e si divide per il numero dei valori Media geometrica: si fa la radice quadrata dei valori elevati al numero dei valori Medie di posizione: le medie precedenti hanno un valore matematico le medie di posizione si possono dare anche valori tipici di ciò che io osservo ed è il caso della MEDIANA ( valore centrale qualora è dispari se è pari invece si prendono i due valori centrali e si sommano e si dividono per 2) N.B: si mettono in ordine crescente

Molte volte durante le osservazioni possiamo parlare di quantili e quartili, si parla di quartili quando la distribuzione viene divisa in 4. Il terzo quartile è simmetrico al 1 (3/4) il secondo quartile coincide con la Mediana (1/2). La moda: che è il carattere che si presenta il maggior numero di volte (quando il carattere si ripete più di una volta si sommano e si divide per il numero di volte in cui si ripresenta e si chiama moda puntuale) La moda puntuale può essere rappresentata mediante gli istogrammi. LA MISURA DELLA VARIABILITÀ: Un carattere si può presentare sotto diverse modalità si parla dunque di variabilità che deve sottostare a delle condizioni: -la misura della variabilità deve essere nulla se tutti i termini osservati sono uguali -la variabilità deve crescere al crescere della differenzia tra le modalità -se i caratteri che si presentano sono diversi si parla di dispersione -la disuguaglianza che misura la distanza tra i vari caratteri Per quantificare la variabilità si usa il campo di variazione W= xn – xi (misura il range delle modalità). Possiamo calcolare anche il range fra due quartili estremi (differenza interquantilica) dq= Q3 – Q Per la misura della dispersione possiamo usare lo scarto semplice medio (s.s.m)= Che costituisce la media aritmetica degli scarti e la media aritmetica della distribuzione e si usa il valore assoluto per ottenere un numero positivo La devianza: è la somma dei quadrati degli scarti e la media aritmetica Se la devianza si divide per M otteniamo la varianza Lo scarto quadratico medio (s.q.m) è la media aritmetica degli scarti, quindi lo scarto quadratico medio sarà sempre maggiore o uguale dello scarto semplice medio La concentrazione è il modo per misurare la variabilità di un carattere cioè la distribuzione fra gli N osservati, quando abbiamo una stessa quantità sin parla di equidistribuzione. Si può parlare di massima concentrazione quando è tutto concentrato in un solo carattere osservato.

È una metodologia più rigorosa e si fonda sull’individuazione dell’asse funzione che presenta la minore sommatoria quadratica. Bisogna minimizzare le funzioni uguagliante a 0 derivante prime e viene utilizzata non più una retta ma una parabola interpolatrice. Per semplificare i calcoli e rimuovere molti ostacoli possiamo effettuare la traslazione degli assi, cioè in un riferimento cartesiano si fanno scorrere gli assi uno sull’altro senza che le curve subiscono modificazioni. Quindi si può traslare l’asse delle ordinate facendolo scorrere sull’asse delle ascisse, ovviamente le nuove ascisse saranno riferite a questa nuova origine degli assi. Applicando il metodo delle ordinate fisse si posizione l’asse delle nuove ordinate in corrispondenza dell’ascisse e l’operazione ancora più vantaggiosa nel caso dei minimi quadrati. Qualunque metodo utilizzato dopo la rappresentazione analitica bisogna valutare quanto sia valido l’adattamento scelto, quindi bisogna vedere la bontà dell’adattamento. LA RELAZIONE TRA VARIABILI La statistica multivariata si occupa di studiare la relazione fra tutti i caratteri osservati sulla singola unità statistica, se osserviamo due caratteri (X Y) si parla di statistica bivariata. Si fa una tabella doppia esplicitando le modalità del carattere di x e y, per agevolare la lettura delle informazioni si usa la tabella a doppia entrata che è formata da s+1 righe, t+1 colonne, 1 colonna madre (prima riga a sinistra) che contiene le modalità del carattere x e una riga madre (la prima in alto che contiene le modalità del carattere y). Ognuno delle t colonne rappresenta le distribuzioni condizionate del carattere x e quindi si può calcolare la distribuzione marginale della x, stessa cosa della y. (Distribuzione tot del carattere). Ognuna delle distribuzioni marginali costituisce una normale distribuzione di frequenza, quindi è possibile fare una rappresentazione in forma di tabella a nova (completa descrizione di tutte le tecniche). Tra i caratteri che si osservano si possono verificare 3 condizioni:

  1. I due caratteri sono indipendenti
  2. Ce una relazione di dipendenza tra i due caratteri (uno dei due condiziona l’altro)
  3. Ci può essere interdipendenza (tra i due caratteri ce solo una relazione, ma l’uno non dipende dall’altro) Due caratteri sono indipendenti quando non ce nessuna relazione tra loro cioè il variare di uno dei caratteri non provoca variazione sull’altro. Se vogliamo calcolare la frequenza essa sarà data dal rapporta tra il prodotto delle corrispondenti frequenze marginali e il n tot delle osservazioni. In conclusione si può dire che esiste indipendenza tra i due caratteri quando non ce alcuna relazione tra x e y.+ Se un carattere assume dei valori che condiziona l’altro carattere vuol dire che entrambi sono dipendenti, e qui possiamo riscontrare un carattere antecedente e conseguente. (Causa e effetto) Bisogna vedere poi la relazione che intercorre tra le due grandezze e sono relazioni lineari si verrà a formare una retta detta RETTA DI REGRESSIONE di equazione y= a+by dove b è il coefficiente di regressione, cioè il coefficiente angolare della retta. Se b ha un valore nullo la retta sarà parallela all’asse. Per calcolare la b al denominatore si pone la devianza della x o y, al numeratore invece si pone la codevianza che si riduce alla devianza quando x e y coincidono. L’INTERDIPENDENZA: si presenta quando non ce consequenzialità ma si vuole vedere il reciproco condizionamento l’uno sull’altro. L’INTERDIPENDENZA è un’associazione della variazione dei due caratteri cioè i caratteri possono comportarsi in maniera concorde oppure discorde. L’associazione tra i caratteri è determinata dalla concordanza o discordanza e si devono considerare gli scarti delle rispettive medie a questo punto si calcola il coefficiente di correlazione lineare (pearson). Il denominatore rappresenta il massimo valore che può raggiungere il numeratore. Il massimo valore di r è compreso tra 0 e 1. Quindi il segno di r può essere positivo (concordanza) negativo (discordanza). Quanto più il valore di r si avvicina all’unita tanto più maggiore è il grado di associazione. Se r è uguale a +1 i punti di coordinate x e yi giacciano tutti sulla stessa retta ed esprimono massima associazione tra i caratteri, se r è uguale a -1 la stessa cosa di +1. Se r ha valore decrescente i punti non saranno sulla stessa retta ma produrranno uno scarter, se r è uguale a 0 ci possono essere diverse manifestazioni del grafico.