Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Appunti Statistica Unipi lezioni+slide, Appunti di Statistica

Documento completo e ben organizzato relativo alla prima parte del programma di Statistica, utile per la preparazione del primo parziale. CORSO A. Gli appunti sono basati su: • Slide del corso • Spiegazioni e appunti presi a lezione • Esercizi svolti All’interno troverai tutta la teoria necessaria, spiegata in modo chiaro, con grafici, esempi ed esercizi utili per comprendere e ripassare gli argomenti.

Tipologia: Appunti

2023/2024

In vendita dal 02/03/2026

giulia-antoniello-1
giulia-antoniello-1 🇮🇹

14 documenti

1 / 66

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42

Anteprima parziale del testo

Scarica Appunti Statistica Unipi lezioni+slide e più Appunti in PDF di Statistica solo su Docsity!

STATISTICA

Nel linguaggio comune, con il termine “statistica” si indicano piu semplicemente i risultati numerici che derivano da un processo di sintesi dei dati osservati. La statistica e una disciplina che fornisce gli strumenti per la raccolta, la descrizione, l’analisi e la rappresentazione dei dati per lo

studio dei fenomeni collettivi dotati di variabilita.

Viviamo nella societa dell’informazione e della comunicazione in cui la statistica e ovunque: quando si legge un giornale, nelle tabelle, grafici, percentuali ecc… La statistica ci fornisce strumenti per l’analisi dei dati e la corretta interpretazione dei risultati, quando sono raccolti e usati correttamente, i dati e le statistiche possono aiutarci a capire i problemi e a prendere decisioni. Un fenomeno collettivo e un qualunque fatto osservabile il cui studio riguarda una pluralita di individui, definiti unita statistiche. Alcuni esempi:

  • il reddito ed il consumo delle famiglie italiane
  • il motivo della presenza di turisti in una certa localita
  • il numero di abitanti dei comuni di una certa provincia Le unita statistiche sono le unita elementari omogenee tra di loro che compongono l’oggetto di studio e formano l'oggetto di osservazione e di analisi. Alcuni esempi:
  • individui (clienti di un albergo, turisti, studenti, dipendenti di un’azienda, ecc...)
  • oggetti (automobili, aziende, prodotti di consumo, ecc...)
  • aggregati territoriali (stati, regioni, province, comuni, altro ancora)

I dati statistici rappresentano la materia prima su cui si basa l’analisi statistica. I dati statistici sono informazioni grezze e non utilizzabili, devono essere elaborati al fine di ricavarne informazioni utili. Le informazioni ricavate dai dati sono necessarie per descrivere e comprendere l'oggetto di studio. I caratteri statistici si distinguono in base alle modalita in:

  • qualitativi: caratteri con modalita non numeriche
  • quantitativi: caratteri con modalita numeriche Un carattere qualitativo viene suddiviso in:
  • sconnesso: le modalita non si possono ordinare secondo un ordine (marca smartphone, colore degli occhi, nazione di residenza)
  • ordinato: le modalita presentano un ordine logico e possono essere:
  • rettilinei: l’ordine e a salire o a scendere (titolo di studio)
  • ciclici: le modalita sono legate da un ordine naturale di successione, ma non hanno un vero e proprio ordine crescente o decrescente (mesi dell'anno, giorni della settimana) I caratteri quantitativi si distinguono tra:
  • discreti: caratteri le cui modalita scaturiscono da un conteggio (numero di figli, voto ad un esame)
  • continui: caratteri le cui modalita scaturiscono da una misurazione (peso di una persona, lunghezza smartphone) -scala a intervalli: non esiste uno zero assoluto, naturale e non arbitrario -scala di rapporti: esiste uno zero assoluto, naturale e non arbitrario) -trasferibile: se un’unita statistica puo cedere tutto o parte del carattere posseduto a un altra unita statistica -non trasferibile: se un’unita statistica non puo cedere tutto o parte del carattere posseduto a un altra unita statistica

L’insieme dei dati e costituito da tutte le rilevazioni effettuate su ognuna delle unita statistiche prese in considerazione rispetto ad ogni carattere.

  • Frequenza assoluta: numero di volte in cui una certa modalita di un carattere viene osservata nella popolazione. La frequenza assoluta si indica con nj, dove j e un indice che varia da 1 a k, e k e il numero massimo di modalita del carattere considerato. Frequenze assolute (nj) j=1,2…,k k = modalita del carattere E’ particolarmente utile nel caso di caratteri qualitativi o quantitativi che possono assumere un numero di modalita k non troppo elevato. DI = diploma inferiore SM = scuola media LT = laurea triennale LM = laurea magistrale
  • Frequenza relativa: rappresenta la frazione della popolazione che presenta una certa modalita di un carattere. La frequenza relativa si indica con fj e si calcola come rapporto fra la frequenza assoluta e la numerosita totale della popolazione.

Le classi sono intervalli di valori tra loro disgiunti e devono comprendere tutte le possibili modalita del carattere. Non esiste una regola per fissare il numero di classi (il numero delle classi si colloca in genere tra 4 e 20). Le classi sono caratterizzate da:

  • estremo inferiore: il piu piccolo valore della classe xj− 1
  • estremo superiore: il valore piu grande della classe xj
  • ampiezza: differenza tra i due estremi della classe = xj − xj− 1
  • valore centrale: valore rappresentativo della classe, si ottiene con In generale i vantaggi delle rappresentazioni grafiche sono i seguenti:
  • consente una visualizzazione immediata dell’andamento del carattere e della struttura della distribuzione
  • consente il confronto tra piu distribuzioni
  • consente di mettere in evidenza la presenza di casi “anomali” (picchi grafici) che possono essere dovuti a errori nei dati
  • si presta meglio a scopi divulgativi rispetto alla forma tabellare Per essere utile ed efficace una rappresentazione grafica dovrebbe contenere chiaramente tutte le informazioni necessarie alla comprensione dei dati rappresentati. Quindi, in ogni grafico dovrebbero figurare il titolo, le etichette, la legenda, le note.
  • Grafico a nastri Si utilizza solitamente per caratteri qualitativi sconnesso. Rappresenta la frequenza (assoluta o relativa) sotto forma di rettangoli (nastri). Ogni nastro ha la medesima base ed i nastri sono tra loro equidistanti, le lunghezze dei nastri sono proporzionali alle frequenze.
  • Grafico a barre Si utilizza per caratteri qualitativi sconnessi, ordinati e quantitativi discreti. Rappresenta la frequenza (assoluta o relativa) sottoforma di rettangoli (barre). Ogni frequenza della distribuzione viene rappresentata da una barra (rettangolo). Ogni barra ha la medesima base e sono fra loro equidistanti, le altezze (delle barre) sono proporzionali alle frequenze.
  • Istogrammi a basi diverse Si utilizza per i caratteri quantitativi continui suddivisi in classi di diversa ampiezza. L’area di ogni rettangolo e proporzionale alla frequenza della classe che rappresenta. La base di ogni rettangolo e pari all’ampiezza ∆j della classe che rappresenta. L’altezza di ogni rettangolo e proporzionale alla densita di frequenza hj , data dal rapporto tra frequenza fj e ampiezza della classe ∆j:

Esempio istogramma a basi diverse faccio quello piu grande - quello piu piccolo Esercizio

Se un carattere e’ quantitativo discreto e conosciamo la sua distribuzione di frequenza assoluta, la media aritmetica si calcola sommando i prodotti ottenuti moltiplicando ogni valore per la rispettiva frequenza e dividendo per il totale delle frequenze: xj e’ la j-esima modalita’ assunta dal carattere ( j = ,... , k) nj e’ la frequenza assoluta con cui si osserva xj N e’ la numerosita’ della popolazione osservata, N = Pkj= nj Dalla formula precedente si ricava la formulazione della media basata sulle frequenze relative:

Qualora la distribuzione di frequenza abbia i valori raggruppati in classi non e’ possibile calcolare esattamente la media aritmetica. E’ possibile calcolarne una approssimazione utilizzando il valore centrale di ogni classe (semi- somma dei valori estremi della classe). cj e’ il valore centrale della j-esima classe ( j = ,... , k) nj e’ la frequenza assoluta della j-esima classe N e’ la numerosita’ complessiva della popolazione Talvolta nel calcolo della media aritmetica si vuole dare diversa importanza alle osservazioni, attribuendo a ciascuna di esso uno specifico peso. La media aritmetica ponderata di un insieme di N valori osservati di un carattere quantitativo X con pesi non negativi e’ data da: wj e’ il peso attribuito alla j-esima modalita di x ( j = ,... , k) wje un coefficiente che aumenta (se > 1) o diminuisce (se < 1) l’importanza del termine xj se i pesi wj = nj o wj = fj la formula e’ equivalente alle formule della media aritmetica per distribuzioni di frequenza

-Traslativita’ -La somma delle differenze tra i valori osservati e la loro media aritmetica e’ pari a zero Questa proprieta’ afferma che -La media aritmetica rende minima la somma degli scarti al quadrato -Associativita’

La media quadratica e’ la radice quadrata della media aritmetica dei quadrati dei valori dati La condizione di invarianza della media quadratica ponderata e’ Dati dei pesi wj, che possono essere anche frequenze assolute o relative, la media quadratica ponderata e’ Si definisce media geometrica di una distribuzione x1,... , xN quel valore G tale che per gli interessi si usa la media geometrica non quella aritmetica Dati dei pesi wj, che possono essere anche frequenze assolute o relative, la media geometrica ponderata e’

Le medie di posizione sono quelle medie che:

  • non richiedono operazioni algebriche sulle modalita del carattere
  • possono essere calcolate per caratteri quantitativi e qualitativi le medie di posizione si suddividono in:
  • la moda, calcolabile per qualsiasi tipo di carattere
  • la mediana, calcolabile per caratteri quantitativi o qualitativi ordinati
  • i quantili (di cui la mediana e’ un caso particolare), calcolabili per caratteri quantitativi o qualitativi ordinati -la moda La moda (Mo) e’ una media di posizione che puo’ essere calcolata per qualsiasi tipo di carattere. La moda (Mo) e’ la modalita’ della distribuzione che si presenta con la massima frequenza (assoluta, relativa o percentuale). Una distribuzione si dice unimodale se presenta una sola moda e bimodale se presenta due modalita’. -la mediana La mediana e’ la media di posizione che rappresenta il valore centrale della distribuzione quando i dati sono ordinati. Si riferisce a caratteri quantitavi e qualitativi ordinari. Si dice mediana (Me) il valore che bipartisce la distribuzione, ossia il valore non inferiore a meta’ dei valori e non superiore all’altra meta’.

Come determinare la mediana (Me)?

  1. Ordinare i valori in modo non decrescente: 2- Se N dispari: 2- Se N pari: -la mediana per distribuzioni di frequenza La differenza nella determinazione della mediana consiste nel tener conto delle frequenze. Lo strumento ideale sono le frequenze assolute cumulate