Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Appunti statistica introduttiva, Appunti di Statistica

Appunti lezioni di introduzione alla statistica

Tipologia: Appunti

2020/2021

Caricato il 12/04/2021

simo-omis
simo-omis 🇮🇹

4.4

(9)

22 documenti

1 / 135

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Argomenti della Statistica..................................................................................................................................... 5
Concetti di base....................................................................................................................................................6
Terminologia Elementare................................................................................................................................. 6
Censimenti....................................................................................................................................................... 7
Rilevazioni Campionarie.................................................................................................................................. 8
Rappresentazione dei dati - Distribuzione.......................................................................................................8
Matrice dei dati.................................................................................................................................................8
Distribuzioni Statistiche....................................................................................................................................9
Distribuzione unitaria (o disaggregata)........................................................................................................ 9
Distribuzione di frequenze semplice (assoluta)........................................................................................... 9
Frequenze relative.....................................................................................................................................11
Frequenze assoluta (o relativa) cumulata..................................................................................................12
Le Rappresentazioni grafiche........................................................................................................................ 13
Diagramma a Torta - Carattere qualitativo.................................................................................................13
Grafico a barre (o a nastri) - Caratteri qualitativi (sconnessi o ordinati) e caratteri quantitativi discreti......13
Istogramma - Carattere quantitativo continuo............................................................................................15
Sommatoria (∑).................................................................................................................................................. 16
Proprietà di ∑................................................................................................................................................ 17
Errori nell’applicazione delle proprietà di ∑.................................................................................................... 17
Sintesi della distribuzione di una variabile..........................................................................................................18
Indici sintetici................................................................................................................................................. 18
Le misure di Centralità...............................................................................................................................18
Medie di posizione................................................................................................................................ 19
Moda................................................................................................................................................ 19
Moda per distribuzioni in classi....................................................................................................19
Problemi della moda come sintesi............................................................................................... 20
Mediana........................................................................................................................................... 20
Mediana per distribuzioni unitarie................................................................................................ 21
Mediana per distribuzioni di frequenze........................................................................................22
Mediana per distribuzioni in classi............................................................................................... 22
Sintesi per il calcolo della mediana.............................................................................................. 24
Percentili.......................................................................................................................................... 24
Quartile............................................................................................................................................ 25
Per le distribuzioni unitarie...........................................................................................................25
Per le distribuzioni di frequenze...................................................................................................26
Per le distribuzioni in classi..........................................................................................................26
Medie analitiche....................................................................................................................................26
Media aritmetica............................................................................................................................... 26
Media aritmetica per distribuzioni unitarie....................................................................................26
Media aritmetica per distribuzioni di frequenze............................................................................27
Media aritmetica per distribuzione in classi..................................................................................28
Proprietà delle medie................................................................................................................... 29
Media Geometrica............................................................................................................................ 32
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Anteprima parziale del testo

Scarica Appunti statistica introduttiva e più Appunti in PDF di Statistica solo su Docsity!

  • Argomenti della Statistica.....................................................................................................................................
  • Concetti di base....................................................................................................................................................
    • Terminologia Elementare.................................................................................................................................
    • Censimenti.......................................................................................................................................................
    • Rilevazioni Campionarie..................................................................................................................................
      • Rappresentazione dei dati - Distribuzione.......................................................................................................
    • Matrice dei dati.................................................................................................................................................
    • Distribuzioni Statistiche.................................................................................................................................... - Distribuzione unitaria (o disaggregata)........................................................................................................ - Distribuzione di frequenze semplice (assoluta)........................................................................................... - Frequenze relative..................................................................................................................................... - Frequenze assoluta (o relativa) cumulata..................................................................................................
    • Le Rappresentazioni grafiche........................................................................................................................ - Diagramma a Torta - Carattere qualitativo................................................................................................. - Grafico a barre (o a nastri) - Caratteri qualitativi (sconnessi o ordinati) e caratteri quantitativi discreti...... - Istogramma - Carattere quantitativo continuo............................................................................................
  • Sommatoria (∑).................................................................................................................................................. - Proprietà di ∑................................................................................................................................................
    • Errori nell’applicazione delle proprietà di ∑....................................................................................................
  • Sintesi della distribuzione di una variabile..........................................................................................................
    • Indici sintetici................................................................................................................................................. - Le misure di Centralità............................................................................................................................... - Medie di posizione................................................................................................................................ - Moda................................................................................................................................................ - Moda per distribuzioni in classi.................................................................................................... - Problemi della moda come sintesi............................................................................................... - Mediana........................................................................................................................................... - Mediana per distribuzioni unitarie................................................................................................ - Mediana per distribuzioni di frequenze........................................................................................ - Mediana per distribuzioni in classi............................................................................................... - Sintesi per il calcolo della mediana.............................................................................................. - Percentili.......................................................................................................................................... - Quartile............................................................................................................................................ - Per le distribuzioni unitarie........................................................................................................... - Per le distribuzioni di frequenze................................................................................................... - Per le distribuzioni in classi.......................................................................................................... - Medie analitiche.................................................................................................................................... - Media aritmetica............................................................................................................................... - Media aritmetica per distribuzioni unitarie.................................................................................... - Media aritmetica per distribuzioni di frequenze............................................................................ - Media aritmetica per distribuzione in classi.................................................................................. - Proprietà delle medie................................................................................................................... - Media Geometrica............................................................................................................................
      • Le misure di variabilità...............................................................................................................................
        • Requisiti per gli indici di variabilità........................................................................................................
        • Campo di variazione (Range)...............................................................................................................
        • Differenza interquartile..........................................................................................................................
        • Box blot (scatola a baffi).......................................................................................................................
        • Varianza............................................................................................................................................... - Varianza ( per distribuzioni di frequenza)........................................................................................ - Varianza ( per distribuzioni in classi)................................................................................................ - Osservazioni sulla Varianza.............................................................................................................
        • Deviazione standard.............................................................................................................................
        • Coefficiente di variazione (CV)..............................................................................................................
        • Variabilità con variabili qualitative.........................................................................................................
        • Mutabilità vs Omogeneità..................................................................................................................... - Minima mutabilità............................................................................................................................. - Massima mutabilità...........................................................................................................................
        • Indici di mutabilità................................................................................................................................. - Indice di Gini.................................................................................................................................... - Indice di Gini (relativo)......................................................................................................................
      • Indici di Forma...........................................................................................................................................
        • Forma della distribuzione : Simmetria................................................................................................... - Indice di asimmetria.........................................................................................................................
  • Distribuzioni Bivariate.........................................................................................................................................
    • Analisi bivariata..............................................................................................................................................
      • Tabella a doppia entrata............................................................................................................................
        • Le frequenze assolute congiunte..........................................................................................................
        • Le frequenze assolute marginali...........................................................................................................
        • Le frequenze relative e percentuali congiunte.......................................................................................
        • Le frequenze relative e percentuali marginali........................................................................................
        • Distribuzioni condizionate.....................................................................................................................
    • L’analisi dell’associazione tra variabili (qualitative/quantitative).....................................................................
      • Misurare la dipendenza statistica..............................................................................................................
        • Indice 𝓧^2 di Pearson............................................................................................................................
          • Indice V di Cramer...............................................................................................................................
        • Massima dipendenza statistica.............................................................................................................
    • L’analisi dell’associazione tra variabili quantitative.........................................................................................
      • Covarianza................................................................................................................................................
        • Coefficiente di correlazione di Bravais e Pearson (- Roh).....................................................................
      • Covarianza per tabelle a doppia entrata....................................................................................................
  • La regressione lineare........................................................................................................................................
    • Modello di regressione lineare semplice........................................................................................................
      • Esempio : altezza e peso..........................................................................................................................
      • Misura della bontà della regressione.........................................................................................................
        • Proprietà dei residui..............................................................................................................................
      • Coefficiente di determinazione.................................................................................................................. - Coefficiente di determinazione basso (R^2 )............................................................................................ - Analisi dei residui..................................................................................................................................
  • Probabilità Statistica...........................................................................................................................................
    • Concetti Primitivi............................................................................................................................................
      • Prova.........................................................................................................................................................
      • Evento.......................................................................................................................................................
      • Probabilità.................................................................................................................................................
      • Lo spazio campionario...............................................................................................................................
    • Operazioni Fondamentali (logica di Boole).....................................................................................................
      • Negazione.................................................................................................................................................
      • Intersezione...............................................................................................................................................
      • Unione.......................................................................................................................................................
      • Evento Impossibile....................................................................................................................................
      • Evento Certo.............................................................................................................................................
      • Eventi Incompatibili...................................................................................................................................
    • Impostazione Assiomatica............................................................................................................................. - Postulati...................................................................................................................................................
    • Misurare la probabilità (Approccio Frequentista)............................................................................................
    • Misurare la probabilità (Approccio Classico)..................................................................................................
      • Esempio: Il gioco dei dadi.......................................................................................................................... - Il gioco della roulette.............................................................................................................................
    • Probabilità condizionate e teorema di Bayes.................................................................................................
      • Eventi condizionati....................................................................................................................................
      • Indipendenza e dipendenza...................................................................................................................... - Indipendenza tra eventi.........................................................................................................................
        • Teorema di Bayes....................................................................................................................................
    • Variabili casuali.............................................................................................................................................. - Funzione di probabilità.............................................................................................................................
      • Funzione di Ripartizione............................................................................................................................
      • Valore atteso (o media).............................................................................................................................
      • Varianza....................................................................................................................................................
    • Distribuzioni di probabilità..............................................................................................................................
      • Distribuzione Binomiale.............................................................................................................................
      • Distribuzione di Poisson............................................................................................................................
    • Variabili casuali Continue...............................................................................................................................
      • Funzione di Densità...................................................................................................................................
      • Funzione di Ripartizione............................................................................................................................
    • La distribuzione normale: principali caratteristiche.......................................................................................
      • Normale Standard (o standardizzata)......................................................................................................
      • Tavole della normale...............................................................................................................................
  • Inferenza statistica............................................................................................................................................
    • Campione e Strategie di campionamento....................................................................................................
      • Strategie di Campionamento................................................................................................................... - Campionamento casuale semplice (per brevità : c.c.s. oppure ccs)....................................................
        • Campionamento Stratificato................................................................................................................
        • Campionamento a grappolo................................................................................................................
        • Campionamento a due stadi...............................................................................................................
      • Distribuzione campionaria.......................................................................................................................
      • Media Campionaria e del Teorema del limite centrale.............................................................................
      • Stima Puntuale........................................................................................................................................
      • Stima puntuale della media di una popolazione......................................................................................
      • Stima puntuale della proporzione di una popolazione.............................................................................
      • Stima puntuale della varianza di una popolazione...................................................................................
    • Stima Intervallare.........................................................................................................................................
      • Intervallo di confidenza............................................................................................................................
        • t di Student..........................................................................................................................................
      • Intervallo di confidenza per la proporzione..............................................................................................
    • Verifica d’ipotesi...........................................................................................................................................
      • Passo 1: Formulazione delle ipotesi........................................................................................................
      • Passo 2: Decidere se accettare l’ipotesi nulla.........................................................................................
        • Calcolare il p-value.............................................................................................................................
      • Schema riassuntivo per il calcolo del p-value..........................................................................................
      • Test per la media di una popolazione con varianza non nota..................................................................
      • Test per la media di una popolazione con varianza non nota..................................................................
        • Schema riassuntivo per il calcolo del p-value.....................................................................................
      • Test per la media di una popolazione con varianza nota.........................................................................
        • Schema riassuntivo per il calcolo del p-value.....................................................................................
  • Possibili domande d’esame..............................................................................................................................
  • Lezioni con esercitazioni in classe (anno 2018/2019).......................................................................................
  • Nomenclature...................................................................................................................................................

Argomenti della Statistica

La statistica è l’arte di apprendere dai dati. La statistica può essere suddivisa in due macro categorie

  • Statistica Descrittiva : si occupa di identificare e sintetizzare la tendenza e gli schemi che sono presenti nei dati. Si fonda sull’idea secondo la quale i dati che abbiamo a disposizione sono esaustivi di tutta la popolazione ( assumiamo che i dati riguardano tutto il fenomeno che stiamo analizzando). Si occupa quindi di descrivere il fenomeno con i dati che abbiamo, mettendo in risalto le caratteristiche principali di un fenomeno; Contenuti : - Cosa sono i dati - Rappresentazione dei dati - Sintesi della distribuzione di una variabile - Analisi della relazione tra due variabili
  • La Probabilità studia i fenomeni casuali ( o aleatori), cioè tutti quei fenomeni il cui esito non è certo, ci aiuta a valutare le chance di un dato evento di accadere. Contenuti : - Probabilità elementari, teorema di Bayes; - Variabili aleatorie, definizione, distribuzione di probabilità, v.a discrete (distribuzioni binomiale e di poisson) e continue (distribuzione normale), esempi notevoli;
  • Statistica inferenziale : (inferire significa arrivare ad una previsione, ragionando su evidenze che sono note) si occupa di fare previsioni ( o prendere decisioni) su un collettivo più grande, rispetto al collettivo più piccolo che osserviamo ( chiamato campione), tramite degli strumenti metodologici basati sulla probabilità. Non parte dal presupposto che i dati che abbiamo siano relativi a tutta la popolazione. Contenuti : - Il concetto di inferenza statistica; - Popolazione e campione : variabilità campionaria; - Stima intervallare per media e proporzione; - Verifica d’ipotesi per media e proporzione;

I caratteri statistici vengono distinti in : ○ Caratteri statistici qualitativi , sono tutti quelli per i quali le modalità sono espresse con sostantivi, avverbi, aggettivi ( cioè parole che esprimono le qualità); A loro volta possono essere suddivisi in 2 grandi categorie, cioè :

  • Caratteri qualitativi sconnessi : cioè se non è possibile individuare un ragionevole criterio di ordinamento tra le sue modalità, l’unica operazione che possiamo fare è confrontare le modalità tra di loro, cioè vedere se sono uguali o diverse, ma non altro ( (es. colore degli occhi, possiamo confrontare solo se due unità hanno la stessa modalità oppure no). Altri esempi di caratteri qualitativi sconnessi sono : hai visto il festival di san remo? [mi è piaciuto festival/non mi è piaciuto/non l’ho visto], quale genere letterario ti piace? [Comico,Romatico,Psicologico, Fantascientifico];
  • Caratteri qualitativi ordinati ( o ordinali) : cioè è possibile istituire un ragionevole criterio di ordinamento (crescente o decrescente) tra le sue modalità, in questo caso possiamo non solo stabilire se due modalità sono uguali o diverse tra di loro, ma anche quale viene prima e quale viene dopo ( le possibilità di analizzare con i caratteri qualitativi ordinati, sono maggiori dei caratteri qualitativi sconnessi). Esempio di caratteri qualitativi ordinati sono : quanto frequentemente bevi birra? [mai, una volta a settimana, due volte a settimana, una volta al giorno] ○ Caratteri statistici quantitativi , sono tutti quelli per i quali le modalità sono esprimibili tramite valori numerici; A loro volta possono essere suddivisi in 2 grandi categorie, cioè :
  • Caratteri quantitativi Discreti : la cui rilevazione delle modalità avviene tramite operazione di conteggio o enumerazioni. Le modalità di questi caratteri sono solitamente espressi in numeri interi ( un carattere è quantitativo discreto se l’insieme delle modalità da esso assumibile può essere messo in corrispondenza biunivoca con l’insieme dei numeri interi ). Ad esempio il conteggio dei figli ( non possiamo avere 2.5 figli) ;
  • Caratteri quantitativi Continui : la cui rilevazione delle modalità avviene tramite uno strumento di misurazione. Le modalità possono assumere valori su tutto l’intervallo dei numeri reali ( un carattere è quantitativo discreto se l’insieme delle modalità da esso assumibile può essere messo in corrispondenza biunivoca con un sottoinsieme dei numeri reali ) Ad esempio l’altezza, o il peso;

Censimenti

I dati sono raccolti su tutte le unità della popolazione: ● maggior ricchezza delle info raccolte ● esaustività, visione completa del fenomeno ● - difficoltà di raggiungere alcune unità ● - temasdpi di realizzazione molto lunghi ● - costi elevati ’sottocopertura’’ : mancata rilevazione di alcune unità.

Rilevazioni Campionarie

I dati vengono raccolti su una parte delle unità, stabilite secondo alcuni criteri, interessi. Quando non si può/vuole osservare l’intera popolazione. Quando la popolazione è infinita. Sempre??? Campione statistico: insieme di unità selezionato della popolazione secondo determinati criteri. Deve essere rappresentativo della popolazione, deve riflettere le caratteristiche della popolazione (per quanto grande può essere se non è rappresentativo non consente generalizzazioni. Dall’analisi esplorativa si fa inferenza. Inferenza: è l’estrazione; procedimento con cui i risultati parziali osservarti sul campione vengono generalizzati sulla popolazione. Generalizzando si produce incertezza, che viene gestita attraverso il calcolo delle probabilità. Statistica inferenziale: insieme dei metodi che permettono di fare questa generalizzazione.

Rappresentazione dei dati - Distribuzione

Matrice dei dati

Una volta raccolti i dati, dobbiamo iniziare a trarre conclusioni su quello che abbiamo osservato, questo lo facciamo tramite la rappresentazione dei dati. il primo strumento che possiamo utilizzare per rappresentare i dati è la matrice dei dati. Pregi

Teoria dei

campioni

Popola

zione

Inferenza

statistica

Campi

one

Si definisce distribuzione di frequenza assoluta la lista delle modalità osservate accompagnata dalle rispettive frequenze assolute. La distribuzione di frequenze avrà K righe ( tante quante sono le modalità ) e 2 colonne, una che indica le modalità e l’altra il conteggio che è stato fatto delle modalità ( quindi le frequenze assolute). Indicheremo un generico elemento/modalità con Xj Indicheremo un generica frequenza assoluta di una modalità con nj Pregi :

  • E’ più facile da leggere, poiché ci indica come le unità si distribuiscono tra le modalità del carattere; Difetti :
  • Ma perdiamo dettagli, non sappiamo a quale unità statistica corrisponda ciascuna modalità; In caso di distribuzione di frequenza assoluta, con caratteri quantitativi che presentano una elevata numerosità delle modalità, per creare una sintesi facile da leggere, bisogna procedere con la suddivisione in classi

Suddivisione in classi

La scelta delle classi è arbitraria , ma va fatta tenendo presente che: ● nessuna classe deve essere vuota; ● le classi devono essere contigue (cioè devono essere una dopo l’altra, senza spazi vuoti tra una classe e l’altra), disgiunte (cioè non deve esserci fraintendimento su dove collocare le unità, cioè ogni modalità del carattere statistico deve ricadere in una sola classe) ed esaustive (cioè devono coprire tutto il range di possibile osservazione); ● devono avere possibilmente la stessa ampiezza; ● il numero di classi deve essere tale da consentire un'adeguata sintesi dei dati senza comportare una eccessiva perdita di informazioni ( deve esserci il giusto trade-off tra numero di classi e informazioni che si perdono)

  • Parentesi tonda ( e ) ⇒ Esclusa
  • Parentesi quadra [ e ] ⇒ Inclusa L’ampiezza della classe può essere interpretata, ma prima di tutto dobbiamo distinguere tra : ● Caratteri quantitativi discreto - in questo caso l’ampiezza della classe rappresenta il numero di modalità distinte che cadono all’interno di quella classe;

● Caratteri quantitativo continuo - in questo caso l’ampiezza della classe rappresenta il numero di intervalli unitari che ricadono in quella classe; Anche in questo caso, introducendo una suddivisione per classi abbiamo una perdita di informazioni ( come per tutte le rappresentazioni di sintesi) ma acquistiamo maggiore leggibilità dei dati. L’ammontare della perdita di informazioni ed il livello di sintesi dipendono dal numero delle classi:

  • Se il numero delle classi è grandi : l’ampiezza di ciascuna classe si riduce, perdiamo meno informazioni ma anche il livello di sintesi è basso;
  • Se il numero delle classi è piccolo : l’ampiezza di ciascuna classe aumenta, il livello di sintesi aumenta ma perdiamo maggiori informazioni;

Classi di differenti ampiezze

Può capitare che le classi siano state costruite utilizzando intervalli di lunghezza differente, in questo caso è conveniente definire anche la densità di frequenza. La densità di una classe è data da un rapporto : Quando parliamo della densità di una classe, assumiamo che vi sia una uniforme distribuzione delle unità all’interno della classe (dell’intervallo). Es. di distribuzione in classi con ampiezza diversa La densità ci dice il numero attesi di unità statistiche per ogni unità di misura delle variabili. NOTA D’ESAME Un classico errore d’esame, parlando di rappresentazione grafiche, se si deve costruire una rappresentazione grafica di caratteri quantitativi continui, l’unica rappresentazione possibile è l’istogramma. Se si deve costruire un istogramma e le classi hanno ampiezza diversa, l’unico modo di rappresentare quella distribuzione è di riferirsi alle densità.

Frequenze relative

Le frequenza assolute hanno un limite , e cioè che dipendono fortemente dalla numerosità del collettivo ( cioè dal numero di unità statistiche che stiamo considerando, vuol dire che data una popolazione con un basso numero di unità, probabilmente le frequenze assolute sono piccole, poiché si osservano poche unità, viceversa con un maggior numero di unità, le frequenze assolute avranno numeri più grandi, poiché si osservano tante più unità). Quindi se osserviamo lo stesso carattere su due collettivi diversi, con numerosità diverse, con le frequenze assolute non possiamo fare confronti , perché le frequenze saranno diverse a causa delle diverse numerosità.

Le Rappresentazioni grafiche

Sono il mezzo principale utilizzato per divulgare le informazioni sul fenomeno da un punto di vista puramente descrittivo, soprattutto ai non addetti ai lavori.

Diagramma a Torta - Carattere qualitativo

E’ una circonferenza suddivisa in spicchi, dove ciascuno spicchio rappresenta una modalità tramite la sua frequenza ( assoluta o relativa).

  • Assoluta ⇒ angolo = 360 ∙

freq. assoluta

N

  • Relativa ⇒ angolo = 360 ∙ freq. relativa Modalità freq. ass. angolo ass. freq. rel angolo rel. Non visto 169 247 0.69 247 Visto e non piaciuto 12 18 0.05 18 Visto e piaciuto 65 95 0.26 95 Totale 246 360 1 360 Se il carattere non è ordinale, possiamo decidere noi l’ordine degli spicchi Se il carattere è ordinale, dobbiamo rispettare l’ordine nel riportare gli spicchi

Problemi

Se il numero le modalità diventano numerose allora la lettura del grafico a torta diventa difficoltosa, quindi è sconsigliabile usare il grafico a torta se le modalità sono molto numerose.

Grafico a barre (o a nastri) - Caratteri qualitativi (sconnessi o ordinati) e caratteri

quantitativi discreti

Il grafico è costruito rappresentando ogni modalità con una barra verticale (o nastro orizzontale) di altezza (o lunghezza) proporzionale alla sua frequenza (assoluta o relativa). Se il carattere rappresentato è qualitativo ordinale o quantitativo (discreto!!!) le modalità verranno rappresentate rispettando l’ordine.

Esempio di grafico a barre

Esempio di grafico a nastro

I grafici a barre possono essere usati per confrontare le distribuzione dello stesso carattere su collettivi differenti. Per confrontare i caratteri, qualora l’ampiezza delle frequenze assolute siano diverse, opteremo per delle frequenze relative. Di seguito un esempio di confronto di titoli di studio tra diversi paesi ( utilizzando le frequenze relative per avere la percentuale di un carattere sul totale, permettendo quindi un confronto tra modalità)

  • ( altezza rettangoli) = ( densità di frequenza dj ) Osservazioni Le rappresentazioni grafiche di distribuzioni di frequenza:
  • Per variabili categoriali (qualitative), la rappresentazione prende il nome di diagramma a torta o diagramma a barre.
  • Per variabili discrete, la rappresentazione prende il nome di diagramma a barre.
  • Per variabili continue, la rappresentazione prende il nome di istogramma.
  • Forniscono un’immagine della distribuzione dei dati: barre o scatole più alte rappresentano modalità più frequenti;
  • Aiutano a descrivere la forma della distribuzione dei dati;
  • Sono fortemente comunicative... ma devono essere ben costruite!

Sommatoria (∑)

Il simbolo ∑ indica la somma di un certo numero di valori ( anche diversi fra loro ) si leggerà “sommatoria di xi , per i che va da 1 a n” Esempio:

Proprietà di ∑

1) Prima proprietà Sia c una costante. Esempio : 2) Seconda proprietà Sia c una costante. Esempio : 3) Terza proprietà Siano X e Y due variabili. Esempio :

Errori nell’applicazione delle proprietà di ∑

1) Primo Errore

2) Secondo Errore

Esprimono il centro ideale della distribuzione, cioè il valore intorno al quale “gravitano” i dati. Non ne esiste solo uno, ma ne possono esistere diversi valori, ognuno dei quali mette in evidenza un aspetto diverso della centralità. La scelta dell’indice dipende essenzialmente da due fattori :

  1. La tipologia del carattere in esame ( qualitativo, quantitativo, etc..);
  2. La motivazione che ci spinge a sintetizzare la distribuzione con un unico valore; A seconda di questi due fattori distinguiamo 2 grandi categorie di misure di centralità: 1) Medie di posizione che si identificano in un valore “più frequente”, oppure in un valore che occupa una “determinata posizione” che vogliamo mettere in evidenza, all’interno della distribuzione ( possono essere calcolate sui caratteri quantitativi, ma anche su alcuni caratteri qualitativi ordinali) 2) Medie analitiche che calcoliamo mediante operazioni algebriche sulle modalità del carattere ( quindi possono essere calcolate solo ed esclusivamente per i caratteri quantitativi, poiché vanno fatti calcoli su numeri)

Medie di posizione

Moda Se dobbiamo sintetizzare una distribuzione in un unico numero che indichi dove la distribuzione stessa è “posizionata”, potremmo farlo indicando il valore della distribuzione che compare più frequentemente, questo valore si chiama moda della distribuzione. La moda di una distribuzione è la modalità cui è associata la massima frequenza (assoluta, relativa, percentuale). La moda esprime la modalità più comune e può essere calcolata su tutti i tipi di variabile ( sia qualitative che quantitative) Attenzione: la Moda si riferisce alla modalità, non alla frequenza. Moda per distribuzioni in classi Con le dovute attenzioni, possiamo calcolare la moda per una distribuzione suddivisa in classi.

  • Non usiamo le modalità, ma usiamo le classi;
  • La moda della distribuzione sarà chiamata classe modale ;
  • Se le classi hanno ampiezze diverse, la classe modale sarà individuata tramite la densità di frequenza ( non con le frequenze assolute/relative) Per calcolare la densità di frequenza , bisogna:
  • Calcolare l’ampiezza della classe ( estremo superiore - estremo inferiore)
  • Calcolare la densità ( frequenza relativa / ampiezza della classe )

Si definisce classe modale la classe alla quale corrisponde la massima frequenza (assoluta, relativa, percentuale). Se all’interno della classe si vuole individuare un unico valore (come valore di moda) si può scegliere quello centrale (come convenzione).

Problemi della moda come sintesi

  • In questo caso la moda corrisponde a 8 ore di sonno ( perchè è la modalità con il maggior numero di frequenza) però c’è un’altra modalità con una frequenza molto simile alla modalità di moda, non c’è quindi un unico valore centrale su cui gravitano gli altri.
  • In questo caso modalità di moda è 77 ( che si presenta solo 7 volte su 50) non è quindi molto centrale come valore, ma le modalità risultano troppo omogeneamente distribuite. Osservazioni
  1. Se tutte le modalità del carattere presentano all’incirca le stesse frequenze, allora non ha senso determinare la moda;
  2. La moda opera un buon criterio di sintesi di una distribuzione, quando si presenta con una frequenza “nettamente maggiore” rispetto alle altre, cioè quando almeno il 50% delle unità del collettivo presentano quel valore, in questo caso possiamo ritenere che la moda sia un buon indice di sintesi. Solo in questo caso è ragionevole assumerla come quel valore più idoneo a rappresentare sinteticamente la distribuzione;
  3. Potrebbe non esserci un’unica moda, ma più di una (cioè più di una modalità con una frequenza nettamente maggiore rispetto alle altre), in questo caso la nostra distribuzione si definisce plurimodali. Si può distinguere tra : a) Distribuzioni bimodali ( cioè solo due mode) b) Plurimodali (più di due mode) Attenzione: che le due o più mode devono essere uguali fra loro ( oltre che nettamente maggiori alle altre). Nell’esempio di ore di sonno, le due modalità non sono da considerarsi entrambe mode, perchè una è maggiore dell’altra. Mediana Il centro di una distribuzione potrebbe anche essere pensato come quel valore che lascia alla sua destra ed alla sua sinistra esattamente il 50% delle osservazioni.