Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Variabili statistiche: Introduzione e tipologie, Sintesi del corso di Statistica

Statistica per le decisioni - lezione 2

Tipologia: Sintesi del corso

2021/2022

Caricato il 26/12/2022

raimondo-del-tufo
raimondo-del-tufo 🇮🇹

4

(23)

43 documenti

1 / 53

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Lezione 2
Variabili statistiche
Stefania Capecchi
Universit `
a degli Studi di Napoli Federico II
S. Capecchi (Napoli Federico II) 2. Variabili statistiche 1/ 53
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35

Anteprima parziale del testo

Scarica Variabili statistiche: Introduzione e tipologie e più Sintesi del corso in PDF di Statistica solo su Docsity!

Lezione 2

Variabili statistiche

Stefania Capecchi

Universit `a degli Studi di Napoli Federico II

[email protected]

Sintesi della lezione

(^1) Introduzione

(^2) Nomenclatura essenziale

(^3) Tipologia delle variabili statistiche

(^4) Matrice dei dati

(^5) Rappresentazioni delle informazioni statistiche

Rilevazione statistica

  • Rilevazione statistica e il complesso di operazioni rivolte adacquisire una o piu informazioni su un insieme di elementi oggetto di studio.

‰ Le rilevazioni statistiche possono essere classificate: i) rispetto alla complessit `a delle operazioni: semplici; complesse.

ii) rispetto alla natura delle informazioni raccolte: risposte; misure.

iii) rispetto al gruppo di riferimento: globali; parziali.

Popolazione e campione

  • Popolazione (o Universo) e qualsiasi insieme di elementi che forma oggetto di uno studio statistico. ‰ Si distingue tra popolazione reale (quando effettivamente esistente e visibile) e popolazione virtuale (quando questa none osservata n ´e osservabile, perch ´e astratta o connessa al futuro, ma `e comunque ben definita).
  • Campione e qualsiasi sotto-insieme derivato da una certa` popolazione e finalizzato ad uno studio statistico. ‰ Gli obiettivi dell’indagine definiscono sia l’estensione della popolazione che la definizione di un campione.

Rapporto tra popolazione e campione

‰ E’ fondamentale per l’indagine statistica che il campione sia determinato in modo casuale, nel senso che ciascuna unit a selezionata dalla popolazione debba essere individuata mediante un’assegnazione casuale, cioe non condizionata da variabili specifiche. ‰ Nella scelta delle unit a statistiche che compongono un campione estratto da una determinata popolazione, occorre considerare due aspetti: (external validity): la validita esterna dell’indagine e la rappresentativita del campione selezionato

(internal validity): la validit a interna dell’indaginee l’assegnazione casuale dell’unit `a statistica al campione

Variabile statistica e modalit `a

  • Variabile e il fenomeno oggetto dello studio, rilevato omisurato sulle unita statistiche.
  • Modalit a e l’espressione concreta mediante la quale la variabile si manifesta nelle unit a statistiche. ‰ In sostanza, modalita e il numero (=valore quantitativo) o l’attributo (=valore qualitativo) che l’unita statistica manifesta nella rilevazione.

‰ Esempio: La registrazione “Il Museo del Risparmio ha 35 dipendenti” costituisce una rilevazione sulla unit a statistica Museo del Risparmio per la quale la variabile “Numero di dipendenti” si manifesta nella modalita 35 dipendenti.

‰ Nel seguito, indicheremo con X la variabile statistica e con {x 1 , x 2 ,... , xk } le sue modalit `a.

Frequenza, serie e seriazione

  • Frequenza e il numero di volte in cui una determinatamodalita si verifica nel collettivo di riferimento.
  • Serie e l’insieme delle modalit `` a rilevate sulla popolazione di riferimento ed organizzate in modo che a ciascuna unit a della popolazione corrisponde una ben definita modalita. In tal caso, si parla anche di dati distinti.
  • Seriazione e l’insieme delle modalit `` a di una popolazione di riferimento organizzate in modo che a ciascuna modalit a corrisponda la rispettiva frequenza. In tal caso, si parla anche di dati raggruppati per modalita.

Esempio di serie

‰ Supponiamo che in un Comune siano state oggetto di accertamento 25 aziende rispetto alle quali si e registrato se sono state rilevate infrazioni, per cui le due possibili modalita (oggetto della rilevazione) sono: SI, NO. ‰ Se la rilevazione ha fornito i seguenti risultati:

{ NO, NO, SI, SI, SI, NO, SI, NO, SI, NO, NO, SI, SI,

SI, SI, NO, SI, SI, NO, SI, NO, SI, NO, SI, SI }

tale elencazione costituisce la serie della variabile “Infrazioni accertate” nella popolazione in esame.

Tipologia delle variabili statistiche

‰ La distinzione pi u importante sui fenomeni che si osservano e si misuranoe tra variabili qualitative e quantitative.

‰ Una variabile quantitativa ha per modalit a dei numeri mentre se cio non avviene si tratta di una variabile qualitativa.

Esempi di variabili qualitative

‰ Il genere di un individuo, la religione, lo stato civile, la professione, la categoria sociale di appartenenza, il comune di nascita, la regione di residenza, la nazionalit `a, lo stato d’animo dopo un esame, il gusto, il gradimento di una esperienza, etc. costituiscono esempi di variabili qualitative.

Classificazione delle variabili

V a r i a b i l i Nominali

QUALITATIVE Ordinali

V a r i a b i l i Discrete

QUANTITATIVE Continue

Variabili qualitative NOMINALI

  • Una variabile nominale e una variabile qualitativa le cuimodalita (attributi) non assumono alcun ordine precostituito. L’unico confronto ammissibile tra due unit a statistiche rispetto alle modalita assunte da variabili nominali consiste nello stabilire se possiedono o no lo stesso attributo, cio e se sono diversi oppure uguali rispetto a quella variabile. ‰ Il genere, la religione, la professione, la nazionalita delle persone costituiscono esempi di variabili nominali i cui attributi (Maschi e Femmine; Cristiani, Ebrei, Musulmani, Induisti, Altri; Italiana, Francese, Tedesca, etc.) non possiedono un ordine naturale n ´e esistono motivi logico-concettuali per preferire un ordinamento tra le modalit a. ‰ Quindi, il confronto tra due unita statistiche rispetto al sesso, alla religione, alla professione, alla nazionalit a, etc. permette solo di affermare se le due unita possiedono la stessa modalit a oppure no (cioe se sono dello stesso sesso, della stessa religione, della stessa professione, della stessa nazionalit `a, etc.).

Variabili qualitative ORDINALI

  • Una variabile ordinale e una variabile qualitativa le cuimodalita sono logicamente sequenziali, in ordine crescente o decrescente. Quindi, per tali variabili, pur essendo impossibile effettuare operazioni aritmetiche tra gli attributi delle singole unit a statistiche, si puo stabilire tra di esse una relazione di ordine rispetto alla variabile individuata.

‰ Il grado militare (sergente, tenente, capitano, maggiore, colonnello, generale), la valutazione scolastica (insufficiente, mediocre, sufficiente, buono, ottimo), un indice di gradimento (per niente, poco, abbastanza, molto) sono fenomeni nei quali la gerarchia, il merito scolastico, la preferenza individuale stabiliscono una graduatoria che mostra univocamente un criterio di ordinamento (precedenza) tra le unit a statistiche, anche se none possibile attribuire un valore numerico alla distanza tra le modalit `a.

Variabili ordinali nei dataset

1 STUDENTI:

Anno di rilevazione

2 RELGOODS:

Titolo di studio Domande sui beni relazionali (scala da 1 a 10) Domande sul tempo libero (scala da 1 a 10)