Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Introduzione alla Statistica: Popolazioni, Campionamento, Caratteri e Classificazione, Appunti di Statistica

Una introduzione alla statistica, spiegando le differenze tra popolazioni reali e concettuali, il vantaggio del campionamento e la classificazione delle unità statistiche. Viene inoltre discusso sulla codificazione di caratteri qualitativi e la classificazione unidimensionale. Il testo include anche informazioni su frequenze cumulate e rappresentazioni grafiche.

Tipologia: Appunti

2020/2021

Caricato il 21/02/2022

HDSte
HDSte 🇮🇹

3 documenti

1 / 7

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA
La statistica rappresenta uno strumento per la soluzione e l'interpretazione di grosse quantità di dati. Per svolgere
un'indagine statistica, noi prendiamo i dati da diverse fonti, che possono essere: censimenti, indagini campionarie,
fonti amministrative, database di alto livello... In Italia la fonte ufficiale è l'Istituto Nazionale di Statistica, ISTAT.
L'oggetto di ogni indagine statistica è la conoscenza di una popolazione, cioè le unità elementari in cui il fenomeno si
manifesta. Esistono due tipi di popolazioni:
popolazioni reali (finite): formate da un numero finito di individui che è possibile identificare
(cittadini italiani, auto immatricolate in Italia ad una certa data, aziende del settore tessile, ecc)
popolazioni concettuali (infinite): si tratta di popolazioni che non esistono in modo concreto.
Spesso, invece di studiare tutte le unità statistiche di una popolazione (censimento), si procede a campione, perchè ha
diversi vantaggi:
nelle popolazioni finite:
si riducono i costi
si riducono i tempi di elaborazione dei dati
si riducono gli errori di rilevazioni dei caratteri
nelle popolazioni infinite:
l'analisi di un campione è l'unico strumento investigativo di cui possiamo disporre
Gli elementi di una popolazione sono denominati unità statistiche. Variabile (o carattere) è il fenomeno oggetto di
studio rilevato o misurato sulle unità statistiche. I valori distinti assunti da una variabile sono detti modalità.
Attraverso una rilevazione statistica otteniamo una matrice di dati, ossia una tabella di n righe e p colonne. Ogni
riga rappresenta un'unità statistica, con in corrispondenza i valori delle variabili che abbiamo misurato. Ogni
colonna rappresenta una variabile.
I caratteri (o variabile) possono essere classificati in base alle loro modalità, ovvero in base alla loro “scala di
misura”.
Tipi di carattere:
Qualitativi: modalità espresse come aggettivi o qualità →
sconnessi (non è possibile alcun ordinamento tra le modalità);
ordinabili (esiste un ordinamento naturale tra le modalità);
Quantitativi: modalità sono dei numeri →
continui: le modalità sono espresse da numeri reali
discreti: le modalità sono espresse da numeri interi o da un loro sottoinsieme
scala a intervalli: l'origine della scala è arbitraria
scala a rapporti: l'origine della scala non è arbitraria.
Notazione: Una variabile si indica con una lettera maiuscola es. X, e con X1, X2, X3 la modalità assunta da X sulla
prima, seconda, terza… unità statistica.
TIPOLOGIA DEI CARATTERI
Possiamo codificare anche in carattere qualitativi, attraverso l’utilizzo dei numeri “0-1”, esempio:
SESSO:
maschio =0 ; femmina =1
Attraverso questo metodo, assegneremo a tutti i maschi il valore 0, e a tutte le femmine il valore 1.
Se abbiamo caratteri qualitativi con più di due modalità, utilizziamo un metodo differente, sempre con l’uso dei
numeri “0-1”, esempio: Se il carattere ha quella modalità assegniamo 1, se non la ha assegniamo 0.
CLASSIFICAZIONE
Una sequenza non ordinata di grandezze individuali di un certo carattere X, si indica sinteticamente con Xi.
L’operazione più semplice per organizzare informazioni nei dati è la classificazione, noi la utilizzeremo per
raggruppare le unità statistiche secondo le modalità di uno o più caratteri.
CLASSIFICAZIONE UNIDIMENSIONALE
Con la classificazione unidimensionale (un solo carattere), possiamo fare le distribuzioni di frequenza, dove si
raggruppano le classi secondo le n unità statistiche e le k modalità del carattere, una classe raggruppa una o più
modalità del carattere. Es:
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Introduzione alla Statistica: Popolazioni, Campionamento, Caratteri e Classificazione e più Appunti in PDF di Statistica solo su Docsity!

STATISTICA

La statistica rappresenta uno strumento per la soluzione e l'interpretazione di grosse quantità di dati. Per svolgere un'indagine statistica, noi prendiamo i dati da diverse fonti, che possono essere: censimenti, indagini campionarie, fonti amministrative, database di alto livello... In Italia la fonte ufficiale è l'Istituto Nazionale di Statistica, ISTAT. L'oggetto di ogni indagine statistica è la conoscenza di una popolazione, cioè le unità elementari in cui il fenomeno si manifesta. Esistono due tipi di popolazioni:

  • popolazioni reali (finite) : formate da un numero finito di individui che è possibile identificare (cittadini italiani, auto immatricolate in Italia ad una certa data, aziende del settore tessile, ecc)
  • popolazioni concettuali (infinite) : si tratta di popolazioni che non esistono in modo concreto. Spesso, invece di studiare tutte le unità statistiche di una popolazione (censimento), si procede a campione, perchè ha diversi vantaggi:
  • nelle popolazioni finite: ◦ si riducono i costi ◦ si riducono i tempi di elaborazione dei dati ◦ si riducono gli errori di rilevazioni dei caratteri
  • nelle popolazioni infinite: ◦ l'analisi di un campione è l'unico strumento investigativo di cui possiamo disporre Gli elementi di una popolazione sono denominati unità statistiche. Variabile (o carattere) è il fenomeno oggetto di studio rilevato o misurato sulle unità statistiche. I valori distinti assunti da una variabile sono detti modalità. Attraverso una rilevazione statistica otteniamo una matrice di dati , ossia una tabella di n righe e p colonne. Ogni riga rappresenta un' unità statistica, con in corrispondenza i valori delle variabili che abbiamo misurato. Ogni colonna rappresenta una variabile. I caratteri (o variabile) possono essere classificati in base alle loro modalità, ovvero in base alla loro “scala di misura”.
  • Tipi di carattere : ◦ Qualitativi: modalità espresse come aggettivi o qualità → ◦ s connessi (non è possibile alcun ordinamento tra le modalità); ordinabili (esiste un ordinamento naturale tra le modalità);
  • Quantitativi: modalità sono dei numeri → ◦ continui: le modalità sono espresse da numeri reali ◦ discreti: le modalità sono espresse da numeri interi o da un loro sottoinsieme ◦ scala a intervalli: l'origine della scala è arbitraria ◦ scala a rapporti: l'origine della scala non è arbitraria. Notazione: Una variabile si indica con una lettera maiuscola es. X, e con X1, X2, X3 la modalità assunta da X sulla prima, seconda, terza… unità statistica. TIPOLOGIA DEI CARATTERI Possiamo codificare anche in carattere qualitativi, attraverso l’utilizzo dei numeri “0-1”, esempio: SESSO: maschio =0 ; femmina = Attraverso questo metodo, assegneremo a tutti i maschi il valore 0, e a tutte le femmine il valore 1. Se abbiamo caratteri qualitativi con più di due modalità, utilizziamo un metodo differente, sempre con l’uso dei numeri “0-1”, esempio: Se il carattere ha quella modalità assegniamo 1, se non la ha assegniamo 0. CLASSIFICAZIONE Una sequenza non ordinata di grandezze individuali di un certo carattere X, si indica sinteticamente con Xi. L’operazione più semplice per organizzare informazioni nei dati è la classificazione, noi la utilizzeremo per raggruppare le unità statistiche secondo le modalità di uno o più caratteri. CLASSIFICAZIONE UNIDIMENSIONALE Con la classificazione unidimensionale (un solo carattere), possiamo fare le distribuzioni di frequenza, dove si raggruppano le classi secondo le n unità statistiche e le k modalità del carattere, una classe raggruppa una o più modalità del carattere. Es:

(Qui abbiamo raggruppato le confessioni in 3 classi dei paesi UE, e la modalità è una distribuzione di frequenza assoluta ) ( Qui abbiamo semplicemente fatto la versione in percentuale es. 8/15*100, chiamasi frequenze percentuali ) (Qui la distribuzione di frequenze relative, senza la moltiplicazione *100), in statistica si utilizzano di più queste e non quelle percentuali. REGOLE COSTRUZIONE DELLE CLASSI

  1. Le classi devono essere esaustive ( ogni modalità del carattere deve poter essere assegnata ad una classe )
  2. Le classi devono essere disgiunte ( ogni modalità del carattere deve poter assegnata ad una e una sola classe ) Raggruppare in classi significa perdere informazioni, bisogno quindi bilanciare l’esigenza di perdere poca informazione. Si preferisce classi di ampiezza costante quando studiamo la forma distributiva di un fenomeno, e di ampiezza diversa quando si identifica e qualifica in ogni classe un “tipo”. FREQUENZE CUMULATE La distribuzione delle frequenze cumulate è definite soltanto per caratteri quantitativi e per caratteri qualitativi ordinabili. Si indica con Nk = n1 + n2 + … la frequenza assoluta cumulata della modalità k. Si indica con Fk = f1+ f2+ … la frequenza relativa cumulata

Grafici a nastro: Come sopra, ma le barre sono orizzontali, utile per caratteri qualitativi sconnessi. Grafici a barre (o nastri) suddivisi: Rappresentazioni grafiche di caratteri QUANTITATIVI: Istogramma (modalità raggruppate in classi): L’istogramma è un grafico costituito da barre non distanziate, con basi in generale diverse, ogni barra possiede un’area proporzionale alla corrispondente frequenza o quantità. NOTA! -> Se abbiamo classi di uguale ampiezza , l’istogramma è uguale ad un grafico a barre, ma le barre NON SONO DISTANZIATE! (sinistra frequenza assoluta, sotto classi) NOTA! -> Se abbiamo classi di diversa ampiezza, dobbiamo calcolare l’altezza del rettangolo! ( sinistra densità di frequenza, sotto classi) Altezza angolo = (frequenza classe assoluta / ampiezza della corrispondente classe)

Poligono di frequenza: Unisce i punti centrali delle basi superiori dei rettangoli dell’istogramma, permette più facilmente il confronto tra distribuzioni diverse. Rappresentazione grafica dei dati elementari: Esistono anche grafici utili per rappresentare direttamente i dati elementari di un carattere (cioè i dati che abbiamo direttamente nella matrice senza calcolare nessuna frequenza)  Grafico a dispersione: Consiste nel rappresentare le modalità assunte da ciascuna unità statistica come punti lungo una retta. E’ una rappresentazione non accurata adatta a caratteri quantitativi continui che tendono ad assumere valori tutti diversi tra loro, abbiamo il problema di rappresentare le unità statistiche che assumono modalità uguali.  Grafico a stella: Si basa sulla rappresentazione delle modalità del carattere come lunghezze del raggio di un cerchio. o Adatto alla rappresentazione di caratteri quantitativi che assumono solo valori positivi o Adatto a rappresentare quanto i valori associali alle singole unità si allontanano dalla “media” generale o Diventa poco leggibile se le modalità sono molte

Serie indice a base mobile: Se, invece, interessa studiare le variazione relative di Q da un tempo t-1 a quello successivo di t, si divide ogni valore q, per il precedente, e si ottiene la serie dei numeri indici a base mobile. NON E’ POSSIBILE DETERMINARE IN NUMERO INDICE RELATIVO IL TEMPO INIZIALE!