Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Introduzione alla Statistica: Definizioni e Concepti Fondamentali, Sintesi del corso di Statistica

Definizioni filosofiche e formali per la statistica, introduttive a unità statistiche, statistica descrittiva e inferenza statistica, distribuzioni dei caratteri statistici, frequenze assolute e relative, distribuzioni di frequenza per caratteri quantitativi e rappresentazioni grafiche. Vengono inoltre presentate le medie analitiche e di posizione.

Tipologia: Sintesi del corso

2019/2020

Caricato il 17/11/2020

erika-bacchieri
erika-bacchieri 🇮🇹

5

(2)

4 documenti

1 / 6

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Definizione di statistica
Definizione filosofica = E' quella scienza che aiuta a prendere decisioni in condizioni di incertezza-
Definizione formale = E' una disciplina di carattere metodologico che ha per oggetto l'analisi dei fenomeni collettivi
dotati di variabilità
Unità statistiche
unità elementari omogenee che costituiscono l'oggetto di osservazione e di analisi.
l'insieme delle unità statistiche omogenee rispetto a una o più caratteristiche costituisce una popolazione
Statistica descrittiva e inferenza statistica
Statistica descrittiva: i caratteri statistici vengono osservati per tutte le N unità statistiche che compongono la
popolazione di interesse, e siamo quindi in grado di dare una descrizione completa su tale popolazione relativamente
ai caratteri di interesse.
Inferenza statistica: i caratteri statistici vengono osservati solamente per un campione di n unità appartenenti alla
popolazione di interesse, ma, attraverso opportune tecniche, si cerca comunque di ottenere una descrizione della
popolazione nel suo complesso relativamente ai caratteri di interesse.
Dati statistici
rappresentano la materia prima su cui si basa l'analisi statistica
i dati statistici sono però informazioni grezze e non immediatamente fruibili
essi devono essere elaborati al fine di ricavarne informazioni utili
le informazioni ricavate dai dati sono necessarie per descrivere e comprendere il fenomeno oggetto di studio
Caratteri statistici
Sono delle caratteristiche delle unità che vengono rilevate e studiate in relazione ad un determinato fenomeno.
Le modalità dei caratteri statistici sono valori o attributi specifici che può assumere un carattere su un unità statistica; e
possono essere:
esaustive = devono rappresentare tutti i possibili modi di manifestarsi del carattere
non sovrapposte = ad ogni unità statistica si può associare una sola modalità
(Nel momento in cui un carattere assume una certa modalità in corrispondenza di un'unità statistica siamo in presenta
di un dato statistico.
I caratteri statistici si suddividono in:
qualitativi = caratteri con modalità non numeriche
quantitativi = caratteri con modalità numeriche
->Tra i caratteri qualitativi distinguiamo i caratteri sconnessi (chiamati anche nominali, sono caratteri per cui le
modalità non si possono ordinare);
e i caratteri ordinati (chiamati anche ordinali, sono caratteri le cui modalità presentano un ordine logico che possono
essere rettilinei, cioè che è a salire o a scendere, oppure ciclici).
->Tra i caratteri quantitativi distinguiamo i caratteri discreti (le cui modalità scaturiscono da un conteggio) e caratteri
continui (le cui modalità scaturiscono da una misurazione
I caratteri quantitativi si riferiscono sempre a una scala di misura, che può essere:
scala di intervalli = scala in cui non esiste uno zero assoluto naturale e non arbitrario
scala di rapporti = scala in cui esiste uno zero assoluto
Distribuzione dei caratteri statistici
Frequenze assolute
L'insieme di dati è costituito da tutte le rilevazioni effettuate su ognuna delle unità statistiche prese in considerazione
rispetto ad ogni carattere.
Un primo punto di partenza delle tecniche di sintesi della statistica descrittiva è la derivazione della distribuzione di
frequenza di ciascun carattere di interesse.
Per frequenza assoluta si intende il numero di volte in cui una certa modalità di un carattere viene osservata nella
popolazione (N unità). La frequenza assoluta si indica con nj dove j è un indice che varia da 1 a k, il numero massimo di
modalità del carattere considerato.
Distribuzione di frequenza assoluta = funzione che associa alle modalità di un carattere, quantitativo o qualitativo, le
corrispondenti frequenze assolute osservate nella popolazione.
La distribuzione di frequenza è un utile strumento di sintesi che ci da informazioni sulle modalità assunte dal carattere
di interesse nella popolazione.
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Introduzione alla Statistica: Definizioni e Concepti Fondamentali e più Sintesi del corso in PDF di Statistica solo su Docsity!

Definizione di statistica Definizione filosofica = E' quella scienza che aiuta a prendere decisioni in condizioni di incertezza- Definizione formale = E' una disciplina di carattere metodologico che ha per oggetto l'analisi dei fenomeni collettivi dotati di variabilità Unità statistiche

  • unità elementari omogenee che costituiscono l'oggetto di osservazione e di analisi.
  • l'insieme delle unità statistiche omogenee rispetto a una o più caratteristiche costituisce una popolazione Statistica descrittiva e inferenza statistica Statistica descrittiva : i caratteri statistici vengono osservati per tutte le N unità statistiche che compongono la popolazione di interesse, e siamo quindi in grado di dare una descrizione completa su tale popolazione relativamente ai caratteri di interesse. Inferenza statistica : i caratteri statistici vengono osservati solamente per un campione di n unità appartenenti alla popolazione di interesse, ma, attraverso opportune tecniche, si cerca comunque di ottenere una descrizione della popolazione nel suo complesso relativamente ai caratteri di interesse. Dati statistici
  • rappresentano la materia prima su cui si basa l'analisi statistica
  • i dati statistici sono però informazioni grezze e non immediatamente fruibili
  • essi devono essere elaborati al fine di ricavarne informazioni utili
  • le informazioni ricavate dai dati sono necessarie per descrivere e comprendere il fenomeno oggetto di studio Caratteri statistici Sono delle caratteristiche delle unità che vengono rilevate e studiate in relazione ad un determinato fenomeno. Le modalità dei caratteri statistici sono valori o attributi specifici che può assumere un carattere su un unità statistica; e possono essere:
  • esaustive = devono rappresentare tutti i possibili modi di manifestarsi del carattere
  • non sovrapposte = ad ogni unità statistica si può associare una sola modalità (Nel momento in cui un carattere assume una certa modalità in corrispondenza di un'unità statistica siamo in presenta di un dato statistico. I caratteri statistici si suddividono in:
  • qualitativi = caratteri con modalità non numeriche
  • quantitativi = caratteri con modalità numeriche ->Tra i caratteri qualitativi distinguiamo i caratteri sconnessi (chiamati anche nominali, sono caratteri per cui le modalità non si possono ordinare); e i caratteri ordinati (chiamati anche ordinali, sono caratteri le cui modalità presentano un ordine logico che possono essere rettilinei, cioè che è a salire o a scendere, oppure ciclici). ->Tra i caratteri quantitativi distinguiamo i caratteri discreti (le cui modalità scaturiscono da un conteggio) e caratteri continui (le cui modalità scaturiscono da una misurazione I caratteri quantitativi si riferiscono sempre a una scala di misura, che può essere:
  • scala di intervalli = scala in cui non esiste uno zero assoluto naturale e non arbitrario
  • scala di rapporti = scala in cui esiste uno zero assoluto Distribuzione dei caratteri statistici Frequenze assolute L'insieme di dati è costituito da tutte le rilevazioni effettuate su ognuna delle unità statistiche prese in considerazione rispetto ad ogni carattere. Un primo punto di partenza delle tecniche di sintesi della statistica descrittiva è la derivazione della distribuzione di frequenza di ciascun carattere di interesse. Per frequenza assoluta si intende il numero di volte in cui una certa modalità di un carattere viene osservata nella popolazione ( N unità). La frequenza assoluta si indica con nj dove j è un indice che varia da 1 a k , il numero massimo di modalità del carattere considerato. Distribuzione di frequenza assoluta = funzione che associa alle modalità di un carattere, quantitativo o qualitativo, le corrispondenti frequenze assolute osservate nella popolazione. La distribuzione di frequenza è un utile strumento di sintesi che ci da informazioni sulle modalità assunte dal carattere di interesse nella popolazione.

E' particolarmente utile nel caso di carattere qualitativi quantitativi che possono assumere un numero di modalità k non troppo elevato. Quando il numero di modalità del carattere è invece molto elevato, la distribuzione di frequenza non può essere utile/comprensibile. Frequenze relative La distribuzione di frequenza di un dato carattere può essere calcolata anche in forma di relativa che assoluta. La frequenza relativa rappresenta la frazione della popolazione che presenta un certa modalità di un carattere. La frequenza relativa si indica con Fj e si calcola come rapporto fra la corrispondente frequenza assoluta e la numerosità totale della popolazione: Fj = nj N Distribuzione di frequenza relativa = funzione che associa alle modalità di un carattere, quantitativo o qualitativo, le corrispondenti frequenze relative osservate nella popolazione. La distribuzione di un dato carattere può essere espressa anche in percentuale. E' questa l'informazione che è solitamente più facile da interpretare e che può consentire di effettuare confronti tra popolazioni con numerosità diversa. Frequenza relativa percentuale = rappresenta la frequenza relativa in termini percentuali. La frequenza relativa percentuale si indica con Pj e si calcola moltiplicando la corrispondente frequenza relativa per 100: Pj = fj x 100 Distribuzione di frequenza relativa percentuale = funzione che associa alle modalità di un carattere, qualitativo o quantitativo, le corrispondenti frequenze relative percentuali osservate nella popolazione. Frequenze cumulate La frequenza cumulata di una modalità è data dalla somma della frequenza della modalità con quella delle modalità precedenti. Le frequenze cumulate si possono calcolare in termini assoluti (cumulando frequenze assolute), relativi (cumulando frequenze relative) o relativi percentuali. Frequenza assoluta cumulata ( Nj ) = è data dalla somma delle frequenze assolute con cui si presentano le prime j modalità di carattere Nj = n1+n2+n3.......nj Frequenza relativa cumulata ( Fj ) = è data dalla somma delle frequenze relative con cui si presentano le prime j modalità di carattere Fj = f1+f2+f3.......fj Frequenza relativa percentuale ( Pj ) = è data dalla somma delle frequenze relative percentuali con cui si presentano le prime j modalità di carattere. Pj = p1+p2+p3.......pj Distribuzione di frequenza per caratteri quantitativi Se il carattere che si vuole analizzare presenta moltissime modalità distinte, si possono avere notevoli difficoltà nella comprensione dei dati, e derivare la distribuzione di frequenza (assoluta o relativa) richiede tempo e non facilita l'interpretazione. Questo avviene speso con i caratteri quantitativi, continui o discreti. In questi casi è solitamente necessario o per lo meno conveniente procedere ad un raggruppamento dei valori in intervalli tra loro disgiunti. Quindi prima di procedere alla derivazione delle distribuzioni di frequenza si suddividono in classi le modalità del carattere e successivamente si derivano le distribuzioni di frequenza per le classi cosi ottenute. Suddivisione in classi di un carattere quantitativo E opportuno definire le classi in modo tale che:

  • il loro numero sia abbastanza piccolo
  • siano tra loro disgiunte
  • comprendano tutte le possibili modalità di carattere
  • abbano se possibile la stessa ampiezza Rappresentazioni grafiche

Istogramma a basi uguali

  • Si utilizza per caratteri quantitativi continui suddivisi in classi di uguale ampiezza
  • l'istogramma è un grafico costituito da barre non distanziate, dove ogni barra possiede un area proporzionale alla frequenza della classe
  • ogni barra ha la medesima base
  • le barre sono unite tra loro
  • le altezze sono proporzionali alle frequenze Istogrammi a basi diverse
  • si utilizza per caratteri quantitativi continui suddivisi in classi di diversa ampiezza
  • l'area di ogni rettangolo è proporzionale alla frequenza della classe che rappresenta
  • la base di ogni rettangolo è pari all'ampiezza aj della classe che rappresenta
  • l'altezza di ogni rettangolo è proporzionale alla densità di frequenza, data dal rapporto tra frequenza e ampiezza della classe
  • la densità di frequenza consente di tenere in considerazione che la frequenza maggiore osservata per una classe potrebbe dipendere dalla maggiore ampiezza di quella classe

Medie Le medie si dividono in due categorie: Medie analitiche = si calcolano effettuando operazioni algebriche sulle modalità del carattere; possono essere calcolate solo per caratteri quantitativi, e sono:

  • aritmetica
  • quadratica
  • geometrica Medie di posizione = non richiedono operazioni algebriche sulle modalità del carattere, possono essere calcolate per caratteri quantitativi e qualitativi, e sono:
  • Moda
  • Mediana
  • Quantili La media aritmetica La media aritmetica è il punto di equilibrio (baricentro) di una distribuzione di dati, in quanto bilancia i valori più alti e quelli più bassi. La media aritmetica si indica con μ e si calcola: x1 + x2 + x3........xn N x = caratteri N = numero totale di unità statistiche osservate Media aritmetica per distribuzioni di frequenze assolute = Se un carattere quantitativo è discreto e conosciamo la sua distribuzione di frequenza assoluta, la media aritmetica si calcola sommando i prodotti ottenuti moltiplicando ogni valore per la rispettiva frequenza, e dividendo per il totale delle frequenze. X1n1 + x2n2..............xknk N xj = è la j-esima modalità assunta dal carattere (j = 1........k) nj = è la frequenza assoluta con cui si osserva xj N = è òa numerosità della popolazione oservata Media aritmetica per distribuzioni di frequenze relative = Se un carattere è quantitativo e conosciamo la sua distribuzione di frequenza relativa, la media aritmetica si calcola sommando i prodotti ottenuti moltiplicando ogni valore per la rispettiva frequenza relativa: x1f1 + x2f2..........xkfk xj = è la j-esima modalità assunta dal carattere (j = 1........k) fj = è la frequenza relativa con cui si osserva xj La media aritmetica per caratteri suddivisi in classi = Quando un carattere quantitativo è suddiviso in classi e conosciamo la sua distribuzione di frequenza assoluta, possiamo approssimare la media aritmetica utilizzando i valori centrali di ciascuna classe: c1n1 + c2n2........cknk N cj = è il valore centrale della j-esima classe (j = 1........k) nj = è la frequenza assoluta della j-esima classe N = è la numerosità complessiva della popolazione La media aritmetica ponderata = Talvolta nel calcolo della media aritmetica si vuole dare diversa importanza alle osservazioni, attribuendo a ciascuna unita un peso specifico. La media aritmetica ponderata di un insieme di N valori osservati di un carattere quantitativo X con pesi non negativi, è data da: x1w1 + x2w2........xkwk w1 + w2........wk wj = è il peso attribuito alla j-esima modalità di x (j = 1.........k) wj è un coefficiente che aumenta ( se > 1) o diminuisce (se < 1) l'importanza del termine xj