Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Introduzione alla Statistica: Popolazione, Campione e Variabili, Sintesi del corso di Statistica

piccoli riferimenti e riassunti di statistica

Tipologia: Sintesi del corso

2020/2021

Caricato il 18/10/2021

pmazelli
pmazelli 🇮🇹

1 documento

1 / 9

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA: TEORIA
LA STATISTICA: (una delle molteplici definizioni) studia in termini quantitativi i
fenomeni collettivi.
I FENOMENI COLLETTIVI: sono fenomeni che la mente umana non può conoscere
con una sola osservazione, ma che invece apprende mediante la sintesi di fenomeni
più semplici.
LA STATISTICA ci fornisce dei metodi che possono essere utilizzati in qualsiasi
materia; es. economia, medicina ecc.
Es. statistica in letteratura: attribuire un testo ad un autore anonimo.
COSA SI INTENDE IN STATISTICA PER
POPOLAZIONE/COLLETTIVO: è un insieme di unità omogenee rispetto ad una
qualunque caratteristica: ci deve essere una caratteristica in comune tra queste
unità.
Dimensione della popolazione N (non sempre N è noto)
Ci sono POPOLAZIONI:
- Con lista: in cui è nota la dimensione N della popolazione
- Senza lista: quando non è nota
- Empirica: le unità sono effettivamente osservabili
- Teorica: le unità non sono osservabili effettivamente
- Finita: le unità sono identificabili
- Infinita: le unità non sono identificabili
UNITA’ STATISTICA generica unità della popolazione, ciascuna unità del collettivo
CARATTERE O VARIABILE (X)
È un aspetto delle unità che deve essere analizzato.
Le manifestazioni che la singola variabile può assumere sulle singole unità sono
DETERMINAZIONI.
Le determinazioni assunte dalla X su ciascuna unità sono dette osservazioni.
pf3
pf4
pf5
pf8
pf9

Anteprima parziale del testo

Scarica Introduzione alla Statistica: Popolazione, Campione e Variabili e più Sintesi del corso in PDF di Statistica solo su Docsity!

STATISTICA: TEORIA

LA STATISTICA : (una delle molteplici definizioni) studia in termini quantitativi i fenomeni collettivi. I FENOMENI COLLETTIVI : sono fenomeni che la mente umana non può conoscere con una sola osservazione, ma che invece apprende mediante la sintesi di fenomeni più semplici. LA STATISTICA ci fornisce dei metodi che possono essere utilizzati in qualsiasi materia; es. economia, medicina ecc. Es. statistica in letteratura: attribuire un testo ad un autore anonimo. COSA SI INTENDE IN STATISTICA PER POPOLAZIONE/COLLETTIVO : è un insieme di unità omogenee rispetto ad una qualunque caratteristica: ci deve essere una caratteristica in comune tra queste unità. Dimensione della popolazione  N (non sempre N è noto) C i sono POPOLAZIONI :

  • Con lista: in cui è nota la dimensione N della popolazione
  • Senza lista: quando non è nota
  • Empirica: le unità sono effettivamente osservabili
  • Teorica: le unità non sono osservabili effettivamente
  • Finita: le unità sono identificabili
  • Infinita: le unità non sono identificabili UNITA’ STATISTICA  generica unità della popolazione, ciascuna unità del collettivo CARATTERE O VARIABILE (X) È un aspetto delle unità che deve essere analizzato. Le manifestazioni che la singola variabile può assumere sulle singole unità sono  DETERMINAZIONI. Le determinazioni assunte dalla X su ciascuna unità sono dette osservazioni.

CON UNA POPOLAZIONE EMPIRICA E FINTA posso fare una  RILEVAZIONE TOTALE / CENSIMENTO RILEVAZIONE TOTALE : si osserva la variabile di interesse su tutte le unità della popolazione, ma spesso tale rilevazione risulta spesso inattuabile, per motivi: 1- Economici: costa troppo 2- Temporali: ci vuole troppo tempo 3- L’osservazione può comportare la distruzione dell’unità stessa Quindi posso fare  RILEVAZIONE PARZIALE : si osserva la variabile di interesse su un sottoinsieme di unità della popolazione. Sottoinsieme di unità = CAMPIONE (n) RILEVAZIONE PARZIALE= RILEVAZIONE CAMPIONARIA Le indagini parziali effettuate su un campione sono dette: INDAGINI CAMPIONARIE n N ^ FRAZIONE DI CAMPIONAMENTO^ (in caso di popolazione con lista, quando N è nota).  STATISTICA DESCRITTIVA : complesso di metodi che comprendono la raccolta, la sintesi e la presentazione dei dati  STATISTICA INFERENZIALE: insieme di metodi che consentono di valutare una caratteristica della popolazione sulla base di un campione  PROBABILITA’ : lega insieme la statistica descrittiva e la statistica inferenziale VARIABILE (O CARATTERE) X  è quel particolare aspetto delle unità statistiche che costituisce l’oggetto dell’indagine COME SI DIVIDONO LE VARIABILI

  1. QUALITATIVE : le determinazioni sono espresse mediante attribuiti
  • Le determinazioni si chiamano anche: modalità (o categorie)  Un insieme di modalità incompatibili ed esaustive: faccio un elenco di tutte le possibili modalità, che a loro volta devono essere incompatibili.

K  modalità o valori distinti nj  numero di volte che si manifesta quella determinazione: si chiama FREQUENZA ASSOLUTA : rappresenta il numero di unità statistiche su cui la variabile X ha assunto valore o modalità. c j (j = 1, 2, …, k). Ovviamente la somma di tutte le frequenze assolute coincide con il numero delle unità esaminate, cioè vale la seguente uguaglianza k

∑ nj=n

J=

DISTRIBUZIONE DI FEQUENZA (DISTRIBUZIONE DI SINTESI) : nella prima tabella contiene le k modalità distinte (o valori), nelle seguenti tabelle contiene le varie frequenze:

  1. Frequenza assoluta
  2. Frequenza relativa  fj =^ nj n

3) Frequenza percentuale  pj = fj x 100

(guardare sul quaderno a pag. 10)  FREQUENZE CUMULATE

 la distribuzione di frequenza viene fatta quando le variabili X sono è di tipo qualitativo o quantitativo discreto.  Quando invece la variabile di interesse X è quantitativa continua , i valori distinti risultano essere troppi, così si crea una DISTINZIONE PER CLASSI. X1 ≤ …. ≤ Xn Campo di variazione  [ X1, X(n) ] l’intervallo della retta reale: tutte le mie osservazioni sono contenute all’interno dell’intervallo. Anziché prendere valori distinti faccio: K classi contigue (C0, C 1 ], (C 1 , C 2 ],….,(CK-1, Ck] Classe  C0 – C 1 notazione corretta C 0 C 1 LA DISTRIBUZIONE PER CLASSI : comporta una perdita di informazione e le informazioni sono meno precise.

INDICI DI POSIZIONE

sono indici che sintetizzano in un valore o modalità l’insieme dei dati, a seconda che la variabile considerata sia qualitativa o quantitativa. MEDIE 1- Di posizione : quando non utilizzo operazioni algebriche (variabili qualitative) 2- Analitiche : sono ottenute mediante operazioni algebriche (variabili quantitative) la media di una variabile qualitativa dovrà necessariamente coincidere con una delle modalità assunte dalla variabile, mentre nel caso di una variabile quantitativa la media sarà sempre interna al suo campo di variazione.  MODA: modalità o valore che si presenta con la massima frequenza

𝑀𝑥 = arg max 𝑛𝑗

ovvero Mx è la determinazione della variabile a cui è associata la frequenza massima Se la distribuzione è espressa mediante le frequenze relative, anziché mediante le frequenze assolute, la moda coincide ovviamente con la determinazione della X per

la quale risulta  𝑀𝑥 = arg max 𝑓𝑗

Nell’analisi statistica dei dati relativi a una variabile X è importante conoscere il numero di unità che manifestano una particolare determinazione della variabile per ciascuna delle possibili determinazioni distinte. In genere è invece del tutto irrilevante sapere su quali unità è stata rilevata una specifica determinazione.

Il simbolo np rappresenta quindi la parte intera superiore di np per cui np  np < np 1. Sono frequentemente utilizzati i quantili x0.25, x0.5 e x0.75 che, per la loro importanza nella descrizione delle caratteristiche della variabile X, hanno un nome particolare e vengono detti quartili.

 MEDIANA  (X0.5) indica quel particolare valore della variabile tale che

almeno la metà delle unità presenta un valore minore o uguale a x0.5 e almeno la metà delle unità presenta un valore maggiore o uguale a x0.5. Altri quantili di uso frequente sono i nove decili x0.1, x0.2, ..., x0.9 e i novantanove centili x0.01, x0.02, ..., x0.99. In questi casi la mediana corrisponde al quinto decile o al cinquantesimo centile.  In una distribuzione di frequenza il quantile di ordine p della variabile quantitativa X corrisponde al valore cj a cui è associata la prima frequenza assoluta cumulata Nj maggiore o uguale a np. Invece, nella distribuzione per classi: ci limitiamo solo a trovare la classe mediana  classe mediana : classe al cui interno è contenuta la mediana. LA MEDIA (per la variabile quantitativa) LA MEDIA: La media aritmetica (o semplicemente media) è una media di tipo analitico, in quanto la sua determinazione richiede operazioni di tipo algebrico sui valori assunti dalla variabile, per cui può essere calcolata esclusivamente per variabili di tipo quantitativo (sia discrete, sia continue). Date n osservazioni di una variabile quantitativa X, la media 𝑥̅ è uguale alla somma di tutti i valori divisa per n.

Utilizzando l’operatore sommatoria, la formula di calcolo della media risulta x ̅ =∑ j = l n Xj n MEDIA: se ho una distribuzione per classi  devo calcolare il valore centrale è solo un’approssimazione della media, ovvero non posso trovare in modo reciso la media. LA MEDIA ARITMETICA PONDERATA: una media dove ogni singolo valore contribuisce alla determinazione dell’ammontare complessivo in maniera proporzionale a un qualche ‘’peso’’ associato al valore stesso Un esempio tipico di media ponderata si presenta quando si vuole calcolare il voto medio ottenuto negli esami di profitto di un corso universitario quando ai diversi esami è attribuito un numero di crediti (CFU) variabile. In questo caso la media dei voti deve tenere conto di questa informazione che “pesa” l’importanza di ciascuno degli esami superati. **PROPRIETA’ DELLA MEDIA ARITMETICA

  1. PRIMA PROPRIETA’ (proprietà di internalità):** la media è sempre interna al campo di variazione

- Campo di variazione: [X(1), X(n)] X(1) ≤ 𝑥̅ ≤ X(n) 2) SECONDA PROPRIETA’: l’ammontare di una variabile quantitative X rilevata su n unità corrisponde a n volte il valore della media, ossia ∑ j = l n Xj = n x ̅ Una conseguenza immediata della precedente relazione è che la somma degli scarti della media è zero (0), ovvero (^) ∑ j = l n ( xix ̅ )= 0 3) TERZA PROPRIETA’: La somma dei quadrati degli scarti delle osservazioni dalla media è un minimo.