Calcoli statistici: medie, varianza, scostamento, mediana, densità, devianza, tabella | Appunti di Statistica

Lezione 1

Introduzione: Il termine “Statistica” deriva da “Stato”: all’inizio la Statistica riguardava la raccolta di dati relativi

allo Stato (numerosità della popolazione, numero di cannoni, quantità di raccolta di grano ecc.). Esistono molte

definizioni formali di statistica ma gli ingredienti essenziali sono i dati e l’uso di strumenti di analisi di tipo

quantitativo. La statistica è la disciplina che si occupa di fenomeni, riferibili ad individui (unità, elementi) in

quanto appartenenti a fissate popolazioni (insiemi, aggregati, ecc.) che possono manifestarsi con modalità diverse

da individuo a individuo e che sono collegati (o possono essere collegati) a fenomeni oggetti di specifiche ricerche.

Essa è la disciplina che elabora i principi e le metodologie che presiedono al processo di rilevazione e raccolta dei

dati, alla rappresentazione sintetica e alla interpretazione dei dati stessi e, laddove ve ne siano condizioni, alla

generalizzazione delle evidenze osservate. La ragione della Statistica risiede nella variabilità dei dati: ogni

carattere assume valori diversi nelle unità statistiche. Se il mondo fosse perfettamente prevedibile e non ci fosse

variabilità, non ci sarebbe bisogno della Statistica.

Cenni storici sullo sviluppo della statistica: La formalizzazione matematica della Statistica è relativamente

giovane: il suo sviluppo è avvenuto in gran parte nei secoli XIX e XX; le sue origini come disciplina autonoma

risalgono al XVII secolo, quando in Inghilterra si sviluppò, a opera di John Graunt (1620- 1674) e William Petty

(1623- 1687), un indirizzo di ricerca che prese il nome di Political Arithmetic, caratterizzato dall’uso del metodo

empirico induttivo, proprio delle scienze naturali, nell’investigazione dei fenomeni demografici e sociali. Nel XVIII

e XIX nasce il calcolo delle probabilità. Il suo sviluppo va ascritto a grandi matematici, tra i quali: Pascal, Laplace,

Bernoulli, Gauss. Del calcolo delle probabilità ce ne serviamo per quanto riguardo l’utilizzo dell’inferenza

statistica cioè trarre una conclusione con una determinata probabilità. Essa è arrivata nel 1900, ma si è sviluppata

soprattutto alla fine degli anni 70 con l’utilizzo del computer. Nella prima metà del XX secolo si scoprirono: la

inferenza statistica, il disegno degli esperimenti e il campionamento.

Cosa sono le Statistiche? I dati statistici o, in breve, le Statistiche (percentuali, medie, frequenze di accadimento di

eventi in un intervallo di tempo ecc.) sono le informazioni espresse numericamente e riferite ad un insieme di

unità omogenee detto Insieme di riferimento (persone, oggetti, aziende, situazioni).

Tradizionalmente, si usa suddividere il campo della statistica metodologica in due settori:

Statistica descrittiva: i principi e i metodi della statistica descrittiva riguardano: l’organizzazione,

all’analisi tabellare e grafica, al calcolo di grandezze sintetiche di ciò che si è rinvenuto nella rilevazione.

Essa è anche nota come Analisi esplorativa (Exploratory Data Analysis) proposta soprattutto da J. W.

Tukey nel 1977. Si configura come una trattazione preliminare indispensabile per affrontare uno studio

complesso. Utilizza tecniche elementari, soprattutto grafiche, di grande efficacia nell’aiutare a

comprendere l’esito della rilevazione.

Statistica inferenziale: è l’insieme dei metodi che ci permettono di generalizzare i risultati basati su

un’osservazione parziale del fenomeno d’interesse, come nel caso delle indagini campionarie, dove viene

analizzato un campione casuale estratto da una popolazione reale, o come nel caso degli esperimenti o

degli studi di osservazione, dove il campione casuale è generato dalla ripetizione dell’esperimento o

dell’osservazione sul campo nelle stesse condizioni.

Tipologia di popolazione: La popolazione può essere:

Finita/Reale: se include oggetti che possono essere contati ed il conteggio, ad un certo punto si

interrompe.

Enumerabile: le unità sono contabili, ma il conteggio non si interrompe mai.

Infinita: ogni sottoinsieme di popolazione contiene lo stesso numero di entità contenute nella popolazione.

Indeterminata: l’insieme dei soggetti è finito, in quanto esiste un limite fisico non valicabile alla sua

crescita, ma le unità sono sparse o rare al punto da rendere impossibile il loro materiale censimento.

Unità statistiche: Possono essere: semplice, una persona, un albero, un’automobile, un soldato, e composta, una

famiglia, una foresta, una concessionaria, un reggimento…

A volte la corretta definizione di unità statistica richiede una definizione convenzionale molto dettagliata. Per

famiglia si intende un insieme di persone legate da vincoli di matrimonio, parentela, affinità, adozione, tutela o da

altri vincoli affettivi, coabitanti e aventi dimora abituale nello stesso comune. Una famiglia può essere costituita

anche da una sola persona.

Interessi maturati su di un conto corrente. (Il

conto corrente).

Tipo di riscaldamento di un appartamento.

(L’appartamento).

Numero di testi consigliati in un corso. (Il

corso).

Emissione di gas tossici da un’automobile.

(L’automobile).

Calcoli statistici: medie, varianza, scostamento, mediana, densità, devianza, tabella, Appunti di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica Calcoli statistici: medie, varianza, scostamento, mediana, densità, devianza, tabella e più Appunti in PDF di Statistica solo su Docsity!

Lezione 1

nella lista da 1 a N , la probabilità che un singolo elemento venga selezionato è pari a 1 / N. Le unità statistiche

probabilità di essere estratta, pari a 1 / N. Con questo tipo di campionamento si rischia di avere un’unità estratta

probabilità di essere estratte pari a 1 / N , alla seconda 1 /( n − 1 ) , ....

per arrotondamento. In modo casuale si seleziona un numero r ≤ k. Si definisce campione sistematico l’insieme di

unità contraddistinte dai numeri [ r ,r + k ; r + 2 k ;r + 3 k ; ... ; ( n − 1 ) k ]. ▪ Per procedere ad un campionamento

restanti n − 1 soggetti prendendo un soggetto ogni k.

Lezione 2

dati sono di solito raccolti in forma rettangolare : matrice righe ∗ colonne. Ogni riga della matrice corrisponde ad

f

N

f

N

∗ 100 = f i ∗ 100

N

= n

+n

+…+n

i= 1, 2,…, k

h

frequenza della classe

ampiezza della classe

di

Lezione 3

C

={ u : X ( u ) ≤ x } ,

x

− 1 x < x

Ora sveglia

Arrivo a lezione in orario

rappresenta l’intero fenomeno ed i componenti (fette, spicchi) sono rappresentati dai settori. Gli angoli ( α )

α : 360 = x %: 100.

A

B

Lezione 4

xi = x 1 + x 2 + … + xn

( Xi + Yi )=

Xi +

Yi

aXi = a

Xi

a = na

( a + Xi )= na + ¿

Xi ¿

xi

N

x 1 + x 2 + … + xn

N

( xi − μ ) si può scrivere come:

xi −¿

μ ¿. Per un’altra proprietà della sommatoria si ha:

xi −¿ Nμ ¿, infine, sostituendo a μ la sua formula

xi −¿ N

xi

N

( xi − c )

( xi − μ )−( c − μ )

( xi − μ )

( c − μ )

( xi − μ ) ( c − μ ).

( c − μ )

( xi − μ ) ( c − μ )=¿ ( c − μ )

( xi − μ )= 0 ¿. Possiamo scrivere

( xi − c )

( xi − μ )

+ N ( c-μ )

( xi − μ )

13.240 × 5 +13.600 × 3

da zero, è data dal rapporto tra N e la somma dei reciproci dei termini. μ

N

x 1

x 2

xn

N

xi

N