STATISTICA QUANTO BASTA

I fondamenti logico-probabilistici della statistica. Strumenti statistici: sintesi, analisi delle relazioni,

inferenza.

L’analisi dei dati è propedeutica a qualsiasi ragionamento per esporre o trattare argomenti. La statistica è

una scienza al servizio di altre scienze sperimentali: analisi di fenomeni sociali, politici che non possono fare

a meno della statistica che studia i dati e li tramuta nel completamento dell’elaborazione dei fenomeni. I

dati servono ad una documentazione per conoscere la nascita di un fenomeno, quali sono le possibili

elaborazioni del fenomeno e le possibili rappresentazioni. Esempio: l’andamento del percorso universitario,

i voti sono una sintesi del nostro percorso; sono variabili, un insieme di dati interessanti perché devono

variare e assumere modalità differenti.

Dunque, sintetizzare e variabilità sono due concetti chiave. Almeno due variabili devono essere diverse con

modalità differenti. Questa è la parte descrittiva monovariata, analizzata da un carattere per volta; inoltre,

analizza la relazione tra variabili, due caratteri che si pongono insieme attraverso l’associazione.

In assenza di dati molto ampi, in assenza di avere tutto, si lavora per campione con un lavoro parziale di

dati. Il campione è lo strumento di cui si serve la statistica che sarebbe l’inferenza. Il campione è costruito

secondo certe modalità, come su una famiglia specifica, e su questa base l'ISTAT elabora un censimento. Il

campione è una relazione parziale per poterli inferire: attraverso strumenti rigorosi, devo riferire all'insieme

della moltitudine di oggetti che si vanno a raggiungere. In questo caso si tratta della statistica inferenziale.

Altro esempio, la previsione andamento PIL 2023: le informazioni sul futuro andamento sono incerte,

perché non sappiamo quale sarà realmente l’andamento nel coso dell’anno. L’analisi deve avvenire con lo

studio dell’andamento di un certo valore che ci si aspetta e che rimanga stabile. Si tratta dell’andamento

stimato.

Controllo delle ipotesi: si lavora in senso previsivo, servendoci di previsioni che possono essere poco

fondate se do ragione alla mia fantasia; devo raccogliere delle informazioni che devo trasformare in dati

statistici e poi devono essere elaborati su uno o più caratteri statistici che stanno in una relazione causale.

(Alla fine del corso, potremmo avere un voto elevato più alto di chi non frequenta: metto in relazione

causale chi ha avuto l’approccio con chi invece no).

Quando faccio delle stime o previsioni, faccio delle ipotesi su benefici e prestazioni. Ho deciso di fare il

corso prima; faccio un’ipotesi previsionale stimata con una logica che non è una matematica, ma è una

logica probabilistica. Mi servo degli strumenti del calcolo della probabilità, di cui non ho i dati su tutto.

La popolazione è l'insieme di tutte le unità oggetto di studio, che non sono solo persone, possono essere

oggetti, enti. Sono unità statistiche a cui sono interessata, ma non è detto che ne posso avere tutte le

informazioni. N rappresenta la dimensione della popolazione. Il parametro è una caratteristica specifica

della popolazione: sono valori calcolati usando i dati sulla popolazione.

Il campione è il sottoinsieme delle unità osservate nella popolazione. N rappresenta la dimensione del

campione. Dal campione andrò a inferire nella popolazione, con una probabilità di incorrere ad un errore.

Sui dati che ho analizzato posso attribuire solo su quel campione a tutta la popolazione. Sono concezioni ed

operazioni di probabilità, lavorando alla stima di parametri e ipotesi raccolti su un campione che hanno

interesse rispetto alla popolazione e non solo al campione. Se non ho le risorse, come quelle temporali, non

posso indagare su tutta la popolazione. La statistica è una caratteristica specifica del campione: i valori

calcolati usando i dati campionari.

La popolazione sono: tutti i potenziali votanti nelle prossime elezioni; tutti i pezzi prodotti oggi; tutti gli

scontrini di novembre. Il campione è: 1000 votanti selezionati a caso (dato osservato su un caso) per

un’intervista; alcuni pezzi selezionati per un test di distruzione; scontrini selezionati a caso per una verifica.

Controllo di qualità dei prodotti: faccio un controllo a campione su determinati pezzi, quindi un campione

sulla popolazione (gli oggetti prodotti).

PROGRAMMA STATISTICA MULTIVARIATA, Appunti di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica PROGRAMMA STATISTICA MULTIVARIATA e più Appunti in PDF di Statistica solo su Docsity!

STATISTICA QUANTO BASTA

N

I dati di base

Analisi fattoriale