Name: Statistica e Probabilità: Tipi di Variabili e Correlazione, Appunti di Statistica
Rating: 5.0 (1 reviews)

STATISTICA
La statistica è la formalizzazione matematica del metodo scientifico: in particolare sviluppa 
metodi e modelli per lo studio quantitativo e qualitativo dei fenomeni; una volta ottenuto il 
problema concettuale, lo faccio diventare matematico. Si distinguono più aree disciplinari: 
Area matematica: si studiano le proprietà matematiche di un oggetto;
Metodologica: si sviluppa un metodo o modello per un tipo di problema;
Computazionale: implemento un algoritmo che risolva il problema;
Applicativa: applico soluzioni al problema tramite un modello statistico.
Queste aree sono legate al calcolo della probabilità, al data mining e al machine learning: 
quando si applicano queste tecniche di analisi dei dati si fa statistica, ma non viceversa. 
Questo perché: 
La statistica studia un fenomeno e lo risolve attraverso correlazioni, raccolta di dati, 
partendo da un’ipotesi iniziale che utilizzerò in fase applicativa;
Il data mining nasce in ambito computazionale, in quanto analizzo i dati e lo studio 
finché non trovo nuove regolarità, senza un modello di riferimento; il problema oggi 
è che i dati sono molteplici, quindi la raccolta ha senso solo se si tratta di big data;
Il machine learning nasce dall’intelligenza artificiale, costruendo un modello in grado 
di imparare dai dati stessi per l’apprendimento e la capacità di prendere decisioni, ad 
esempio nei giochi.
INTRODUZIONE
La scienza statistica è comunemente suddivisa in due branche principali:
statistica descrittiva;
statistica inferenziale.
La statistica descrittiva ha come scopo quello di sintetizzare i dati attraverso i suoi strumenti 
grafici (diagrammi a barre, a torta, istogrammi) e indici (indicatori statistici, indicatori di 
posizione come la media, di variazione come la varianza, ecc.) che descrivono gli aspetti 
salienti dei dati osservati, formando così il contenuto statistico.
La statistica inferenziale ha come obiettivo, invece, quello di stabilire delle caratteristiche dei
dati e dei comportamenti delle misure rilevate (variabili statistiche) con una possibilità di 
errore predeterminata. Le inferenze possono riguardare la natura teorica del fenomeno che si 
osserva. La conoscenza di questa natura permetterà poi di fare una previsione (si pensi, ad 
esempio, che quando si dice che "l'inflazione il prossimo anno avrà una certa entità" deriva 
dal fatto che esiste un modello dell'andamento dell'inflazione derivato da tecniche 
inferenziali). La statistica inferenziale è fortemente legata alla teoria della probabilità. Sotto 
questo punto di vista descrivere in termini probabilistici o statistici un fenomeno aleatorio 
nel tempo, caratterizzabile dunque da una variabile aleatoria, vuol dire descriverlo in termini 
di densità di distribuzione di probabilità e dei suoi parametri di media o valore atteso e 
varianza. La statistica inferenziale si suddivide poi in altri capitoli, di cui i più importanti 
sono la teoria della stima (stima puntuale e stima intervallare) e la verifica delle ipotesi.