DATA ANALYTICS

DATA ANALYTICS

INTRODUZIONE AGLI ALGORITMI

Progettazione di algoritmi

Il concetto di algoritmo è un procedimento per la risoluzione di un problema utilizzando un numero finito

di istruzioni. La prima cosa su cui ci concentriamo è che quando definiamo un algoritmo lo facciamo per

risolvere un problema. I due aspetti fondamentali nella progettazione di un algoritmo:

- Correttezza: dato un certo insieme di dati in input, l’algoritmo deve fornire sempre la soluzione corretta.

- Efficienza: riguarda la velocità di un algoritmo di risolvere un certo problema.

La progettazione di algoritmi è utilizzata per diversi problemi fondamentali di analisi di dati:

- Ordinamento dei dati: operazione di base

- Calcolo di distanza tra elementi

- Calcolo della rilevanza: PageRank - algoritmo di Google per ordinare i risultati delle proprie ricerche

- Algoritmi di suggerimento

Scienza dei dati

La disciplina che si occupa dell’analisi dei dati viene chiamata “scienza dei dati”. è diventata importante

perché la produzione di dati negli ultimi vent’anni è cresciuta sempre di più, diventando importante la

descrizione di questi dati per descrivere le persone, interessi delle persone, per scopi commerciali. Si parla

infatti di “era dei dati”.

Chi produce i dati? Gli individui quando navigano in rete in quanto esistono diversi dispositivi che tengono

traccia dei nostri movimenti; dati che vengono ricavati dai sensori, tipo le temperature, o di macchinari. I

dati che riguardano gli esseri umani e quelli dei sensori crescono di più di quelli degli altri.

Era dei dati

Quando parliamo di analisi dei dati bisogna tener conto di alcuni fattori che hanno portato alla crescita dei

dati:

- Diffusione delle tecnologie che permettono di raccogliere i dati: questo permette di avere un certo

insieme di dati, sono in se importanti ma hanno la necessità di essere analizzati.

- Crescita delle capacità di computazione: si riesce a studiare i dati in maniera sempre più efficiente

l’analisi, questo riguarda quindi i dispositivi.

- Applicazioni efficaci nell’analisi: si diffondono tecniche di analisi dei dati innovative e che permettono

di analizzare e riuscire ad ottenere informazioni utili. Molte di queste tecniche sono di apprendimento,

se io ho pochi dati apprendo meno se ne ho di più la capacità di apprendere cresce, ecco perché queste

tecniche sono negli ultimi anni sempre più utili.

Utilizzo dei dati

Per dato si intende ciò che è immediatamente presente alla conoscenza, prima di ogni elaborazione (in

informatica) elementi di informazione costituiti da simboli che debbono essere elaborati.

Mentre per informazione si intende notizia, dato o elemento che consente di avere conoscenza più o meno

esatta di fatti, situazioni, modi di essere.

Partendo dai dati, devo applicare degli algoritmi e delle tecniche di analisi per riuscire a estrarre

informazione e creare conoscenza. Questa analisi permette di arrivare agli obbiettivi che sono:

- Proprietà

DATA ANALYTICS - Appunti completi delle lezioni, Dispense di Probabilità e Statistica