Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Dati e Informazione in Informatica: Conoscenza, Database e Business Intelligence, Appunti di Elementi di Informatica

I concetti base di dati, informazione e conoscenza in informatica. Esplora la relazione tra dati e informazione, il ruolo della conoscenza, la gestione dei dati coerenti attraverso le transazioni e la consistenza. Inoltre, introduce il concetto di data warehouse e business intelligence, che consentono di estrarre informazioni utili per supportare le decisioni aziendali.

Tipologia: Appunti

2018/2019

Caricato il 28/03/2019

chiara-nembrini-1
chiara-nembrini-1 🇮🇹

4 documenti

1 / 4

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
INFORMATICA PT4
Il dato è l’unità elementare (grezza) di informazione.
L’informazione è l’elaborazione dei dati per rispondere a esigenze specifiche.
Presentare l’informazione vuol dire valorizzare il senso e il significato di quello che esprime. La conoscenza
è l’utilizzo dell’informazione come elemento di comprensione dei dati raccolti, analizzati e lavorati.
L’informazione esiste, quindi, perché è sostanziata dai dati. Senza dati non avremmo informazione e avere
informazione significa gestire una conoscenza tale da permettere attività di analisi, gestione, coordinamento.
I dati, e la conseguente conoscenza, ovvero l’applicazione dell’informazione, sono il fulcro di qualsiasi
organizzazione in qualsiasi ambito.
Dati.
Un dato “è una descrizione elementare, spesso codificata, di un'entità, di un fenomeno, di una
transazione, di un avvenimento o di altro. I dati possono presentarsi sotto diverse forme: numeri e
lettere dell'alfabeto (testo), immagini statiche, immagini in movimento (video), suono (audio) ed
altri”. I dati sono fatti oggettivi, segnali, numeri, ma, da soli, significano poco o nulla.
Informazioni.
Un'informazione è il risultato dell’elaborazione - contestualizzazione, categorizzazione,
elaborazione, sintesi - di più dati.
Conoscenza.
La conoscenza è il risultato della correlazione fra informazioni e del loro inserimento in quello che è
l’impianto esperienziale e cognitivo di un individuo.
Saggezza.
La saggezza - immateriale e intangibile - è il giudizio, la capacità di aggiungere valore ed è unica e
personale.
L’informazione viene trattata e assume valore nei processi e nelle attività di qualsiasi organizzazione e non
esiste processo o procedura che non tratti dati e di conseguenza informazioni. L’analisi dei flussi e dei
processi in qualsiasi ambito permette di individuare e registrare le informazioni che assumono di volta in
volta valore e rilevanza a ogni passaggio. L’analisi delle informazioni registrate permette alle organizzazioni
di controllare e misurare le attività, prendere decisioni, migliorare i propri processi, il proprio business e la
propria missione. L’informatica ha avuto fin dall’inizio l’esigenza di creare strutture e modelli che
facilitassero la raccolta dei dati e la loro ricerca. Nascono così le “basi dati” e un Database è proprio un
insieme di informazioni catalogate e organizzate.
Per la progettazione ad alto livello di un database è largamente diffuso l'uso del modello “entità e
relazioni” (in inglese Entity-Relationship). Questo modello consente di tradurre i risulti dell'analisi dei dati di
un contesto applicativo in uno schema concettuale con associabile una rappresentazione grafica
comprensibile anche da parte di non specialisti di database. Il modello si basa sull'identificazione delle classi
di elementi chiamate appunto entità. Dove ogni classe rappresenta l'insieme di elementi che presentano una
serie di tipi di dati in comune, dove ogni singolo elemento della classe avrà i propri dati. Ogni singola
occorrenza, che rappresenta ogni singolo lavoratore conterrà poi i dati che a lui si riferiscono. In un contesto
applicativo le entità sono fra loro in relazione, nel senso che ogni occorrenza della prima può essere associata
ad una o più occorrenze della seconda.
A partire da un modello entità e relazioni, gli specialisti di database procedono alla stesura dello schema
logico dettagliato, secondo il modello di database adottato e da questi allo schema fisico che precisa i
supporti di memoria di massa dove le diverse occorrenze delle entità e delle relazioni devono essere inseriti.
Lo schema logico e quello fisico vengono quindi inseriti nel prodotto che gestirà poi le operazioni sui dati
contenuti nel database e che prende il nome di DBMS. DBMS è infatti l’acronimo di Data Base Management
System, e il DBMS è il software che permette di creare e gestire un database.
Insieme ai database nasceva il problema di gestire dei dati coerenti e correlati durante la loro registrazione e
il loro trattamento. La transazione entrava nel glossario della gestione dei dati. Una transazione sul database,
si intende quando o tutte le operazioni vanno a buon fine e aggiornano i dati o tutte le operazioni vengono
rigettate e non modificano o inseriscono dati nel database.
pf3
pf4

Anteprima parziale del testo

Scarica Dati e Informazione in Informatica: Conoscenza, Database e Business Intelligence e più Appunti in PDF di Elementi di Informatica solo su Docsity!

INFORMATICA PT

Il dato è l’unità elementare (grezza) di informazione. L’informazione è l’elaborazione dei dati per rispondere a esigenze specifiche. Presentare l’informazione vuol dire valorizzare il senso e il significato di quello che esprime. La conoscenza è l’utilizzo dell’informazione come elemento di comprensione dei dati raccolti, analizzati e lavorati. L’informazione esiste, quindi, perché è sostanziata dai dati. Senza dati non avremmo informazione e avere informazione significa gestire una conoscenza tale da permettere attività di analisi, gestione, coordinamento. I dati, e la conseguente conoscenza, ovvero l’applicazione dell’informazione, sono il fulcro di qualsiasi organizzazione in qualsiasi ambito.

  • Dati. Un dato “è una descrizione elementare, spesso codificata, di un'entità, di un fenomeno, di una transazione, di un avvenimento o di altro. I dati possono presentarsi sotto diverse forme: numeri e lettere dell'alfabeto (testo), immagini statiche, immagini in movimento (video), suono (audio) ed altri”. I dati sono fatti oggettivi, segnali, numeri, ma, da soli, significano poco o nulla.
  • Informazioni. Un'informazione è il risultato dell’elaborazione - contestualizzazione, categorizzazione, elaborazione, sintesi - di più dati.
  • Conoscenza. La conoscenza è il risultato della correlazione fra informazioni e del loro inserimento in quello che è l’impianto esperienziale e cognitivo di un individuo.
  • Saggezza. La saggezza - immateriale e intangibile - è il giudizio, la capacità di aggiungere valore ed è unica e personale. L’informazione viene trattata e assume valore nei processi e nelle attività di qualsiasi organizzazione e non esiste processo o procedura che non tratti dati e di conseguenza informazioni. L’analisi dei flussi e dei processi in qualsiasi ambito permette di individuare e registrare le informazioni che assumono di volta in volta valore e rilevanza a ogni passaggio. L’analisi delle informazioni registrate permette alle organizzazioni di controllare e misurare le attività, prendere decisioni, migliorare i propri processi, il proprio business e la propria missione. L’informatica ha avuto fin dall’inizio l’esigenza di creare strutture e modelli che facilitassero la raccolta dei dati e la loro ricerca. Nascono così le “basi dati” e un Database è proprio un insieme di informazioni catalogate e organizzate. Per la progettazione ad alto livello di un database è largamente diffuso l'uso del modello “entità e relazioni” (in inglese Entity-Relationship). Questo modello consente di tradurre i risulti dell'analisi dei dati di un contesto applicativo in uno schema concettuale con associabile una rappresentazione grafica comprensibile anche da parte di non specialisti di database. Il modello si basa sull'identificazione delle classi di elementi chiamate appunto entità. Dove ogni classe rappresenta l'insieme di elementi che presentano una serie di tipi di dati in comune, dove ogni singolo elemento della classe avrà i propri dati. Ogni singola occorrenza, che rappresenta ogni singolo lavoratore conterrà poi i dati che a lui si riferiscono. In un contesto applicativo le entità sono fra loro in relazione, nel senso che ogni occorrenza della prima può essere associata ad una o più occorrenze della seconda.

A partire da un modello entità e relazioni, gli specialisti di database procedono alla stesura dello schema logico dettagliato, secondo il modello di database adottato e da questi allo schema fisico che precisa i supporti di memoria di massa dove le diverse occorrenze delle entità e delle relazioni devono essere inseriti. Lo schema logico e quello fisico vengono quindi inseriti nel prodotto che gestirà poi le operazioni sui dati contenuti nel database e che prende il nome di DBMS. DBMS è infatti l’acronimo di Data Base Management System, e il DBMS è il software che permette di creare e gestire un database. Insieme ai database nasceva il problema di gestire dei dati coerenti e correlati durante la loro registrazione e il loro trattamento. La transazione entrava nel glossario della gestione dei dati. Una transazione sul database, si intende quando o tutte le operazioni vanno a buon fine e aggiornano i dati o tutte le operazioni vengono rigettate e non modificano o inseriscono dati nel database.

L’acronimo ACID (Atomicità, Consistenza, Isolamento, Durabilità) esprime proprio i concetti associati alla gestione coerente delle transazioni:

  • Atomicità: la transazione è indivisibile nella sua esecuzione, e la sua esecuzione deve essere o totale o nulla, non sono ammesse esecuzioni intermedie. Tecnicamente si parla di COMMIT in caso di transazione totale coerente o ROLLBACK in caso di transazione non coerente, con dati da ripristinare per rispettare il concetto di Consistenza.
  • Consistenza: quando inizia una transazione il database si trova in uno stato coerente e quando la transazione termina il database deve essere in uno stato coerente, ovvero non deve violare eventuali vincoli di integrità, quindi non devono verificarsi contraddizioni tra i dati archiviati nella base dati, da cui la necessità del concetto di Atomicità.
  • Isolamento: ogni transazione deve essere eseguita in modo isolato e indipendente dalle altre; l'eventuale fallimento di una transazione non deve interferire con altre transazioni in esecuzione.
  • Durabilità: persistenza; i cambiamenti apportati non dovranno essere più persi. Il termine Data Warehouse è stato introdotto per indicare l’insieme di strutture dati e di tool necessari per estrarre, dai dati operazionali dell’azienda e da dati esterni, informazioni utili per supportare i manager nella valutazione tecnico-economica dell’andamento aziendale e nella presa di decisioni. Si è definito come una raccolta di dati di supporto ai processi decisionali:
  • Integrata L’integrazione della raccolta dati è un aspetto essenziale di un DWH. Vi confluiscono dati ed informazioni provenienti da diverse procedure aziendali e da fonti esterne.
  • Orientata all’oggetto Il DWH è orientato a temi specifici aziendali.
  • Variante nel tempo Ha un contenuto storico ampio. I dati una volta raccolti non vengono modificati da eventuali successive transazioni. Il tempo è parte delle chiavi.
  • Non-volatile I dati non vengono mai rimossi. Il data warehouse può solo crescere con il tempo. La business intelligence raggruppa un insieme di pratiche capaci di estrarre poche e significative informazioni da un grande insieme di dati, e di presentarle in maniera immediatamente comprensibile per chi deve prendere decisioni. Esistono strumenti molto sofisticati per l’analisi dei dati, ma la cosa più importante sono i ragionamenti per definire e capire quali sono gli indicatori di cui abbiamo bisogno per prendere decisioni per comprendere quali possono essere i dati di ingresso da cui si estraggono le informazioni. Con business intelligence (BI) ci si riferisce quindi:
  1. ai processi aziendali per la raccolta e l’analisi delle informazioni importanti e strategiche,
  2. alla tecnologia utilizzata per realizzare questi processi,
  3. alle informazioni ottenute come risultato di questi processi. Le organizzazioni raccolgono informazioni per effettuare valutazioni e stime sul proprio contesto aziendale e di mercato. I dati raccolti sono elaborati e utilizzati per supportare concretamente le decisioni di chi occupa ruoli direzionali. In secondo luogo le informazioni possono essere analizzate a differenti livelli di dettaglio e gerarchici per le necessità di ogni altra funzione aziendale. Il software utilizzato nella business intelligence ha l’obiettivo di permettere alle persone di prendere decisioni strategiche fornendo informazioni precise, aggiornate e significative nel contesto di riferimento. I sistemi di business intelligence sono chiamati anche sistemi per il supporto alle decisioni. Le tecniche di business intelligence possono presentare informazioni di sintesi utilizzando il cosiddetto cruscotto (dashboard), uno strumento indispensabile per guidare l’analisi, in grado di separare indicatori indispensabili dai dati consultabili per pianificare le prossime azioni. I cruscotti sono interfacce che accelerano i processi decisionali presentando in modo sintetico le informazioni più importanti in termini di business intelligence. Le informazioni sono sintetizzate con indicatori di performance associati a criteri operativi, tattici e strategici di una organizzazione. Il data mart (deposito di dati) indica un sotto-insieme contenente i dati per un particolare settore (dipartimento, direzione, servizio, gamma prodotto, ecc.). Il data mining (estrazione dei dati) permette l'estrazione di un sapere o di una conoscenza a partire da grandi quantità di dati e l'utilizzazione operativa di questo sapere. Il data mining ha una duplice funzione: ▪ Estrazione, con tecniche analitiche d'avanguardia, di informazione implicita, nascosta, da dati già strutturati, per renderla disponibile e direttamente utilizzabile. ▪ Esplorazione e analisi, su grandi quantità di dati, allo scopo di scoprire pattern significativi.

interrogazioni in tempo reale e la restituzione dei risultati necessitano di tecnologie, architetture e applicazioni ottimizzate e dedicate. Per Veridicità si intende la qualità dei dati intesa come il valore informativo che se ne può estrarre. La Veridicità è un valore. Tutti i dati raccolti costituiscono un valore per un’azienda. È dall’analisi che si colgono le opportunità e supporto ai processi decisionali. Tuttavia un grande volume di dati non garantisce da solo la qualità dei dati. Bisogna essere sicuri della loro affidabilità. Ciò che non si percepisce, invece, è il fatto che connettendo queste singole miniere si ottiene un insieme che è molto di più della somma dei singoli data set. Un insieme reticolare che ci può fornire non solo le risposte a vecchie domande, ma che può far emergere domande nuove di particolare importanza strategica. Le analisi di business sono un sistema evoluto di data processing che permette di acquisire una visione accurata della situazione attuale, di individuare scenari futuri e di favorire e suggerire decisioni efficaci e risultati tangibili. Le analisi possono essere di tipo descrittivo, diagnostico, predittivo, prescrittivo e preventivo.

  • L’analisi descrittiva rappresenta quello che accade e presenta informazioni servendosi di strumenti di Business Intelligence. Si occupa di analizzare gli eventi passati, per riassumere e chiarire le dinamiche e le performance delle metriche di interesse e ricavarne indicazioni su come approcciarsi alle prossime attività. • L’analisi diagnostica individua le cause che hanno portato alla situazione attuale.
  • L’analisi predittiva è la previsione di ciò che accadrà nel futuro. Permette di migliorare la comprensione del business, contribuendo a prevedere il comportamento degli utenti e le performance dell’organizzazione.
  • L’analisi prescrittiva si spinge oltre la previsione dei risultati futuri e fornisce raccomandazioni in maniera automatica sulle azioni da intraprendere.
  • Per ultima, l’analisi preventiva indaga le ulteriori azioni da intraprendere per evitare risultati negativi, come per esempio la perdita di fidelizzazione da parte dei clienti. Gli Open Data sono dati che possono essere liberamente utilizzati, riutilizzati e ridistribuiti, con la sola limitazione, al massimo, della richiesta di attribuzione dell’autore e della ridistribuzione senza che vengano effettuate modifiche. Le regole e le definizioni per gli Open Data sono: ▪ Disponibilità e accesso: i dati devono essere distribuiti nel loro insieme e in un formato utile e modificabile. ▪ Riutilizzo e ridistribuzione: i dati devono essere forniti a condizioni tali da permetterne il riutilizzo e la ridistribuzione; ciò comprende la possibilità di combinarli con altre basi dati. ▪ Partecipazione universale: tutti devono essere in grado di usare, riutilizzare e ridistribuire i dati. ▪ Completezza: i dati devono comprendere tutte le componenti (metadati) che consentano di esportarli ed utilizzarli online e offline. ▪ Primarietà: debbono essere raccolti alla fonte, in forme non aggregate (ovvero devono essere disponibili in forma granulare) né modificate. ▪ Tempestività: devono essere accessibili in modo rapido ed immediato. ▪ Accessibilità: devono essere disponibili attraverso protocolli standard (HTTP) e senza richiesta di alcuna sottoscrizione di contratto. ▪ Leggibili da computer: devono essere processabili in automatico da computer. ▪ In formati non proprietari: devono essere disponibili in formati aperti e pubblici. ▪ Liberi da licenze che ne limitino l’uso, la diffusione o la retribuzione. ▪ Ricercabilità: deve essere assicurata agli utenti l’opportunità di ricercare con facilità e immediatezza dati e informazioni di proprio interesse, mediante strumenti di ricerca ad hoc. ▪ Permanenti: le caratteristiche elencate devono perdurare per l’intero ciclo di vita del dato. L’Open Government si basa sul principio per il quale tutte le attività dei governi e delle amministrazioni dello Stato devono essere aperte e disponibili per favorire azioni efficaci e garantire il controllo diffuso sulla gestione della cosa pubblica: ▪ Trasparenza: le informazioni devono essere facilmente reperibili. ▪ Partecipazione: coinvolgimento attivo dei cittadini nei processi decisionali. ▪ Collaborazione: le istituzioni non si intendono più come strutture a sé stanti ma inserite in una rete collaborativa. Una Open Data Company, è un’impresa che pubblica open data, o collabora a renderli disponibili o crea servizi basati su di essi.