Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Sistemi Informativi Aziendali: Data Warehouse, Big Data e Data Mining, Appunti di Informatica gestionale

Una panoramica completa dei sistemi informativi aziendali, con particolare attenzione a data warehouse, big data e data mining. Le strutture dati a supporto delle applicazioni analitiche (olap), le sfide e le opportunità legate alla gestione dei big data, e le tecniche di data mining per estrarre conoscenza dai dati. Vengono inoltre analizzati i sistemi informativi per livello operativo, i sistemi erp e i sistemi crm, fornendo una visione completa dell'utilizzo dei sistemi informativi in ambito aziendale.

Tipologia: Appunti

2020/2021

Caricato il 03/12/2024

mario-giovanni-1
mario-giovanni-1 🇮🇹

3 documenti

1 / 6

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
INFORMATICA COMPLETAMENTO!
DATA WAREHOUSE
Le strutture dati a supporto delle applicazioni analitiche (On Line Analytical Processing - OLAP)
sono di norma separate da quelle di supporto ai sistemi transazionali (OLTP). Queste strutture dati
sono indicate con il nome di Data Warehouse.!
Vantaggi della separazione degli ambiti:!
-integrazione!
-qualità !
-ecienza!
-estensione!
La progettazione di un data warehouse si basa su un modello di rappresentazione dei dati di tipo
multidimensionale, in grado di assicurare un duplice vantaggio:!
-sul piano logico, le dimensioni corrispondono in modo naturale ai criteri di analisi utilizzati dai
decision maker;!
-sul piano funzionale, riesce a garantire tempi di risposta piuttosto bassi a fronte di interrogazioni
anche molto complesse.!
Tale rappresentazione fa riferimento a schemi logici detti, nella loro forma più semplice, schemi a
stella, che contengono due tipi di informazioni: dimensioni e fatti.Un data warehouse è realizzato a
partire dalle fonti interne ed esterne mediante un insieme di strumenti, detti ETL (Extract,
Transform, Load), che eettuano le seguenti operazioni: estrazione,trasformazione e caricamento.!
Questa tipologia di analisi è nota con il nome di analisi multidimensionale o analisi OLAP ed è
supportata da specifici strumenti applicativi detti cubi OLAP. gli strumenti OLAP consentono di
realizzare un reporting dinamico sui dati grazie ad una serie di operazioni, dette operazioni OLAP,
consistenti in:!
rotazioni del cubo di dati (pivoting);!
compressione ed espansione dei dati (rolling up & down);!
riduzione di dimensioni (slicing);!
fissazione di intervalli sulle dimensioni (dicing)!
BIG DATA"
Con il termine ‘big data’ ci si riferisce all’enorme volume di dati. Sono analizzabili tramite la
definizione delle 3V:Volume,Velocità,Varietà;A queste si sono nel tempo aggiunte altre 3V:
veridicità, valore, variabilità. Più una caratteristica fondamentale ovvero la Complessità. Le fonti
dei big data si suddividono in: Streaming Data,Social Media Data e Fonti pubbliche.Dopo aver
identificato le potenziali fonti dei dati è necessario assumere alcune decisioni in merito alla loro
gestione:Come immagazzinare e gestire i dati, Quanti dati analizzare, Come usare le informazioni
ricavate dai dati. Le specificità delineate fanno emergere due direttrici nella gestione dei big data:!
1. utilizzo di strutture dati idonee 2. adozione di approcci analitici innovativi: Approccio
descrittivo, approccio predittivo, approccio prescrittivo!
DATA MINING "
Il data mining integra i sistemi di analisi multi dimensionale in quanto consente di estrarre
conoscenza nascosta dai dati. Con il termine data mining si intende:esplorazione e analisi, per
mezzo di sistemi di apprendimento induttivo, di un insieme di dati generalmente di grandi
dimensioni, per individuare regolarità ed estrarre informazioni e conoscenza utili nei processi
decisionali. Analisi di data mining: classificazione, regressione, cluster analysis e scoperta di
associazioni !
SISTEMI INFORMATIVI AZIENDALI
Con il termine sistema informativo intendiamo: un insieme di dati, strumenti e applicazioni,
processi e persone che permette ad un’impresa di disporre delle informazioni necessarie allo
svolgimento del business!
-sistemi informatici per livello operativo:i sistemi di elaborazione delle transazioni (TPS):!
Un sistema di elaborazione delle transazioni (TPS) è un sistema informativo progettato per
automatizzare le attività ripetitive con l’obiettivo di migliorare l’ecienza dei processi aziendali.I
documenti originali che descrivono una specifica transazione aziendale sono il punto di partenza
(input) del processo di elaborazione, che verifica la disponibilità dei prodotti a magazzino e, in
caso di verifica positiva, ne eettua la ‘prenotazione’, calcola l’ammontare complessivo dell’ordine
e produce una serie di informazioni o documenti (output) per i successivi processi di
impacchettamento, spedizione, fatturazione e per il controllo dell’attività (reporting).I documenti
che costituiscono l’input della transazione possono essere elaborati in tempo reale, nell’istante in
cui sono resi disponibili (elaborazione online) oppure essere raccolti per una elaborazione
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Sistemi Informativi Aziendali: Data Warehouse, Big Data e Data Mining e più Appunti in PDF di Informatica gestionale solo su Docsity!

INFORMATICA COMPLETAMENTO

DATA WAREHOUSE

Le strutture dati a supporto delle applicazioni analitiche (On Line Analytical Processing - OLAP) sono di norma separate da quelle di supporto ai sistemi transazionali (OLTP). Queste strutture dati sono indicate con il nome di Data Warehouse. Vantaggi della separazione degli ambiti: -integrazione -qualità -efficienza -estensione La progettazione di un data warehouse si basa su un modello di rappresentazione dei dati di tipo multidimensionale, in grado di assicurare un duplice vantaggio: -sul piano logico, le dimensioni corrispondono in modo naturale ai criteri di analisi utilizzati dai decision maker; -sul piano funzionale, riesce a garantire tempi di risposta piuttosto bassi a fronte di interrogazioni anche molto complesse. Tale rappresentazione fa riferimento a schemi logici detti, nella loro forma più semplice, schemi a stella, che contengono due tipi di informazioni: dimensioni e fatti.Un data warehouse è realizzato a partire dalle fonti interne ed esterne mediante un insieme di strumenti, detti ETL (Extract, Transform, Load), che effettuano le seguenti operazioni: estrazione,trasformazione e caricamento. Questa tipologia di analisi è nota con il nome di analisi multidimensionale o analisi OLAP ed è supportata da specifici strumenti applicativi detti cubi OLAP. gli strumenti OLAP consentono di realizzare un reporting dinamico sui dati grazie ad una serie di operazioni, dette operazioni OLAP, consistenti in:

  • rotazioni del cubo di dati (pivoting);
  • compressione ed espansione dei dati (rolling up & down);
  • riduzione di dimensioni (slicing);
  • fissazione di intervalli sulle dimensioni (dicing) BIG DATA Con il termine ‘big data’ ci si riferisce all’enorme volume di dati. Sono analizzabili tramite la definizione delle 3V:Volume,Velocità,Varietà;A queste si sono nel tempo aggiunte altre 3V: veridicità, valore, variabilità. Più una caratteristica fondamentale ovvero la Complessità. Le fonti dei big data si suddividono in: Streaming Data,Social Media Data e Fonti pubbliche.Dopo aver identificato le potenziali fonti dei dati è necessario assumere alcune decisioni in merito alla loro gestione:Come immagazzinare e gestire i dati, Quanti dati analizzare, Come usare le informazioni ricavate dai dati. Le specificità delineate fanno emergere due direttrici nella gestione dei big data:
  1. utilizzo di strutture dati idonee 2. adozione di approcci analitici innovativi: Approccio descrittivo, approccio predittivo, approccio prescrittivo DATA MINING Il data mining integra i sistemi di analisi multi dimensionale in quanto consente di estrarre conoscenza nascosta dai dati. Con il termine data mining si intende:esplorazione e analisi, per mezzo di sistemi di apprendimento induttivo, di un insieme di dati generalmente di grandi dimensioni, per individuare regolarità ed estrarre informazioni e conoscenza utili nei processi decisionali. Analisi di data mining: classificazione, regressione, cluster analysis e scoperta di associazioni SISTEMI INFORMATIVI AZIENDALI Con il termine sistema informativo intendiamo: un insieme di dati, strumenti e applicazioni, processi e persone che permette ad un’impresa di disporre delle informazioni necessarie allo svolgimento del business -sistemi informatici per livello operativo:i sistemi di elaborazione delle transazioni (TPS): Un sistema di elaborazione delle transazioni (TPS) è un sistema informativo progettato per automatizzare le attività ripetitive con l’obiettivo di migliorare l’efficienza dei processi aziendali.I documenti originali che descrivono una specifica transazione aziendale sono il punto di partenza (input) del processo di elaborazione, che verifica la disponibilità dei prodotti a magazzino e, in caso di verifica positiva, ne effettua la ‘prenotazione’, calcola l’ammontare complessivo dell’ordine e produce una serie di informazioni o documenti (output) per i successivi processi di impacchettamento, spedizione, fatturazione e per il controllo dell’attività (reporting).I documenti che costituiscono l’input della transazione possono essere elaborati in tempo reale, nell’istante in cui sono resi disponibili (elaborazione online) oppure essere raccolti per una elaborazione

successiva a blocchi (elaborazione batch). L’inserimento dei dati (data entry) in un TPS può essere manuale, semiautomatico o automatico. -Sistemi informativi per il livello tattico: MIS. Un MIS (Management Information System) è un sistema realizzato per fornire informazioni relative ad aspetti interni ed esterni all’azienda, con l’obiettivo di supportare i manager operativi ad assumere decisioni strutturate.L’architettura di un MIS è costituita dalle seguenti componenti. Input: dati provenienti dalle transazioni del sistema TPS, da altri sistemi interni e da richieste specifiche. Elaborazione: aggregazione e riepilogo dei dati. Output: report di formato opportuno con informazioni ricorrenti e non ricorrenti -Sistemi informativi per il livello tattico: DSS. Con il termine DSS (Decision Support System o anche sistemi di Business Intelligence) si indicano i sistemi che aiutano le figure di livello direzionale nell’assumere decisioni in contesti caratterizzati da informazione limitata. L’architettura di un DSS è costituita dalle seguenti componenti. Input: dati provenienti da fonti e sistemi interni, modelli, input manuali. Elaborazione: in prevalenza interattiva, finalizzata alla manipolazione dei dati e alla calibrazione dei modelli per simulazioni, ottimizzazioni e previsioni. Output: visualizzazioni grafiche e testuali. -Sistemi informativi per il livello strategico: EIS. Un sistema progettato per supportare i dirigenti di massimo livello è chiamato EIS (Executive Information System) e ha l’obiettivo di consolidare le informazioni provenienti da fonti interne ed esterne per assistere le decisioni di carattere strategico. Per raggiungere i suoi obiettivi, un EIS è in grado di fornire al decisore sia dati soft, sia dati hard. L’architettura di un EIS è costituita dalle seguenti componenti. Input: dati provenienti da fonti e sistemi interni, dati esterni e richieste di informazioni. Elaborazione: riepilogo e aggregazione dei dati anche in forma grafica. Output: report di riepilogo, analisi di tendenza e simulazioni, analisi di eccezioni e report ad hoc. ORGANIZZAZIONE DEI DATI In un DBMS i dati sono normalmente organizzati secondo un modello, noto come Modello Relazionale (da cui l’acronimo RDBMS usato per indicare i DBMS relazionali), in cui le entità di interesse aziendale sono rappresentate da tabelle righe – colonne, dove le righe sono le singole occorrenze di una entità e le colonne gli attributi che le descrivono. Altre tipologie di DBMS che si vanno diffondendo in alcuni ambiti specifici sono le seguenti: Data base a oggetti,Data base ‘schema less’. Data Warehouse (DW), ovvero una collezione di dati, con le seguenti caratteristiche: integrata,orientata al soggetto, variabile nel tempo, non volatile.La progettazione di un data warehouse si basa su un modello di rappresentazione multidimensionale, che fa riferimento a schemi logici detti schemi a stella, contenenti due tipi di tabelle: Tabelle delle dimensioni. Tabelle dei fatti. La realizzazione di un DW si basa è assistita da ETL. SUPPORTO AI PROCESSI AZIENDALI I sistemi informativi aziendali sono utilizzati per supportare processi rivolti sia all’interno che all’esterno di un’organizzazione. Possono essere rivolti all’interno (livello intra-organizzativo)o rivolti all’esterno (livello inter-organizzativo).Le attività sono suddivise in attività core e di supporto. Per una generica impresa commerciale o manifatturiera le attività core o primarie comprendono: Logistica in entrata,Operazioni e produzione,Logistica in uscita, marketing e vendite, servizio clienti. Indipendentemente dalla tipologia di impresa, le attività di supporto comprendono: Attività infrastrutturali,Gestione delle risorse umane, Sviluppo della tecnologia, approvvigionamento. Le applicazioni che integrano le esigenze informative specifiche delle diverse aree operative aziendali sono note come sistemi ERP (Enterprise Resource Planning) ovvero sistemi di pianificazione delle risorse aziendali. Le applicazioni ERP sono fornite come pacchetti software, quindi sono di tipo generalizzato. I Componenti ERP Core supportano le attività interne all’organizzazione per la produzione di beni e servizi: gestione finanziaria,gestione operazioni, gestione risorse umane. I Componenti ERP Estesi supportano le attività primarie dell’organizzazione rivolte verso l’esterno, ovvero tutte le attività attraverso le quali l’azienda si relaziona con fornitori e clienti e constano di due macro moduli: gestione delle relazioni con i clienti, gestione delle relazioni con i fornitori. -gestione delle relazioni con i clienti:Le applicazioni di CRM (Customer Relationship Management) hanno due obieIvi principali:1. attrarre potenziali clienti;2. fidelizzare i clienti esistenti Per

SERVICE OPERATION: gestione dei servizi. CONTINUAL SERVICE IMPROVEMENT: realizzazione di nuovi servizi e miglioramento dei servizi esistenti. IL WEB 2. Gli ultimi anni hanno visto l’evoluzione del Web da semplice contenitore di informazioni a piattaforma di pubblicazione e condivisione di contenuti. Tale trasformazione è nota con il termine di Web 2.0. -I web service costituiscono uno dei componenti cruciali per la condivisione delle informazioni: come abbiamo visto, si tratta di semplici programmi, scritti secondo gli standard del Web, che consentono di accedere attraverso un browser a dati e applicazioni esistenti.

  • I widget sono piccoli strumenti (programmi) interattivi che realizzano una singola funzione. -Un mashup non è nient’altro che una nuova applicazione o sito web che integra uno o più web service -Un sistema di gestione dei contenuti o content management system (CMS) consente agli utenti di pubblicare sul Web, modificare, tracciare le versioni e recuperare contenuti digitali. -Un wiki è un sito web che consente a chiunque di (1) pubblicare, (2) integrare, (3) modificare, (4) accedere alle informazioni. -Il tagging costituisce un’altra modalità con la quale gli utenti possono contribuire ad aggiungere valore ai siti web. Si tratta dell’aggiunta di informazioni descrittive rispetto al contenuto del sito. -Nel Web 2.0 gli utenti sono in grado di esprimere i propri punti di vista attraverso i blog. -Con il termine web marketing si intende il complesso delle attività di marketing potenziate dalle tecnologie di comunicazione digitale, è caratterizzato da earned media,paid media, owned media. -La pubblicità on-line si occupa di gestire tutti quegli spazi pubblicitari nei quali un utente può imbattersi nel Web. I principali strumenti sono Search advertising;Display advertising; Email advertising; classified listings +search advertising:Si definisce search engine marketing (SEM) ‘qualsiasi attività volta a migliorare la posizione di un sito web all’interno dei motori di ricerca e ad aumentare il traffico proveniente da questi ultimi’. +display advertising:Raggruppa un insieme di strumenti di tipo push quali:immagini, filmati, animazioni, advertorial , interstitial , sister window. +banner:I banner, statici, dinamici o interattivi sono tra gli strumenti più utilizzati. Sono acquistati dagli inserzionisti in modalità cost per click (CPC), che permette di pagare solo per i click effettivamente fatti sul banner.L’efficacia di una campagna è misurata in termini di conversion rate. +directory listing:Le directory web sono raccolte di siti internet organizzate per categorie e sottocategorie di argomenti. Il loro obiettivo, come per i motori di ricerca, è quello di aiutare gli utenti a trovare le informazioni richieste. +e-mailing:Tra gli strumenti di promozione on-line, l’email marketing resta comunque il più efficace. +social community:Descrive i canali social media focalizzati sulla creazione e mantenimento di relazioni e attività comuni a più persone. +social publishing:Descrive gli strumenti che favoriscono la diffusione di contenuti tramite persone, giornalisti o organizzazioni. +social entertainment:Raggruppa i canali che offrono la possibilità di giocare e divertirsi +social commerce:Raggruppa i social media che possono anche essere utilizzati per favorire l’acquisto on-line di prodotti e servizi. RISCHIO INFORMATICO: Si definisce rischio informatico‘il rischio di danni economici e di reputazione derivanti dall’uso della tecnologia, intendendosi con ciò tanto i rischi impliciti nella tecnologia (rischi endogeni) quanto i rischi che derivano dall’automazione, attraverso l’uso della tecnologia, delle attività aziendali (rischi esogeni). -rischi endogeni:accadimenti che hanno origine nella tecnologia utilizzata per la realizzazione del sistema informativo.Possono essere raggruppati nelle seguenti categorie: incidenti e disastri naturali;fattori interni; fattori esterni;collegamenti con altre organizzazioni. -rischi esogeni:legati a fattori sostanzialmente riconducibili alla conformità del sistema informativo alla normativa aziendale o alla normativa esterna. -analisi del rischio:Elemento critico di ogni politica di gestione del rischio informatico è l’attività di analisi del rischio, finalizzata ad identificare:
  1. le risorse informatiche impattate;
  1. i fattori che possono determinarne la vulnerabilità;
  2. l’entità del danno potenzialmente emergente. -i fattori che possono determinare la vulnerabilità delle risorse possono essere organizzativi o tecnici. -gestione del rischio:trasferire il rischio;ridurre il rischio;accettare il rischio. -Si definisce sicurezza informatica ‘l’insieme delle misure tecniche e organizzative adottate per fronteggiare i rischi nell’ambito di un approccio orientato alla sua mitigazione’. -piano di sicurezza informatica:Classificazione e gestione degli asset informatici;Sicurezza delle informazioni correlata alla gestione delle risorse umane;Gestione della sicurezza fisica;Gestione degli aspetti di sicurezza nelle operazioni;Acquisizione, sviluppo e manutenzione dei sistemi;Gestione degli incidenti inerenti alla sicurezza informatica;Gestione degli aspetti di continuità operativa;Controllo e auditing dei sistemi informativi. -Le soluzioni tecnologiche per la sicurezza informatica sono classificate in funzione degli obiettivi di: controllo,riservatezza, integrità degli asset digitali. +controllo:Soluzioni finalizzate a controllare l’accesso ai dati autenticando gli utenti mediante meccanismi di accreditamento:Meccanismi di accreditamento intangibili. Meccanismi di accreditamento fisici (o misti).Meccanismi di accreditamento biometrici. Un altro strumento finalizzato a supportare l’attività di controllo è il firewall. +riservatezza:Una delle tecniche principali per garantire la riservatezza delle informazioni è la crittografia. Chiave privata o chiave pubblica. +integrità:Soluzioni tecnologiche finalizzate a garantire la non alterabilità dei dati presenti in un sistema informativo aziendale.Tra le principali minacce all’integrità vi sono:malware,spyware,ransomware. Le contromisure in quest’ambito sono rappresentate dai software antivirus. ETICA INFORMATICA: -etica informatica: ‘quel campo d’indagine che affronta i problemi etici creati, trasformati o aggravati dall’ICT’ -Norbert Wiener fu tra i primi ad evidenziare i rischi legati ad una diffusione indiscriminata dell’automazione nelle fabbriche e a sviluppare una visione del computer come protesi di comunicazione -John Von Neumann intravide la possibilità che il computer fosse utilizzato come “macinatore di numeri” -Roxanne Hiltz e Murray Turoff rilevavano come la nascita delle reti di computer rischiava di creare una nuova frontiera della disuguaglianza -L’impatto etico delle tecnologie informatiche assume particolare rilevanza se si pensa alle loro caratteristiche peculiari: +uniquely stored (capacità di memorizzazione e conseguenze) +uniquely malleable (capacità di adattamento del software) +uniquely complex (complessità della tecnologia) +uniquely fast (velocità di elaborazione) +uniquely cheap (economicità delle operazioni) +uniquely cloned (possibilità di riprodurre un documento originale) +uniquely discrete (senza margini di tolleranza, sistemi a stati ‘finiti’) +uniquely coded (necessità di decodifica per interpretazione) +uniquely networked (interconnessione e cyberspazio) -Nel 1986 Richard O. Mason identifica quattro temi di particolare criticità riguardanti la gestione delle informazioni:1. Riservatezza; 2. Accuratezza; 3. Ownership; 4. Accesso. -decalogo del computer: