Scarica Informatica (teoria) e più Appunti in PDF di Fondamenti di informatica solo su Docsity!
Economia &
Management Anno I,
Semestre II
Ludovica Selicato
INFORMATICA
TEORIA
INFORMAZIONE E CODIFICA DATO VS INFORMAZIONE:
- Dato: descrive in maniera elementare un fatto/oggetto/o altro, attraverso simboli o combinazione di simboli o Non è interpretato o Esprime in forma originaria l’oggetto rappresentato o Diventa informazione quando ci permette di scegliere o DATA MINING : Selezione, osservazione e modellazione di grandi moli di dati Obiettivo: riconoscere principi di funzionamento non noti a priori Le ipotesi di ricerca vengono scoperte nei dati stessi
- Informazione: diventa conoscenza quando ci permette di capire
ANALOGICO E DIGITALE
Analogico: usa grandezze variabili; è più difficile essere precisi Digitale: usa sequenza finita di simboli; è più facile essere precisi
- Vantaggi del digitale: o Qualità della trasmissione: con il segnale digitale è più facile rilevare gli errori o Prestazioni: la trasmissione digitale consente di trasmettere una maggiore quantità di dati all’interno della stessa banda SORGENTI DELL’INFORMAZIONE:
- Sorgenti acustiche
- Sorgenti visive
- Dati alfanumerici La trasmissione del segnale su lunghe distanze può avvenire attraverso
- Segnali elettromagnetici
- Segnali ottici
Conversione analogico-digitale
Elaboratori elettronici: hanno natura discreta
- Ogni grandezza può essere rappresentata solo da un numero finito di elementi Conversione analogico-digitale: serve per elaborare segnali analogici
- Segnali analogici: devono essere digitalizzati attraverso operazioni di campionamento e quantizzazione
- Richiede 3 operazioni:
- Campionamento: produce una discretizzazione (digitalizzazione) nel tempo
o ha delle limitazioni dovute al mezzo trasmissivo utilizzato o la riduzione del bit rate viene chiamata compressione del segnale
COMPRESSIONE
- permette di ridurre la quantità di dati per trasmettere la stessa informazione
- coder : compressore (o codificatore) che realizza la compressione
- decoder : decompressore (o decodificatore) che effettua la decompressione o DECOMPRESSIONE: serve per ottenere l’informazione originaria
- codec: dispositivo che raggruppa coder e decoder
- FATTORE DI COMPRESSIONE: rapporto tra quantità di bit da inviare senza e con compressione
- Vantaggi della compressione: o Aumento della capacità effettiva dei supporti di memorizzazione o Aumento della qualità del segnale a parità di banda disponibile sul canale trasmissivo
- Svantaggi della compressione: o Peggioramento della qualità all’aumentare del fattore di compressione o Ritardo nella produzione Compressione audio: sfrutta la ridondanza percettiva (incapacità dell’orecchio di percepire alcune componenti sonore in certe situazioni, che quindi non vengono codificate) Compressione video: sfrutta la stabilità dei fotogrammi vengono codificate solo le differenze TECNICHE DI COMPRESSIONE:
- Lossless: compressione senza perdita o Permette di ricostruire il file originario a partire da quello compresso, senza perdita di informazioni o Usata per la compressione di documenti di testo, programmi, database… o A questa categoria appartengono i formati .zip e .rar (usati per comprimere file)
- Lossy: compressione con perdita o Non permette di ricostruire il file originario a partire dal file compresso o La compressione avviene a scapito delle qualità delle informazioni (es. perdita di qualità o di definizione) o Consente di ottenere riduzioni notevoli dei dati originali, a prezzo di una perdita nella qualità o Applicata alle immagini (es. JPEG), video (es. mpeg) e suoni (es. mp3)
Compressione dati (lossless)
2 categorie:
- Compressione statistica: o Si basa sullo studio dell’input da comprimere o Associa codifiche più brevi a simboli più frequenti, per ridurre la lunghezza dei media o Codifica di Huffman
- Compressione per sostituzione: o Una sequenza di simboli uguali viene sostituta da un solo simbolo ed il numero di ripetizioni
Software as a
Service (SAAS)
Platform as a
Service (PAAS)
Infrastructure as a
Service (IAAS)
o Successioni di simboli ripetute vengono sostituite da un solo simbolo
Codifica immagini:
FORMATO GIF:
- supporta fino a 8 bit per pixel
- il numero di colori è limitato a 256 o limitazione che rende il GIF poco adatto per immagini fotografiche a colori
- adatto a immagini geometriche
- grado di compressione tipico = 50% FORMATO JPEG:
- diminuisce la qualità della visualizzazione, ma utilizza tutta la gamma di colori RGB
- adatto a immagini fotografiche con variazioni graduali di colore o non adatto per immagini geometriche o con variazioni nette di colore che devono essere editate più volte (perché ogni operazione di compressione/decompressione introduce degradazioni)
- è lossy: comporta una perdita di risoluzione
- grado di compressione tipico = 90% CLOUD COMPUTING E RETI
CLOUD COMPUTING
Cloud computing: nuovo approccio all’utilizzo di tecnologie già esistenti
- Consente di gestire applicazioni, attività e risorse online (non all’interno di reti private) o Si crea un ambiente di elaborazione virtuale
- Permette di accedere ad una serie di servizi offerti da un provider ad un cliente finale o Si crea un ambiente di elaborazione virtuale rispetto ad un ambiente fisico
- I soggetti che interagiscono attraverso il cloud sono:
- Fornitore (o provider): mette a disposizione i servizi secondo il modello pay-per-use
- Amministratore: sceglie e configura i servizi offerti
- Cliente finale: utilizza i servizi acquistati e configurati dall’amministratore Servizi che possono essere offerti da una struttura cloud sono:
o Uso riservato all’azienda con risorse dedicate esclusivamente ad essa
- Può essere situato fisicamente nel data center locale dell’organizzazione
- Vantaggi: o Maggiore flessibilità: l’organizzazione può personalizzare il proprio ambiente cloud o Maggiore controllo: le risorse non vengono condivise con altri utenti Cloud ibrido:
- Combinazione di cloud pubblico e cloud privato o Consente di spostare dati e app tra i due ambienti
- Vantaggi: o Controllo: l’organizzazione può mantenere un’infrastruttura privata o carichi di lavoro riservati o Flessibilità: si possono sfruttare risorse aggiuntive nel clpud pubblico
RETI
Rete informatica:
- Insieme di dispositivi (nodi) collegati tra loro tramite mezzi trasmissivi (link cablati o wireless) o Nodo: qualsiasi dispositivo hardware del sistema in grado di comunicare con gli altri dispositivi che fanno parte della rete
- Consentono di comunicare e condividere informazioni e risorse
- Sono classificate a seconda delle dimensioni
- Possono coprire zone circoscritte oppure vaste aree
- Protocolli di comunicazione : regole che descrivono il funzionamento della rete o Controllano lo scambio di informazioni in una comunicazione COME VIAGGIA L’INFORMAZIONE IN RETE:
- Commutazione di circuito: usata nella rete telefonica o Garantisce una banda riservata per tutta la durata della comunicazione o L’instradamento viene deciso all’instaurazione della chiamata e non cambia
- Commutazione di pacchetto: usata in Internet o L’informazione è suddivisa in pacchetti dati o La banda è sempre condivisa tra gli utenti o L’instradamento è deciso nodo per nodo lungo il percorso CLASSIFICAZIONE DELLE RETI IN BASE ALLE DIMENSIONI:
- PAN (Peronal Area Network): reti personali o Collegamenti limitati a qualche millimetro o Tipicamente tra dispositivi appartenenti allo stesso utente
- LAN (Local Area Network): reti locali o Connettono utenti in un’area geografica limitata o Si differenziano tra loro per Topologia: definisce i modi in cui i nodi sono collegati tra loro Rete a stella Rete a bus
Rete ad anello Protocolli: definiscono i modi in cui i dati e le informazioni vengono scambiati Reti basate su protocollo client-server Rete peer-to-peer
- MAN (Metropolitan Area Network): reti metropolitane o Interconnettono più LAN geograficamente vicine con una connessione ad alta velocità
- WAN (Wide Area Network): reti geografiche o Collegano dispositive in un’ampia area geografica Possono inglobare reti MAN, reti LAN o singoli dispositivi collocati in punti molto distanti l’uno dall’altro o Bisogna affidarsi ad un ISP (Internet Service Provider): fornisce i servizi di connessione
- Internetwork: reti di reti o Collegano più reti differenti mediante elementi di interfaccia che si possono estendere ovunque (es. Internet) o INTERNET: Si basa su un insieme di protocolli di comunicazione ( Internet Protocol Suite ), definiti da un organismo internazionale (IETF) Funziona su scala globale Costituito dall’interconnessione di reti, dette sottoreti Interconnesse mediante un router, che le instrada verso la destinazione È una rete a commutazione di pacchetto MEZZI FISICI UTILIZZATI PER LA TRASMISSIONE:
- Mezzi cablati (portante fisico): linee fisiche che portano il segnale fino al ricevitore o Supportano la trasmissione di segnali elettrici oppure ottici
- Mezzi radio (wireless): irradiazione di segnali elettromagnetici nello spazio o Varie frequenze di trasmissione o Uso di antenne ELEMENTI CHE INFLUENZANO LA TRASMISSIONE:
- Capacità del canale: larghezza di banda ( bandwidth ) o Massima quantità di dati che può essere trasmessa in un’unità di tempo o Si misura in Megabit al secondo
- Frequenza o Determina la capacità di propagazione su lunghe distanze e le dimensioni delle antenne o Si misura in Herz (Hz) o multipli
- Grado di attenuazione del segnale
- Interferenze tra segnali
Reti aziendali: classificazione
- Reti pubbliche: aperte a chiunque paghi la tariffa prevista per la connessione
- Intranet: rete limitata alle dimensioni dell’azienda e accessibile solo ai dipendenti e ad altri utenti autorizzati o Usano gli stessi protocolli di comunicazione di Internet, ma sono protette da firewall (barriere difensive)
o Ad ogni passaggio di livello il messaggio viene elaborato eliminando informazioni non necessarie per i livelli superiori
I COLLEGAMENTI TRA LE RETI
- Protocollo IP (Internet Protocol): o Protocollo connectionless : non orientato alla connessione o Responsabile del trasporto da una sorgente a una destinazione o Se necessario, spezza i pacchetti troppo grandi in pacchetti di dimensioni più piccole Frammenta il flusso di dati in datagrammi: sono poi inviati a destinazione lungo percorsi distinti non c’è garanzia che arrivino a destinazione né che arrivino in ordine - la correttezza e l’ordine di ricezione dei dati devono essere assicurati da protocolli di livello più elevato o Indirizzo IP: necessario per trasmette un messaggio in rete Identifica in modo univoco la destinazione o Indirizza i dati e sceglie la strada migliore per farli arrivare a destinazione
- Protocollo TCP (Transmission Control Protocol): o Protocollo di livello superiore a IP o Protocollo connection-oriented : orientato alla connessione Stabilisce preliminarmente una connessione o Stabilisce una connessione tra due applicazioni identificate da un numero di porta Suddivide i dati in uscita in pacchetti a cui viene aggiunta un’intestazione con le informazioni sulla destinazione o Garantisce la trasmissione senza errori di un flusso di dati Controllo di integrità riguarda sia l’intestazione TCP che i dati o Controlla se la comunicazione va a buon fine ed implementa un time-out per la chiusura delle connessioni interrotte o non stabilite Gestisce le situazioni di congestione del traffico o Divide i file troppo grandi in segmenti
- Protocollo TCP/IP: o Dato dall’unione dei protocolli IP e TCP Permette di ottenere sia buona efficienza di trasmissione che elevata affidabilità o usato da Internet o copre 2 livelli: Trasporto: trasforma dati per renderli inviabili secondo le regole del protocollo TCP Rete: protocollo IP di invio ed instradamento dei singoli pacchetti di dati sulla rete
WORLD WIDE WEB
Più recente ed utilizzato servizio di Internet TERMINOLOGIA ESSENZIALE:
- Pagina Web: costituita da oggetti ed indirizzata da un URL
- Uniform Resource Locator (URL):
o identifica un oggetto nella rete e specifica il modo per accedere ad esso ogni pagina web è dotata di un indirizzo URL univoco o ha 2 componenti:
- nome dell’host (o server): computer su cui si trovano le risorse e che offre il servizio
- percorso nell’host (o server) APPLICATION LAYER del World Wide Web: - si basa sul protocollo HTTP (Hyper Text Transfer Protocol) : gestisce l’interazione tra un browser (user agent) e un server web - client e server si scambiano dei messaggi: richieste da parte del client e risposte da parte del server - fasi del processo: 1. l’utente richiede una pagina residente su un server 2. il browser richiede una connessione TCP con il server 3. il server accetta la connessione iniziata dal browser 4. il browser e il server si scambiano dei messaggi 5. la connessione viene chiusa GRAFI E RETI SOCIALI, RICERCHE NEL WEB, PRIVACY E GOOGLE ANALYTICS
GRAFI
Grafo:
- struttura relazionale che si presenta perfettamente nell’analisi del funzionamento delle reti sociali, attraverso una specifica modellazione (Social Network Analysis)
- costituisce la base per la gestione di mappe ed itinerari
- usato per la modellazione delle reti sociali (o social networks)
- presente nelle strutture dati utilizzati dai motori di ricerca
- tipi di grafo: o grafo non orientato: ad ogni nodo del grafo è associata la lista dei suoi adiacenti grado: numero di archi incidenti un nodo es.: Facebook i nodi sono le persone e gli archi sono le amicizie ed interazioni o grafo orientato: ad ogni nodo del grafo è associata la lista dei suoi successori caratterizzato da: grado in ingresso: numero di archi entranti grado in uscita: numero di archi uscenti es.: Twitter una persona A può seguire una persona B, ma B può scegliere di non seguire A
o numero di Erdos: i nodi della rete sono autori di articoli di matematica c’è un arco tra due autori se questi hanno lavorato insieme ad un articolo o numero di Bacon: i nodi della rete sono attori cinematografici c’è un arco tra due attori se hanno lavorato insieme in un film
Web scraping
- tecnica informatica di estrazione di dati e informazioni dalla rete, mediante strumenti automatizzati o chiamato anche web data extraction o processo di utilizzo dei Robot (bot) per estrarre contenuti e dati da un sito web
- esistono librerie di Python che permettono di effettuare operazioni di scraping
- IMPORTANTE: o le operazioni di estrazione dati devono essere sempre condotte nel rispetto della privacy o bisogna controllare la data di pubblicazione: la normativa si evolve nel tempo, e non è detto che il codice che era legale in passato lo sia ancora oggi
RICERCA SU WEB
COMPONENTI DI UN MOTORE DI RICERCA:
- Crawler: scarica in locale le pagine
- Indexer: processa le pagine create dal crawler e crea un indice dei documenti
- Query processor: utilizza l’indice dei documenti creato dall’indexer e restituisce i risultati ordinati METODI DI RICERCA E INDICIZZAZIONE:
- Robot: o Programmi che operano senza supervisione umana o Si occupano della creazione degli indici:
Page Rank
- Ordina i risultati
- È il cuore del motore di ricerca Google o Dimensione dell’indice di google = 100 petabyte (= 100 milioni di GB) Esplorazione della pagina iniziale e ricerca di tutti i link presenti in essa Ogni link trovato viene processato in una mappatura a ricognizione continua
- Per calcolare i valori delle pagine guarda solo la struttura di grafo delle pagine web (WebGraph) o Ogni pagina è un nodo o Ogni link tra le pagine è un arco diretto
- Inizialmente, ogni pagina ha un valore (detto peso ), pari ad 1
- Procedura (viene ripetuta finché i valori convergono, ovvero non cambiano più tra un’iterazione e l’altra): 1. Ogni pagina divide il suo peso tra le pagine che punta 2. Normalizzazione: vengono divisi tutti i pesi per il peso massimo tra due pagine
SOCIAL MEDIA MINING & SOCIAL NETWORK
SOCIAL MEDIA
- Insieme di applicazioni web
- Permettono agli utenti di creare e scambiarsi contenuti
- Sono piattaforme digitali
- Community online: o Gruppo di persone che si incontrano e si scambiano informazioni attraverso la rete Persone con interessi o valori comuni o Si evolvono grazie ai social media o Tecniche per individuare le relazioni esistenti tra i componenti della community: Analisi delle discussioni: contenuto e tempi di pubblicazione/risposta Suddivisione in cluster: costruzione del grafo e individuazione di sotto-grafi Attraverso l’individuazione di caratteristiche che determineranno la suddivisione in gruppi
- Contenuto generato dagli utenti: o Qualsiasi tipo di contenuto creato dagli utenti e pubblicato in Internet o 3 criteri per illustrare i requisiti generali necessari 1. Requisiti di pubblicazione 2. Sforzo creativo 3. Creazione al di fuori delle pratiche e delle routine professionali
- SOCIAL MEDIA MINING: o Estrazione di informazioni dai social media o Obiettivo: esaminare le informazioni e trasformarle in conoscenza o Social Media Analytics e Insights Si occupano dell’estrazione di dati di comportamenti della piattaforma o Può essere necessario effettuare ripetuti cicli di estrazione, modificando la procedura sulla base dei risultati ottenuti nel ciclo precedente o Modalità di estrazione dei dati: Manuale: attraverso interazione diretta con l’interfaccia grafica Automatica: utilizza crawler, (o spider, o robot), che leggono i contenuti oggetto dell’estrazione La lettura può essere effettuata anche attraverso ripetute richieste ai servizi API (Application Programming Interface) della piattaforma o Pre-elaborazione: È sempre opportuno pre-trattare i dati per ottimizzare le frasi successive I dati possono essere inizialmente letti senza controlli restrittivi: per semplificare le operazioni di estrazione
GOOGLE ANALYTICS
- I proprietari di siti web utilizzano i dati raccolti da Google Analytics per migliorare il funzionamento dei loro siti o INFORMAZIONI SUI COOKIE: Usati per Memorizzare le impostazioni e preferenze dell’utente Fornire, gestire e migliorare servizi e annunci Personalizzare contenuti in base all’attività dell’utente sui servizi Google Effettuare analisi e misurazioni L’utente può decidere di rifiutare tutti i cookie o soltanto alcuni
- Per utilizzare la piattaforma è necessario creare un account principale o All’interno possono essere definiti fino a 100 account secondari per i singoli componenti del team di lavoro o In questa fase si devono definire: Impostazioni sulla condivisione e sul trattamento di dati Scelta sulla condivisione delle informazioni gestite con Google Analytics con altri servizi di Google e terze parti Filtri per impedire la raccolta di dati anche non utili per le analisi Informazioni sul DPA (Data Processing Agreement): per attestare che le modalità di raccolta e gestione di dati sia conforme al regolamento generale sulla protezione dei dati
- Bisogna definire le proprietà: indicano cosa si vuole tracciare o Per ogni proprietà si ottiene un tag, che dovrà essere inserito nel sito o All’interno di ogni proprietà si possono creare fino a 25 visite (ovvero l’insieme dei rapporti che creeremo sulla piattaforma)
- Strumenti: o Acquisizione: indirizza ad un utilizzo consapevole ed interessato l’utente o Comportamento: traccia le modalità di interazione degli utenti con il sito o Conversione: quando un utente esegue un’azione di valore o Proprietà: indica le connessioni ad altri servizi o Vista: permette di Impostare i filtri Gestire gli obiettivi di conversione DATABASE
- Collezione di dati o Organizzata o Persistente o Condivisa o Di notevoli dimensioni e varietà
- Miglior controllo di: o Concorrenza su dati condivisi o Rispetto vincoli di integrità
- Una sola rappresentazione che eviti
o Ridondanze o Disallineamenti o Inutili ripetizioni di operazioni CARATTERISTICHE DI UN DATABASE:
- Progettazione, organizzazione in struttura di dati della realtà in oggetto
- Sistema di gestione dei dati; interrogazioni; aggiornamenti; cancellazioni
- Utilizzo da parte di molti utenti contemporaneamente
- Protezione in caso di crash del sistema
- Integrità e sicurezza
- Gestione degli utenti per impedire accessi non autorizzati
DBMS (DATA BASE MANAGEMENT SYSTEM)
- SISTEMA (software) DI GESTIONE DI DATI che siano o Di grandi dimensioni o Persistenti: periodo di vita indipendente dalle singole esecuzioni dei programmi che le utilizzano o Condivise: utilizzate da applicazioni e utenti diversi in maniera consistente
- Assicurano che i data base siano o Affidabili: alta tolleranza ai guasti con funzionalità avanzate di ripristino e backup o Sicuri: disciplina e controllo degli accessi (meccanismi di autenticazione) o Efficienti: performance accettabili (rendendo produttive le attività degli utilizzatori)
- MODELLO GERARCHICO: o I dati sono organizzabili in una struttura ad albero o Perfetto per rappresentare relazioni semplici
- MODELLO RETICOLARE: o I nodi sono insiemi omogenei e ordinati tra loro o Archi: associazioni in cui ogni nodo può avere più nodi padre un nodo può avere un numero qualsiasi di figli o vi possono essere più archi che collegano la stessa coppia di nodi
- MODELLO RELAZIONALE : o Progettato nel 1970 da E.F.Codd o Oggi, con il termine database si intende il modello relazionale o Base di dati: collezione di una o più relazioni Ogni relazione è una tabella con righe e colonne Relazione tra entità: un elemento di un’entità è collegato ad un elemento di un’altra entità Collegamento tra entità avviene mediante la corrispondenza di 1 o più attributi appartenenti alle diverse entità Relazione: costrutto principale, è costituita da Schema relazionale: nome della relazione, nome di ogni campo/colonna/attributo, dominio di ciascun campo Istanza della relazione: tabella
MODELLO DI DATI:
- Insieme di concetti usati per o organizzare i dati di interesse o descrivere la struttura dei dati obiettiva: renderla manipolabile
- definisce il modo in cui i dati vengono: o memorizzati o organizzati o gestiti
Con interfacce amichevoli (senza linguaggio testuale)
DIAGRAMMA ENTITÀ/RELAZIONE
- Insiemi di entità con insiemi di associazioni che esprimono le informazioni significative
- Associazioni n-arie (binarie, ternarie…)
- Modello grafico per descrivere lo schema concettuale
- Convenzioni per indicare entità, associazioni, ruoli e le loro proprietà
- Si utilizzano diagrammi di flusso ( flow chart ) Entità:
- Insieme di elementi distinti omogenei o Es. clienti è l’entità; Mario Rossi, Luigi Bianchi sono gli elementi
- Nel database: o Entità: diventano tabelle o Elementi: diventano i record o Attributi: diventano i campi dello schema
- Sono in relazione tra loro o Relazione tra entità: indica che un elemento di un’entità è collegato ad un elemento di un’altra entità Relazione avviene attraverso la corrispondenza di 1 o più attributi appartenenti alle diverse entità o = tabelle: sono in relazione tra loro Relazione tra tabelle: indica che un record di una tabella è collegato ad un record di un’altra tabella Relazione avviene attraverso la corrispondenza di 1 o più campi appartenenti alle diverse tabelle o TIPI DI RELAZIONE: Relazione 1 a 1 (1:1): 1 elemento di A 1 elemento di B 1 elemento di B 1 elemento di A Relazione 1 a molti (1:n): 1 elemento di A più elementi di B 1 elemento di B 1 elemento di A Relazione molti a molti (n:n). 1 elemento di A più elementi di B 1 elemento di B più elementi di A Identificazione univoca dei record
- Obiettivo: assenza di ridondanza (es. record identici)
- Si procede dalla scelta di uno/più campi, in modo tale che tutti i record di quella tabella presentino valori diversi in quei campi
- Chiave primaria: campi impiegati per distinguere i record Chiave semplice: 1 solo campo Chiave composta: più campi o La chiave primaria di una tabella è sempre indicizzata
- Frequente l’uso di identificativi numerici progressivi
Chiavi e indici Superchiave: insieme di campi
- Esistono due record con lo stesso valore di quei campi
- Chiave: superchiave minimale (non esiste un’altra superchiave che la contenga) Chiave esterna: insieme di campi in una tabella
- Fa riferimento alla chiave primaria di un’altra tabella o La chiave primaria di una tabella è sempre indicizzata Indici: tabelle di sistema
- Permettono di usare metodi di ricerca veloci per reperire più rapidamente le informazioni desiderate TABELLE DI SISTEMA (indici):
- Permettono di usare metodi di ricerca veloci per reperire più velocemente le informazioni Vincoli di integrità
- Servono a garantire la correttezza dei dati inseriti
- Vincoli all’interno di una tabella o Vincoli di valore: sul singolo campo Es. vincolo sul voto del singolo esame o Vincoli sul singolo record
- Vincoli tra tabelle
- Per ogni coppia di tabelle collegate da una relazione bisogna garantire che il riferimento utilizzato sia reperibile
- Vincoli di integrità referenziale o Integrità referenziale: sistema di regole Garantisce che le relazioni tra righe di tabelle correlate siano valide non sia possibile eliminare/modificare in maniera errata i dati correlati Normalizzazione
- nella progettazione di una base di dati si devono evitare scelte che possono produrre o incoerenza (stessi dati che assumono valori diversi) o ridondanza (dati uguali nello stesso archivio) problemi causati dalla ridondanza: memorizzazione non ottimizzata anomalie (che producono dati incoerenti) da
- inserimento
- aggiornamento
- cancellazione
- se una relazione presenta più concetti tra loro indipendenti, la si decompone in relazioni più piccole (una per ogni concetto)
APPLICAZIONI OLTP (ON-LINE TRANSACTION PROCESSING)