Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Informatica (teoria), Appunti di Fondamenti di informatica

Appunti relativi alla parte teorica del corso di Informatica

Tipologia: Appunti

2020/2021

In vendita dal 13/04/2022

LudovicaSelicato
LudovicaSelicato 🇮🇹

4.9

(9)

35 documenti

1 / 44

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Economia &
Management Anno I,
Semestre II
Ludovica Selicato
INFORMATICA
TEORIA
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c

Anteprima parziale del testo

Scarica Informatica (teoria) e più Appunti in PDF di Fondamenti di informatica solo su Docsity!

Economia &

Management Anno I,

Semestre II

Ludovica Selicato

INFORMATICA

TEORIA

INFORMAZIONE E CODIFICA DATO VS INFORMAZIONE:

  • Dato: descrive in maniera elementare un fatto/oggetto/o altro, attraverso simboli o combinazione di simboli o Non è interpretato o Esprime in forma originaria l’oggetto rappresentato o Diventa informazione quando ci permette di scegliere o DATA MINING :  Selezione, osservazione e modellazione di grandi moli di dati  Obiettivo: riconoscere principi di funzionamento non noti a priori  Le ipotesi di ricerca vengono scoperte nei dati stessi
  • Informazione: diventa conoscenza quando ci permette di capire

ANALOGICO E DIGITALE

Analogico: usa grandezze variabili; è più difficile essere precisi Digitale: usa sequenza finita di simboli; è più facile essere precisi

  • Vantaggi del digitale: o Qualità della trasmissione: con il segnale digitale è più facile rilevare gli errori o Prestazioni: la trasmissione digitale consente di trasmettere una maggiore quantità di dati all’interno della stessa banda SORGENTI DELL’INFORMAZIONE:
  • Sorgenti acustiche
  • Sorgenti visive
  • Dati alfanumerici La trasmissione del segnale su lunghe distanze può avvenire attraverso
  • Segnali elettromagnetici
  • Segnali ottici

Conversione analogico-digitale

Elaboratori elettronici: hanno natura discreta

  • Ogni grandezza può essere rappresentata solo da un numero finito di elementi Conversione analogico-digitale: serve per elaborare segnali analogici
  • Segnali analogici: devono essere digitalizzati attraverso operazioni di campionamento e quantizzazione
  • Richiede 3 operazioni:
  1. Campionamento: produce una discretizzazione (digitalizzazione) nel tempo

o ha delle limitazioni dovute al mezzo trasmissivo utilizzato o la riduzione del bit rate viene chiamata compressione del segnale

COMPRESSIONE

  • permette di ridurre la quantità di dati per trasmettere la stessa informazione
  • coder : compressore (o codificatore) che realizza la compressione
  • decoder : decompressore (o decodificatore) che effettua la decompressione o DECOMPRESSIONE: serve per ottenere l’informazione originaria
  • codec: dispositivo che raggruppa coder e decoder
  • FATTORE DI COMPRESSIONE: rapporto tra quantità di bit da inviare senza e con compressione
  • Vantaggi della compressione: o Aumento della capacità effettiva dei supporti di memorizzazione o Aumento della qualità del segnale a parità di banda disponibile sul canale trasmissivo
  • Svantaggi della compressione: o Peggioramento della qualità all’aumentare del fattore di compressione o Ritardo nella produzione Compressione audio: sfrutta la ridondanza percettiva (incapacità dell’orecchio di percepire alcune componenti sonore in certe situazioni, che quindi non vengono codificate) Compressione video: sfrutta la stabilità dei fotogrammi  vengono codificate solo le differenze TECNICHE DI COMPRESSIONE:
  • Lossless: compressione senza perdita o Permette di ricostruire il file originario a partire da quello compresso, senza perdita di informazioni o Usata per la compressione di documenti di testo, programmi, database… o A questa categoria appartengono i formati .zip e .rar (usati per comprimere file)
  • Lossy: compressione con perdita o Non permette di ricostruire il file originario a partire dal file compresso o La compressione avviene a scapito delle qualità delle informazioni (es. perdita di qualità o di definizione) o Consente di ottenere riduzioni notevoli dei dati originali, a prezzo di una perdita nella qualità o Applicata alle immagini (es. JPEG), video (es. mpeg) e suoni (es. mp3)

Compressione dati (lossless)

2 categorie:

  • Compressione statistica: o Si basa sullo studio dell’input da comprimere o Associa codifiche più brevi a simboli più frequenti, per ridurre la lunghezza dei media o Codifica di Huffman
  • Compressione per sostituzione: o Una sequenza di simboli uguali viene sostituta da un solo simbolo ed il numero di ripetizioni

Software as a

Service (SAAS)

Platform as a

Service (PAAS)

Infrastructure as a

Service (IAAS)

o Successioni di simboli ripetute vengono sostituite da un solo simbolo

Codifica immagini:

FORMATO GIF:
  • supporta fino a 8 bit per pixel
  • il numero di colori è limitato a 256 o limitazione che rende il GIF poco adatto per immagini fotografiche a colori
  • adatto a immagini geometriche
  • grado di compressione tipico = 50% FORMATO JPEG:
  • diminuisce la qualità della visualizzazione, ma utilizza tutta la gamma di colori RGB
  • adatto a immagini fotografiche con variazioni graduali di colore o non adatto per immagini  geometriche o con variazioni nette di colore  che devono essere editate più volte (perché ogni operazione di compressione/decompressione introduce degradazioni)
  • è lossy: comporta una perdita di risoluzione
  • grado di compressione tipico = 90% CLOUD COMPUTING E RETI

CLOUD COMPUTING

Cloud computing: nuovo approccio all’utilizzo di tecnologie già esistenti

  • Consente di gestire applicazioni, attività e risorse online (non all’interno di reti private) o Si crea un ambiente di elaborazione virtuale
  • Permette di accedere ad una serie di servizi offerti da un provider ad un cliente finale o Si crea un ambiente di elaborazione virtuale rispetto ad un ambiente fisico
  • I soggetti che interagiscono attraverso il cloud sono:
    1. Fornitore (o provider): mette a disposizione i servizi secondo il modello pay-per-use
    2. Amministratore: sceglie e configura i servizi offerti
    3. Cliente finale: utilizza i servizi acquistati e configurati dall’amministratore Servizi che possono essere offerti da una struttura cloud sono:

o Uso riservato all’azienda con risorse dedicate esclusivamente ad essa

  • Può essere situato fisicamente nel data center locale dell’organizzazione
  • Vantaggi: o Maggiore flessibilità: l’organizzazione può personalizzare il proprio ambiente cloud o Maggiore controllo: le risorse non vengono condivise con altri utenti Cloud ibrido:
  • Combinazione di cloud pubblico e cloud privato o Consente di spostare dati e app tra i due ambienti
  • Vantaggi: o Controllo: l’organizzazione può mantenere un’infrastruttura privata o carichi di lavoro riservati o Flessibilità: si possono sfruttare risorse aggiuntive nel clpud pubblico

RETI

Rete informatica:

  • Insieme di dispositivi (nodi) collegati tra loro tramite mezzi trasmissivi (link cablati o wireless) o Nodo: qualsiasi dispositivo hardware del sistema in grado di comunicare con gli altri dispositivi che fanno parte della rete
  • Consentono di comunicare e condividere informazioni e risorse
  • Sono classificate a seconda delle dimensioni
  • Possono coprire zone circoscritte oppure vaste aree
  • Protocolli di comunicazione : regole che descrivono il funzionamento della rete o Controllano lo scambio di informazioni in una comunicazione COME VIAGGIA L’INFORMAZIONE IN RETE:
  • Commutazione di circuito: usata nella rete telefonica o Garantisce una banda riservata per tutta la durata della comunicazione o L’instradamento viene deciso all’instaurazione della chiamata e non cambia
  • Commutazione di pacchetto: usata in Internet o L’informazione è suddivisa in pacchetti dati o La banda è sempre condivisa tra gli utenti o L’instradamento è deciso nodo per nodo lungo il percorso CLASSIFICAZIONE DELLE RETI IN BASE ALLE DIMENSIONI:
  • PAN (Peronal Area Network): reti personali o Collegamenti limitati a qualche millimetro o Tipicamente tra dispositivi appartenenti allo stesso utente
  • LAN (Local Area Network): reti locali o Connettono utenti in un’area geografica limitata o Si differenziano tra loro per  Topologia: definisce i modi in cui i nodi sono collegati tra loro  Rete a stella  Rete a bus

 Rete ad anello  Protocolli: definiscono i modi in cui i dati e le informazioni vengono scambiati  Reti basate su protocollo client-server  Rete peer-to-peer

  • MAN (Metropolitan Area Network): reti metropolitane o Interconnettono più LAN geograficamente vicine con una connessione ad alta velocità
  • WAN (Wide Area Network): reti geografiche o Collegano dispositive in un’ampia area geografica  Possono inglobare reti MAN, reti LAN o singoli dispositivi collocati in punti molto distanti l’uno dall’altro o Bisogna affidarsi ad un ISP (Internet Service Provider): fornisce i servizi di connessione
  • Internetwork: reti di reti o Collegano più reti differenti mediante elementi di interfaccia che si possono estendere ovunque (es. Internet) o INTERNET:  Si basa su un insieme di protocolli di comunicazione ( Internet Protocol Suite ), definiti da un organismo internazionale (IETF)  Funziona su scala globale  Costituito dall’interconnessione di reti, dette sottoreti  Interconnesse mediante un router, che le instrada verso la destinazione  È una rete a commutazione di pacchetto MEZZI FISICI UTILIZZATI PER LA TRASMISSIONE:
  • Mezzi cablati (portante fisico): linee fisiche che portano il segnale fino al ricevitore o Supportano la trasmissione di segnali elettrici oppure ottici
  • Mezzi radio (wireless): irradiazione di segnali elettromagnetici nello spazio o Varie frequenze di trasmissione o Uso di antenne ELEMENTI CHE INFLUENZANO LA TRASMISSIONE:
  • Capacità del canale: larghezza di banda ( bandwidth ) o Massima quantità di dati che può essere trasmessa in un’unità di tempo o Si misura in Megabit al secondo
  • Frequenza o Determina la capacità di propagazione su lunghe distanze e le dimensioni delle antenne o Si misura in Herz (Hz) o multipli
  • Grado di attenuazione del segnale
  • Interferenze tra segnali

Reti aziendali: classificazione

  • Reti pubbliche: aperte a chiunque paghi la tariffa prevista per la connessione
  • Intranet: rete limitata alle dimensioni dell’azienda e accessibile solo ai dipendenti e ad altri utenti autorizzati o Usano gli stessi protocolli di comunicazione di Internet, ma sono protette da firewall (barriere difensive)

o Ad ogni passaggio di livello il messaggio viene elaborato eliminando informazioni non necessarie per i livelli superiori

I COLLEGAMENTI TRA LE RETI

  • Protocollo IP (Internet Protocol): o Protocollo connectionless : non orientato alla connessione o Responsabile del trasporto da una sorgente a una destinazione o Se necessario, spezza i pacchetti troppo grandi in pacchetti di dimensioni più piccole  Frammenta il flusso di dati in datagrammi:  sono poi inviati a destinazione lungo percorsi distinti  non c’è garanzia che arrivino a destinazione né che arrivino in ordine - la correttezza e l’ordine di ricezione dei dati devono essere assicurati da protocolli di livello più elevato o Indirizzo IP: necessario per trasmette un messaggio in rete  Identifica in modo univoco la destinazione o Indirizza i dati e sceglie la strada migliore per farli arrivare a destinazione
  • Protocollo TCP (Transmission Control Protocol): o Protocollo di livello superiore a IP o Protocollo connection-oriented : orientato alla connessione  Stabilisce preliminarmente una connessione o Stabilisce una connessione tra due applicazioni identificate da un numero di porta  Suddivide i dati in uscita in pacchetti a cui viene aggiunta un’intestazione con le informazioni sulla destinazione o Garantisce la trasmissione senza errori di un flusso di dati  Controllo di integrità riguarda sia l’intestazione TCP che i dati o Controlla se la comunicazione va a buon fine ed implementa un time-out per la chiusura delle connessioni interrotte o non stabilite  Gestisce le situazioni di congestione del traffico o Divide i file troppo grandi in segmenti
  • Protocollo TCP/IP: o Dato dall’unione dei protocolli IP e TCP  Permette di ottenere sia buona efficienza di trasmissione che elevata affidabilità o usato da Internet o copre 2 livelli:  Trasporto: trasforma dati per renderli inviabili secondo le regole del protocollo TCP  Rete: protocollo IP di invio ed instradamento dei singoli pacchetti di dati sulla rete

WORLD WIDE WEB

Più recente ed utilizzato servizio di Internet TERMINOLOGIA ESSENZIALE:

  • Pagina Web: costituita da oggetti ed indirizzata da un URL
  • Uniform Resource Locator (URL):

o identifica un oggetto nella rete e specifica il modo per accedere ad esso  ogni pagina web è dotata di un indirizzo URL univoco o ha 2 componenti:

  1. nome dell’host (o server): computer su cui si trovano le risorse e che offre il servizio
  2. percorso nell’host (o server) APPLICATION LAYER del World Wide Web: - si basa sul protocollo HTTP (Hyper Text Transfer Protocol) : gestisce l’interazione tra un browser (user agent) e un server web - client e server si scambiano dei messaggi: richieste da parte del client e risposte da parte del server - fasi del processo: 1. l’utente richiede una pagina residente su un server 2. il browser richiede una connessione TCP con il server 3. il server accetta la connessione iniziata dal browser 4. il browser e il server si scambiano dei messaggi 5. la connessione viene chiusa GRAFI E RETI SOCIALI, RICERCHE NEL WEB, PRIVACY E GOOGLE ANALYTICS

GRAFI

Grafo:

  • struttura relazionale che si presenta perfettamente nell’analisi del funzionamento delle reti sociali, attraverso una specifica modellazione (Social Network Analysis)
  • costituisce la base per la gestione di mappe ed itinerari
  • usato per la modellazione delle reti sociali (o social networks)
  • presente nelle strutture dati utilizzati dai motori di ricerca
  • tipi di grafo: o grafo non orientato:  ad ogni nodo del grafo è associata la lista dei suoi adiacenti  grado: numero di archi incidenti un nodo  es.: Facebook  i nodi sono le persone e gli archi sono le amicizie ed interazioni o grafo orientato:  ad ogni nodo del grafo è associata la lista dei suoi successori  caratterizzato da:  grado in ingresso: numero di archi entranti  grado in uscita: numero di archi uscenti  es.: Twitter  una persona A può seguire una persona B, ma B può scegliere di non seguire A

o numero di Erdos:  i nodi della rete sono autori di articoli di matematica  c’è un arco tra due autori se questi hanno lavorato insieme ad un articolo o numero di Bacon:  i nodi della rete sono attori cinematografici  c’è un arco tra due attori se hanno lavorato insieme in un film

Web scraping

  • tecnica informatica di estrazione di dati e informazioni dalla rete, mediante strumenti automatizzati o chiamato anche web data extraction o processo di utilizzo dei Robot (bot) per estrarre contenuti e dati da un sito web
  • esistono librerie di Python che permettono di effettuare operazioni di scraping
  • IMPORTANTE: o le operazioni di estrazione dati devono essere sempre condotte nel rispetto della privacy o bisogna controllare la data di pubblicazione: la normativa si evolve nel tempo, e non è detto che il codice che era legale in passato lo sia ancora oggi

RICERCA SU WEB

COMPONENTI DI UN MOTORE DI RICERCA:
  • Crawler: scarica in locale le pagine
  • Indexer: processa le pagine create dal crawler e crea un indice dei documenti
  • Query processor: utilizza l’indice dei documenti creato dall’indexer e restituisce i risultati ordinati METODI DI RICERCA E INDICIZZAZIONE:
  • Robot: o Programmi che operano senza supervisione umana o Si occupano della creazione degli indici:

Page Rank

  • Ordina i risultati
  • È il cuore del motore di ricerca Google o Dimensione dell’indice di google = 100 petabyte (= 100 milioni di GB) Esplorazione della pagina iniziale e ricerca di tutti i link presenti in essa Ogni link trovato viene processato in una mappatura a ricognizione continua
  • Per calcolare i valori delle pagine guarda solo la struttura di grafo delle pagine web (WebGraph) o Ogni pagina è un nodo o Ogni link tra le pagine è un arco diretto
  • Inizialmente, ogni pagina ha un valore (detto peso ), pari ad 1
  • Procedura (viene ripetuta finché i valori convergono, ovvero non cambiano più tra un’iterazione e l’altra): 1. Ogni pagina divide il suo peso tra le pagine che punta 2. Normalizzazione: vengono divisi tutti i pesi per il peso massimo tra due pagine

SOCIAL MEDIA MINING & SOCIAL NETWORK

SOCIAL MEDIA

  • Insieme di applicazioni web
  • Permettono agli utenti di creare e scambiarsi contenuti
  • Sono piattaforme digitali
  • Community online: o Gruppo di persone che si incontrano e si scambiano informazioni attraverso la rete  Persone con interessi o valori comuni o Si evolvono grazie ai social media o Tecniche per individuare le relazioni esistenti tra i componenti della community:  Analisi delle discussioni: contenuto e tempi di pubblicazione/risposta  Suddivisione in cluster: costruzione del grafo e individuazione di sotto-grafi  Attraverso l’individuazione di caratteristiche che determineranno la suddivisione in gruppi
  • Contenuto generato dagli utenti: o Qualsiasi tipo di contenuto creato dagli utenti e pubblicato in Internet o 3 criteri per illustrare i requisiti generali necessari 1. Requisiti di pubblicazione 2. Sforzo creativo 3. Creazione al di fuori delle pratiche e delle routine professionali
  • SOCIAL MEDIA MINING: o Estrazione di informazioni dai social media o Obiettivo: esaminare le informazioni e trasformarle in conoscenza o Social Media Analytics e Insights  Si occupano dell’estrazione di dati di comportamenti della piattaforma o Può essere necessario effettuare ripetuti cicli di estrazione, modificando la procedura sulla base dei risultati ottenuti nel ciclo precedente o Modalità di estrazione dei dati:  Manuale: attraverso interazione diretta con l’interfaccia grafica  Automatica: utilizza crawler, (o spider, o robot), che leggono i contenuti oggetto dell’estrazione  La lettura può essere effettuata anche attraverso ripetute richieste ai servizi API (Application Programming Interface) della piattaforma o Pre-elaborazione:  È sempre opportuno pre-trattare i dati per ottimizzare le frasi successive  I dati possono essere inizialmente letti senza controlli restrittivi: per semplificare le operazioni di estrazione

GOOGLE ANALYTICS

  • I proprietari di siti web utilizzano i dati raccolti da Google Analytics per migliorare il funzionamento dei loro siti o INFORMAZIONI SUI COOKIE:  Usati per  Memorizzare le impostazioni e preferenze dell’utente  Fornire, gestire e migliorare servizi e annunci  Personalizzare contenuti in base all’attività dell’utente sui servizi Google  Effettuare analisi e misurazioni  L’utente può decidere di rifiutare tutti i cookie o soltanto alcuni
  • Per utilizzare la piattaforma è necessario creare un account principale o All’interno possono essere definiti fino a 100 account secondari per i singoli componenti del team di lavoro o In questa fase si devono definire:  Impostazioni sulla condivisione e sul trattamento di dati  Scelta sulla condivisione delle informazioni gestite con Google Analytics con altri servizi di Google e terze parti  Filtri per impedire la raccolta di dati anche non utili per le analisi  Informazioni sul DPA (Data Processing Agreement): per attestare che le modalità di raccolta e gestione di dati sia conforme al regolamento generale sulla protezione dei dati
  • Bisogna definire le proprietà: indicano cosa si vuole tracciare o Per ogni proprietà si ottiene un tag, che dovrà essere inserito nel sito o All’interno di ogni proprietà si possono creare fino a 25 visite (ovvero l’insieme dei rapporti che creeremo sulla piattaforma)
  • Strumenti: o Acquisizione: indirizza ad un utilizzo consapevole ed interessato l’utente o Comportamento: traccia le modalità di interazione degli utenti con il sito o Conversione: quando un utente esegue un’azione di valore o Proprietà: indica le connessioni ad altri servizi o Vista: permette di  Impostare i filtri  Gestire gli obiettivi di conversione DATABASE
  • Collezione di dati o Organizzata o Persistente o Condivisa o Di notevoli dimensioni e varietà
  • Miglior controllo di: o Concorrenza su dati condivisi o Rispetto vincoli di integrità
  • Una sola rappresentazione che eviti

o Ridondanze o Disallineamenti o Inutili ripetizioni di operazioni CARATTERISTICHE DI UN DATABASE:

  • Progettazione, organizzazione in struttura di dati della realtà in oggetto
  • Sistema di gestione dei dati; interrogazioni; aggiornamenti; cancellazioni
  • Utilizzo da parte di molti utenti contemporaneamente
  • Protezione in caso di crash del sistema
  • Integrità e sicurezza
  • Gestione degli utenti per impedire accessi non autorizzati

DBMS (DATA BASE MANAGEMENT SYSTEM)

  • SISTEMA (software) DI GESTIONE DI DATI che siano o Di grandi dimensioni o Persistenti: periodo di vita indipendente dalle singole esecuzioni dei programmi che le utilizzano o Condivise: utilizzate da applicazioni e utenti diversi in maniera consistente
  • Assicurano che i data base siano o Affidabili: alta tolleranza ai guasti con funzionalità avanzate di ripristino e backup o Sicuri: disciplina e controllo degli accessi (meccanismi di autenticazione) o Efficienti: performance accettabili (rendendo produttive le attività degli utilizzatori)
  • MODELLO GERARCHICO: o I dati sono organizzabili in una struttura ad albero o Perfetto per rappresentare relazioni semplici
  • MODELLO RETICOLARE: o I nodi sono insiemi omogenei e ordinati tra loro o Archi: associazioni in cui  ogni nodo può avere più nodi padre  un nodo può avere un numero qualsiasi di figli o vi possono essere più archi che collegano la stessa coppia di nodi
  • MODELLO RELAZIONALE : o Progettato nel 1970 da E.F.Codd o Oggi, con il termine database si intende il modello relazionale o Base di dati: collezione di una o più relazioni  Ogni relazione è una tabella con righe e colonne  Relazione tra entità: un elemento di un’entità è collegato ad un elemento di un’altra entità  Collegamento tra entità avviene mediante la corrispondenza di 1 o più attributi appartenenti alle diverse entità  Relazione: costrutto principale, è costituita da  Schema relazionale: nome della relazione, nome di ogni campo/colonna/attributo, dominio di ciascun campo  Istanza della relazione: tabella
MODELLO DI DATI:
  • Insieme di concetti usati per o organizzare i dati di interesse o descrivere la struttura dei dati  obiettiva: renderla manipolabile
  • definisce il modo in cui i dati vengono: o memorizzati o organizzati o gestiti

 Con interfacce amichevoli (senza linguaggio testuale)

DIAGRAMMA ENTITÀ/RELAZIONE

  • Insiemi di entità con insiemi di associazioni che esprimono le informazioni significative
  • Associazioni n-arie (binarie, ternarie…)
  • Modello grafico per descrivere lo schema concettuale
  • Convenzioni per indicare entità, associazioni, ruoli e le loro proprietà
  • Si utilizzano diagrammi di flusso ( flow chart ) Entità:
  • Insieme di elementi distinti omogenei o Es. clienti è l’entità; Mario Rossi, Luigi Bianchi sono gli elementi
  • Nel database: o Entità: diventano tabelle o Elementi: diventano i record o Attributi: diventano i campi dello schema
  • Sono in relazione tra loro o Relazione tra entità: indica che un elemento di un’entità è collegato ad un elemento di un’altra entità  Relazione avviene attraverso la corrispondenza di 1 o più attributi appartenenti alle diverse entità o = tabelle: sono in relazione tra loro  Relazione tra tabelle: indica che un record di una tabella è collegato ad un record di un’altra tabella  Relazione avviene attraverso la corrispondenza di 1 o più campi appartenenti alle diverse tabelle o TIPI DI RELAZIONE:  Relazione 1 a 1 (1:1):  1 elemento di A  1 elemento di B  1 elemento di B  1 elemento di A  Relazione 1 a molti (1:n):  1 elemento di A  più elementi di B  1 elemento di B  1 elemento di A  Relazione molti a molti (n:n).  1 elemento di A  più elementi di B  1 elemento di B  più elementi di A Identificazione univoca dei record
  • Obiettivo: assenza di ridondanza (es. record identici)
  • Si procede dalla scelta di uno/più campi, in modo tale che tutti i record di quella tabella presentino valori diversi in quei campi
  • Chiave primaria: campi impiegati per distinguere i record  Chiave semplice: 1 solo campo  Chiave composta: più campi o La chiave primaria di una tabella è sempre indicizzata
  • Frequente l’uso di identificativi numerici progressivi

Chiavi e indici Superchiave: insieme di campi

  • Esistono due record con lo stesso valore di quei campi
  • Chiave: superchiave minimale (non esiste un’altra superchiave che la contenga) Chiave esterna: insieme di campi in una tabella
  • Fa riferimento alla chiave primaria di un’altra tabella o La chiave primaria di una tabella è sempre indicizzata Indici: tabelle di sistema
  • Permettono di usare metodi di ricerca veloci per reperire più rapidamente le informazioni desiderate TABELLE DI SISTEMA (indici):
  • Permettono di usare metodi di ricerca veloci per reperire più velocemente le informazioni Vincoli di integrità
  • Servono a garantire la correttezza dei dati inseriti
  • Vincoli all’interno di una tabella o Vincoli di valore: sul singolo campo  Es. vincolo sul voto del singolo esame o Vincoli sul singolo record
  • Vincoli tra tabelle
  • Per ogni coppia di tabelle collegate da una relazione bisogna garantire che il riferimento utilizzato sia reperibile
  • Vincoli di integrità referenziale o Integrità referenziale: sistema di regole  Garantisce che  le relazioni tra righe di tabelle correlate siano valide  non sia possibile eliminare/modificare in maniera errata i dati correlati Normalizzazione
  • nella progettazione di una base di dati si devono evitare scelte che possono produrre o incoerenza (stessi dati che assumono valori diversi) o ridondanza (dati uguali nello stesso archivio)  problemi causati dalla ridondanza:  memorizzazione non ottimizzata  anomalie (che producono dati incoerenti) da
  • inserimento
  • aggiornamento
  • cancellazione
  • se una relazione presenta più concetti tra loro indipendenti, la si decompone in relazioni più piccole (una per ogni concetto)

APPLICAZIONI OLTP (ON-LINE TRANSACTION PROCESSING)

  • obiettivi: