Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Fondamenti di informatica, Dispense di Fondamenti di informatica

Appunti completi del corso di Fondamenti di informatica del prof Nicola Orio

Tipologia: Dispense

2023/2024

In vendita dal 03/09/2025

Iris_selvatico
Iris_selvatico 🇮🇹

35 documenti

1 / 53

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
FONDAMENTI DI INFORMATICA
Prof Nicola Orio
“L’informatica non riguarda i computer più di quanto l’astronomia riguardi i telescopi” (Edsger W. Dijkstra)
L’informatica riguarda:
- la ricerca scientifica (che consente alla tecnologia di sviluppare nuovi prodotti)
- lo sviluppo tecnologico (che pone nuovi problemi di ricerca)
(da grandi poteri derivano grandi personalità)
DEFINIZIONI
Informazione: insieme dei dati forniti dall’ambiente espressi in forma comprensibile e significativa in un
particolare contesto
La definizione mette in evidenza che
- l’informazione riguarda il modo in cui un sistema acquisisce conoscenza del mondo
- un qualsiasi dato acquista valore solo in relazione ad altre informazioni che ne definiscono il senso
Informazione = dato + contesto
Informatica: ramo della scienza che si occupa di rappresentare ed elaborare l’informazione
La definizione mette in evidenza che
- l’informazione ha un ruolo centrale (informatica viene da “informazione automatica”) (e di solito si occupa
di dati poiché sono portatori di informazioni)
- l’informatica si occupa di creare modelli (come per ogni scienza, i modelli descrivono la realtà)
- l’informatica può definirsi senza parlare di computer
Con l’avvento del digitale (che ha sostituito l’analogico) l’informazione da rappresentare o trasmettere
diventa numerica
- (nel mondo analogico) l’analogia, per quanto possa essere precisa, non sarà mai perfetta (la qualità
dell’informazione si modifica in base anche al deterioramento e all’uso del dispositivo, per esempio)
Bit: unità di informazione, in forma di cifra binaria
- trasformare la realtà in dati numerici (l’analogia non è più necessaria)
La definizione mette in evidenza che
- l’informazione è misurabile (e questa misura può quindi avere dei valori, solitamente 0 e 1)
Per gli informatici il bit è anche la più piccola quantità di informazione rappresentabile
- ma se è la più piccola, perché non esiste un valore unitario (invece di binario)? Per avere
informazione, ho bisogno di una parte di incertezza nel risultato (e la minore incertezza possibile è
binaria)
- non si fa differenza sul tipo di informazione (numeri, testo, immagini, suoni)
- un bit può assumere solo due valori: 0 e 1
Nb non avviene perdita di informazione! (si disaccoppia l’invecchiamento dell’informazione
dall’invecchiamento del supporto) e le copie dell’oggetto sono copie conformi!
Codifica unificata
I bit sono alla base di ogni rappresentazione (digitale)
Nb tante opere oramai nascono in digitale, perciò si sta sviluppando il problema della conservazione
dei bit
- ogni dato è trasformato in una sequenza finita di bit, successione di opportuna lunghezza di 0 e 1
la sequenza è la struttura dati più semplice
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35

Anteprima parziale del testo

Scarica Fondamenti di informatica e più Dispense in PDF di Fondamenti di informatica solo su Docsity!

FONDAMENTI DI INFORMATICA

Prof Nicola Orio

“L’informatica non riguarda i computer più di quanto l’astronomia riguardi i telescopi” (Edsger W. Dijkstra) L’informatica riguarda:

  • la ricerca scientifica (che consente alla tecnologia di sviluppare nuovi prodotti)
  • lo sviluppo tecnologico (che pone nuovi problemi di ricerca) (da grandi poteri derivano grandi personalità)

DEFINIZIONI

Informazione : insieme dei dati forniti dall’ambiente espressi in forma comprensibile e significativa in un particolare contesto La definizione mette in evidenza che

  • l’informazione riguarda il modo in cui un sistema acquisisce conoscenza del mondo
  • un qualsiasi dato acquista valore solo in relazione ad altre informazioni che ne definiscono il senso Informazione = dato + contesto

Informatica : ramo della scienza che si occupa di rappresentare ed elaborare l’informazione La definizione mette in evidenza che

  • l’informazione ha un ruolo centrale (informatica viene da “informazione automatica”) (e di solito si occupa di dati poiché sono portatori di informazioni)
  • l’informatica si occupa di creare modelli (come per ogni scienza, i modelli descrivono la realtà)
  • l’informatica può definirsi senza parlare di computer

Con l’avvento del digitale (che ha sostituito l’analogico) l’informazione da rappresentare o trasmettere diventa numerica

  • (nel mondo analogico) l’analogia, per quanto possa essere precisa, non sarà mai perfetta (la qualità dell’informazione si modifica in base anche al deterioramento e all’uso del dispositivo, per esempio)

Bit : unità di informazione, in forma di cifra binaria

  • trasformare la realtà in dati numerici (l’analogia non è più necessaria) La definizione mette in evidenza che
  • l’informazione è misurabile (e questa misura può quindi avere dei valori, solitamente 0 e 1) Per gli informatici il bit è anche la più piccola quantità di informazione rappresentabile
    • ma se è la più piccola, perché non esiste un valore unitario (invece di binario)? Per avere informazione, ho bisogno di una parte di incertezza nel risultato (e la minore incertezza possibile è binaria)
  • non si fa differenza sul tipo di informazione (numeri, testo, immagini, suoni)
  • un bit può assumere solo due valori: 0 e 1 Nb non avviene perdita di informazione! (si disaccoppia l’invecchiamento dell’informazione dall’invecchiamento del supporto) e le copie dell’oggetto sono copie conformi!

Codifica unificata I bit sono alla base di ogni rappresentazione (digitale) Nb tante opere oramai nascono in digitale, perciò si sta sviluppando il problema della conservazione dei bit

  • ogni dato è trasformato in una sequenza finita di bit, successione di opportuna lunghezza di 0 e 1 la sequenza è la struttura dati più semplice

Implicazioni:

  • tutti i dati sono trattati in modo uniforme (allo stesso modo) Nb in questa maniera, sarebbe sufficiente un unico supporto/strumento per tutte le info (invece nella vita reale c’è bisogno di macchine fotografiche, libri etc)
  • sono necessarie delle convenzioni nella codifica (per accedere a dati creati in tempi e per scopi diversi)
  • la quantità di dati gestibili è sempre limitata

Esempio: stessibit.pdf, stessibit.bmp etc

  • il .pdf si chiama estensione e, dati dei file con lo stesso numero di bit, è l’unico strumento che ha il pc per capire di che tipo di file si tratta (es immagine, audio, testo, pdf etc)
  • il legame tra il bit e l’informazione che mantengono è estremamente labile! (basta modificare o sbagliare l’estensione e il file potrebbe essere non più utilizzabile/rappresentabile/riproducibile)
  • per il computer sono tutte sequenza di bit, spetta a noi tener traccia di cosa rappresentano (come tradurre la sequenza) – la sequenza di bit non è sufficiente, bisogna mantenere il modo in cui sono organizzati (serve la chiave di lettura)

Byte : sequenza di 8 bit (può assumere 256 valori diversi) Il byte è utilizzato come unità di grandezza pratica dell’informazione

  • più pratico del bit (spesso un byte rappresenta un carattere a stampa nb delle lingue occidentali)
  • le grandezze sono espresse utilizzando byte (si utilizzano anche gruppi di 2, 4, 8 byte)

Multipli I multipli sono riferiti alle potenze di 2

  • si considera che 210 = 1024 ~ 1000
  • si utilizza la stessa terminologia usata in fisica kilo(K) 2 (alla decima) = 1024 ~ migliaia mega (M) 2 (alla ventesima) = 1024 (alla seconda) ~ milioni giga (G) 2 (alla trentesima) = 1024 (alla terza) ~ miliardi tera (T) 2 (alla quarantesima) = 1024 (alla quarta) ~ migliaia di miliardi peta (P) 2 (alla cinquantesima) = 1024 (alla quinta) ~ milioni di miliardi exa (E) 2 (alla sessantesima) = 1024 (alla sesta) ~ miliardi di miliardi zetta (Z) 2 (alla settantesima) = 1024 (alla settima) ~ migliaia di miliardi di miliardi
  • es 1 kilobyte = 1024 byte
  • es 1 megabyte = 1024 x 1024 byte

Nb la RAM è la memoria di lavoro (deve lavorare veloce) La memoria come spazio di archiviazione è la memoria di magazzino

File : struttura informativa contenente informazioni omogenee, organizzate sequenzialmente e trattate come un’unità

  • raccoglie informazioni coerenti tra loro e ne dà una struttura
  • significato complessivo degli aggregati è maggiore rispetto al significato dei singoli elementi informativi (es una parola significa più di una singola lettera) I file aggregano dati che hanno significato solo se mantenuti insieme
  • nomi e numeri di un’agendina telefonica
  • singole lettere di un testo L’effettiva organizzazione dei dati è decisa dal software che crea/legge il file Il software può essere proprietario o di pubblico dominio

Razionali aperiodici e irrazionali devono essere approssimati In questo corso tratteremo solo i numeri naturali

  • Lo 0 e gli interi positivi

Rappresentazione dei numeri in formato binario su base…:

Rappresentazione in base 10 Caratteristiche del sistema digitale

  • basato sulla combinazione di 10 simboli (da 0 a 9)
  • il significato di ogni cifra dipende dalla sua posizione Le cifre, partendo da destra, sono moltiplicate per una potenza crescente di 10 (1, 10, 100, ...) I prodotti sono sommati tra loro Limitazioni nel sistema binario: avendo due caselle, si possono inserire solo due cifre e quindi si potranno avere solamente 100 numeri (da 00 a 99)

Rappresentazione in base 2 Simile a quella decimale, con 2 al posto di 10

  • basato sulla combinazione di 2 simboli (0 e 1)
  • il significato di ogni cifra dipende dalla sua posizione Le cifre, partendo da destra, sono moltiplicate per una potenza crescente di 2 (1, 2, 4, 8, ...) I prodotti sono sommati tra loro Metodo più semplice ma c’è bisogno di sequenze molto molto lunghe per numeri alti

Rappresentazione in base 16 Stesso principio di base 10 e base 2

  • si usano 16 simboli diversi (numeri da 0 a 9 e lettere da A a F)
  • usata spesso per rappresentare i colori Un byte è codificato con 2 cifre esadecimali

Conversione tra le basi 2, 10 e 16

Sequenze di numeri Tanti bit al loco per un numero, tanti più numeri potrò ottenere Normalmente si usa un simbolo separatore le serie 14 7 1789 o 14-7-1789 o 14/7/1789 sono diverse dal numero 1471789

  • un bit può rappresentare solamente due simboli non si può rappresentare il simbolo separatore

Usare un numero costante di bit per ogni numero

  • indipendentemente da quanti sono necessari Ad esempio la sequenza 100101110101 equivale a
    • 100, 101, 110, 101 = 4, 5, 6, 5 utilizzando tre bit per numero
    • 1001, 0111, 0101 = 9, 7, 5 utilizzando quattro bit per numero
  • è importante decidere quanti bit vanno utilizzati per rappresentare un numero Utilizzare sequenze fisse di bit ha degli svantaggi
  • non si possono rappresentare valori troppo elevati Se si sfora il valore finale non è significativo
  • spesso si usano più bit del necessario I bit più a sinistra sono uguali a zero
  • è necessario conoscere a priori il numero di bit Normalmente si utilizzano byte e multipli
  • 1 byte = 8 bit = numeri da 0 a 255
  • 2 byte = 16 bit = numeri da 0 a 65535
  • 4 byte = 32 bit = numeri da 0 a circa 4,3 miliardi
  • 8 byte = 64 bit = numeri da 0 a circa 18 miliardi di miliardi

Codifica del testo Un testo è una sequenza di simboli (caratteri, generalmente nelle lingue ogni suono corrisponde a un segno grafico)

  • organizzato in forma lineare Concetto simile alla sequenza finita di bit L’insieme di simboli è finito e noto a priori
  • simboli possono essere Numeri, segni d’interpunzione, operatori Lettere di un alfabeto
    • latino, greco, cirillico, arabo, ebraico
    • differenze nei diacritici (å ç ř ê) Ideogrammi

Codifica di caratteri I caratteri appartengono ad un insieme noto

  • ad ogni carattere si associa un numero intero L’intero è il codice del carattere
  • l’associazione va fatta per tutti i possibili simboli I simboli senza un codice non sono rappresentabili Bisogna porre attenzione alla scelta dell’alfabeto
  • l’associazione è arbitraria Un testo diventa una sequenza di numeri
  • bisogna scegliere quanti bit si usano per ogni numero (conviene scegliere il numero minore possibile)
  • il numero di bit dipende dall’alfabeto 6 bit = 64 caratteri 7 bit = 128 caratteri 8 bit = 256 caratteri 16 bit = 65536 caratteri Non esiste una codifica naturale
  • conviene preservare l’ordine alfabetico Ordinare un testo diventa come ordinare numeri

Unicode Consorzio quindi codice unico Proposta di standard che si basa sull’ASCII a 7 bit e su Latin 1 Scopo: dare un codice unico per ogni simbolo

  • indipendentemente dal computer e dal software (gestisce anche il software per i caratteri e il supporto per utilizzarlo) Superare i limiti dell’ASCII
  • codifica tutte le lingue Ideogrammi ma anche simboli di lingue morte
  • utilizza un sistema per minimizzarne la quantità Un testo di solito è scritto in una sola lingua
    • rappresenta solo un sottoinsieme dei caratteri di Unicode Utilizza il numero di bit necessari per ogni lingua Un carattere può occupare 1, 2 o addirittura 4 bit
  • esistono implementazioni a 8, 16 o 32 bit Punto in comune con l’ASCII sono i primi 256 codici

E il resto dell’informazione? (quella non simbolica es suoni o immagini o video o altro ancora, che ha a che fare con la percezione della realtà)

Informazione continua Numeri e testo

  • sono rappresentati con simboli Finiti noti a priori Rappresentati da un’opportuna sequenza di bit Suoni e immagini
  • sono di natura continua
  • infinite variazioni Non è possibile una rappresentazione simbolica Si deve approssimare la realtà (come?) Nel mondo reale
  • le grandezze variano con continuità Variazione nel tempo dei suoni Variazione nello spazio delle immagini
  • necessario usare sequenze di lunghezza infinita Si applica un campionamento
  • le grandezze assumono qualsiasi valore Ampiezza dell’onda sonora o tonalità deli colori
  • necessario usare moltissimi bit Si applica una quantizzazione

IL COLORE

Il colore è dovuto a onde elettromagnetiche nello spettro visibile (da 380 nm a 730 nm) Il colore sono onde elettromagnetiche che si propagano nello spazio

  • onde ad alta frequenza (raggi x, ultravioletti), spettro del visibile, onde a bassa frequenza (es infrarosso, radar etc)
  • le onde sono percepite da dei sensori specializzati in certe zone (red, green, blu rgb e un sensore per la mancanza di luce)

La luce bianca Classico esperimento del prisma

  • bianco = somma di tutti i colori (alla stessa intensità)
  • Newton: dato che la luce bianca può essere scomposta nei colori dell’iride (o arcobaleno), la somma di tutti i colori darà la percezione di bianco Esperimento del disco colorato rotante

Idea di dover rappresentare qualcosa in base alla frequenza

Assorbimento e riflessione: gli oggetti assorbono e riflettono i colori

  • nei trasmettitori (es televisione, proiettori etc) si fa attenzione alla luce che viene prodotta, ma nella maggior parte delle cose che vediamo si caratterizza dalla luce che non viene assorbita

L’occhio

La retina Due tipi di fotorecettori

  • coni (cones)
  • bastoncelli (rodes) Quando la luce è assorbita dai fotorecettori, l’energia luminosa è convertita in segnali elettrici e chimici
  • questi segnali sono trasmessi al cervello dal nervo ottico

I bastoncelli (rodes) Caratteristiche principali dei bastoncelli

  • sensibili a variazioni luce-buio (responsabili della visione notturna) Circa 1000 volte più sensibili alla luminosità dei coni
    • poco efficaci nella percezione del colore
  • distribuiti soprattutto nella periferia della retina Più rapidi a rispondere agli stimoli
    • visione periferica più rapida rispetto alla frontale Ci sono circa 120 milioni di bastoncelli nella retina
  • le immagini generate dai bastoncelli sono poco nitide e limitate a sfumature di grigio

Rappresentazione CMYK Sintesi sottrattiva (stampanti, plotter)

  • 3 colori fondamentali Cyan (azzurro chiaro), Magenta (viola-lilla), Yellow (giallo)
  • 3 colori secondari Red = Yellow + Magenta Green = Yellow + Cyan Blue = Magenta + Cyan
  • ruolo opposto dei colori rispetto alla sintesi additiva

RGB e CMYK a confronto Sintesi additiva (RGB)

  • assenza di colore = nero -tutti i colori al massimo = bianco Sintesi sottrattiva (CMYK)
  • assenza di colore = bianco
  • tutti i colori al massimo = marrone scuro (non nero) (viene utilizzato un quarto colore, il blacK (nero) Entrambe le sintesi
  • somma dei tre colori fondamentali con uguale percentuale da diverse sfumature di grigio Nb l’RGB è considerato il più efficiente (a parità di info, l’RGB mostra più sfumature percepite)

Rappresentazione HSL Tre dimensioni percettive

  • Hue (tonalità) È la caratteristica per cui classifichiamo un oggetto come “avente un dato colore” (rosso, verde, blu, giallo, indaco, oliva etc)
  • Saturation (saturazione) Purezza di un colore, quantità di bianco (o nero) mischiato al colore base (colore più o meno carico o sbiadito o ingrigito etc)
  • Lightness (luminosità) Intensità della luce che lo colpisce e lo definisce, percezione di chiaro o scuro (es ombre)

Ogni pixel è scomponibile in tre unità ovvero HSL, e ciascuna unità può essere rappresentata con un certo numero in base all’intensità/livello

Esiste un altro canale ed è la trasparenza!

Rappresentazione tramite bit Come per ogni altra informazione, si utilizza un numero fisso di bit per rappresentare il colore

  • rappresentazione RGB la più diffusa Utile per schermi, proiettori che emettono luce
    • per usare le stampanti viene convertita in CMYK Si assegna un numero fisso di bit per ogni colore fondamentale
    • scelta naturale: 1 byte per ogni colore
    • ogni punto quindi è rappresentato da 3 byte (sarebbero 4, per la trasparenza) Spesso si aggiunge il canale alpha (trasparenza)

Esempio del numero di bit

Valori tipici 1 bit: bianco e nero Usata solo in passato per la scansione di documenti 4-8 bit : sfumature di grigio (da 16 a 256) Per scansioni di immagini nate in bianco e nero 1 byte: 256 colori diversi, scelti da una palette Immagini non fotografiche, GIF 3 byte: 16 milioni di colori (precisamente 16 777 216) Configurazione tipica 4 byte: circa 4,3 miliardi di combinazioni Aggiunta del canale alpha per la trasparenza Utile anche perché le schede video sono a 32 bit

Non ancora pixel e dpi (dot per index, punti per pollice) Tecnicamente la rappresentazione dei colori riguarda la quantizzazione dell’informazione

  • devo approssimare il valore di una quantità continua (il colore) con un numero finito di bit La selezione dei pixel, quanti per unità di lunghezza, riguarda il campionamento
  • devo fare un numero finito di misurazioni da un fenomeno che varia con continuità (la superficie dell’immagine)

Formato PNG (portable network graphic) – 170 KB

  • buon formato di compressione
  • lavora con il concetto di ridondanza (quando l’immagine è quasi omogenea es se una parte di sfondo è tutta bianca, è rappresentato con un rettangolo bianco)

Formato GIF – 53 KB

  • zona del compromesso tra qualità e spazio
  • utile per le copie di diffusione (no immagine di archivio)
  • nonostante i pixel abbiano la stessa dimensione, invece di rappresentare tutti i colori possibili vengono rappresentati solo quelli scelti (256 colori) Per esempio, le sfumature vengono rappresentate come fasce di colori (approssima i colori)
  • va bene per le immagini create al computer (es loghi, interventi di grafica) ma non per le immagini fotografiche
  • utile per testo, grafici, immagini con pochi colori

Formato EPS – 448 KB

  • risulta più sfocato (non si riconoscono bene nemmeno i pixel)
  • usato in editoria, aperto, standard, leggermente ridondante, disegna l’immagine
  • linguaggio che dice alla stampante cosa deve fare, come disegnare l’immagine
  • da qui deriva il pdf

Formato JPG – 14 KB

  • quando salvo l’immagine compressa posso decidere quando comprimerla Nb comprime sempre e comunque, quindi occhio (meglio usarlo solo alla fine)
  • prende l’immagine e la divide in quadratoni, e poi cerca di rappresentare ciascun quadratone nel miglior modo possibile
  • quando c’è un cambio netto di colore, vi è un riversamento di colore da un quadrato all’altro)
  • ottimo per un’immagine fotografica normale (ma no con dettagli di testo o grafica)
  • limite: non gestisce la trasparenza e comprime sempre

Formato ZIP

  • programma di compressione (non nasce per l’immagine ma per il testo) che sfrutta la ridondanza
  • non sul numero di punti ma sul numero di colori

RAPPRESENTAZIONE DELL’INFORMAZIONE PT 2

La realtà varia con continuità (es colori) e noi dobbiamo prendere dei campioni (pixel)

  • va trovato il giusto numero di info per non perderne di rilevanti

Campionamento Es. 1: La temperatura di una stanza

  • impossibile misurarla ad ogni istante La temperatura varia lentamente
    • La misura a 12:00 è quasi uguale a 11:59 e 12:
    • La misura a 12:00 simile a 11:45 e 12: Es. 2: L’altezza di un terreno
  • impossibile misurarla in ogni singolo punto In molti casi i dislivelli sono minimi
    • La misura in un punto è quasi uguale nel centimetro intorno
  • La misura in un punto è simile a quella a 10 metri di distanza Data una grandezza che varia con continuità nel tempo o nello spazio
  • si sceglie ogni quanto misurarla Si fa in modo che sia rappresentativa Misure molto ravvicinate
  • Si devono fare tante misurazioni che occupano spazio Misure molto distanziate
  • Si rischia di perdere variazioni importanti Le misure si chiamano campioni In informatica i campioni sono equispaziati
  • Non obbligatorio, scelto per semplicità
  • frequenza di campionamento Numero di campioni nell’unità di tempo
  • Usato per i suoni Numero di campioni nell’unità di lunghezza
  • Usato per le immagini
  • l’informazione tra due campioni è persa del tutto Campioni molto ravvicinati minimizzano la perdita
  • Compromesso tra precisione e costo (misurazione, spazio, ...)

Quantizzazione Es. 1: La temperatura di una stanza Il termometro è impreciso

  • Il valore oltre un certo numero di decimale non è significativo In casa non ha senso misurare i centesimi di grado
  • Sono inutili per la particolare applicazione Es. 2: L’altezza di un terreno L’altimetro è impreciso
  • Non ha senso misurare i millimetri di altezza sul livello del mare La precisione dipende dall’applicazione
  • Mappa per alpinisti oppure mappa per cartina stradale Data una grandezza che può assumere un qualsiasi valore continuo
  • si sceglie quanto approssimarla/arrotondarla (ogni arrotondamento porta a un errore) Si fa in modo che l’errore sia ridotto Arrotondamento fine
  • Si deve misurare con precisione, si occupa molto spazio Arrotondamento grossolano
  • Si rappresenta la grandezza in modo approssimativo
  • L’utente percepisce questo arrotondamento come un rumore aggiunto alla grandezza misurata In informatica l’arrotondamento si basa sulla quantizzazione
  • i valori possibili sono numerati Bisogna scegliere con cura cosa rappresentare
  • Valori non previsti non sono rappresentabili
  • ad ogni valore viene associato un numero intero Simile alla codifica dei caratteri
  • una volta approssimato, il valore iniziale è perso Quanti molto ravvicinati minimizzano la perdita
  • Compromesso tra precisione e costo (spazio)
  • A volte si può manipolare direttamente il file compresso
  • Se serve decomprimerlo i tempi di calcolo possono aumentare Tipologie di compressione
  • lossless (senza perdita) Il processo è completamente invertibile Usata per testi, programmi, multimedia di qualità
  • basata sulla ridondanza dell’informazione Esempi: archivi .zip, .rar, .tgz
  • lossy (con perdita) Non si riesce a tornare perfettamente al file iniziale Usata per immagini, suoni e video
  • basata sulle soglie percettive umane Esempi: file .jpg, .mp3, .mpg, .avi Compressione lossless L’informazione può essere ridondante
  • Pixel di una zona monocroma di un’immagine
  • Parole ripetute, serie di spazi o a capo Si usano meno bit per descrivere le ridondanze Gli elementi hanno diverso contenuto informativo
  • Dopo la “q” è molto probabile trovare una “u”
  • Fase di attacco di un suono rispetto alla fase di nota tenuta Si usa un numero di bit proporzionale all’effettiva quantità di informazione Compressione lossy L’occhio e l’orecchio hanno dei limiti fisici
  • ciò che non è percepito non è rappresentato Dipende anche dalle interfacce di output
  • si è effettua un degrado al di sotto della soglia di percezione (di occhio e/o orecchio) Attenzione: compressioni successive portano il degrado ad essere visibile/udibile (effetto fotocopia di fotocopia)
  • scelta tra fattore di compressione e accettabilità Si può accettare di percepire il degrado se è più importante avere file di piccole dimensioni

LA RAPPRESENTAZIONE DEL SUONO NEI SISTEMI DIGITALI

Il suono percepito dall’uomo è dovuto a onde di pressione da circa 20 a 20000 Hz (Hertz)

  • l’intervallo effettivo varia con l’età (diventa minore più si invecchia) e con l’esposizione a segnali forti

Suono e rumore

  • tono/nota: ha un andamento regolare, che si ripete uguale ad ogni ciclo Generato da
    • corpi in grado di mantenere un’oscillazione periodica es corde tese (chitarra, pianoforte, strumenti ad arco, arpa) e tubi cavi (sassofoni, ottoni, legni, flauti, organo, campane tubolari)
  • rumore: non ha un andamento periodico Generato da
    • rumori impulsivi ovvero qualsiasi oggetto percosso (in musica, tamburi e piatti)
  • rumori stazionari come macchinari e suoni naturali

Caratteristiche di un suono Frequenza

  • quante volte si ripete in un secondo Legata alla percezione di altezza sonora: grave/acuto Intensità - quanto ampia è l’oscillazione Legata alla percezione di volume: piano/forte Timbro
  • caratteristica sonora che consente di riconoscere come diversi due suoni con pari frequenza e intensità

Toni puri e complessi Un tono puro è composto da un’unica oscillazione

  • può avere diverse frequenze e ampiezze
  • ha la forma di una sinusoide Un tono complesso è la somma di tante sinusoidi
  • fondamentale: sinusoide con frequenza minima
  • armoniche: sinusoidi multiple intere della fondamentale

Suoni strumentali Oscillazione di una corda tesa:

L’orecchio

Le cellule ciliate Suoni gravi (basse frequenze) eccitano le cellule ad una estremità, suoni gravi all’altra estremità

  • non sentiamo infrasuoni e ultrasuoni perché non abbiamo cellule ciliate per quelle frequenze Suoni complessi
  • ogni suono ha un pattern di eccitazione
  • grazie a questo che riconosciamo il parlato Vocali e consonanti
  • riconosciamo anche gli strumenti musicali Altezza, intensità Timbro

Lo spettrogramma

Risparmiare bit Nella rappresentazione dei CD

  • 1 minuto di audio
    • 60 (secondi) * 44100 (campioni) * 2 (stereo) * 2 (byte)
    • Sono in tutto 10.584.000 byte (ovvero circa 10 MB)
  • è necessario applicare tecniche di compressione Lossless (poco diffusa, può arrivare a compressione del 40-50%) Lossy (standard per l’ascolto della musica; si basa sullo studio della percezione sonora)

Soglia di udibilità I suoni di bassa intensità non vengono percepiti, la soglia dipende dalla frequenza

Curve isofoniche L’intensità percepita dipende dalla frequenza

Mascheramento in frequenza Quando due toni sono compresenti, il suono più forte può mascherare il più debole

  • si parla di bande critiche quando l’effetto è maggiore Effetto del mascheramento

Mascheramento temporale Un suono di alta intensità rende inudibili per un po’ di tempo i suoni più flebili

Spazializzazione Localizzazione della sorgente sonora

  • storicamente legata al concetto di stereofonia Approssimabile alla differenza temporale con cui un suono giunge alle due orecchie Insufficiente per localizzare una sorgente nello spazio
  • superata nei sistemi di home theatre e nei cinema Dal semplice 4.1 alle configurazioni con 64 o 128 canali La percezione dipendente dall’altezza sonora Suoni molto gravi non sono localizzabili Suoni molto acuti localizzabili in base al loro inviluppo

Il formato MP MP3 = MPEG 1 – Layer 3 MPEG perché Moving Picture Expert Group

  • esteso poi alle versioni MPEG2, MPEG Compatibilità all’indietro per molti player Layer 3
  • sono previsti tre layer, di crescente complessità e fattore di compressione a parità di qualità Il più utilizzato è il Layer 3 Utilizza le conoscenze sulla percezione sonora

Il formato AAC Advanced Audio Coding

  • usa molte delle strategie dell’MP E’ stato inventato solo 4 anni dopo
  • gestisce meglio il joint-stereo Ovvero il fatto che i canali stereo sono molto correlati tra loro
  • non è ancora molto popolare Problemi di compatibilità con i lettori (soprattutto quelli portatili) NB: Nel 2017 è scaduto il brevetto MP3 negli USA

Compressione della voce Assume un modello sorgente/risuonatore

  • la sorgente, la glottide, emette un segnale semplice, approssimabile con un’onda triangolare
  • il risuonatore, il tratto vocale, è approssimabile con un filtro la cui caratteristica varia lentamente nel tempo