compressione dei dati audio | Schemi e mappe concettuali di Fondamenti di informatica

compressione dei

dati audio

Lossy ( con perdita

di informazione )

Lossless ( senza perdita

di informazione )

codec

decoder: è la parte

del sistema che si

occupa di

decodificare i dati.

deve essere molto

veloce

encoder: è quella

parte del sistema di

compressione che si

occupa di codificare

i dati.

codifica Huffmann:

algo per comprimere dati.

bisogna conoscere prima i dati

da comprimere.

<dati, <tasso di compressione.

dati da flusso continuo (non

conosco prima) dividerli in

buffer di dim grand per tass di

comp e piccolo per out put

rapido

FLAC ( Free Lossless Audio

Compression )

pensato per file audio,

senza perdità qualità.

è open-source.

blocco meta dati non def.

decoder ignora blocchi

sconosciuti.

StreamInfo Block unico

obbligatorio

1.Blocking: file in blocchi dim

parametrica

2.Inter-channel decorrelation:

memo mid e side dell'

intensità dei 2 canali stereo

(meno ingombranti)

3.Modelling: creare funz che

riduca al min l'errore la diff

con il segnale origin e il

risultato cod con - bit

4.Residual Coding: il segnale

residuo (err diff) compresso

con Huffmann

5.Framing: ogni blocco

attribuito meta-dati per decod

MPEG

encoder:

1. Banco di Filtri ibrido: dati dom

tempo->dom freq.

2. Modello psicoacustico: analizza il

segnale conv in spettro con trasf fi

Fourier utilizzando pricipi

psicoacustici per det smr.

3. Quantizzatore non lineare: cod

numericamente il modello secondo

indicazioni del mod psico +utili +bit, -

utili -bit.

4. Impacchettamento: crea frame

secondo MPEG scelto, layer 3

Huffmann

BAC, divisione dell'encoder

dello spettro. orecchio

percepisce meglio freq gravi

che acute, quindi intervalli sottili

grav e int grandi acuti

decoder:

1. Spacchettamento: il blocco viene

spacchettato in modo da

decodificarne

lo spettro, mp3 deco Huffmann

2. Banco di filtri invertito: Questa

parte si occupa di convertire lo

spettro e generare i campioni PCM

da dare in pasto al DAC o per

scrivere un

nuovo file PCM

Altri formati Lossy:

AAC ( Advanced Audio Coding ): Poichè si è analizzato che

la retrocompatibilita’ del modello MPEG-2 presuppone dei

limiti, si è deciso di creare uno standard che non fosse

limitato da queste necessità, di conseguenza questo

prevede a parità di bit-rate una miglior qualità. Integrato

Inoltre nell’MPEG-4.

MPEG-4 : L’MPEG-4 è un formato di codifica audio

rivoluzionare nel suo genere perché introduce

per la prima volta degli oggetti audio coesistenti che in

funzione delle loro caratteristiche possono

essere trattati e quindi ottimizzati ad hoc.

Windows Media Audio: è form di windows, non si sa le

specifiche

OGG Vorbis: E’ un sistema per la compressione audio Free

and Open Source basato sulla codifica percettiva nel

dominio frequenziale. Il progetto nasce con l’idea di definire

uno standar di alta

qualita’ globale e libero per la compressione lossy audio.

tipi codifica canale:

• Single channel

• Dual channel

• Stereo

• Joint Stereo - "compressa"; alg per compressione:

o Intenity stereo: sopra i 2 kHz e per ogni banda critica, il

sistema uditivo umano basa

la percezione dell’immagine stereo sull’inviluppo personale del

segnale audio

piuttosto che sull’intensità delle singole frequenze.

o M/S stereo: memorizza nel canale sinistro la media della

somma dei due canali, sul

canale destro la media della loro differenza. La codifica è

efficiente se i due canali

sono molto simili fra loro in quanto il “canale differenza” avrà

bisogno di pochi bit

per essere quantizzato

bitrate = Il numero di bit

necessari per rappresentare

un secondo di

informazione.

Processing delay

= E’ la somma

dei tempi di

esecuzione di

encoder e

decoder.

Signal quality = La

bonta’ del segnale.

si tasso compressione

dati persi x sempre

degrado file con nuove compress

tasso compressione

variabile

Segnali vocali: per compriremere

segnali audio vocali estraendo

caratteristiche come pitch e formanti

in compressione e sintetizzandoli i

decomp.

General Purpose: Si tratta di

algoritmi che lavorano sullo spettro

del

segnale guidati da un modello

psicoacusti al fine di eliminare dal

segnale tutte

le informazioni considerate “inutili”.

Formato di

codifica, Insieme di

regole e specifiche.

Encoder, più

pesante del dec.

Decode.

modello psicoacustico elimina:

• Le frequenze al di fuori della soglia di udibilita

• Se due frequenze esistono simultaneamente una

maschera l’altra per via

dell’intensita quest’ultima ha meno importanza

• Se due frequenze sono cosi vicine per cui non

percepiamo una differenza

struttuta Huffmann:

1.ogni simbolo associata

frequenza di occorrenza in

%, inizialmete tutti foglie

2.simboli con >frequenza si

rende bro, con padre nodo

con somma freq

3.nodo padre prende posto

figli, si ripete proc fino a nodo

padre con max prob

figlio sx 1, dx 0, da cosi

creare path, simbolo meni

freq, meno bit

tipi di bitrate:

• Bit-rate fisso - tutti frame cod stesso bt tasso

compressione min

• Bit-rate variabile - tutti frame bt diff buon qualità

compr

• Bit-rate FreeFormat - bt varia ma dentro range layer

• Bit-rate Average - def valore medio bt frame per

frame in fun qualità input

La compressione dati è una tecnica di elaborazione dati che, attuata per mezzo di

opportuni algoritmi, permette la riduzione della quantità di bit necessari alla

rappresentazione in forma digitale di un'informazione. La compressione dati viene

utilizzata sia per ridurre le dimensioni di un file, e quindi lo spazio necessario per la sua

memorizzazione, sia per ridurre l'occupazione di banda necessaria in una generica

trasmissione dati digitale, dove l’esigenza di comprimere si ha sia nello spazio che nel

tempo. Nel caso dei file audio, si parla appunto di compressione in quanto a riduzione di

quantità di informazione per unità di tempo. Un file audio è una sequenza

di cifre binarie (bit) utilizzata come veicolo di informazione; comprimere significa ridurre il

numero delle cifre

che costituiscono la sequenza mantenendo l'informazione inalterata o in un intorno

dell'informazione originaria (ossia facendo in modo che la nuova informazione

approssimi quella precedente)

compressione dei dati audio, Schemi e mappe concettuali di Fondamenti di informatica

Documenti correlati

Anteprima parziale del testo

Scarica compressione dei dati audio e più Schemi e mappe concettuali in PDF di Fondamenti di informatica solo su Docsity!

MPEG