Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


compressione dei dati audio, Schemi e mappe concettuali di Fondamenti di informatica

schemi per informatica applicata alla musica

Tipologia: Schemi e mappe concettuali

2020/2021

Caricato il 03/07/2024

luca-maggi-26
luca-maggi-26 🇮🇹

59 documenti

1 / 1

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
compressione dei
dati audio
Lossy ( con perdita
di informazione )
Lossless ( senza perdita
di informazione )
codec
decoder: è la parte
del sistema che si
occupa di
decodificare i dati.
deve essere molto
veloce
encoder: è quella
parte del sistema di
compressione che si
occupa di codificare
i dati.
codifica Huffmann:
algo per comprimere dati.
bisogna conoscere prima i dati
da comprimere.
<dati, <tasso di compressione.
dati da flusso continuo (non
conosco prima) dividerli in
buffer di dim grand per tass di
comp e piccolo per out put
rapido
FLAC ( Free Lossless Audio
Compression )
1.Blocking: file in blocchi dim
parametrica
2.Inter-channel decorrelation:
memo mid e side dell'
intensità dei 2 canali stereo
(meno ingombranti)
3.Modelling: creare funz che
riduca al min l'errore la diff
con il segnale origin e il
risultato cod con - bit
4.Residual Coding: il segnale
residuo (err diff) compresso
con Huffmann
5.Framing: ogni blocco
attribuito meta-dati per decod
MPEG
encoder:
1. Banco di Filtri ibrido: dati dom
tempo->dom freq.
2. Modello psicoacustico: analizza il
segnale conv in spettro con trasf fi
Fourier utilizzando pricipi
psicoacustici per det smr.
3. Quantizzatore non lineare: cod
numericamente il modello secondo
indicazioni del mod psico +utili +bit, -
utili -bit.
4. Impacchettamento: crea frame
secondo MPEG scelto, layer 3
Huffmann
BAC, divisione dell'encoder
dello spettro. orecchio
percepisce meglio freq gravi
che acute, quindi intervalli sottili
grav e int grandi acuti
decoder:
1. Spacchettamento: il blocco viene
spacchettato in modo da
decodificarne
lo spettro, mp3 deco Huffmann
2. Banco di filtri invertito: Questa
parte si occupa di convertire lo
spettro e generare i campioni PCM
da dare in pasto al DAC o per
scrivere un
nuovo file PCM
Altri formati Lossy:
AAC ( Advanced Audio Coding ): Poichè si è analizzato che
la retrocompatibilita’ del modello MPEG-2 presuppone dei
limiti, si è deciso di creare uno standard che non fosse
limitato da queste necessità, di conseguenza questo
prevede a parità di bit-rate una miglior qualità. Integrato
Inoltre nell’MPEG-4.
MPEG-4 : L’MPEG-4 è un formato di codifica audio
rivoluzionare nel suo genere perché introduce
per la prima volta degli oggetti audio coesistenti che in
funzione delle loro caratteristiche possono
essere trattati e quindi ottimizzati ad hoc.
Windows Media Audio: è form di windows, non si sa le
specifiche
OGG Vorbis: E’ un sistema per la compressione audio Free
and Open Source basato sulla codifica percettiva nel
dominio frequenziale. Il progetto nasce con l’idea di definire
uno standar di alta
qualita’ globale e libero per la compressione lossy audio.
tipi codifica canale:
• Single channel
• Dual channel
• Stereo
• Joint Stereo - "compressa"; alg per compressione:
o Intenity stereo: sopra i 2 kHz e per ogni banda critica, il
sistema uditivo umano basa
la percezione dell’immagine stereo sull’inviluppo personale del
segnale audio
piuttosto che sull’intensità delle singole frequenze.
o M/S stereo: memorizza nel canale sinistro la media della
somma dei due canali, sul
canale destro la media della loro differenza. La codifica è
efficiente se i due canali
sono molto simili fra loro in quanto il “canale differenza” avrà
bisogno di pochi bit
per essere quantizzato
bitrate = Il numero di bit
necessari per rappresentare
un secondo di
informazione.
Processing delay
= E’ la somma
dei tempi di
esecuzione di
encoder e
decoder.
Signal quality = La
bonta’ del segnale.
si tasso compressione
dati persi x sempre
degrado file con nuove compress
tasso compressione
variabile
Segnali vocali: per compriremere
segnali audio vocali estraendo
caratteristiche come pitch e formanti
in compressione e sintetizzandoli i
decomp.
General Purpose: Si tratta di
algoritmi che lavorano sullo spettro
del
segnale guidati da un modello
psicoacusti al fine di eliminare dal
segnale tutte
le informazioni considerate “inutili”.
Formato di
codifica, Insieme di
regole e specifiche.
Encoder, più
pesante del dec.
Decode.
modello psicoacustico elimina:
• Le frequenze al di fuori della soglia di udibilita
• Se due frequenze esistono simultaneamente una
maschera l’altra per via
dell’intensita quest’ultima ha meno importanza
• Se due frequenze sono cosi vicine per cui non
percepiamo una differenza
struttuta Huffmann:
1.ogni simbolo associata
frequenza di occorrenza in
%, inizialmete tutti foglie
2.simboli con >frequenza si
rende bro, con padre nodo
con somma freq
3.nodo padre prende posto
figli, si ripete proc fino a nodo
padre con max prob
figlio sx 1, dx 0, da cosi
creare path, simbolo meni
freq, meno bit
tipi di bitrate:
• Bit-rate fisso - tutti frame cod stesso bt tasso
compressione min
• Bit-rate variabile - tutti frame bt diff buon qualità
compr
• Bit-rate FreeFormat - bt varia ma dentro range layer
• Bit-rate Average - def valore medio bt frame per
frame in fun qualità input
La compressione dati è una tecnica di elaborazione dati che, attuata per mezzo di
opportuni algoritmi, permette la riduzione della quantità di bit necessari alla
rappresentazione in forma digitale di un'informazione. La compressione dati viene
utilizzata sia per ridurre le dimensioni di un file, e quindi lo spazio necessario per la sua
memorizzazione, sia per ridurre l'occupazione di banda necessaria in una generica
trasmissione dati digitale, dove l’esigenza di comprimere si ha sia nello spazio che nel
tempo. Nel caso dei file audio, si parla appunto di compressione in quanto a riduzione di
quantità di informazione per unità di tempo. Un file audio è una sequenza
di cifre binarie (bit) utilizzata come veicolo di informazione; comprimere significa ridurre il
numero delle cifre
che costituiscono la sequenza mantenendo l'informazione inalterata o in un intorno
dell'informazione originaria (ossia facendo in modo che la nuova informazione
approssimi quella precedente)

Anteprima parziale del testo

Scarica compressione dei dati audio e più Schemi e mappe concettuali in PDF di Fondamenti di informatica solo su Docsity!

compressione dei dati audio

Lossy ( con perdita di informazione )

Lossless ( senza perdita di informazione )

codec

decoder: è la parte del sistema che si occupa di decodificare i dati. deve essere molto veloce

encoder: è quella parte del sistema di compressione che si occupa di codificare i dati.

codifica Huffmann: algo per comprimere dati. bisogna conoscere prima i dati da comprimere. <dati, <tasso di compressione. dati da flusso continuo (non conosco prima) dividerli in buffer di dim grand per tass di comp e piccolo per out put rapido

FLAC ( Free Lossless Audio Compression )

pensato per file audio, senza perdità qualità. è open-source. blocco meta dati non def. decoder ignora blocchi sconosciuti. StreamInfo Block unico obbligatorio

1.Blocking: file in blocchi dim parametrica 2.Inter-channel decorrelation: memo mid e side dell' intensità dei 2 canali stereo (meno ingombranti) 3.Modelling: creare funz che riduca al min l'errore la diff con il segnale origin e il risultato cod con - bit 4.Residual Coding: il segnale residuo (err diff) compresso con Huffmann 5.Framing: ogni blocco attribuito meta-dati per decod

MPEG

encoder:

  1. Banco di Filtri ibrido: dati dom tempo->dom freq.
  2. Modello psicoacustico: analizza il segnale conv in spettro con trasf fi Fourier utilizzando pricipi psicoacustici per det smr.
  3. Quantizzatore non lineare: cod numericamente il modello secondo indicazioni del mod psico +utili +bit, - utili -bit.
  4. Impacchettamento: crea frame secondo MPEG scelto, layer 3 Huffmann

BAC, divisione dell'encoder dello spettro. orecchio percepisce meglio freq gravi che acute, quindi intervalli sottili grav e int grandi acuti decoder:

  1. Spacchettamento: il blocco viene spacchettato in modo da decodificarne lo spettro, mp3 deco Huffmann
  2. Banco di filtri invertito: Questa parte si occupa di convertire lo spettro e generare i campioni PCM da dare in pasto al DAC o per scrivere un nuovo file PCM

Altri formati Lossy: AAC ( Advanced Audio Coding ): Poichè si è analizzato che la retrocompatibilita’ del modello MPEG-2 presuppone dei limiti, si è deciso di creare uno standard che non fosse limitato da queste necessità, di conseguenza questo prevede a parità di bit-rate una miglior qualità. Integrato Inoltre nell’MPEG-4. MPEG-4 : L’MPEG-4 è un formato di codifica audio rivoluzionare nel suo genere perché introduce per la prima volta degli oggetti audio coesistenti che in funzione delle loro caratteristiche possono essere trattati e quindi ottimizzati ad hoc. Windows Media Audio: è form di windows, non si sa le specifiche OGG Vorbis: E’ un sistema per la compressione audio Free and Open Source basato sulla codifica percettiva nel dominio frequenziale. Il progetto nasce con l’idea di definire uno standar di alta qualita’ globale e libero per la compressione lossy audio.

tipi codifica canale:

  • Single channel
  • Dual channel
  • Stereo
  • Joint Stereo - "compressa"; alg per compressione: o Intenity stereo: sopra i 2 kHz e per ogni banda critica, il sistema uditivo umano basa la percezione dell’immagine stereo sull’inviluppo personale del segnale audio piuttosto che sull’intensità delle singole frequenze. o M/S stereo: memorizza nel canale sinistro la media della somma dei due canali, sul canale destro la media della loro differenza. La codifica è efficiente se i due canali sono molto simili fra loro in quanto il “canale differenza” avrà bisogno di pochi bit per essere quantizzato

bitrate = Il numero di bit necessari per rappresentare un secondo di informazione.

Processing delay = E’ la somma dei tempi di esecuzione di encoder e decoder.

Signal quality = La bonta’ del segnale.

si tasso compressione dati persi x sempre degrado file con nuove compress

tasso compressione variabile

Segnali vocali: per compriremere segnali audio vocali estraendo caratteristiche come pitch e formanti in compressione e sintetizzandoli i decomp.

General Purpose: Si tratta di algoritmi che lavorano sullo spettro del segnale guidati da un modello psicoacusti al fine di eliminare dal segnale tutte le informazioni considerate “inutili”.

Formato di codifica, Insieme di regole e specifiche.

Encoder, più pesante del dec.

Decode.

modello psicoacustico elimina:

  • Le frequenze al di fuori della soglia di udibilita
  • Se due frequenze esistono simultaneamente una maschera l’altra per via dell’intensita quest’ultima ha meno importanza
  • Se due frequenze sono cosi vicine per cui non percepiamo una differenza (^) struttuta Huffmann: 1.ogni simbolo associata frequenza di occorrenza in %, inizialmete tutti foglie 2.simboli con >frequenza si rende bro, con padre nodo con somma freq 3.nodo padre prende posto figli, si ripete proc fino a nodo padre con max prob figlio sx 1, dx 0, da cosi creare path, simbolo meni freq, meno bit

tipi di bitrate:

  • Bit-rate fisso - tutti frame cod stesso bt tasso compressione min
  • Bit-rate variabile - tutti frame bt diff buon qualità compr
  • Bit-rate FreeFormat - bt varia ma dentro range layer
  • Bit-rate Average - def valore medio bt frame per frame in fun qualità input

La compressione dati è una tecnica di elaborazione dati che, attuata per mezzo di opportuni algoritmi, permette la riduzione della quantità di bit necessari alla rappresentazione in forma digitale di un'informazione. La compressione dati viene utilizzata sia per ridurre le dimensioni di un file, e quindi lo spazio necessario per la sua memorizzazione, sia per ridurre l'occupazione di banda necessaria in una generica trasmissione dati digitale, dove l’esigenza di comprimere si ha sia nello spazio che nel tempo. Nel caso dei file audio, si parla appunto di compressione in quanto a riduzione di quantità di informazione per unità di tempo. Un file audio è una sequenza di cifre binarie (bit) utilizzata come veicolo di informazione; comprimere significa ridurre il numero delle cifre che costituiscono la sequenza mantenendo l'informazione inalterata o in un intorno dell'informazione originaria (ossia facendo in modo che la nuova informazione approssimi quella precedente)