Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


MPEG-2: Codificación y Decodificación de Videos Digitales, Tesinas de Procesamiento de Imágenes Digitales

El estándar internacional iso/iec 13818-2, conocido como mpeg-2, utilizado para la codificación y decodificación de videos digitales. El proceso incluye predicción de movimiento, transformación dct y cuantificación de coeficientes, entre otros. El texto explica detalles de la codificación de imágenes p, b y i, y la estructura del stream de video.

Tipo: Tesinas

2018/2019

Subido el 10/02/2019

Isravasquez
Isravasquez 🇪🇨

1 documento

1 / 9

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Introducción
El estándar internacional ISO/IEC 13818-2 describe un sistema conocido como
MPEG-2, para codicación y decodicación de video digital. El video es codicado
como una serie de palabras código en una manera complicada que causa que la
longitud promedio de las palabras código sea mucho más pequeñas. Por ejemplo
cada pixel en cada cuadro (frame) fue codicado con un valor de 8 bits. Este
estándar permite codicar a un amplio rango de resoluciones, incluyendo una alta
resolución comúnmente conocida como HDTV.
En este sistema, las imágenes codicadas se componen de píxeles. Cada matriz de
8x8 de píxeles se conoce como un bloque. Una matriz de 2x2 de bloques se
denomina un macrobloque. La compresión se consigue utilizando las técnicas bien
conocidas de predicción (estimación de movimiento en el codicador, la
compensación de movimiento en el decodicador), 2 de coseno discreta
bidimensional de transformación (DCT) realizó en bloques de 8x8 de píxeles, la
cuanticación de los coecientes DCT, y Human y RUN / nivel codicación. Frames
llamadas I imágenes se codican sin predicción. Fotos denominadas imágenes P
pueden codicarse con la predicción de las imágenes anteriores. B fotos se pueden
codicar utilizando la predicción de las dos imágenes anteriores y posteriores. A
simplicada MPEG- 2 codicador y el decodicador se muestran en el codicador /
decodicador MPEG Diagrama.
Codicación
El proceso de codicación para las imágenes P y B se explicará a continuación.
Los datos que representan los macrobloques de los valores de píxel de una imagen
a codicar son alimentados tanto al sustractor y el estimador de movimiento. El
estimador de movimiento compara cada uno de estos nuevos macrobloques con
macrobloques en una imagen o imágenes de referencia almacenada con
anterioridad. Encuentra el macrobloque en la imagen de referencia que más se
acerque el nuevo macrobloque. El estimador de movimiento calcula un vector de
movimiento (MV), que representa el desplazamiento horizontal y vertical desde el
macrobloque se codica a la zona de macrobloque de tamaño coincidente en la
imagen de referencia. Tenga en cuenta que los vectores de movimiento tienen una
resolución media pixel alcanzado por interpolación lineal entre los píxeles
adyacentes.
El estimador de movimiento también lee este macrobloque correspondiente
(conocido como un macrobloque predicho) fuera de la memoria de imágenes de
referencia y la envía al sustractor que lo resta, en un píxel por píxel, a partir de la
nueva macrobloque de entrar en el codicador. Esto forma un error de predicción o
la señal residual que representa la diferencia entre el macrobloque predicho y el
macrobloque actual que se está codicando. Esta residual es a menudo muy
pequeña.
pf3
pf4
pf5
pf8
pf9

Vista previa parcial del texto

¡Descarga MPEG-2: Codificación y Decodificación de Videos Digitales y más Tesinas en PDF de Procesamiento de Imágenes Digitales solo en Docsity!

Introducción

El estándar internacional ISO/IEC 13818-2 describe un sistema conocido como MPEG-2, para codificación y decodificación de video digital. El video es codificado como una serie de palabras código en una manera complicada que causa que la longitud promedio de las palabras código sea mucho más pequeñas. Por ejemplo cada pixel en cada cuadro (frame) fue codificado con un valor de 8 bits. Este estándar permite codificar a un amplio rango de resoluciones, incluyendo una alta resolución comúnmente conocida como HDTV.

En este sistema, las imágenes codificadas se componen de píxeles. Cada matriz de 8x8 de píxeles se conoce como un bloque. Una matriz de 2x2 de bloques se denomina un macrobloque. La compresión se consigue utilizando las técnicas bien conocidas de predicción (estimación de movimiento en el codificador, la compensación de movimiento en el decodificador), 2 de coseno discreta bidimensional de transformación (DCT) realizó en bloques de 8x8 de píxeles, la cuantificación de los coeficientes DCT, y Huffman y RUN / nivel codificación. Frames llamadas I imágenes se codifican sin predicción. Fotos denominadas imágenes P pueden codificarse con la predicción de las imágenes anteriores. B fotos se pueden codificar utilizando la predicción de las dos imágenes anteriores y posteriores. A simplificada MPEG- 2 codificador y el decodificador se muestran en el codificador / decodificador MPEG Diagrama.

Codificación

El proceso de codificación para las imágenes P y B se explicará a continuación.

Los datos que representan los macrobloques de los valores de píxel de una imagen a codificar son alimentados tanto al sustractor y el estimador de movimiento. El estimador de movimiento compara cada uno de estos nuevos macrobloques con macrobloques en una imagen o imágenes de referencia almacenada con anterioridad. Encuentra el macrobloque en la imagen de referencia que más se acerque el nuevo macrobloque. El estimador de movimiento calcula un vector de movimiento (MV), que representa el desplazamiento horizontal y vertical desde el macrobloque se codifica a la zona de macrobloque de tamaño coincidente en la imagen de referencia. Tenga en cuenta que los vectores de movimiento tienen una resolución media pixel alcanzado por interpolación lineal entre los píxeles adyacentes.

El estimador de movimiento también lee este macrobloque correspondiente (conocido como un macrobloque predicho) fuera de la memoria de imágenes de referencia y la envía al sustractor que lo resta, en un píxel por píxel, a partir de la nueva macrobloque de entrar en el codificador. Esto forma un error de predicción o la señal residual que representa la diferencia entre el macrobloque predicho y el macrobloque actual que se está codificando. Esta residual es a menudo muy pequeña.

El residual se transforma desde el dominio espacial por una DCT dimensional 2.

(Los dos DCT dimensional consisten en DCT unidimensionales verticales y horizontales separables.) Los coeficientes DCT del residual son entonces cuantificados en un proceso que reduce el número de bits necesarios para representar cada coeficiente. Por lo general, muchos coeficientes se cuantifican de manera efectiva a 0.

Los coeficientes DCT cuantificados son Huffman RUN / nivel codificada que reduce aún más el número medio de bits por coeficiente. Esto se combina con datos de vector de movimiento y otra información de lado (incluyendo una indicación de I, P o una imagen B) y se envía al decodificador.

Para el caso de imágenes P, los coeficientes DCT cuantificados también a un bucle interno que representa el funcionamiento del decodificador (un decodificador dentro del codificador). El residual es a cuantificación inversa y DCT inversa transforma. El macrobloque predicho leer de la memoria de imagen de referencia se añade de nuevo a la residual en un pixel por pixel base y vuelve a almacenar en la memoria para servir como una referencia para la predicción de las imágenes subsiguientes. El objeto es tener los datos en la memoria de imagen de referencia del codificador coincida con los datos en la memoria de imagen de referencia del decodificador. Fotos B no se almacenan como imágenes de referencia.

La codificación de imágenes I utiliza el mismo circuito, sin embargo no se produce la estimación de movimiento y de la entrada (-) a la restador se ve obligado a 0. En este caso los coeficientes DCT cuantificados representan transforman los valores de píxel en lugar de los valores residuales como fue el caso para P y fotos B. Como es el caso de imágenes P, imágenes decodificadas I se almacenan como imágenes de referencia.

El sistema puede codificar secuencias de imágenes progresivas o entrelazadas. Para las secuencias entrelazadas, las imágenes pueden ser codificadas como imágenes de campo o como imágenes de trama. Para las secuencias progresivas, todas las imágenes son imágenes de marco con marco DCT codificación y predicción de cuadro. Una explicación más detallada se encuentra en Campo DCT Codificación y Frame DCT Codificación.

Decodificación

El proceso de decodificación puede ser pensado como el inverso del proceso de codificación. Consulte el codificador / decodificador MPEG Diagrama.

Los datos codificados recibido es Huffman / nivel ejecutar decodificado. Los vectores de movimiento se analizan a partir de la secuencia de datos y se alimenta al compensador de movimiento. Coeficientes DCT cuantificados se alimentan al cuantificador inverso y luego a un circuito IDCT que los transforma de nuevo al dominio espacial. Para imágenes P y B, los datos de vector de movimiento se

(Martínez, 2016)

Datos obtenidos en software de la simulación.

Residual

Matriz

Conclusiones

  • A medida que los requerimientos de los usuarios crecen por demanda de una mejora significativa de las imágenes secuenciales en este caso llamadas videos, siguen saliendo estándares de compresión de las imágenes para un ahorro por parte de los fabricantes y un costo beneficio por parte de los usuarios.