

















Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: postproduccion audiovisual, Profesor: Fara Fara, Carrera: Comunicación Audiovisual, Universidad: UVIGO
Tipo: Apuntes
1 / 25
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!


















Muchos archivos multimedia contienen tanto datos de audio como de vídeo, y a menudo alguna referencia que permite la sincronización del audio y el vídeo. Cada uno de estos tres flujos de datos puede ser manejado con programas, procesos, o hardware diferentes; pero para que estos streams sean útiles para almacenarlos o transmitirlos, deben ser encapsulados juntos. Esta función es realizada por un formato de archivo de vídeo (contenedor), como .mpg, .avi, .mov, .mp4, .rm, .ogg, o .mkv. Algunos de estos formatos están limitados a contener streams que se reducen a un pequeño juego de códecs, mientras que otros son usados para objetivos más generales. Un formato contenedor es un formato de archivo que puede contener varios tipos de datos, comprimidos mediante una serie de códecs. El archivo contenedor es usado simplemente para identificar e interpolar los diferentes tipos de datos que contiene. Algunos formatos contenedores:
Audio-Video Interleave (AVI) es un formato contenedor multimedia introducido por Microsoft en 1992, como parte de la tecnología de Video para Windows. Estos archivos contienen ambos audio y video en un contenedor estándar que permite la reproducción en simultáneo. Casi todos los archivos AVI también usan la extensión del formato desarrollada por el grupo Matrox OpenDML en Febrero de 1996. Estos archivos también son soportados por Microsoft, y se conocen oficialmente como 'AVI 2.0'. MOV Un archivo QuickTime MOV contiene una o más pistas, las cuales pueden ser de audio, video, efectos o subtítulos. Técnicamente, el formato permite contener pistas comprimidas con otros códecs tales como Cinepak, Sorenson codec, MP3, JPEG, DivX, o PNG, o una referencia a un medio almacenado en otro archivos o ubicación de red. La habilidad para contener referencias abstractas en el medio, y la separación de los datos manejada internamente hacen que QuickTime sea un formato práctico para la edición, ya que es capaz de importar y editar sin copia previa otros formatos como AIFF DV, MP3, MPEG-1, y AVI. La principal desventaja es que este formato es desarrollado por Apple y requiere la instalación de QuickTime para poder reproducirlo bajo sistemas operativos Windows.
MPEG-4 Part 14 ó MP4 es un formato de archivo contenedor especificado como parte del estándar internacional ISO/IEC MPEG-4. Es usado para almacenar medios con las definiciones de ISO/IEC Moving Picture Experts Group, aunque también puede almacenar otros tipos de medios también. MP4 permite streaming de contenido bajo demanda vía Internet, así como el multiplexado de múltiples pistas de audio y video en un único archivo, bitrates y cuadros por segundo variables, subtítulos, etc. OGG Ogg Media Container es desarrollado por Xiph.org como parte del encuadre de una iniciativa mayor que apunta una iniciativa para desarrollar un conjunto de herramientas para la codificación y decodificación de contenidos multimedia que son gratuitas para la implementación en software, según la definición oficial en el sitio de Xiph.org. El término Ogg suele referirse incorrectamente al códec de audio Ogg Vorbis, sin embargo otros componentes del contenedor Ogg son el códec de video Theora y el formato de compresión de audio hablado Speex.
Códecs Con la llegada de las capacidades gráficas a los ordenadores personales, también llegó la posibilidad de ver imágenes en movimiento. Los primeros sistemas que cumplían este propósito eran normalmente lentos, de baja calidad, y además, las imágenes almacenadas ocupaban muchísimo espacio. El primer sistema de lo que podríamos denominar Video para PC fue el formato FLI de Autodesk. Este formato, en sus orígenes, era una secuencia de imágenes GIF a 32Ox2OO y 256 colores sin sonido. El sistema de compresión usado era muy simple y consistía en, a partir de la primera imagen (fotograma), almacenar sólo las variaciones que existían en las siguientes. Con esto, se conseguía un ratio de compresión de 1:2 aproximadamente. Este formato posteriormente evolucionó admitiendo distintas resoluciones y más profundidad de color, manteniendo el mismo sistema de compresión sin pérdida. Compresión es el proceso de eliminación o reestructuración de los datos para disminuir el tamaño de un archivo. Los archivos de video digital son muy grandes, requiriendo gran velocidad de transferencia de datos en la lectura y reproducción. Pasó el tiempo y, como ha ocurrido tantas veces, APPLE desarrolla un nuevo sistema de video para ordenador con sonido y lo llama QuickTime. Poco después, Microsoft copia este sistema y lo llama "Video para Windows" (los famosos AVI's sobre los que hablaremos extensamente) por este motivo, APPLE y Microsoft se enfrentaron en los tribunales. Este sistema AVI (Audio y Video Entrelazado) utiliza diversos formatos, dependiendo de los Codecs MCI (una especie de drivers) que se utilicen.
Códecs de vídeo de compresión sin pérdida:
Códecs de vídeo de compresión con pérdida:
Formato MPEG El formato MPEG (Moving Pictures Experts Group) es un formato de almacenamiento de vídeo digital con una compresión de los datos con una pequeña pérdida de la calidad. Desde su creación, se ha definido el MPEG- utilizado en Audio CD y Vídeo CD, el MPEG-2, usado en los DVD y la televisión digital, y el MPEG-4, que se emplea para transmitir vídeo e imágenes con un ancho de banda reducido. El formato MPEG-1 se publicó como un estándar ISO/IEC 11172 con el título 'Information technology -- Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbps'. El estándar consta de un documento con cinco partes:
Vídeo El diseño fue fuertemente influenciado por el formato estándar H.261. El vídeo del formato MPEG-1 explota los métodos de compresión de percepción para reducir significativamente la cantidad de datos requeridos por un flujo de vídeo. Reduce o descarta totalmente la información en determinadas frecuencias y áreas de la imagen en que el ojo humano tiene una capacidad limitada para percibir plenamente. También utiliza métodos eficaces para explotar la redundancia temporal y espacial en vídeo para lograr una mayor compresión de datos. Espacio de color Antes de la codificación del vídeo al formato MPEG-1, el espacio de color se transforma al Y'CbCr = (Y' Luma, Cb = Chroma blue, Cr = Chroma Red). La luminancia se define como una tupla de dos valores: el brillo y la resolución, y la crominancia como una tupla de tres valores: color, matiz y fase. La luminancia (brillo, resolución) se almacena separadamente de la crominancia (color, matiz, fase) y además se separa en sus componentes rojo y azul. La crominancia también es muestreada a 4:2:0, lo que significa que es dividido por la mitad en sentido vertical y la otra mitad en sentido horizontal, a sólo un cuarto de la resolución del vídeo. Debido a que el ojo humano es mucho menos sensible a pequeños cambios de color que del brillo, el muestreo de la crominancia es una forma muy eficaz de reducir la cantidad de datos de vídeo que deben ser comprimidos. En los vídeos con detalle fino, de alta complejidad espacial, esto puede dar lugar a defectos de 'aliasing' de crominancia. En comparación con otros defectos de compresión digital, esta cuestión raramente puede ser una molestia. Resolución/Tasas de bit El formato MPEG-1 soporta resoluciones de hasta 4095×4095 (12 bits), y tasas de hasta 100 Mbps. Normalmente los vídeos con formato MPEG-1 se visualizan utilizando alguna de las resoluciones siguientes: 352x240, 352x288, o 320x240. Estas bajas resoluciones, combinadas con una tasa de bits inferior a 1,5 Mbps, forman lo que se conoce como CPB (Constrained Parameters Bitstream), es decir, los parámetros restringidos del flujo de bits. Posteriormente esto se rebautizó como perfil bajo (Low Level) en el formato MPEG-2. Son las especificaciones mínimas de vídeo que cualquier descodificador de vídeo debe ser capaz de manejar para ser considerado compatible con el formato MPEG-
Se establecen límites en el número máximo de fotogramas entre I-frames debido a la complejidad de la descodificación, el tamaño de búfer del descodificador, el tiempo de recuperación después de los errores de datos, la capacidad de búsqueda y la acumulación de errores IDCT en las implementaciones de baja precisión más comunes en los descodificadores de hardware. P-frames P-frame es una abreviatura de Predicted-frame, es decir, fotograma previsto. Las B-frames son también inter-frames. Las P-frames existen para mejorar la compresión mediante la explotación de la redundancia temporal en un vídeo. Las P-frames almacenan sólo las diferencias en cuanto a la imagen del fotograma inmediatamente anterior, ya sea una I- frame o una P-frame. Esta fotograma de referencia se llama fotograma anclaje. La diferencia entre una P-frame y su fotograma anclaje se calcula utilizando los vectores de movimiento en cada macrobloque del fotograma. Los datos del vector de movimiento se integrarán en la P-frame para el uso por el descodificador. Un P-frame puede contener cualquier número de código dentro de los bloques, además de cualquier bloques previsto hacia delante. Si un vídeo cambia drásticamente de un fotograma a otro, como un corte, es más eficiente codificarlo como una I-frame. B-frames Una B-frame es un fotograma bidireccional. Las B-frames son bastante similares a las P-frames, excepto a que pueden hacer predicciones utilizando tanto las fotogramas anteriores como las posteriores, es decir, tienen dos fotogramas anclaje. Por lo tanto es necesario para el reproductor, primero descodificar secuencialmente el siguiente fotograma anclaje I- o P- después de la B-frame, antes de que la B-frame puede ser descodificada y visualizada. Esto hace que las B-frames sean computacionalmente muy complejas, requiera grandes buffers de datos, y cause un retraso mayor tanto en la descodificación como durante la codificación. Esto hace que se necesiten marcas de tiempo de visualización (DTS - Display Time Stamps) en el flujo de datos. De esta manera las B-frames han sido tema de mucha controversia durante mucho tiempo, razón por la cual se han evitado muchas veces en los vídeos, y en ocasiones no son soportadas completamente por los descodificadores de hardware.
D-frames Las D-frames o DC-pictures son imágenes independientes (intra-frames) que han sido codificadas DC-sólo (los coeficientes AC-DCT se eliminan) y por lo tanto, son de muy baja cualidad. Las D-frames nunca son referenciadas por los fotogramas I-, P o B-frames. Las D-frames sólo se utilizan para las vistas rápidas previas de vídeo, por ejemplo, cuando se busca a través de un vídeo a alta velocidad. La existencia de D-frames permite previsualizaciones de alta calidad, y sin la necesidad de las Dframes que ocupan espacio en el flujo, no mejora la calidad de vídeo. Macrobloques El formato MPEG-1 opera en vídeo con una serie de bloques de 8x8 pixels para la cuantificación. Sin embargo debido a la crominancia, se muestrea con un factor de 4. Así cada par de bloques de crominancia (rojo y azul) corresponde a 4 bloques diferentes de luminancia. Este conjunto de 6 bloques, con una resolución de 16x pixels, se llama macrobloque. Un macrobloque es la unidad independiente más pequeña de vídeo en color. Los vectores de movimiento operan exclusivamente en el nivel macrobloque. Si la altura y/o la anchura del vídeo no es exactamente un múltiplo de 16, a pesar de esto se debe codificar una fila completa de macrobloques para almacenar el resto de la imagen. Es un despilfarro de una cantidad significativa de datos en el flujo de bits, y tiene que ser evitado. Algunos descodificadores también manejan inadecuadamente los vídeos con macrobloques parciales, con el resultado de una visualización defectuosa. Vectores de movimiento Para disminuir la cantidad de redundancia espacial en un vídeo, sólo se actualizan los bloques que tienen cambios, hasta el tamaño GOP (Group Of Pictures) máximo. Esto se conoce como reposición condicional. Los movimientos de los objetos, y/o de la cámara puede consumir grandes porciones del fotograma que se necesita para su actualización, a pesar de que sólo ha cambiado la posición de los objetos previamente codificados. A través de la estimación del movimiento, el codificador puede compensar este movimiento y eliminar una gran cantidad de información redundante.