








Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
visão computacional
Tipologia: Notas de estudo
1 / 14
Esta página não é visível na pré-visualização
Não perca as partes importantes!









Trabalho apresentado ao Curso de Engenharia de Controle e Automação do Centro Universitário de Barra Mansa, como requisito parcial para a obtenção media no período em Visão Computacional.
Aluno:
Imagens gráficas: As imagens gráficas podem estar no formato vetorial (quando são representadas pelas coorde^ 0 01 F nadas dos segmentos de reta que as compõem) ou matricial (quando são representadas por uma matriz de pontos, com cada componente da matriz carregando a informação de cor do ponto). Para imagens gráficas no formato matricial e sem com0 01 F pressão, a taxa de erro de bit pode ser maior que a taxa de erro de pacote, uma vez que, em geral, não haverá nenhum problema se um pixel de uma tela ficar azul em vez de verde, por exemplo, mas não se pode dizer o mesmo da perda de um pacote, que poderá, por exemplo, apagar um bloco de imagem na tela.
Para imagens vetoriais ou matriciais em que foram utilizadas técnicas de compressão, a taxa de erro de bit pode ser um fator crítico. Outro caso importante são as imagens que não são processadas somente pelo olho humano, mas também pelo computador, como, por exemplo, as imagens médicas.
Nesse caso, a perda de um único bit pode ser into0 01 F lerável (uma doença que se quer diagnosticar por meio de uma imagem médica). Os trabalhos nesta área visam, em sua maioria, à
melhoria das imagens obtidas a partir da tomografia computadorizada, ressonância magnética, etc., com técnicas que têm como objetivo a retirada de ruído e obtenção de maior resolução espacial.
Características do olho huma^ 0 01 F no:
O olho humano possui três tipos de células fotor0 01 F receptoras de cores, chamadas de cones. Devido a isso, três componentes numéricos são suficientes para representar a cor (Poynton, 1994). O espaço de cor é um sistema de coordenadas, de três di^ 0 01 F mensões, cujos eixos correspondem aos três com0 01 F ponentes de cor.
Diferentes espaços de cor são usados para diferentes propósitos e transformações que fazem o mapeamento dos dados de um espa^ 0 01 F ço de cor para outro. Esses receptores apresentam diferentes sensibilidades a vários comprimentos de onda do espectro visível.
O sistema de codificação de cor utilizado para vídeo deriva do espaço de cor RGB, sistema que utiliza combinação das cores primárias vermelho, verde e azul para a obtenção de outras cores. A sensibilidade dos cones de absorção do verde é 5% maior que a dos cones de absorção do vermelho, e ambos são cerca de 30 vezes mais sensíveis que o cone de absorção do azul. O sistema RGB é trans^ 0 01 F formado no caso de outro sistema, que permita o emprego de técnicas de codificação de vídeo para explorar as características de percepção de cores pelo olho humano.
O brilho e as informações de cores são tratados diferentemente pelo sistema visual humano, a sensação de brilho é relativa ao valor médio de iluminação de uma cena; outra característica a ser considerada é o contraste, que é a detecção da diferença de brilho entre diferentes partes de uma imagem. O olho humano depois de adaptado às mudanças de brilho, é capaz de perceber de 80 a 150 níveis lineares de luminância. Os seres humanos são mais sensíveis a mudanças no brilho do que a mudanças na cor.
Devido a isso, um componente especial é usado para representar informações de brilho. Este componente é chamado de “luminân^ 0 01 F cia” e é denotado pelo símbolo Y. Em codificação de vídeo, uma versão não linear da luminância, denominada “luma”, é usada e representada pelo símbolo Y’. Os dois componentes restantes são utilizados para representar cor e são chamados de “crominância”.
de compressão e o número de bits por pixel (o núme0 01 F ro de bits requerido para representar um pixel de imagem).
É típico que as técnicas de compressão de vídeo causem perdas de informação. Entretanto, isto é aceitável, porque os algoritmos de codificação são concebidos para descartar informações que não sejam perceptíveis pelo olho humano ou informações redundantes. Existem algumas técnicas comuns à maioria dos algoritmos de compressão de vídeo, como “color space sampling” e “redundancy reduction”.
“Color space sampling”
É uma técnica usada para reduzir a quantidade de dados necessários para codificação. Se uma imagem está codificada em espaço YUV, as componentes U e V podem ser sub-amostradas porque o olho humano possui baixa sensibilidade às informações de crominância.
“Redundancy reduction”
É outra técnica usada para diminuir a quantidade de informação codificada. A codificação “Intra-frame” promove compressão, reduzindo a redundância espacial interna a uma figura. Essa técnica funciona porque pixels vizinhos em uma imagem são usualmente similares. A codificação “Inter- frame” promove a compressão por redução da redundância entre imagens. Esta técnica funciona porque frames vizinhos em uma seqüência de imagens são normalmente similares.
Os codificadores e decodificadores fonte:
O codificador fonte é responsável pela redução ou eliminação de qualquer redundância psicovisual ou interpixel ou de codificação na imagem de entrada. A aplicação especifica ou requisitos de fidelidade correspondentes determinam a melhor
abordagem de codificação para se usar numa dada situação. A modelagem pode ser abordada numa serie de três operações independentes. Cada operação é projetada para reduzir uma das três redundâncias.
No primeiro estagio do processo de codificação fonte, o mapeador transforma os dados de entrada num formato projetado para reduzir as redundâncias interpixels nas imagens de entrada.
Essa operação é normalmente reversível e pode ou não reduzir completamente a quantidade de dados necessária para representar a imagem.
f(x,y)F 0E 0 MAPEADOR F 0E 0 QUANTIZADORF 0E 0 CODIFICADOR DE SIMBOLOSF 0E 0 CANAL
CANALF 0E 0 DECODIFICADOR DE SIMBOLOSF 0E 0 MAPEADOR INVERSOF 0E 0 f(x,y)
Compressão livre de erro:
É a única maneira aceitável de redução de dados, uma destas aplicações é o arquivamento de documentos médicos em que a compressão por perdas é proibida por razões legais. Uma outra é o processamento de imagens Landsat em que tanto o uso quanto o custo da coleta dos dados torna qualquer perda indesejável. Finalmente outra é a radiografia digital, em que a perda de informação pode comprometer a precisão do diagnóstico.
Compressão com perdas:
É um formato originalmente concebido para o programa de PC Paintbrush e é vulgarmente usado em compatíveis IBM-PC. PICT É largamente usado em ambientes gráficos Macintosh e aplicações de paginação como um ficheiro intermediário na transferência de documentos entre aplicações. É especialmente eficaz na compressão de imagens que contêm grandes áreas contínuas de cor.
TIFF - Tagged-Image File Format Utilizado na troca de documentos entre aplicações e entre os Macintoshes e o Windows. O formato TIFF suporta a compressão LZW. LZW é a mesma compressão usada no formato GIF, no entanto, ao contrário do GIF, suporta outros tipos de imagem para além dos indexed color. Quando se grava uma imagem no formato TIFF, pode-se escolher um formato destinado a um Macintosh ou a um PC compatível. Pode-se ainda escolher "comprimir automaticamente o documento para um tamanho menor" usando a opção LZW Compression.
JPEG - Joint Photgraphic Experts Group Formato de compressão que economiza espaço na forma como armazena e liberta (anula)
informação desnecessária na utilização da imagem. Uma vez comprimida e posteriormente descomprimida, a imagem não será já igual à imagem original. Na maioria dos casos, as diferenças entre a imagem original e a comprimida através da opção Excelente JPEG são impossíveis de distinguir. Existe um compromisso entre a qualidade de uma imagem e a sua compressão. Uma imagem gravada no modo Excelente JPEG é sujeita a uma menor compressão, ocupando no entanto mais espaço em disco. Geralmente, as imagens comprimidas no modo anteriormente referido apresentam níveis de compressão na ordem dos 5:1 e 15:1. As imagens JPEG são automaticamente descomprimidas quando são abertas.
O JPEG é um padrão de codificação para ima0 01 F gens estáticas desenvolvidas pelo Joint Photographic Experts Group. Apesar de ser concebido para ima^ 0 01 F gens estáticas, com hardware especial, é possível codificar e decodificar uma seqüência de imagens JPEG em tempo real para gerar vídeo em movimen0 01 F to. Este uso de codificação JPEG é normalmente referido como “Motion JPEG” ou MJPEG. Não existe, entretanto, um padrão oficial para MJPEG.
Existem quatro modos definidos de operação para JPEG : seqüencial, progressivo, lossless e por hierarquia. Mas apenas o modo seqüencial é implementado de modo típico.
O JPEG utiliza uma técnica de compressão espacial intra- frame denominada codificação DCT (Discrete Cosine Transform).
A análise assume a codificação de uma imagem de componente único (escala de cinza). Para imagens de múltiplos componentes de cor, a informação do componente é intercalada. A codificação JPEG é independente do espaço de cores, apesar de os siste^ 0 01 F mas poderem converter as imagens para o espaço YUV e sub amostrar as componentes de crominância.
O primeiro passo do processo de codificação é executar um DCT em blocos de 8 × 8 amostras de componentes. Esse passo transforma a informação para o domínio da freqüência. O sinal de saída neste passo é a composição de 64 coeficientes DCT.
O DCT produz o efeito de concentrar a maioria das informações no bloco no canto superior esquerdo da matriz. O valor médio do bloco, chamado componente DC, está no canto superior esquerdo, e os outros coeficientes são chamados “coeficientes AC”. Nenhuma informação é perdida
durante este passo, os dados são apenas transformados em outro do^ 0 01 F mínio e podem ser recuperados executando-se um DCT inverso.
O próximo passo do processo de codificação é a quantização. Os coeficientes DCT são divididos por uma matriz de quantização de 8 × 8. Esta matriz é concebida para reduzir a amplitude dos
Referências Bibliográficas:
Rafael C. Gonzales, Processamento de imagens digitais.
Editora Edgard Blusher
O PROCESSAMENTO digital de imagens.
Disponível em <file://D/internethdtveprocimagem/imagens.htm>.