






Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Israel Andrade Esquef a M´arcio Portes de Albuquerque b Marcelo Portes de Albuquerque b
Tipologia: Manuais, Projetos, Pesquisas
1 / 12
Esta página não é visível na pré-visualização
Não perca as partes importantes!







Israel Andrade Esquef a^ M´arcio Portes de Albuquerque b Marcelo Portes de Albuquerque b aUniversidade Estadual do Norte Fluminense - UENF bCentro Brasileiro de Pesquisas F´ısicas - CBPF
Resumo
As imagens s˜ao produzidas por uma variedade de dispositivos f´ısicos, tais como cˆameras e v´ıdeo cˆameras, equipamentos de radiografia, microsc´opios eletrˆonicos, magn´eticos e de for¸ca atˆomica, radares, equipamento de ultra-som, entre v´arios outros. A produ¸c˜ao e utiliza¸c˜ao de imagens podem ter diversos objetivos, que v˜ao do puro entretenimento at´e aplica¸c˜oes militares, m´edicas ou tecnol´ogicas. O objetivo da an´alise de imagens, seja por um observador humano ou por uma m´aquina, ´e extrair informa¸c˜oes ´uteis e relevantes para cada aplica¸c˜ao desejada. Em geral, a imagem pura, rec´em adquirida pelo dispositivo de captura, necessita de transforma¸c˜oes e realces que a torne mais adequada para que se possa extrair o conte´udo de informa¸c˜ao desejada com maior eficiˆencia. O Processamento Digital de Imagens (PDI) ´e uma ´area da eletrˆonica/teoria de sinais em que imagens s˜ao convertidas em matrizes de n´umeros inteiros, sendo que cada elemento desta matriz ´e composta por um elemento fundamental: o pixel (uma abrevia¸c˜ao de picture element). A partir desta matriz de pixels que representa a imagem, diversos tipos de processamento digital podem ser implementados por algoritmos computacionais. A aplica¸c˜ao destes algoritmos realizam as transforma¸c˜oes necess´arias para que se possa, por exemplo, obter uma imagem com os realces pretendidos ou extrair atributos ou informa¸c˜oes pertinentes. O PDI ser´a considerado neste trabalho como a uni˜ao das ´areas de processamento de imagem e vis˜ao computacional.
1 Representa¸c˜ao da Imagem Digital
Uma imagem monocrom´atica ´e uma fun¸c˜ao bidimensional f (x, y) da intensi- dade luminosa, onde x e y denotam coordenadas espaciais, que por conven¸c˜ao: x = [1, 2 ,... , M] e y = [1, 2 ,... , N]. O valor de f no ponto (x, y) ´e propor- cional ao brilho (ou n´ıvel de cinza) da imagem neste ponto, como ilustrado na figura 1. Esta figura 1 apresenta uma regi˜ao em destaque em que se pode observar os pixels e os n´ıveis de cinza ou n´ıveis de luminˆancia de cada um deles.
Pixel e Conectividade
Um pixel ´e o elemento b´asico em uma imagem. A forma mais comum para o pixel ´e a forma retangular ou quadrada. O pixel ´e tamb´em um elemento de
(^1) A imagem “Goldhill” ´e freq¨uentemente utilizada para testes e demonstra¸c˜oes em
PDI
Centro Brasileiro de Pesquisas F´ısicas 18 de fevereiro de 2003
y
x
Figura 1. Imagem monocrom´atica “Goldhill” com destaque para uma regi˜ao de 17 x 17 pixels
dimens˜oes finitas na representa¸c˜ao de uma imagem digital. Freq¨uentemente, a organiza¸c˜ao de uma imagem sob a forma de uma matriz de pixels ´e feita em uma simetria quadrada. Isto se deve a facilidade de implementa¸c˜ao eletrˆonica, seja dos sistemas de aquisi¸c˜ao seja dos sistemas de visualiza¸c˜ao de imagens. Este tipo de organiza¸c˜ao provoca o aparecimento de dois problemas impor- tantes nas t´ecnicas de processamento. Em primeiro lugar um pixel n˜ao apre- senta as mesmas propriedades em todas as dire¸c˜oes, isto ´e, ele ´e anisotr´opico. Esta propriedade faz com que um pixel tenha quatro vizinhos de borda e qua- tro vizinhos de diagonal, ilustrado na figura 2. Esta propriedade obriga que seja definido o tipo de conectividade que ser´a utilizada, ou B4 (considerando apenas os vizinhos de borda) ou B8 (considerando os vizinhos de borda e os de diagonal). O segundo problema ´e conseq¨uˆencia direta do primeiro, ou seja, as distˆancias entre um ponto e seus vizinhos n˜ao ´e a mesma para qualquer tipo de vizinho. Ser´a igual a 1 para vizinhos de borda e
2 para aqueles na diagonal.
i 7 i (^8)
i (^0)
i (^1)
i (^4)
i 2 i (^3)
i (^5)
i (^6)
i (^0)
i (^1)
i (^4)
i 3 i (^2)
Conectividade B8 Conectividade B
Figura 2. Ilustra¸c˜ao de tipos de conectividade dos pixels vizinhos ao pixel central i 0. Conectividade B8 apresenta 8 vizinhos, sendo 4 de bordas e 4 diagonais. Conectivi- dade B4 apresenta apenas os pixels de borda.
que ao observarmos todo o conjunto de dados, n´os possamos bucar correla¸c˜oes espaciais entre eles.
2.2 T´ecnicas de Pr´e-processamento
As t´ecnicas de pr´e-processamento tˆem a fun¸c˜ao de melhorar a qualidade da im- agem. Estas t´ecnicas envolvem duas categorias principais: m´etodos que operam no dom´ınio espacial e m´etodos que operam no dom´ınio da freq¨uˆencia. T´ecnicas de processamento no dom´ınio espacial baseiam-se em filtros que manipulam o plano da imagem, enquanto que as t´ecnicas de processamento no dom´ınio da freq¨uˆencia se baseiam em filtros que agem sobre o espectro da imagem. E comum para real¸´ car determinadas caracter´ısticas de uma imagem, combi- nar v´arios m´etodos que estejam baseados nestas duas categorias. A figura 4 ilustra um pr´e-processamento simples: a aplica¸c˜ao de um filtro mediana, para redu¸c˜ao de ru´ıdo e em seguida um filtro passa-altas, para realce nos contornos ou bordas dos objetos na imagem.
(A) (B) (C)
Figura 4. Exemplo de um pre-processamento simples: (A) Imagem original corromp- ida com ru´ıdo gaussiano, (B) Imagem ap´os a aplica¸c˜ao de um filtro mediana para redu¸c˜ao do ru´ıdo, e (C) Imagem final, ap´os a aplica¸c˜ao de um filtro passa-altas para realce dos contornos.
2.2.1 O Histograma de Luminˆancia
O histograma de um a imagem digital com k n´ıveis de cinza ´e definido por uma fun¸c˜ao discreta
p(k) =
nk n
em que o argumento k representa os n´ıveis de luminˆancia discretos, nk repre- senta o n´umero de pixels na imagem com intensidade k e n ´e o n´umero total de pixels da imagem, ou seja, n = M × N. De forma simplificada, podemos afir- mar que o histograma de luminˆancia de uma imagem representa a contagem
dos n´ıveis de cinza da imagem, podendo informar a distribui¸c˜ao dos pixels dentro dos k n´ıveis poss´ıveis. O histograma pode ser considerado como uma fun¸c˜ao distribui¸c˜ao de probabilidades, obedecendo aos axiomas e teoremas da teoria de probabilidades, i.e. que
∑
k
p(k) = 1.
O histograma da imagem digital ´e uma ferramenta bastante ´util na etapa de pre-processamento, fornece uma vis˜ao estat´ıstica sobre a distribui¸c˜ao dos pixels, sobre o contraste da imagem e os n´ıveis de ilumina¸c˜ao. Al´em disso, o histograma ´e bastante utilizado na etapa de segmenta¸c˜ao, principalmente em t´ecnicas que se utilizam da similaridade entre os pixels. O histograma ´e utilizado com freq¨uˆencia como sendo uma distribui¸c˜ao estat´ıstica dos pixels (“luminancia”) na imagem, como por exemplo no caso das t´ecnicas que o utilizam para calcular a entropia da imagem.
Na figura 5 s˜ao apresentadas duas imagens e seus histogramas, sendo que a imagem (A) ´e uma imagem de baixo contraste, enquanto a imagem (B) possui um maior contraste.
0 0 50 100 150 200 250
0.01
0.02
0.03
0.04
0.05
00 50 100 150 200 250
0.04
0.08
0.12
(A) (B)
p(k)
k
p(k)
k
Figura 5. Exemplo de imagens com histogramas diferenciados. (A) Imagem de baixo contraste e seu histograma de luminˆancia. (B) Imagem de alto contraste e seu his- tograma de luminˆancia.
A figura 6 apresenta outras duas imagens com histogramas de tipos bimodal e multimodal. O histograma bimodal ´e classificado desta forma devido a pre- sen¸ca de dois picos, ou duas regi˜oes de luminˆancia com maior incidˆencia de pixels da imagem. Este ´e o caso t´ıpico de imagens que apresentam objetos e fundo de maneira bem definida, como a imagem (A) da figura 6. O histograma multimodal apresenta os pixels distribu´ıdos em mais de duas regi˜oes de n´ıveis de cinza, o que se pode perceber atrav´es dos picos no histograma em torno destes valores de luminˆancia. Este ´e o caso da imagem (B) da figura 6, que apresenta trˆes picos bem definidos.
imagens. A segmenta¸c˜ao ´e um processo emp´ırico e adaptativo, procurando sempre se adequar `as caracter´ısticas particulares de cada tipo de imagem e aos objetivo que se pretende alcan¸car. Apesar de existir uma grande diversidade de t´ecnicas de segmenta¸c˜ao de imagens, ainda assim existe atualmente, um grande interesse no estudo e desenvolvimento de novas t´ecnicas.
(A) (B) (C)
Figura 7. Duas abordagens para segmenta¸c˜ao. (A) Imagem original em n´ıveis de cinza. (B) Imagem segmentada atrav´es de uma binariza¸c˜ao. (C) Imagem segmen- tada por detec¸c˜ao de bordas.
De um modo geral, as t´ecnicas de segmenta¸c˜ao utilizam duas abordagens principais: a similaridade entre os pixels e a descontinuidade entre eles. Sem d´uvida, a t´ecnica baseada em similaridade mais utilizada ´e a chamada bina- riza¸c˜ao. A binariza¸c˜ao de imagens ou image thresholding ´e uma t´ecnica efi- ciente e simples do ponto de vista computacional, sendo portanto largamente utilizada em sistemas de vis˜ao computacional. Este tipo de segmenta¸c˜ao ´e utilizado quando as amplitudes dos n´ıveis de cinza s˜ao suficientes para carac- terizar os “objetos” presentes na imagem. Na binariza¸c˜ao, um n´ıvel de cinza ´e considerado como um limiar de separa¸c˜ao entre os pixels que comp˜oem os objetos e o fundo. Nesta t´ecnica, se obt´em como sa´ıda do sistema uma im- agem bin´aria, i.e., uma imagem com apenas dois n´ıveis de luminˆancia: preto e branco. A determina¸c˜ao deste limiar de modo otimizado para segmenta¸c˜ao da imagem ´e o objetivo principal dos diversos m´etodos de binariza¸c˜ao existentes.
As t´ecnicas baseadas em descontinuidade entre os pixels procuram determi- nar varia¸c˜oes abruptas do n´ıvel de luminˆancia entre pixels vizinhos. Estas varia¸c˜oes, em geral, permitem detectar o grupo de pixels que delimitam os con- tornos ou bordas dos objetos na imagem. A t´ecnica de segmenta¸c˜ao baseada em descontinuidade mais utilizada ´e a chamada detec¸c˜ao de bordas. A figura 7 apresenta dois exemplos de segmenta¸c˜ao, uma binariza¸c˜ao e uma detec¸c˜ao de bordas. A imagem (A) ´e a imagem original em n´ıveis de cinza, a imagem (B) foi segmentada por binariza¸c˜ao e a imagem (C) foi segmentada por detec¸c˜ao de bordas.
2.4 P´os-processamento
O p´os-processamento geralmente ´e a etapa que sucede a segmenta¸c˜ao. E nesta´ etapa que os principais defeitos ou imperfei¸c˜oes da segmenta¸c˜ao s˜ao devida- mente corrigidos. Normalmente, estes defeitos da segmenta¸c˜ao s˜ao corrigidos atrav´es de t´ecnicas de Morfologia Matem´atica, com a aplica¸c˜ao em seq¨uˆencia de filtros morfol´ogicos que realizam uma an´alise quantitativa dos pixels da imagem.
2.4.1 Opera¸c˜oes Morfol´ogicas B´asicas
A Morfologia Matem´atica (MM) ´e uma das grandes ´areas do Processamento Digital de Imagens. Todos os m´etodos descritos pela MM s˜ao fundamental- mente baseados em duas linhas: os operadores booleanos de conjuntos (uni˜ao, interse¸c˜ao, complemento etc.) e a no¸c˜ao de forma b´asica, chamado de “ele- mento estruturante”. As opera¸c˜oes s˜ao realizadas sempre entre a imagem e o elemento estruturante. A forma do elemento estruturante ´e fun¸c˜ao do trata- mento desejado e do tipo de conectividade adotada (B4 ou B8).
Dois operadores b´asicos s˜ao utilizados na maior parte das t´ecnicas de MM: a eros˜ao e a dilata¸c˜ao. Consideremos por exemplo, um objeto X como um grupo de pixels x delimitado por uma linha tracejada, como mostrado na figura 8. A opera¸c˜ao de eros˜ao consiste em eliminar do conjunto X os pixels x em fun¸c˜ao do elemento estruturante B, tal que:
x
X
Y
x x
x x X
Y
x
B - Elemento Estruturante (a) (b)
Figura 8. Opera¸c˜ao de eros˜ao (a) e dilata¸c˜ao (b) aplicada a um elemento estrutu- rante B. Obtemos a forma Y. x 1 ´e um ponto de X que tamb´em pertence a Y. Em (a) x 2 pertence a X, mas n˜ao a Y devido a opera¸c˜ao de eros˜ao. Por outro lado, em (b) x 2 passa a pertencer a Y devido a dilata¸c˜ao. x 3 n˜ao pertence a ambos X e Y.
Y = EB^ (X) → Y = {x/B(x) ⊂ X} (2)
onde B(x) ´e o elemento estruturante centrado no pixel x. Na pr´atica este procedimento corresponde a construir um novo conjunto de pontos Y , a partir
segmentados calculando para cada regi˜ao de pixels cont´ıguos um parˆametro espec´ıfico, como ´area ou per´ımetro por exemplo. A figura 9 apresenta um ex- emplo desta t´ecnica para uma imagem constitu´ıda de c´elulas bem delimitadas entre si. O processo de segmenta¸c˜ao separa as regi˜oes pertencentes as c´elulas daquelas pertencentesas regi˜oes entre c´elulas (fundo), criando um delimitador entre elas. A etapa de “labeliza¸c˜ao” cria um r´otulo que identifica cada uma dessas regi˜oes para que os processos seguintes de tratamento da informa¸c˜ao sejam concentrados em cada uma das regi˜oes quer receberam um r´otulo.
2 3 4 5 (^8 ) 7 9 12
13
16
14
11
15
10
33
20 22 18 34
31
21 19 17 32
25 27 24 26 28 23 (^3029)
Figura 9. Imagem ‘Labelizada’: (a) Imagem original composta por regi˜oes cont´ıguas de pixels. (b) Imagem final ap´os o processo de rotula¸c˜ao. As cores s˜ao utilizadas para auxiliar na visualiza¸c˜ao das regi˜oes.
2.5.2 Atributos da Imagem
Existem basicamente duas classes de medidas: i) atributos da imagem como um todo (field features), por exemplo n´umero de objetos, ´area total de obje- tos, etc. e ii) atributos de regi˜ao (region features) que se referem aos objetos independentemente, por exemplo ´area, per´ımetro, forma, etc. Os atributos de regi˜ao podem ser muito sofisticados, permitindo uma nova separa¸c˜ao dos ob- jetos em classes de similaridades, em fun¸c˜ao dos parˆametros medidos. A figura 10 apresenta os principais atributos de regi˜ao que podem ser extra´ıdos de uma imagem, ap´os as etapas de segmenta¸c˜ao e p´os-processamento.
2.6 Classifica¸c˜ao e Reconhecimento
O objetivo do reconhecimento ´e realizar, de forma autom´atica, a “identi- fica¸c˜ao” dos objetos segmentados na imagem. Existem duas etapas no pro- cesso de classifica¸c˜ao de formas: o aprendizado e o reconhecimento propri- amente dito. Na maior parte dos sistemas de reconhecimento de formas, os parˆametros provenientes da etapa de extra¸c˜ao de atributos s˜ao utilizados para construir um espa¸co de medida `a N dimens˜oes. Os sistemas de aprendizado ir˜ao definir uma fun¸c˜ao discriminante que separe eficientemente todas as for- mas representadas neste espa¸co de medida.
Comprimento
Largura
Diâmetro de Feret (em uma direção)
Perímetro
Perímetro do furo
Perímetro convexo
Retângulo Mínimo de Inclusão (largura e altura)
Área (excluindo furos)
Área (incluindo furos)
Área do Retângulo Mínimo
L
W D (^) F
P
P
PC
WR
L (^) R
A
A
Ar
Relações de Cálculo Relação perímetro/área A Cicularidade =^ π^ L^ 2 4Α
P 2
Retangularidade
Relação de Aspecto
= =
___WL ___4A π
=
Diâmetro Circular Equivalente
= ___AA r
Figura 10. Principais atributos de regi˜ao, ou seja, dos objetos independentes pre- sentes na imagem.
O espa¸co de medidas ´e um espa¸co de dimens˜ao N onde cada dimens˜ao corre- sponde a um parˆametro (atributo). A escolha e a qualidade dos parˆametros para construir este espa¸co ´e essencial para a realiza¸c˜ao de um bom processo de reconhecimento de forma. A escolha de um grande n´umero de parˆametros leva a um espa¸co de grande dimens˜ao e a uma dif´ıcil etapa de aprendizado. Um pequeno espa¸co de medidas pode acarretar em uma baixa caracteriza¸c˜ao da forma e a muitos erros no processo de reconhecimento. Em alguns casos pode ser interessante normalizar cada eixo para construir um espa¸co que seja bem distribu´ıdo e facilite o processo de classifica¸c˜ao.
Podemos dividir o processo de aprendizado em dois tipos: os m´etodos super- visionados e n˜ao supervisionados. No m´etodo supervisionado, o classificador, em sua fase de aprendizado, recebe informa¸c˜oes de como as classes devem ser identificadas. Por exemplo, em um sistema de reconhecimento de caracteres, existir´a classes in- dependentes para todas as letras do alfabeto. Por exemplo a classe das letras “A” ser´a representada pela ocorrˆencia da letra A em suas diferentes varia¸c˜oes.