IPI-3 Ampliação Contraste

Fazer download em doc, pdf ou txt
Fazer download em doc, pdf ou txt
Você está na página 1de 10

20

CAPÍTULO 3 - AMPLIAÇÃO DE CONTRASTE

O esforço para melhorar, ou seja, ampliar o grau de contraste dos objetos visualizados nas
imagens de sensoriamento remoto, é a tarefa mais importante no processamento de imagens com o
objetivo de oferecer ao analista uma melhor capacidade para a análise e interpretação dos dados. O
conjunto destas técnicas é conhecido como técnicas de realces de imagens.
Por definição, o processo de realce de imagem consiste na aplicação de um conjunto de
técnicas de processamento que visa exclusivamente melhorar ou realçar as características visuais de
toda a imagem, ou de feições específicas, para posterior interpretação visual. Isso é realizado por
transformações pontuais pixel a pixel do valor de brilho do pixel que está sendo processado, ou por
transformações espaciais dos pixels vizinhos, ambas para realçar as feições de baixo contraste
espectral. Não há desta forma um esforço intencional para melhorar a fidelidade da imagem, como é
feito na base de correção geométrica, como também não há uma qualidade de imagem realçada que
possa servir de padrão para as diferentes finalidades de aplicação. Sem dúvida, as técnicas de realce
alteram as relações de brilho ou nível de cinza dos pixels originais e, portanto, se a imagem realçada
for usada para uma classificação automática, o analista precisa saber qual será o efeito da
transformação sobre os valores digitais.
A escolha da melhor técnica de realce ou da melhor imagem realçada está condicionada às
características fisiográficas de cada área, ao objetivo específico do trabalho e à própria capacidade
do analista em interpretação de imagem. A decisão cabe, portanto, ao analista, desde que a
concepção de qualquer técnica de realce é uma forma de processamento que possibilita uma estreita
interação com o usuário.
Há basicamente dois processos para se realçar uma imagem. Há as técnicas de trabalham
no domínio espectral e, que são maioria, e as que trabalham no domínio espacial. No domínio
espectral o realce é efetuado para que cada pixel da imagem aumente o seu contraste em relação ao
pixel vizinho, independente do valor do pixel vizinho. No domínio espacial da imagem o realce é
efetuado em dependência do valor do pixel em relação aos seus vizinhos, portanto depende da
distribuição espacial dos pixels. Esta última inclui as técnicas de filtragens de imagens
As técnicas de processamento apresentadas nos itens subsequentes são em termos de
processamento as mais simples e invariavelmente, são as primeiras que o analista deve testar para
obter uma imagem com qualidade de interpretação. Pela sua simplicidade são rapidamente
executadas com um grau elevado de independência pelo analista, possibilitando um alta
interatividade homem-máquina.

3.1 Representação Histogrâmica da Imagem Digital

Os valores digitais ou a distribuição dos níveis de cinza de uma imagem digital pode ser
examinada através de um histograma, o qual descreve a distribuição estatística de cada número
digital em termos do número de pixels (Fig.3.1). Ele é análogo a uma função de densidade de
probabilidade, e em geral tem um comportamento gaussiano, pois assim assume-se que se
comportam os materiais na natureza. Se o histograma é gaussiano ele pode ser representado pelos
parâmetros estatísticos de média e variância. A média está relacionada com uma grandeza que nos
indica algo sobre o nível de reflectância dos alvos, enquanto a variância como medida nos dá uma
idéia de como é o contraste da imagem. Contudo, o histograma de uma imagem não contém
nenhuma informação sobre a distribuição espacial dos níveis de cinza da imagem.

20
21

Frequência ou número de pixel

Fig. 3.1 Representação histogrâmica da distribuição dos níveis de cinza de uma imagem.

A figura 3.2 ilustra como se pode analisar as informações de uma imagem pelas suas
formas histogrâmicas. Se a média dos valores de níveis de cinza é baixa, tem-se uma imagem cujos
alvos ou objetos no terreno possuem baixa reflectância, devendo a imagem ter um tom de cinza
geral, mais escuro. Caso contrário se a média é alta, a imagem possui alta reflectância e se
apresentará com tons mais claros. Para se saber nas duas situações o nível de contraste da imagem,
analisa-se a sua variância. Se a imagem de baixa ou alta reflectância tem baixo contraste, a curva
histogrâmica é fechada, isto é, a variância é baixa, e será de alto contraste se a curva for aberta, isto
é, a variância é alta. O histograma é obtido para cada banda, individualmente. Observando os
histogramas da Fig.3.2 chega-se facilmente à conclusão que a imagem que possui o maior contraste
é a da figura 3.2d.

(b)
(a)

0 255

(c)
(d)

0 255

Fig.3.2 - Formas histogrâmicas de imagens com diferentes distribuições de níveis de cinza


(Fonte: Schowengerdt, 1983).

21
22

3.2- Ampliação linear de contraste

Os sensores são instrumentos concebidos para registrarem em qualquer faixa espectral


(banda) uma ampla variação de intensidade de radiância, refletida ou emitida. Acontece que na
natureza, freqüentemente o conjunto de alvos distribuídos por uma área não apresenta, em uma
banda espectral específica, grande contraste de reflectância, o que ocasiona que apenas uma
pequena proporção dos possíveis valores de brilho de uma imagem seja ocupado, e quase sempre
num intervalo estreio. Por ex., os sensores TM e SPOT possuem um intervalo dinâmico ou
amplitude de 256 níveis para representar os valores de brilho ou reflectância, enquanto observa-se
nos histogramas de suas imagens que a média máxima de variações de níveis de brilho situa-se ao
redor de 60 diferentes níveis. Em resumo, tem-se que cada banda normalmente exibe pouco
contraste. A razão de se ter um intervalo dinâmico de 256 níveis de brilho, é simplesmente para
evitar saturação de brilho.
A maneira de melhorar esse contraste é reescalonando a amplitude de cada pixel, através de
uma regra básica de modificação histogrâmica. A imagem modificada ou realçada, é assumida de
ser restrita ao mesmo número de pixels da imagem original, apenas expandidos para o intervalo
dinâmico 0 a 255, de uma maneira que o nível de brilho de saída é o nível que mais se aproxima do
exato mapeamento de um nível de brilho de entrada. Esse efeito resulta numa escala de níveis de
brilho de saída mais diferenciados. Ao se efetuar um realce numa imagem a mesma operação é
aplicada igualmente para todos os pixels que tenham o mesmo valor de brilho, o que significa ser
impossível aplicar numa imagem diferentes transformações histogrâmicas para as áreas com os
mesmos valores de brilho.
A função ampliação linear de contraste é uma função de 1º grau (linear) que faz destinar
novos valores de brilho para cada pixel da imagem original. Na função matemática ou
computacional de primeiro grau, o coeficiente b define o offset (deslocamento) que desloca o
histograma original para uma posição mais central do eixo X, que representa o intervalo de níveis
de cinza, enquanto que o coeficiente a determina a inclinação da reta e exerce efetivamente o efeito
de ampliação do histograma original. Para a>1 quando b=0 tem-se uma ampliação de contraste na
imagem de saída; quando b>0 acrescenta-se à expansão de contraste um deslocamento dos níveis de
cinza (Fig. 3.3).

y = f(x) = ax +b
255
Intervalo de brilho de da imagem saída

que é expressa por Vs = 255 (Ve - Min)


Max – Min Y= ax + b
onde:
Vs = valor de brilho de saída
VBe = valor de brilho de entrada
Max = valor de brilho máximo
Min = valor de brilho mínimo

b a
0

0 40 185 255
intervalo de brilho
da imagem de entrada

Fig.3.3- Ampliação linear dos valores de brilho de uma imagem.

22
23

Para aplicar o realce linear o programa adquire o histograma para cada banda e determina
seus valores máximos e mínimos de níveis de cinza ou brilho. A função de transformação é aplicada
a cada banda, fazendo com que automaticamente o valor mínimo seja fixado ao valor de brilho 0 e o
valor máximo ao valor de brilho 255, e qualquer valor dentro do intervalo é linearmente ampliado
entre 0 e 255. Portanto, as regiões vizinhas ao intervalo Min-Max são mapeadas para preto e
branco respectivamente, a técnica consistindo desta forma num realce de contraste com saturação.
Este é um bom procedimento para manter a base de dados normalizada à escala total do intervalo
dinâmico de brilho. Usualmente, o analista observando o histograma determina livremente qual é o
valor mínimo e máximo, pois pode ele decidir que abaixo ou acima de um certo nível de cinza não
há informação que lhe interesse.
Considere como exemplo a Fig.3.4 que corresponde ao histograma de uma banda qualquer.
Os valores mínimos e máximos dos pixels da imagem de entrada são respectivamente 5 e 25. O
problema pode ser assim formulado
valores brilho < 5 - - > fixados a 0 (b=0)
valores brilho > 25 - - > fixados a 255
valores brilho > 5 e < 25 - - > expandidos entre 0-255
portanto, segundo a função computacional de transferência de 1º grau
P/ f(x,y) < 5 – - > y = 0
P/ f (x,y) > 25 - - > y = 255
P/ f(x,y) [ 5,25], y=__255__(Ve – 5)
25-5
onde: VB, é o valor de brilho do pixel de entrada (imagem original)

Imagem de entrada
LUT

E S
5 0
8 38
9 64
Número pixel

12 89
5 8 10 12 15 22 25 valores de brilho 15 127
22 216
25 255
38 64 83 127 216 255
Imagem de saída

Transformação linear
0

Número de pixels 0 5 25 255

Fig. 3.4- Representação das ampliações dos valores de brilho de uma imagem pelo método de realce linear.

A Fig. 3.5 ilustra o resultado obtido de uma imagem realçada por ampliação linear de
contraste e seus respectivos histogramas. As duas barras no histograma da imagem original marcam
os valores mínimos e máximos que serão expandidos para o intervalo total dinâmicos de 0 a 255.

23
24

imagem original ampliação linear

histograma imagem original histograma imagem realce linear

Fig. 3.5- Exemplo de realce por ampliação histogrâmica linear

As operações histogrâmicas podem ser numericamente representadas por uma tabela


que relaciona os valores de brilho da imagem original aos correspondentes valores de brilho
da imagem realçada. Essa forma tabular é denominada de Look up Tables (LUT) que é feita
mediante uma rotina computacional usando a equação da transformação para realce da
imagem.
A técnica de ampliação linear de contraste é aplicada quando a imagem original
exibe um histograma de valores de brilho com forma unimodal. Acontece algumas vezes, que
dependendo das características espectrais dos alvos de uma dada área e do tamanho desta área
(muitos pixels), o histograma pode mostrar-se multimodal. Neste caso, um procedimento
similar de expansão de contraste deve ser adotado, porém para cada concentração de níveis de
brilho em torno de cada componente modal. Isso compreende em fazer um realce de contraste
linear por partes. Considere os dois exemplos da Fig. 3.6. No 1º caso, figura 4a, tem-se uma
imagem cujo histograma exibe duas componentes modais, com a 1ª moda indicando uma

24
25

grande concentração de pixels com níveis de brilho escuros, e a 2ª moda com menor número
de pixels com valores de brilho mais claros. A maneira mais correta de realçar esta imagem,
seria dar uma maior expansão às feições escuras da imagem e comprimir o contraste das
feições claras. Isso é visto no gráfico abaixo do histograma da figura 34a, que mostra que o
intervalo digital correspondente à moda da região escura expande-se para um maior intervalo
digital na imagem de saída. O 2o caso, figura 34b a maior expansão seria para a região de
feições mais claras, que têm a maior moda. O procedimento é inverso ao do 1º caso.

0 255 0 255
255
a b
Imagem de saída

255

Imagem de
saída
255
255
255
00

0 255 0 255
moda da região escura moda da região clara

Fig. 3.6- Ampliação linear por partes. A maior expansão linear de brilho é efetuada na região de moda maior.

3.3 – Equalização histogrâmica

A técnica de realce de contraste não linear para as feições claras e escuras de uma
imagem, é usada para obter uma forma de redistribuição dos valores de brilho, tal que os
incrementos de ampliação do brilho da imagem sejam desigualmente distribuídos entre 0 a
255.
A vantagem desta técnica em relação à forma de contraste linear por partes, seria
porque o estímulo de percepção visual do olho humano não é linear. Os algoritmos mais
usados são a, equalização e o gaussiano.
Na equalização, cada classe de números digitais (0 – 255) da imagem deve conter
aproximadamente igual número de pixels, o que resulta em um histograma quase uniforme. O
método envolve primeiramente o cálculo do número de pixels que cada classe do histograma
equalizado deverá ter. Este valor, chamado de nt é encontrado dividindo o número total N de
pixels da imagem original por 256 (intervalo digital da imagem). No exemplo dado na tabela
1, para simplificar os cálculos considerou-se uma imagem com intervalo digital não de 256
níveis, mas apenas de 16 níveis de cinza ou classes (primeira coluna da tabela 1).
Essa imagem contém N= 262144 pixels que dividido por 16 classes resulta em nt =
16384, que deverá ser o número de pixels de cada classe da imagem de saída. Na segunda

25
26

coluna da tabela tem-se o número de pixels por classe da imagem original de entrada. No
próximo passo, coluna 3 da tabela, o histograma da imagem de entrada é convertido para a
forma cumulativa. O primeiro valor da coluna 3 é 1311 porque é a classe 0. Os demais valores
da coluna 3 são calculados somando-se a primeira classe da coluna 3 com a segunda classe da
coluna 2 e assim sucessivamente. Os valores da coluna 4 são obtidos dividindo-se nt = 16384
por cada classe de pixel cumulativo da coluna 3. Nessa divisão considera-se apenas o valor
inteiro do quociente. Assim, os níveis de entrada 0 a 2 da coluna 1 são alocados ao nível de
saída 0 na coluna 4; os níveis de entrada 3 e 4 são alocados ao nível de saída 1 e, assim por
diante. Note que as classes da imagem original com relativa baixa sequência, i.e., poucos
pixels, foram agrupadas no mesmo valor de classe de saída. Por exemplo, as classes 0, 1 e 2
de entrada agrupam-se na classe 0 da imagem de saída. Observe que o mesmo ocorre para as
classes 10 a 15. Isso significa que o contraste nessas áreas, isso é, nas regiões mais das
extremidades do histograma, foi reduzido, enquanto que o contraste para as classes com maior
número de pixels, que ocupam a posição mais central do histograma, é ampliado. Portanto, o
efeito da equalização é o de aumentar o contraste no centro do histograma que tem mais densa
população de pixels, enquanto reduz o contraste nas extremidades.
O último passo é calcular o número de pixels que deverá ser alocado para cada classe
da imagem de saída da coluna 4. Isso é feito somando-se o número de pixels por classe da
coluna 2 que na correspondente classe da coluna 4 tenham o mesmo valor. Os resultados são
mostrados na tabela 1b

Tabela 1a – Cálculo ilustrando o processo de equalização de histograma N= 262144, nt = 16384.


Classes da imagem Número de pixels Número de pixel Classes da imagem
de entrada por classe cumulativo por de saída
classe
0 1311 1311 0
1 2622 3933 0
2 5243 9176 0
3 9176 18352 1
4 13108 31460 1
5 24904 56364 3
6 30146 86510 5
7 45875 132385 8
8 58982 191367 11
9 48496 239863 14
10 11796 251659 15
11 3932 255591 15
12 3932 259523 15
13 2621 262144 15
14 0 262144 15
15 0 262144 15

Tabela 1b – Número de pixels alocados a cada classe depois da equalização


(0) (1) (2) (3) (4) 5 (6) (7) (8)
9176 22284 0 24904 0 30146 0 0 45875

(9) (10) (11) (12) (13) (14) (15)


0 0 58982 0 0 48496 22281

26
27

A figura 3.7 ilustra o resultado da ampliação histogrâmica por equalização de uma


banda de imagem TM.

imagem original imagem equalizada

histograma imagem original histograma imagem equalizada

Fig. 3.7- Exemplo de realce de imagem por equalização

3.4 – Histograma Gaussiânico

O contraste gaussiânico é a transformação também não linear do histograma da


imagem de entrada para um histograma normal ou Gaussiânico. A forma de uma distribuição
normal é mostrada na Fig. 3.8 com os valores dos seus desvios padrão 1σ, 2σ e 3σ, que
respectivamente abrangem 60,7%, 95% e 99% dos valores distribuídos. Uma distribuição
gausssiânica é definida por

f (x) = C e – ax2

27
28

-2σ -1σ 0 1σ 2σ
unidades de desvio padrão

Fig. 3.8- Distribuição normal padrão

O exemplo mostrado na tabela 2 são com os mesmos dados computados para a


equalização. Como a curva de uma distribuição normal varia de menos infinito para mais
infinito, no exemplo, um intervalo de desvio padrão de  3 da média é usado.

Tabela 2- Valores de classes de pixels obtidos no processo de transformação histogrâmica


gaussiânica. (N número total de pixels = 262144)
( i) (ii) (iii) (iv) (v) (vi) (vii) (viii)
0 <- 3,0 00020 530 530 1311 1311 1
1 - 2,6 0,0033 868 1398 2622 3933 3
2 - 2,2 0,0092 2423 3821 5243 9176 3
3 - 1,8 0,0220 5774 9595 9176 18352 4
4 - 1,4 0,0448 1175 21346 13108 31460 5
5 - 1,0 0,0779 20421 41767 24904 56364 6
6 - 0,6 0,1156 30303 72070 30146 86510 7
7 - 0,2 0,1465 38401 110471 45875 132385 8
8 0,2 0,1585 41555 152026 58982 191367 10
9 0,6 0,1465 38401 190427 48496 239863 11
10 1,0 0,1156 30303 220730 11796 251659 12
11 1,4 0,0779 20421 241151 3932 255591 13
12 1,8 0,0448 11751 252902 3932 259523 14
13 2,2 0,0220 5774 258676 2621 262144 15
14 2,6 0,0092 2423 261099 0 362144 15
15 > 3,0 0,0040 1045 262144 0 262144 15
(i) valores das classes de pixels da imagem original
(ii) dá os pontos na distribuição normal (desvio padrão) para os quais os pixels de cada
classe serão mapeados
(iii) probabilidade definida de cada classe da distribuição normal;
(iv) número de pixels calculado para cada nível = N x Prob. classe (ex. 262.144. x
0,0020 = 530);
(v) número cumulativo de pixels das classes da coluna (iv);
(vi) número de pixel que foi observado de ocorrer para cada classe de nível de cinza da
coluna (i) da imagem de entrada; a soma desta coluna é N= 262144;
(vii) número acumulado de pixels observados;
(viii) valores dos pixels depois da transformação.

A coluna final dá o nível a ser usado no realce gaussiânico da imagem. Esses níveis
são determinados comparando-se a coluna (v) com a coluna (vii) da seguinte maneira. O valor
ao nível 0 da coluna (i) associado à coluna (vii) é 1311. O primeiro valor na coluna (v) a

28
29

exceder 1311 é aquele associado com o nível 1 de (i), que é 1398; assim o nível de entrada 0
torna-se no nível de saída 1. Continuando, toma-se o valor cumulativo coluna (vii) com o
nível de entrada 1 que é 3933, encontramos que o primeiro elemento da coluna (v) a exceder
3933 é aquele associado com o nível 3 (9595), de modo que o nível de entrada 1 (i) torna-se
no nível de saída 3. O processo é repetido para cada nível de entrada (i). Automaticamente os
níveis da coluna (i) são então mapeados para os níveis da coluna (vii).
Para se calcular o número de pixels que conterá cada um dos níveis da coluna (viii)
da imagem de saída, soma-se os números de pixels da coluna (vi) para cada nível da coluna
(viii). Os resultados estão na tabela 3.

Tabela 3 - Número de pixels calculado para cada nível da imagem gausssiânica


(0) (1) (2) (3) (4) (5) (6) (7) (8)
0 1311 0 7865 9176 13108 24904 30146 45875
(9) (10) (11) (12) (13) (14) (15)
0 58982 48496 11796 3932 3932 2621

Se comparamos a tabela 2 de equalização com a tabela 3 gaussiânica, veremos que


o realce gausssiânico enfatiza o contraste nas extremidades da distribuição. O número de 3
desvios padrões usados foi um exemplo. Um maior ou menor número de desvios padrões
pode ser especificado pelo usuário. A figura 3.9 dá um exemplo de uma imagem realçada
pela ampliação histogrâmica gaussiânica.
imagem original imagem realce gaussiânico

Fig.3.9-Exemplo de realce de imagem por ampliação gaussiânica

29

Você também pode gostar