Análise do uso de diferentes bandas de cores na

Transcrição

Análise do uso de diferentes bandas de cores na
XII Simpósio Brasileiro de Automação Inteligente (SBAI)
Natal – RN, 25 a 28 de outubro de 2015
ANÁLISE DO USO DE DIFERENTES BANDAS DE CORES NA DETECÇÃO DO
DISCO ÓPTICO EM IMAGENS DE RETINA
Luckas Santos
Fernando Assunção
Rodrigo Veras∗, Fátima Medeiros†
∗
Departamento de Computação
Universidade Federal do Piauı́
Teresina, Piauı́, Brasil
†
Departamento de Computação
Universidade Federal do Ceará
Fortaleza, Ceará, Brasil
Emails: [email protected]
[email protected]
[email protected], [email protected]
Abstract— In this work, we sought to develop several processing techniques to locate the optical disc (OD)
of images on the retina. Finding the OD in a retinal image improves the chances of detecting non-systemic
and systemic diseases such as diabetes, hypertension and arteriosclerosis. The location also serves as input to
detect other anatomical structures of the retina and macula such as blood vessels, for this purpose have been
implemented and compared six different algorithms that use different approaches to detection of making use of
four color bands in six image databases in the public domain.
Keywords—
retinal images, detection of the optical disc, color bands.
Resumo— Neste trabalho procura-se desenvolver várias técnicas de processamento para a localização do disco
óptico(DO) em imagens de retina. Encontrar o DO em uma imagem da retina melhora as chances de detectar
doenças não-sistêmicas e sistêmicas, como a diabetes, a hipertensão e a arteriosclerose. A sua localização também
serve como entrada para a detecção de outras estruturas anatômicas da retina, tais como mácula e vasos sanguı́neos, para esta finalidade foram implementados e comparados seis algoritmos diferentes que utilizam diversas
abordagens para detecção do DO, fazendo uso de quatro bandas de cores, em seis bases de imagem de domı́nio
público.
Keywords—
imagens de retina, detecção do disco óptico, bandas de cores.
1
Introdução
na identificação do disco óptico. Existem diversos
algoritmos para detecção dessa importante região
da retina (Veras et al., 2014).
O olho humano é responsável pela capacidade do
homem interagir visualmente com o meio ambiente que o rodeia. Baseado em um conjunto de
processos quı́micos e fı́sicos básicos, o olho transforma estı́mulos luminosos em estı́mulos elétricos
e envia-os ao cérebro para que possam ser interpretados.
A retina constitui a membrana mais interna
do olho, situando-se na sua parede posterior.
Quando o olho focaliza uma cena, a imagem correspondente é projetada sobre a retina. A análise
da retina pode prover informações sobre mudanças patológicas causadas por doenças oculares
locais e sinais recentes de doenças sistemáticas
como hipertensão, arteriosclerose, diabetes mellitus(Silva and Veras, 2011). A Figura 1 mostra
uma ilustração da retina humana.
O disco ótico aparece no lado esquerdo desta
imagem destacado com o cı́rculo branco. Esta
estrutura constitui em uma imagem de retina
saudável a parte mais brilhante como também a
região de convergência dos vasos sanguı́neos. Em
uma retina normal, as várias propriedades (forma,
cor, tamanho e convergência dos vasos) auxiliam
Figura 1: Imagem da retina humana e suas principais estruturas.
Normalmente algoritmos de detecção do DO
fazem uso de um canal de cor especı́fico muitas
vezes baseado empiricamente nos conjuntos de imagens utilizados para teste, o que muitas vezes elevam suas taxas de acerto.
O objetivo principal deste trabalho é descrever a influência do canal de cor em seis métodos
1789
XII Simpósio Brasileiro de Automação Inteligente (SBAI)
de detecção do DO implementados, comparando
o desempenho em seu canal de cor originalmente
proposto a outros três canais em imagens de retina
com diferentes caracterı́sticas.
2
2.1
2.2
2.2.1
Canais de cor utilizados
As imagens coloridas são resultantes da combinação de três imagens obtidas, cada uma em um
canal diferente R (red ), G (green), B (Blue).
Quando se trata de imagens coloridas de retina,
muitos trabalhos afirmam que o canal verde (G)
contém o melhor contraste entre os elementos e o
fundo, enquanto no canal vermelho (R) é encontrado muita saturação e o canal azul na maioria
dos casos não contém informação relevante.
Dessa forma, além de avaliarmos os canais R e
G, também, avaliamos outras combinações dadas
pelas equações 1 e 2.
(1)
Y = 0, 299R + 0, 5876G + 0, 114B
(2)
2.2.2
(b)
(c)
(d)
Método de Akram et al (2010)
O método de Akram et al introduzido em (Akram
et al., 2010) utiliza um algoritmo onde inicialmente a imagem de entrada é convertida para a
banda verde, posteriormente, os autores aplicaram
um filtro de média no canal verde para remover o
ruı́do resultante no fundo da imagem. Como o
DO é considerado uma parte brilhante no fundo
de uma imagem de retina, os autores buscaram
a região onde tinham os pixels com maior intensidade segundo o histograma da imagem. Estes
pixels localizados são identificados como a região
de interesse (ROI). A partir da ROI, eles extraem
o DO aplicando a TCH e marcam um cı́rculo onde
foi localizado.
A primeira imagem (D) é formada pela combinação das imagens R e G. Esperava-se que na
imagem resultante o DO apareça como uma região
mais homogênea e destacada do fundo da imagem. Já a imagem resultante da equação 2 representa a luminância(medida de intensidade de luz
refletida). Utilizamos a luminância visto que o
DO normalmente apresenta a caracterı́stica de ser
mais brilhante em relação a outras partes da imagem. A imagem 2 demonstra a mesma imagem
em diversos canais de cor.
(a)
Método de Liu et al (1997)
O método de (Liu et al., 1997) utiliza a transformada Circular de Hough (TCH) para identificar o DO através de uma metodologia que detecta formas geométricas em imagens digitais. No
algoritmo mesmo podendo interferir na detecção
de bordas, os autores usaram a componente vermelha, pois com uso dessa componente não aparecem os vasos sanguı́neos do DO. Este algoritmo
leva em consideração somente a diferença do fundo
da imagem e o brilho do DO.
Materiais e Métodos
D = 0, 5R + 0, 5G
Métodos de detecção de DO utilizados para
avaliação dos canais de cor
2.2.3
Método de Rajaput et al (2011)
O método de (Rajaput et al., 2011) faz a localização da fóvea em imagens coloridas de retina,
o qual considera um conhecimento a priori do
diâmetro e centro do DO. Em virtude dessa informação os autores propuseram um método de
detecção do DO. Com este objetivo, os autores
aplicam uma equalização de histograma no canal
vermelho da imagem para realçar o contraste. Em
seguida, a imagem é invertida e as áreas de mı́nima
intensidade são identificadas utilizando a transformada H, empiricamente os autores definiram o
valor de h (altura limite) como 20 pixels. O resultado desse processamento é uma imagem binária
com os pixels brancos representando as regiões
de mı́nima intensidade da imagem original. Essas regiões de mı́nimo são pixels conectados e que
possuem o mesmo valor de intensidade e cujo os
pixels da borda externa possuem um valor de intensidade mais alto.
2.2.4
Figura 2: Canais de cores. 2(a) canal vermelho,
2(b) canal verde, 2(c) combinação entre os canais
vermelho e verde e 2(d) combinação entre os três
canais verde, vermelho e azul.
Método de Sekar e Nagarajan (2012)
Sekar e Nagarajan propuseram em (Sekar and Nagarajan, 2012) um método para localização do DO
baseado em uma abordagem de agrupamento de
histograma. Neste métodos, primeiro é necessário
determinar as regiões candidatas, agrupando os
1790
XII Simpósio Brasileiro de Automação Inteligente (SBAI)
1% dos pixels mais intensos na banda vermelha
em imagens de retina. Em seguida, é gerada uma
imagem verde contendo os agrupamentos de pixels
mais intensos gerados no passo anterior, esta nova
imagem gerada na banda verde é processada por
três métodos independentes chamados de método
de máxima variância, máxima diferença e filtro
gaussiano. Após esta etapa os autores analisam
o histograma das três subimagens retornadas por
estes métodos e analisam aquela que possuir um
maior número de pixels na banda azul.
2.2.5
em um programa no qual tinha objetivo de monitorar a retinopatia diabética na Holanda, essa
base foi criada pelo Image Sciences Institute da
University Medical Center Utrecht para auxiliar
os estudos comparativos em segmentação de vasos sanguı́neos na retina. As imagens foram capturadas em formato digital por uma câmera nãomidriática Canon CR5 3CCD com um campo de
vista de 45o . Estas imagens possuem dimensões
de 768 × 584 pixels e estão no formato JPEG.
A base DRIONS-DB (Carmona et al., 2008)
(Digital Retinal Images for Optic Nerve Segmentation Database) é composta por 110 imagens digitais da retina. Essas imagens foram selecionadas
aleatoriamente a partir de um banco de imagens
de fundo de olho pertencente ao Serviço de Oftalmologia do Hospital Miguel Servet, Saragossa (Espanha). As imagens foram obtidas com uma câmara analógica e foram armazenadas em formato
de slide. Para obter as imagens digitais, elas foram
digitalizadas usando um scanner de alta resolução
HP-PhotoSmart-S20, resolução de 600 × 400 pixels no formato JPEG.
A base Drishti-GS composta por um total de
101 imagens. Estas foram divididas em 50 de
treino e 51 de teste. Todas as imagens foram marcados por 4 peritos do olho com diferentes nı́veis
de experiência clı́nica. Todas as imagens foram
coletadas em Aravind Eye Hospital. Todas as imagens foram tiradas centrada no DO com um Field
Of-View (FOV) de 30 graus e de dimensões 2896
× 1944 pixels e formato PNG.
A base STARE (Hoover and Goldbaum, 2003)
(Structured Analysis of the Retina) contém 402
slides digitalizados, sendo obtidas de um projeto
iniciado por Michael Goldbaum na Universidade
da Califórnia em 1975 para análises de imagens
em de retina. Os slides foram capturado com a
câmera TopCon TRV-50 com angulação de 35o
com relação ao campo de vista. Os slides foram
digitalizados para um formato de 700 × 605 pixels
e utilizam oito bits por canal de cor em formato
JPEG. Nesta base contém informação de patologia em imagens, onde 36 imagens são classificadas
como saudáveis e 67 classificadas como doentes.
A base de imagem ARIA (Damian, 2006) (Automated Retinal Image Analysis)é composta por
116 imagens sendo essas divididas em dois grupos, que são: saudáveis com 61 imagens de retinas
e doentes (com patologia) com 55. Essas imagens
foram obtidas através de uma câmera Zeiss FF450
em formato TIFF.
A figura 3 contém um exemplo de todas as
bases de imagens.
Método de Punolil (2013)
Em (Punnolil, 2013) é apresentado um sistema
para detecção e classificação automática de gravidade do edema macular. Para Esta finalidade, o
centro DO foi detectado e a região da fóvea foi
localizada utilizando as informações dos vasos da
retina. Para detecção do DO os autores aplicaram
um operador de fechamento morfológico no canal
verde da imagem com elemento estruturante de
raio 15 para eliminar os vasos sanguı́neos da região
do DO. Um operador de vizinhança em coluna foi
aplicado usando uma janela deslizante de tamanho
11 x 11. A imagem resultante foi binarizada com
um valor de limiar de 0,95 com base em uma estimativa interativa para cada imagem. Por fim, o
centro da região resultante da binarização é fixado
como sendo o centro do DO.
2.2.6
Método de Zubair et al (2013)
Em Zubair et al (Zubair et al., 2013) é proposto
um método para detecção de DO e que inicialmente seleciona o canal verde em imagem colorida
de retina. Posteriormente, é feita uma equalização
do histograma para melhorar as caracterı́sticas da
imagem e um alongamento do contraste utilizando
uma operação morfológica de erosão para remover
os candidatos que não são DO e posteriormente
é feita uma dilatação com elemento estruturante
próximo ao tamanho do DO, o candidato que possuir maior contraste em relação aos outros candidatos detectados é escolhido como o DO.
2.3
Bases de Imagens
Para testar o desempenho dos algoritmos foram
utilizadas cinco bases de imagens, a saber:
DRIVE(Staal et al., 2004) ,DRIONS(Carmona
et al., 2008),DRISHTI, STARE(Hoover and Goldbaum, 2003) e ARIA(Damian, 2006).
Tais
bases apresentam imagens com diferentes formatos,patologias, e caracterı́sticas como luminosidade, tamanho, posição e raio do DO definidos
manualmente por especialistas.
A base DRIVE (Staal et al., 2004) (Digital
Retinal Images for Vessel Extraction ) possui 40
imagens de fundo de olho e estas foram obtidas
3
Resultados e Discussões
Neste trabalho será utilizada uma metodologia
de avaliação que é taxa de sucesso que avalia a
proximidade da marcação dos métodos individu-
1791
XII Simpósio Brasileiro de Automação Inteligente (SBAI)
(a) Drive
(b) DRIONS
(c) STARE
(d) ARIA
(e) MESSIDOR
Figura 4: Grafico DO todas as bases.
os resultados para a determinação do centro do
DO para imagens saudáveis, já na Figura 6 temos
os resultados para as imagens patológicas, ambas
testadas nas bases ARIA e STARE por conterem
esta especificação realizada por especialistas.
(f) DRISHTI
Figura 3: Exemplos de imagens de todas as bases.
ais em relação ao DO. Tobin et al. em (Tobin
et al., 2007), introduziu uma metodologia simples
para avaliar o desempenho de métodos de detecção
de DO, o que compara as coordenadas estimadas
(xE ,yE ) marcadas pelo método para um par de coordenadas que foi marcado manualmente, como o
centro do DO(xDO ,yDO ), onde a distância euclidiana entre esses pontos forem menor que 1R (Valor
do raio do DO) a avaliação será dada como correta, portanto esta abordagem exibe o resultado
como sucesso se a equação 3 é válida.
p
(xDO − xE )2 + (yDO − yE )2 ≤ 1R,
Figura 5: Grafico DO imagens saudaveis.
(3)
Para realizar a avaliação dos algoritmos implementados foi utilizado a metodologia de avaliação proposta na equação 3 em um total de 420
imagens utilizando os quatro canais de cor (R, G,
D, Y) nas 5 bases descritas na seção 2.2. Afim de
comparar o desempenho dos métodos foi realizada
uma avaliação global dos algoritmos utilizando a
média da taxa de sucesso de todas as bases para
cada canal de cor como pode ser ilustrado na
Figura 4.
De uma maneira geral, podemos afirmar que o
método do obteve melhor taxa de sucesso no canal
vermelho foi (Akram et al., 2010) com (77,80%)
seguido por (Rajaput et al., 2011) com 71,80%, no
canal verde (Rajaput et al., 2011) obteve 86,15%.
Já na junção dos canais vermelho e verde (D),
(Punnolil, 2013) teve melhor desempenho com
78,76%, e por fim nas imagens em tons de cinza
(Rajaput et al., 2011) obteve novamente a maior
taxa de acerto com 86,15%.
Fizemos ainda uma comparação entre imagens saudáveis e patológicas. Na Figura 5 temos
Figura 6: Grafico DO imagens com algum grau de
patologia.
Vemos que nas imagens saudáveis os algoritmos possuem uma taxa melhor de acerto, isso se
deve pelo fato de algumas patologias apresentarem
regiões escuras como caracterı́stica principal o que
muitas vezes dificulta a detecção do DO em diversos canais. É possı́vel analisar que o método de
1792
XII Simpósio Brasileiro de Automação Inteligente (SBAI)
(Akram et al., 2010) obteve melhor taxa de acerto no canal vermelho (R) com 87,63%, posteriormente no canal verde (G) (Rajaput et al., 2011)
foi o melhor método para este canal com 94,84%.
No canal D (Punnolil, 2013) acertou mais com
86,59%, e por fim no canal Y (Rajaput et al., 2011)
novamente foi o método que acertou mais com
uma taxa de 93,81%.
De uma maneira geral, no subgrupo de imagens patológicas o método de (Akram et al., 2010)
repetiu o bom desempenho com novamente o melhor resultado no canal vermelho (47,54%), obtendo neste conjunto de imagens uma maior taxa
de acerto no canal D (59,00%) . Nos canais verde
e Y, (Rajaput et al., 2011) confirmou ser o melhor método para imagens nestes canais acertando
60,65% e 59,83% respectivamente.
4
Hoover, A. and Goldbaum, M. (2003). Locating
the optic nerve in a retinal image using the
fuzzy convergence of the blood vessels, IEEE
Transactions on Medical Imaging 22(8): 951–
958.
Liu, Z., Opas, C. and Krishnan, S. (1997).
Automatic image analysis of fundus photograph, Proceedings 19th IEEE Engineering in
Medicine and Biology Society Annual Conference, Vol. 2, Chicago, IL, EUA, pp. 524–
525.
Punnolil, A. (2013). A novel approach for diagnosis and severity grading of diabetic maculopathy, Advances in Computing, Communications and Informatics (ICACCI), 2013 International Conference on pp. 1230–1235.
Rajaput, G. G., Reshmi, B. M. and Sidramappa,
C. (2011). Automatic localization of fovea
center using mathematical morpology in fundus images, International Journal of Machine Intelligence 3(4): 172–179.
Conclusão e Trabalhos Futuros
Na avaliação utilizando imagens com diversas caracterı́sticas (formato, cor, tamanho) concluı́mos
que houve muita variação nos resultados e que o
algoritmo deve ser especı́fico para o canal de cor,
visto que a utilização deste canal de cor escolhido
tende a ser melhor no conjunto de imagens que
este método vai ser implementado.
Foi detectado que a presença de patologias nas
imagens dificultam a detecção do DO em diversos
canais, pois as alterações causadas por este estado
são confundidas pelos métodos mesmo utilizando
canais diferentes.
Como trabalho futuro iremos pesquisar como
definir qual a melhor relação entre canal de cor
e método implementado para cada imagem, visto
que o mesmo tem desempenho superior em imagens com certas caracterı́sticas utilizando um determinado canal mesmo que este não seja o mesmo
proposto originalmente, e posteriormente iremos
aprofundar pesquisas para detecção de DO no
canal D, pois os melhores resultados foram obtidos
neste canal.
Sekar, G. B. and Nagarajan, M. P. (2012). Localisation of optic disc in fundus images by using
clustering and histogram techniques, International Conference on Computing, Electronics and Electrical Technologies - ICCEET,
pp. 584 – 589.
Silva, R. and Veras, R. (2011). Estudo e implementação de algoritmos para detecção da
mácula em imagens de retina, Piauı́, Brasil.
Staal, J., Abramoff, M. D., Niemeijer, M.,
Viergever, M. A. and Ginneken, B. V. (2004).
Ridge-based vessel segmentation in color images of the retina, IEEE Transactions on
Medical Imaging 23(4): 501–509.
Tobin, K. W., Chaum, E., Govindasamy, V. P.
and Karnowski, T. P. (2007). Detection of
anatomic structures in human retinal imagery, IEEE Transactions on Medical Imaging 26(12): 1729–1739.
Referências
Akram, M. U., Khan, A., Iqbal, K. and Butt,
W. H. (2010).
Retinal images: Optic
disk localization and detection, in M. K.
c
AurÃlio
Campilho (ed.), International Cnference on Image Analysis and Recognition,
Vol. 6112, pp. 40–49.
Veras, R., Medeiros, F., Santos, L. and Assunção,
F. (2014). A comparative study of optic disc
detection methods on five publicly available
database, Workshop de Informática Médica,
Brasilia, Brazil.
Zubair, M., Yamin, A. and Khan, S. (2013). Automated detection of optic disc for the analysis
of retina using color fundus image, IEEE International Conference on Imaging Systems
and Techniques, Beijing, pp. 239 – 242.
Carmona, E., Rincon, M., Garcia-Feijoo, J. and
de-la Casa, J. M. M. (2008). Identification of the optic nerve head with genetic algorithms, Artificial Intelligence in Medicine
43(3): 243–259.
Damian, F. (2006). Aria online, retinal image archive, http://www.eyecharity.com/
aria_online/.
1793

Documentos relacionados

Análise do uso de diferentes bandas de cores na detecç ˜ao do

Análise do uso de diferentes bandas de cores na detecç ˜ao do Sekar, G. B. and Nagarajan, M. P. (2012). Localisation of optic disc in fundus images by using clustering and histogram techniques. In International Conference on Computing, Electronics and Electri...

Leia mais