Análise do uso de diferentes bandas de cores na

Transcrição

XII Simpósio Brasileiro de Automação Inteligente (SBAI)
Natal – RN, 25 a 28 de outubro de 2015
ANÁLISE DO USO DE DIFERENTES BANDAS DE CORES NA DETECÇÃO DO
DISCO ÓPTICO EM IMAGENS DE RETINA
Luckas Santos
Fernando Assunção
Rodrigo Veras∗, Fátima Medeiros†
∗
Departamento de Computação
Universidade Federal do Piauı́
Teresina, Piauı́, Brasil
†
Departamento de Computação
Universidade Federal do Ceará
Fortaleza, Ceará, Brasil
Emails: [email protected]
[email protected]
[email protected], [email protected]
Abstract— In this work, we sought to develop several processing techniques to locate the optical disc (OD)
of images on the retina. Finding the OD in a retinal image improves the chances of detecting non-systemic
and systemic diseases such as diabetes, hypertension and arteriosclerosis. The location also serves as input to
detect other anatomical structures of the retina and macula such as blood vessels, for this purpose have been
implemented and compared six different algorithms that use different approaches to detection of making use of
four color bands in six image databases in the public domain.
Keywords—
retinal images, detection of the optical disc, color bands.
Resumo— Neste trabalho procura-se desenvolver várias técnicas de processamento para a localização do disco
óptico(DO) em imagens de retina. Encontrar o DO em uma imagem da retina melhora as chances de detectar
doenças não-sistêmicas e sistêmicas, como a diabetes, a hipertensão e a arteriosclerose. A sua localização também
serve como entrada para a detecção de outras estruturas anatômicas da retina, tais como mácula e vasos sanguı́neos, para esta finalidade foram implementados e comparados seis algoritmos diferentes que utilizam diversas
abordagens para detecção do DO, fazendo uso de quatro bandas de cores, em seis bases de imagem de domı́nio
público.
Keywords—
imagens de retina, detecção do disco óptico, bandas de cores.
1
Introdução
na identificação do disco óptico. Existem diversos
algoritmos para detecção dessa importante região
da retina (Veras et al., 2014).
O olho humano é responsável pela capacidade do
homem interagir visualmente com o meio ambiente que o rodeia. Baseado em um conjunto de
processos quı́micos e fı́sicos básicos, o olho transforma estı́mulos luminosos em estı́mulos elétricos
e envia-os ao cérebro para que possam ser interpretados.
A retina constitui a membrana mais interna
do olho, situando-se na sua parede posterior.
Quando o olho focaliza uma cena, a imagem correspondente é projetada sobre a retina. A análise
da retina pode prover informações sobre mudanças patológicas causadas por doenças oculares
locais e sinais recentes de doenças sistemáticas
como hipertensão, arteriosclerose, diabetes mellitus(Silva and Veras, 2011). A Figura 1 mostra
uma ilustração da retina humana.
O disco ótico aparece no lado esquerdo desta
imagem destacado com o cı́rculo branco. Esta
estrutura constitui em uma imagem de retina
saudável a parte mais brilhante como também a
região de convergência dos vasos sanguı́neos. Em
uma retina normal, as várias propriedades (forma,
cor, tamanho e convergência dos vasos) auxiliam
Figura 1: Imagem da retina humana e suas principais estruturas.
Normalmente algoritmos de detecção do DO
fazem uso de um canal de cor especı́fico muitas
vezes baseado empiricamente nos conjuntos de imagens utilizados para teste, o que muitas vezes elevam suas taxas de acerto.
O objetivo principal deste trabalho é descrever a influência do canal de cor em seis métodos
1789
de detecção do DO implementados, comparando
o desempenho em seu canal de cor originalmente
proposto a outros três canais em imagens de retina
com diferentes caracterı́sticas.
2
2.1
2.2
2.2.1
Canais de cor utilizados
As imagens coloridas são resultantes da combinação de três imagens obtidas, cada uma em um
canal diferente R (red ), G (green), B (Blue).
Quando se trata de imagens coloridas de retina,
muitos trabalhos afirmam que o canal verde (G)
contém o melhor contraste entre os elementos e o
fundo, enquanto no canal vermelho (R) é encontrado muita saturação e o canal azul na maioria
dos casos não contém informação relevante.
Dessa forma, além de avaliarmos os canais R e
G, também, avaliamos outras combinações dadas
pelas equações 1 e 2.
(1)
Y = 0, 299R + 0, 5876G + 0, 114B
(2)
2.2.2
(b)
(c)
(d)
Método de Akram et al (2010)
O método de Akram et al introduzido em (Akram
et al., 2010) utiliza um algoritmo onde inicialmente a imagem de entrada é convertida para a
banda verde, posteriormente, os autores aplicaram
um filtro de média no canal verde para remover o
ruı́do resultante no fundo da imagem. Como o
DO é considerado uma parte brilhante no fundo
de uma imagem de retina, os autores buscaram
a região onde tinham os pixels com maior intensidade segundo o histograma da imagem. Estes
pixels localizados são identificados como a região
de interesse (ROI). A partir da ROI, eles extraem
o DO aplicando a TCH e marcam um cı́rculo onde
foi localizado.
A primeira imagem (D) é formada pela combinação das imagens R e G. Esperava-se que na
imagem resultante o DO apareça como uma região
mais homogênea e destacada do fundo da imagem. Já a imagem resultante da equação 2 representa a luminância(medida de intensidade de luz
refletida). Utilizamos a luminância visto que o
DO normalmente apresenta a caracterı́stica de ser
mais brilhante em relação a outras partes da imagem. A imagem 2 demonstra a mesma imagem
em diversos canais de cor.
(a)
Método de Liu et al (1997)
O método de (Liu et al., 1997) utiliza a transformada Circular de Hough (TCH) para identificar o DO através de uma metodologia que detecta formas geométricas em imagens digitais. No
algoritmo mesmo podendo interferir na detecção
de bordas, os autores usaram a componente vermelha, pois com uso dessa componente não aparecem os vasos sanguı́neos do DO. Este algoritmo
leva em consideração somente a diferença do fundo
da imagem e o brilho do DO.
Materiais e Métodos
D = 0, 5R + 0, 5G
Métodos de detecção de DO utilizados para
avaliação dos canais de cor
2.2.3
Método de Rajaput et al (2011)
O método de (Rajaput et al., 2011) faz a localização da fóvea em imagens coloridas de retina,
o qual considera um conhecimento a priori do
diâmetro e centro do DO. Em virtude dessa informação os autores propuseram um método de
detecção do DO. Com este objetivo, os autores
aplicam uma equalização de histograma no canal
vermelho da imagem para realçar o contraste. Em
seguida, a imagem é invertida e as áreas de mı́nima
intensidade são identificadas utilizando a transformada H, empiricamente os autores definiram o
valor de h (altura limite) como 20 pixels. O resultado desse processamento é uma imagem binária
com os pixels brancos representando as regiões
de mı́nima intensidade da imagem original. Essas regiões de mı́nimo são pixels conectados e que
possuem o mesmo valor de intensidade e cujo os
pixels da borda externa possuem um valor de intensidade mais alto.
2.2.4
Figura 2: Canais de cores. 2(a) canal vermelho,
2(b) canal verde, 2(c) combinação entre os canais
vermelho e verde e 2(d) combinação entre os três
canais verde, vermelho e azul.
Método de Sekar e Nagarajan (2012)
Sekar e Nagarajan propuseram em (Sekar and Nagarajan, 2012) um método para localização do DO
baseado em uma abordagem de agrupamento de
histograma. Neste métodos, primeiro é necessário
determinar as regiões candidatas, agrupando os
1790
1% dos pixels mais intensos na banda vermelha
em imagens de retina. Em seguida, é gerada uma
imagem verde contendo os agrupamentos de pixels
mais intensos gerados no passo anterior, esta nova
imagem gerada na banda verde é processada por
três métodos independentes chamados de método
de máxima variância, máxima diferença e filtro
gaussiano. Após esta etapa os autores analisam
o histograma das três subimagens retornadas por
estes métodos e analisam aquela que possuir um
maior número de pixels na banda azul.
2.2.5
em um programa no qual tinha objetivo de monitorar a retinopatia diabética na Holanda, essa
base foi criada pelo Image Sciences Institute da
University Medical Center Utrecht para auxiliar
os estudos comparativos em segmentação de vasos sanguı́neos na retina. As imagens foram capturadas em formato digital por uma câmera nãomidriática Canon CR5 3CCD com um campo de
vista de 45o . Estas imagens possuem dimensões
de 768 × 584 pixels e estão no formato JPEG.
A base DRIONS-DB (Carmona et al., 2008)
(Digital Retinal Images for Optic Nerve Segmentation Database) é composta por 110 imagens digitais da retina. Essas imagens foram selecionadas
aleatoriamente a partir de um banco de imagens
de fundo de olho pertencente ao Serviço de Oftalmologia do Hospital Miguel Servet, Saragossa (Espanha). As imagens foram obtidas com uma câmara analógica e foram armazenadas em formato
de slide. Para obter as imagens digitais, elas foram
digitalizadas usando um scanner de alta resolução
HP-PhotoSmart-S20, resolução de 600 × 400 pixels no formato JPEG.
A base Drishti-GS composta por um total de
101 imagens. Estas foram divididas em 50 de
treino e 51 de teste. Todas as imagens foram marcados por 4 peritos do olho com diferentes nı́veis
de experiência clı́nica. Todas as imagens foram
coletadas em Aravind Eye Hospital. Todas as imagens foram tiradas centrada no DO com um Field
Of-View (FOV) de 30 graus e de dimensões 2896
× 1944 pixels e formato PNG.
A base STARE (Hoover and Goldbaum, 2003)
(Structured Analysis of the Retina) contém 402
slides digitalizados, sendo obtidas de um projeto
iniciado por Michael Goldbaum na Universidade
da Califórnia em 1975 para análises de imagens
em de retina. Os slides foram capturado com a
câmera TopCon TRV-50 com angulação de 35o
com relação ao campo de vista. Os slides foram
digitalizados para um formato de 700 × 605 pixels
e utilizam oito bits por canal de cor em formato
JPEG. Nesta base contém informação de patologia em imagens, onde 36 imagens são classificadas
como saudáveis e 67 classificadas como doentes.
A base de imagem ARIA (Damian, 2006) (Automated Retinal Image Analysis)é composta por
116 imagens sendo essas divididas em dois grupos, que são: saudáveis com 61 imagens de retinas
e doentes (com patologia) com 55. Essas imagens
foram obtidas através de uma câmera Zeiss FF450
em formato TIFF.
A figura 3 contém um exemplo de todas as
bases de imagens.
Método de Punolil (2013)
Em (Punnolil, 2013) é apresentado um sistema
para detecção e classificação automática de gravidade do edema macular. Para Esta finalidade, o
centro DO foi detectado e a região da fóvea foi
localizada utilizando as informações dos vasos da
retina. Para detecção do DO os autores aplicaram
um operador de fechamento morfológico no canal
verde da imagem com elemento estruturante de
raio 15 para eliminar os vasos sanguı́neos da região
do DO. Um operador de vizinhança em coluna foi
aplicado usando uma janela deslizante de tamanho
11 x 11. A imagem resultante foi binarizada com
um valor de limiar de 0,95 com base em uma estimativa interativa para cada imagem. Por fim, o
centro da região resultante da binarização é fixado
como sendo o centro do DO.
2.2.6
Método de Zubair et al (2013)
Em Zubair et al (Zubair et al., 2013) é proposto
um método para detecção de DO e que inicialmente seleciona o canal verde em imagem colorida
de retina. Posteriormente, é feita uma equalização
do histograma para melhorar as caracterı́sticas da
imagem e um alongamento do contraste utilizando
uma operação morfológica de erosão para remover
os candidatos que não são DO e posteriormente
é feita uma dilatação com elemento estruturante
próximo ao tamanho do DO, o candidato que possuir maior contraste em relação aos outros candidatos detectados é escolhido como o DO.
2.3
Bases de Imagens
Para testar o desempenho dos algoritmos foram
utilizadas cinco bases de imagens, a saber:
DRIVE(Staal et al., 2004) ,DRIONS(Carmona
et al., 2008),DRISHTI, STARE(Hoover and Goldbaum, 2003) e ARIA(Damian, 2006).
Tais
bases apresentam imagens com diferentes formatos,patologias, e caracterı́sticas como luminosidade, tamanho, posição e raio do DO definidos
manualmente por especialistas.
A base DRIVE (Staal et al., 2004) (Digital
Retinal Images for Vessel Extraction ) possui 40
imagens de fundo de olho e estas foram obtidas
3
Resultados e Discussões
Neste trabalho será utilizada uma metodologia
de avaliação que é taxa de sucesso que avalia a
proximidade da marcação dos métodos individu-
1791
(a) Drive
(b) DRIONS
(c) STARE
(d) ARIA
(e) MESSIDOR
Figura 4: Grafico DO todas as bases.
os resultados para a determinação do centro do
DO para imagens saudáveis, já na Figura 6 temos
os resultados para as imagens patológicas, ambas
testadas nas bases ARIA e STARE por conterem
esta especificação realizada por especialistas.
(f) DRISHTI
Figura 3: Exemplos de imagens de todas as bases.
ais em relação ao DO. Tobin et al. em (Tobin
et al., 2007), introduziu uma metodologia simples
para avaliar o desempenho de métodos de detecção
de DO, o que compara as coordenadas estimadas
(xE ,yE ) marcadas pelo método para um par de coordenadas que foi marcado manualmente, como o
centro do DO(xDO ,yDO ), onde a distância euclidiana entre esses pontos forem menor que 1R (Valor
do raio do DO) a avaliação será dada como correta, portanto esta abordagem exibe o resultado
como sucesso se a equação 3 é válida.
p
(xDO − xE )2 + (yDO − yE )2 ≤ 1R,
Figura 5: Grafico DO imagens saudaveis.
(3)
Para realizar a avaliação dos algoritmos implementados foi utilizado a metodologia de avaliação proposta na equação 3 em um total de 420
imagens utilizando os quatro canais de cor (R, G,
D, Y) nas 5 bases descritas na seção 2.2. Afim de
comparar o desempenho dos métodos foi realizada
uma avaliação global dos algoritmos utilizando a
média da taxa de sucesso de todas as bases para
cada canal de cor como pode ser ilustrado na
Figura 4.
De uma maneira geral, podemos afirmar que o
método do obteve melhor taxa de sucesso no canal
vermelho foi (Akram et al., 2010) com (77,80%)
seguido por (Rajaput et al., 2011) com 71,80%, no
canal verde (Rajaput et al., 2011) obteve 86,15%.
Já na junção dos canais vermelho e verde (D),
(Punnolil, 2013) teve melhor desempenho com
78,76%, e por fim nas imagens em tons de cinza
(Rajaput et al., 2011) obteve novamente a maior
taxa de acerto com 86,15%.
Fizemos ainda uma comparação entre imagens saudáveis e patológicas. Na Figura 5 temos
Figura 6: Grafico DO imagens com algum grau de
patologia.
Vemos que nas imagens saudáveis os algoritmos possuem uma taxa melhor de acerto, isso se
deve pelo fato de algumas patologias apresentarem
regiões escuras como caracterı́stica principal o que
muitas vezes dificulta a detecção do DO em diversos canais. É possı́vel analisar que o método de
1792
(Akram et al., 2010) obteve melhor taxa de acerto no canal vermelho (R) com 87,63%, posteriormente no canal verde (G) (Rajaput et al., 2011)
foi o melhor método para este canal com 94,84%.
No canal D (Punnolil, 2013) acertou mais com
86,59%, e por fim no canal Y (Rajaput et al., 2011)
novamente foi o método que acertou mais com
uma taxa de 93,81%.
De uma maneira geral, no subgrupo de imagens patológicas o método de (Akram et al., 2010)
repetiu o bom desempenho com novamente o melhor resultado no canal vermelho (47,54%), obtendo neste conjunto de imagens uma maior taxa
de acerto no canal D (59,00%) . Nos canais verde
e Y, (Rajaput et al., 2011) confirmou ser o melhor método para imagens nestes canais acertando
60,65% e 59,83% respectivamente.
4
Hoover, A. and Goldbaum, M. (2003). Locating
the optic nerve in a retinal image using the
fuzzy convergence of the blood vessels, IEEE
Transactions on Medical Imaging 22(8): 951–
958.
Liu, Z., Opas, C. and Krishnan, S. (1997).
Automatic image analysis of fundus photograph, Proceedings 19th IEEE Engineering in
Medicine and Biology Society Annual Conference, Vol. 2, Chicago, IL, EUA, pp. 524–
525.
Punnolil, A. (2013). A novel approach for diagnosis and severity grading of diabetic maculopathy, Advances in Computing, Communications and Informatics (ICACCI), 2013 International Conference on pp. 1230–1235.
Rajaput, G. G., Reshmi, B. M. and Sidramappa,
C. (2011). Automatic localization of fovea
center using mathematical morpology in fundus images, International Journal of Machine Intelligence 3(4): 172–179.
Conclusão e Trabalhos Futuros
Na avaliação utilizando imagens com diversas caracterı́sticas (formato, cor, tamanho) concluı́mos
que houve muita variação nos resultados e que o
algoritmo deve ser especı́fico para o canal de cor,
visto que a utilização deste canal de cor escolhido
tende a ser melhor no conjunto de imagens que
este método vai ser implementado.
Foi detectado que a presença de patologias nas
imagens dificultam a detecção do DO em diversos
canais, pois as alterações causadas por este estado
são confundidas pelos métodos mesmo utilizando
canais diferentes.
Como trabalho futuro iremos pesquisar como
definir qual a melhor relação entre canal de cor
e método implementado para cada imagem, visto
que o mesmo tem desempenho superior em imagens com certas caracterı́sticas utilizando um determinado canal mesmo que este não seja o mesmo
proposto originalmente, e posteriormente iremos
aprofundar pesquisas para detecção de DO no
canal D, pois os melhores resultados foram obtidos
neste canal.
Sekar, G. B. and Nagarajan, M. P. (2012). Localisation of optic disc in fundus images by using
clustering and histogram techniques, International Conference on Computing, Electronics and Electrical Technologies - ICCEET,
pp. 584 – 589.
Silva, R. and Veras, R. (2011). Estudo e implementação de algoritmos para detecção da
mácula em imagens de retina, Piauı́, Brasil.
Staal, J., Abramoff, M. D., Niemeijer, M.,
Viergever, M. A. and Ginneken, B. V. (2004).
Ridge-based vessel segmentation in color images of the retina, IEEE Transactions on
Medical Imaging 23(4): 501–509.
Tobin, K. W., Chaum, E., Govindasamy, V. P.
and Karnowski, T. P. (2007). Detection of
anatomic structures in human retinal imagery, IEEE Transactions on Medical Imaging 26(12): 1729–1739.
Referências
Akram, M. U., Khan, A., Iqbal, K. and Butt,
W. H. (2010).
Retinal images: Optic
disk localization and detection, in M. K.
c
AurÃlio
Campilho (ed.), International Cnference on Image Analysis and Recognition,
Vol. 6112, pp. 40–49.
Veras, R., Medeiros, F., Santos, L. and Assunção,
F. (2014). A comparative study of optic disc
detection methods on five publicly available
database, Workshop de Informática Médica,
Brasilia, Brazil.
Zubair, M., Yamin, A. and Khan, S. (2013). Automated detection of optic disc for the analysis
of retina using color fundus image, IEEE International Conference on Imaging Systems
and Techniques, Beijing, pp. 239 – 242.
Carmona, E., Rincon, M., Garcia-Feijoo, J. and
de-la Casa, J. M. M. (2008). Identification of the optic nerve head with genetic algorithms, Artificial Intelligence in Medicine
43(3): 243–259.
Damian, F. (2006). Aria online, retinal image archive, http://www.eyecharity.com/
aria_online/.
1793

Análise do uso de diferentes bandas de cores na

Transcrição

Documentos relacionados

Análise do uso de diferentes bandas de cores na detecç ˜ao do

Cópia de Biometria 2 - Sumário

resumo das diretrizes dos padrões de práticas preferenciais

Ecstasy pode provocar altera visão até 24 horas

Fisiologia do Sistema Nervoso - Enfermagem

Artigo Completo

Apostila de Ciências Orgãos dos sentidos

separados por dois pontos – centralizados e sem

universidade castelo branco qualittas pós graduação

Um Sistema Acurado de Detecç ˜ao de Ameaças em Tempo Real

Neves Martins, Dr. - Hospital Privado da Trofa

RETINA

edição maio/2016 - Fundação Penido Burnier

Dicas para as Redes Sociais aqui

GROUPS-NET: Roteamento Ciente de Encontros de

ARQUIVOS - Fundação Penido Burnier

Veja Bem

Oftalmologia veterinária

Teorema de Ptolomeu

Mídia Kit 2016

Embriologia - WordPress.com

Saúde dos Olhos