Análise do uso de diferentes bandas de cores na
Transcrição
Análise do uso de diferentes bandas de cores na
XII Simpósio Brasileiro de Automação Inteligente (SBAI) Natal – RN, 25 a 28 de outubro de 2015 ANÁLISE DO USO DE DIFERENTES BANDAS DE CORES NA DETECÇÃO DO DISCO ÓPTICO EM IMAGENS DE RETINA Luckas Santos Fernando Assunção Rodrigo Veras∗, Fátima Medeiros† ∗ Departamento de Computação Universidade Federal do Piauı́ Teresina, Piauı́, Brasil † Departamento de Computação Universidade Federal do Ceará Fortaleza, Ceará, Brasil Emails: [email protected] [email protected] [email protected], [email protected] Abstract— In this work, we sought to develop several processing techniques to locate the optical disc (OD) of images on the retina. Finding the OD in a retinal image improves the chances of detecting non-systemic and systemic diseases such as diabetes, hypertension and arteriosclerosis. The location also serves as input to detect other anatomical structures of the retina and macula such as blood vessels, for this purpose have been implemented and compared six different algorithms that use different approaches to detection of making use of four color bands in six image databases in the public domain. Keywords— retinal images, detection of the optical disc, color bands. Resumo— Neste trabalho procura-se desenvolver várias técnicas de processamento para a localização do disco óptico(DO) em imagens de retina. Encontrar o DO em uma imagem da retina melhora as chances de detectar doenças não-sistêmicas e sistêmicas, como a diabetes, a hipertensão e a arteriosclerose. A sua localização também serve como entrada para a detecção de outras estruturas anatômicas da retina, tais como mácula e vasos sanguı́neos, para esta finalidade foram implementados e comparados seis algoritmos diferentes que utilizam diversas abordagens para detecção do DO, fazendo uso de quatro bandas de cores, em seis bases de imagem de domı́nio público. Keywords— imagens de retina, detecção do disco óptico, bandas de cores. 1 Introdução na identificação do disco óptico. Existem diversos algoritmos para detecção dessa importante região da retina (Veras et al., 2014). O olho humano é responsável pela capacidade do homem interagir visualmente com o meio ambiente que o rodeia. Baseado em um conjunto de processos quı́micos e fı́sicos básicos, o olho transforma estı́mulos luminosos em estı́mulos elétricos e envia-os ao cérebro para que possam ser interpretados. A retina constitui a membrana mais interna do olho, situando-se na sua parede posterior. Quando o olho focaliza uma cena, a imagem correspondente é projetada sobre a retina. A análise da retina pode prover informações sobre mudanças patológicas causadas por doenças oculares locais e sinais recentes de doenças sistemáticas como hipertensão, arteriosclerose, diabetes mellitus(Silva and Veras, 2011). A Figura 1 mostra uma ilustração da retina humana. O disco ótico aparece no lado esquerdo desta imagem destacado com o cı́rculo branco. Esta estrutura constitui em uma imagem de retina saudável a parte mais brilhante como também a região de convergência dos vasos sanguı́neos. Em uma retina normal, as várias propriedades (forma, cor, tamanho e convergência dos vasos) auxiliam Figura 1: Imagem da retina humana e suas principais estruturas. Normalmente algoritmos de detecção do DO fazem uso de um canal de cor especı́fico muitas vezes baseado empiricamente nos conjuntos de imagens utilizados para teste, o que muitas vezes elevam suas taxas de acerto. O objetivo principal deste trabalho é descrever a influência do canal de cor em seis métodos 1789 XII Simpósio Brasileiro de Automação Inteligente (SBAI) de detecção do DO implementados, comparando o desempenho em seu canal de cor originalmente proposto a outros três canais em imagens de retina com diferentes caracterı́sticas. 2 2.1 2.2 2.2.1 Canais de cor utilizados As imagens coloridas são resultantes da combinação de três imagens obtidas, cada uma em um canal diferente R (red ), G (green), B (Blue). Quando se trata de imagens coloridas de retina, muitos trabalhos afirmam que o canal verde (G) contém o melhor contraste entre os elementos e o fundo, enquanto no canal vermelho (R) é encontrado muita saturação e o canal azul na maioria dos casos não contém informação relevante. Dessa forma, além de avaliarmos os canais R e G, também, avaliamos outras combinações dadas pelas equações 1 e 2. (1) Y = 0, 299R + 0, 5876G + 0, 114B (2) 2.2.2 (b) (c) (d) Método de Akram et al (2010) O método de Akram et al introduzido em (Akram et al., 2010) utiliza um algoritmo onde inicialmente a imagem de entrada é convertida para a banda verde, posteriormente, os autores aplicaram um filtro de média no canal verde para remover o ruı́do resultante no fundo da imagem. Como o DO é considerado uma parte brilhante no fundo de uma imagem de retina, os autores buscaram a região onde tinham os pixels com maior intensidade segundo o histograma da imagem. Estes pixels localizados são identificados como a região de interesse (ROI). A partir da ROI, eles extraem o DO aplicando a TCH e marcam um cı́rculo onde foi localizado. A primeira imagem (D) é formada pela combinação das imagens R e G. Esperava-se que na imagem resultante o DO apareça como uma região mais homogênea e destacada do fundo da imagem. Já a imagem resultante da equação 2 representa a luminância(medida de intensidade de luz refletida). Utilizamos a luminância visto que o DO normalmente apresenta a caracterı́stica de ser mais brilhante em relação a outras partes da imagem. A imagem 2 demonstra a mesma imagem em diversos canais de cor. (a) Método de Liu et al (1997) O método de (Liu et al., 1997) utiliza a transformada Circular de Hough (TCH) para identificar o DO através de uma metodologia que detecta formas geométricas em imagens digitais. No algoritmo mesmo podendo interferir na detecção de bordas, os autores usaram a componente vermelha, pois com uso dessa componente não aparecem os vasos sanguı́neos do DO. Este algoritmo leva em consideração somente a diferença do fundo da imagem e o brilho do DO. Materiais e Métodos D = 0, 5R + 0, 5G Métodos de detecção de DO utilizados para avaliação dos canais de cor 2.2.3 Método de Rajaput et al (2011) O método de (Rajaput et al., 2011) faz a localização da fóvea em imagens coloridas de retina, o qual considera um conhecimento a priori do diâmetro e centro do DO. Em virtude dessa informação os autores propuseram um método de detecção do DO. Com este objetivo, os autores aplicam uma equalização de histograma no canal vermelho da imagem para realçar o contraste. Em seguida, a imagem é invertida e as áreas de mı́nima intensidade são identificadas utilizando a transformada H, empiricamente os autores definiram o valor de h (altura limite) como 20 pixels. O resultado desse processamento é uma imagem binária com os pixels brancos representando as regiões de mı́nima intensidade da imagem original. Essas regiões de mı́nimo são pixels conectados e que possuem o mesmo valor de intensidade e cujo os pixels da borda externa possuem um valor de intensidade mais alto. 2.2.4 Figura 2: Canais de cores. 2(a) canal vermelho, 2(b) canal verde, 2(c) combinação entre os canais vermelho e verde e 2(d) combinação entre os três canais verde, vermelho e azul. Método de Sekar e Nagarajan (2012) Sekar e Nagarajan propuseram em (Sekar and Nagarajan, 2012) um método para localização do DO baseado em uma abordagem de agrupamento de histograma. Neste métodos, primeiro é necessário determinar as regiões candidatas, agrupando os 1790 XII Simpósio Brasileiro de Automação Inteligente (SBAI) 1% dos pixels mais intensos na banda vermelha em imagens de retina. Em seguida, é gerada uma imagem verde contendo os agrupamentos de pixels mais intensos gerados no passo anterior, esta nova imagem gerada na banda verde é processada por três métodos independentes chamados de método de máxima variância, máxima diferença e filtro gaussiano. Após esta etapa os autores analisam o histograma das três subimagens retornadas por estes métodos e analisam aquela que possuir um maior número de pixels na banda azul. 2.2.5 em um programa no qual tinha objetivo de monitorar a retinopatia diabética na Holanda, essa base foi criada pelo Image Sciences Institute da University Medical Center Utrecht para auxiliar os estudos comparativos em segmentação de vasos sanguı́neos na retina. As imagens foram capturadas em formato digital por uma câmera nãomidriática Canon CR5 3CCD com um campo de vista de 45o . Estas imagens possuem dimensões de 768 × 584 pixels e estão no formato JPEG. A base DRIONS-DB (Carmona et al., 2008) (Digital Retinal Images for Optic Nerve Segmentation Database) é composta por 110 imagens digitais da retina. Essas imagens foram selecionadas aleatoriamente a partir de um banco de imagens de fundo de olho pertencente ao Serviço de Oftalmologia do Hospital Miguel Servet, Saragossa (Espanha). As imagens foram obtidas com uma câmara analógica e foram armazenadas em formato de slide. Para obter as imagens digitais, elas foram digitalizadas usando um scanner de alta resolução HP-PhotoSmart-S20, resolução de 600 × 400 pixels no formato JPEG. A base Drishti-GS composta por um total de 101 imagens. Estas foram divididas em 50 de treino e 51 de teste. Todas as imagens foram marcados por 4 peritos do olho com diferentes nı́veis de experiência clı́nica. Todas as imagens foram coletadas em Aravind Eye Hospital. Todas as imagens foram tiradas centrada no DO com um Field Of-View (FOV) de 30 graus e de dimensões 2896 × 1944 pixels e formato PNG. A base STARE (Hoover and Goldbaum, 2003) (Structured Analysis of the Retina) contém 402 slides digitalizados, sendo obtidas de um projeto iniciado por Michael Goldbaum na Universidade da Califórnia em 1975 para análises de imagens em de retina. Os slides foram capturado com a câmera TopCon TRV-50 com angulação de 35o com relação ao campo de vista. Os slides foram digitalizados para um formato de 700 × 605 pixels e utilizam oito bits por canal de cor em formato JPEG. Nesta base contém informação de patologia em imagens, onde 36 imagens são classificadas como saudáveis e 67 classificadas como doentes. A base de imagem ARIA (Damian, 2006) (Automated Retinal Image Analysis)é composta por 116 imagens sendo essas divididas em dois grupos, que são: saudáveis com 61 imagens de retinas e doentes (com patologia) com 55. Essas imagens foram obtidas através de uma câmera Zeiss FF450 em formato TIFF. A figura 3 contém um exemplo de todas as bases de imagens. Método de Punolil (2013) Em (Punnolil, 2013) é apresentado um sistema para detecção e classificação automática de gravidade do edema macular. Para Esta finalidade, o centro DO foi detectado e a região da fóvea foi localizada utilizando as informações dos vasos da retina. Para detecção do DO os autores aplicaram um operador de fechamento morfológico no canal verde da imagem com elemento estruturante de raio 15 para eliminar os vasos sanguı́neos da região do DO. Um operador de vizinhança em coluna foi aplicado usando uma janela deslizante de tamanho 11 x 11. A imagem resultante foi binarizada com um valor de limiar de 0,95 com base em uma estimativa interativa para cada imagem. Por fim, o centro da região resultante da binarização é fixado como sendo o centro do DO. 2.2.6 Método de Zubair et al (2013) Em Zubair et al (Zubair et al., 2013) é proposto um método para detecção de DO e que inicialmente seleciona o canal verde em imagem colorida de retina. Posteriormente, é feita uma equalização do histograma para melhorar as caracterı́sticas da imagem e um alongamento do contraste utilizando uma operação morfológica de erosão para remover os candidatos que não são DO e posteriormente é feita uma dilatação com elemento estruturante próximo ao tamanho do DO, o candidato que possuir maior contraste em relação aos outros candidatos detectados é escolhido como o DO. 2.3 Bases de Imagens Para testar o desempenho dos algoritmos foram utilizadas cinco bases de imagens, a saber: DRIVE(Staal et al., 2004) ,DRIONS(Carmona et al., 2008),DRISHTI, STARE(Hoover and Goldbaum, 2003) e ARIA(Damian, 2006). Tais bases apresentam imagens com diferentes formatos,patologias, e caracterı́sticas como luminosidade, tamanho, posição e raio do DO definidos manualmente por especialistas. A base DRIVE (Staal et al., 2004) (Digital Retinal Images for Vessel Extraction ) possui 40 imagens de fundo de olho e estas foram obtidas 3 Resultados e Discussões Neste trabalho será utilizada uma metodologia de avaliação que é taxa de sucesso que avalia a proximidade da marcação dos métodos individu- 1791 XII Simpósio Brasileiro de Automação Inteligente (SBAI) (a) Drive (b) DRIONS (c) STARE (d) ARIA (e) MESSIDOR Figura 4: Grafico DO todas as bases. os resultados para a determinação do centro do DO para imagens saudáveis, já na Figura 6 temos os resultados para as imagens patológicas, ambas testadas nas bases ARIA e STARE por conterem esta especificação realizada por especialistas. (f) DRISHTI Figura 3: Exemplos de imagens de todas as bases. ais em relação ao DO. Tobin et al. em (Tobin et al., 2007), introduziu uma metodologia simples para avaliar o desempenho de métodos de detecção de DO, o que compara as coordenadas estimadas (xE ,yE ) marcadas pelo método para um par de coordenadas que foi marcado manualmente, como o centro do DO(xDO ,yDO ), onde a distância euclidiana entre esses pontos forem menor que 1R (Valor do raio do DO) a avaliação será dada como correta, portanto esta abordagem exibe o resultado como sucesso se a equação 3 é válida. p (xDO − xE )2 + (yDO − yE )2 ≤ 1R, Figura 5: Grafico DO imagens saudaveis. (3) Para realizar a avaliação dos algoritmos implementados foi utilizado a metodologia de avaliação proposta na equação 3 em um total de 420 imagens utilizando os quatro canais de cor (R, G, D, Y) nas 5 bases descritas na seção 2.2. Afim de comparar o desempenho dos métodos foi realizada uma avaliação global dos algoritmos utilizando a média da taxa de sucesso de todas as bases para cada canal de cor como pode ser ilustrado na Figura 4. De uma maneira geral, podemos afirmar que o método do obteve melhor taxa de sucesso no canal vermelho foi (Akram et al., 2010) com (77,80%) seguido por (Rajaput et al., 2011) com 71,80%, no canal verde (Rajaput et al., 2011) obteve 86,15%. Já na junção dos canais vermelho e verde (D), (Punnolil, 2013) teve melhor desempenho com 78,76%, e por fim nas imagens em tons de cinza (Rajaput et al., 2011) obteve novamente a maior taxa de acerto com 86,15%. Fizemos ainda uma comparação entre imagens saudáveis e patológicas. Na Figura 5 temos Figura 6: Grafico DO imagens com algum grau de patologia. Vemos que nas imagens saudáveis os algoritmos possuem uma taxa melhor de acerto, isso se deve pelo fato de algumas patologias apresentarem regiões escuras como caracterı́stica principal o que muitas vezes dificulta a detecção do DO em diversos canais. É possı́vel analisar que o método de 1792 XII Simpósio Brasileiro de Automação Inteligente (SBAI) (Akram et al., 2010) obteve melhor taxa de acerto no canal vermelho (R) com 87,63%, posteriormente no canal verde (G) (Rajaput et al., 2011) foi o melhor método para este canal com 94,84%. No canal D (Punnolil, 2013) acertou mais com 86,59%, e por fim no canal Y (Rajaput et al., 2011) novamente foi o método que acertou mais com uma taxa de 93,81%. De uma maneira geral, no subgrupo de imagens patológicas o método de (Akram et al., 2010) repetiu o bom desempenho com novamente o melhor resultado no canal vermelho (47,54%), obtendo neste conjunto de imagens uma maior taxa de acerto no canal D (59,00%) . Nos canais verde e Y, (Rajaput et al., 2011) confirmou ser o melhor método para imagens nestes canais acertando 60,65% e 59,83% respectivamente. 4 Hoover, A. and Goldbaum, M. (2003). Locating the optic nerve in a retinal image using the fuzzy convergence of the blood vessels, IEEE Transactions on Medical Imaging 22(8): 951– 958. Liu, Z., Opas, C. and Krishnan, S. (1997). Automatic image analysis of fundus photograph, Proceedings 19th IEEE Engineering in Medicine and Biology Society Annual Conference, Vol. 2, Chicago, IL, EUA, pp. 524– 525. Punnolil, A. (2013). A novel approach for diagnosis and severity grading of diabetic maculopathy, Advances in Computing, Communications and Informatics (ICACCI), 2013 International Conference on pp. 1230–1235. Rajaput, G. G., Reshmi, B. M. and Sidramappa, C. (2011). Automatic localization of fovea center using mathematical morpology in fundus images, International Journal of Machine Intelligence 3(4): 172–179. Conclusão e Trabalhos Futuros Na avaliação utilizando imagens com diversas caracterı́sticas (formato, cor, tamanho) concluı́mos que houve muita variação nos resultados e que o algoritmo deve ser especı́fico para o canal de cor, visto que a utilização deste canal de cor escolhido tende a ser melhor no conjunto de imagens que este método vai ser implementado. Foi detectado que a presença de patologias nas imagens dificultam a detecção do DO em diversos canais, pois as alterações causadas por este estado são confundidas pelos métodos mesmo utilizando canais diferentes. Como trabalho futuro iremos pesquisar como definir qual a melhor relação entre canal de cor e método implementado para cada imagem, visto que o mesmo tem desempenho superior em imagens com certas caracterı́sticas utilizando um determinado canal mesmo que este não seja o mesmo proposto originalmente, e posteriormente iremos aprofundar pesquisas para detecção de DO no canal D, pois os melhores resultados foram obtidos neste canal. Sekar, G. B. and Nagarajan, M. P. (2012). Localisation of optic disc in fundus images by using clustering and histogram techniques, International Conference on Computing, Electronics and Electrical Technologies - ICCEET, pp. 584 – 589. Silva, R. and Veras, R. (2011). Estudo e implementação de algoritmos para detecção da mácula em imagens de retina, Piauı́, Brasil. Staal, J., Abramoff, M. D., Niemeijer, M., Viergever, M. A. and Ginneken, B. V. (2004). Ridge-based vessel segmentation in color images of the retina, IEEE Transactions on Medical Imaging 23(4): 501–509. Tobin, K. W., Chaum, E., Govindasamy, V. P. and Karnowski, T. P. (2007). Detection of anatomic structures in human retinal imagery, IEEE Transactions on Medical Imaging 26(12): 1729–1739. Referências Akram, M. U., Khan, A., Iqbal, K. and Butt, W. H. (2010). Retinal images: Optic disk localization and detection, in M. K. c AurÃlio Campilho (ed.), International Cnference on Image Analysis and Recognition, Vol. 6112, pp. 40–49. Veras, R., Medeiros, F., Santos, L. and Assunção, F. (2014). A comparative study of optic disc detection methods on five publicly available database, Workshop de Informática Médica, Brasilia, Brazil. Zubair, M., Yamin, A. and Khan, S. (2013). Automated detection of optic disc for the analysis of retina using color fundus image, IEEE International Conference on Imaging Systems and Techniques, Beijing, pp. 239 – 242. Carmona, E., Rincon, M., Garcia-Feijoo, J. and de-la Casa, J. M. M. (2008). Identification of the optic nerve head with genetic algorithms, Artificial Intelligence in Medicine 43(3): 243–259. Damian, F. (2006). Aria online, retinal image archive, http://www.eyecharity.com/ aria_online/. 1793
Documentos relacionados
Análise do uso de diferentes bandas de cores na detecç ˜ao do
Sekar, G. B. and Nagarajan, M. P. (2012). Localisation of optic disc in fundus images by using clustering and histogram techniques. In International Conference on Computing, Electronics and Electri...
Leia mais