Exploração de Bases de Dados Médicas Utilizando Redes Neurais
Transcrição
Exploração de Bases de Dados Médicas Utilizando Redes Neurais
Exploração de Bases de Dados Médicas Utilizando Redes Neurais Artificiais Auto-Organizáveis Lucimar F. de Carvalho1, Candice Abella S. Dani1, Hugo T. de Carvalho2, Silvia M. Nassar3 , Fernando M. Azevedo3, Diego Dozza4, Ana Luisa C. Brasil 4 1 Curso de Ciência da Computação, Dpto. de Informática e Estatística, UPF/RS 2 Médico Especialista – HC/HSVP - Passo Fundo/RS 3 Curso de Pós-Graduação-Ciência da Computação e Engenharia Biomédica, UFSC/SC 4 Alunos Bolsistas – FAPERGS e PIBIC/UPF [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected] Resumo - O objetivo deste trabalho é a implementação de técnicas utilizadas no processo de aprendizagem em Redes Neurais Artificiais Auto-organizáveis (RNA’s). Inicialmente a rede será treinada a partir do simulador da Neusciences - ActiveX que utiliza o algoritmo padrão de Kohonen com a aprendizagem competitiva e não supervisionada. O resultado da simulação será comparado com o algoritmo que utiliza aprendizagem supervisionada através da técnica Learning Vector of Quantization (LVQ1). O domínio escolhido para a implementação dos algoritmos de aprendizagem foi a aplicação no Diagnóstico Clínico das Crises Convulsivas, baseado na Classificação International League Against Epilepsy ILAI/81[4]. De acordo com os resultados encontrados do simulador e do algoritmo que utiliza a técnica LVQ1, as bases de treinamento da rede mostraram um índice de convergência de 69,76% e 71,31% respectivamente; as bases de teste apresentaram 80% e 100% respectivamente, em uma matriz 2 x 2. A partir destes resultados observou-se que, com a utilização da técnica LVQ1 e uma topologia de rede 5 x 5, ocorre uma melhora significativa no reconhecimento de padrões. No final serão descritos resultados mais precisos em relação às matrizes utilizadas em ambos os algoritmos. Palavras-chave: Inteligência Artificial, Redes Neurais Artificiais, Crise Convulsiva. Introdução Redes que utilizam uma topologia de autoorganização foram pesquisadas por Teuvo Kohonen e podem ser encontradas na sua obra, Self-Organization and Associative Memory (Kohonen, 2001). São redes que mapeiam informações sensoriais distribuídas em representações de duas ou mais dimensões. Os resultados da aprendizagem encontrados nestas RNA`s são similares aos encontrados no cérebro humano, dando origem a maneira como as informações são armazenadas e assimiladas artificialmente. As RNA`s incorporaram alguma forma de aprendizagem e podem evoluir com a experiência adquirida, através do conceito de generalização. As RNA`s foram pesquisados inicialmente por Gallant (Gallant, 1988). através de uma rede direta para diagnosticar duas doenças a partir de seis sintomas apresentados pelos pacientes. Quando se modela um procedimento de ensino e aprendizagem através de técnicas computacionais, pode-se deduzir na forma de transmitir conhecimentos organizadamente. O grande desafio encontra-se em descobrir processos de ensino e aprendizagem para que o computador tenha um comportamento inteligente, informando ao computador como ele deve se comportar aos diferentes tipos de entradas recebidas. Um das maneiras de informar ao computador como ele deve se comportar em uma abordagem conexionista é através dos algoritmos de aprendizagem utilizados nas RNA’s. É através destes algoritmos que as redes neurais conseguem aprender um conjunto de conhecimentos (padrões) após encontrar um conjunto de pesos ideal. Estes pesos vão permitir à rede realizar o processamento desejado, para em uma próxima etapa, generalizá-los em um conjunto maior. Desta forma o conhecimento em uma Rede Neural Artificial está contido na melhor escolha dos seus pesos sinápticos e, principalmente na arquitetura de rede escolhida. Algumas RNA`s dependendo do sinal de entrada que recebem, podem ter seus valores de saída associados a uma resposta através do aprendizado supervisionado ou nãosupervisionado. Para a compreensão melhor destas redes, será descrito uma visão simplificada envolvendo as Redes Neurais Biológicas e as Redes Neurais Artificiais. Redes Neurais Biológicas O sistema nervoso é inigualável quanto à vasta complexidade de ações de controle que pode exercer sendo composto por mais de 100 bilhões (1011) de neurônios (Guyton, 1997). Existem aproximadamente 100 trilhões (1014) de conexões (sinapses) o que torna o cérebro uma estrutura extremamente complexa. O descobridor do neurônio foi o anatomista italiano Camilo Golgi em 1975, através de sua técnica de tingimento dos neurônios (Moisés et al, 1993). Através deste tingimento, de uma pequena parte do neurônio, pode-se visualizá-lo, com todas as suas ramificações. Os neurônios são divididos em três partes: o corpo da célula (núcleo), os dendritos e o axônio, conforme mostra a Figura 1. Neste momento a informação é processada e novos impulsos são gerados. Figura 1 – Neurônio Biológico e suas conexões. A função principal do Sistema Nervoso é processar as informações que chegam de maneira a controlar as reações do corpo. Ele combina estas informações com as informações armazenadas pela hereditariedade utilizadas no controle de suas diversas atividades corporais. As informações são processadas entre os neurônios, através das sinapses, a qual conecta um axônio de um neurônio a um dendrito do outro. Existem dois tipos de sinapses utilizadas na transmissão dos sinais: (1) a sinapse química e (2) a sinapse elétrica (Guyton, 1997). A maioria das sinapses do Sistema Nervoso Central são as sinapses químicas. Ambas as sinapses são utilizadas na transmissão dos sinais ao Sistema Nervoso Central. Os impulsos elétricos são recebidos pelos neurônios através dos dendritos, os quais apresentam a função de receber as informações de outros neurônios para conduzi-los ao núcleo (soma) onde são processados. Já o axônio tem a função de carregar os impulsos elétricos que foram gerados no núcleo até a sinapse. Desta forma pode-se perceber que o Sistema Nervoso Central recebe literalmente milhões de bits de informações dos diferentes órgãos sensoriais e, depois, integra todos para determinar a resposta a ser dada pelo corpo (Guyton, 1997). Todo este processo é similar com a arquitetura das RNA`s. Redes Neurais Artificiais Uma RNA`s tem inspiração nos neurônios biológicos e nos sistemas nervosos (De Azevedo,1997). É através destes neurônios que a rede aprenderá determinadas informações fornecidas pelos canais de entrada, tentando reproduzir o funcionamento do cérebro humano, pelo menos em parte. Redes Neurais são organizadas na forma de grupamento de nós, chamados de camada. Existem as camadas de entrada, chamadas de nós de entrada e as camadas de processamento, chamadas de neurônios. Os nós de entrada não efetuam o processamento, são utilizados para alimentar outros nós com sua informação. Os neurônios recebem informação dos nós de entrada ou de outros neurônios para efetuar o processamento. Um neurônio artificial é uma unidade de processamento de informações fundamental para a operação de uma rede neural. A Figura 2 mostra um modelo para o neurônio dinâmico, neste modelo as entradas wij xj são combinadas através da função φ, produzindo desta forma um estado de ativação do neurônio para, através da função λ produzir a saída do neurônio [2, 8]. Neste exemplo, d indica a possibilidade de inclusão de dinâmica no processamento do neurônio. E as conexões sinápticas são consideradas como externas ao modelo do neurônio o que possibilita interpretar a matriz de conexões como a matriz de pesos de um grafo representativo da rede neural, processo similar ao que ocorre no sistema nervoso biológico. Pode-se definir um neurônio i pelo par de equações abaixo: n hi = ∑ wij xj j=1 e yi = f (hi) (1) onde x1, x2, ... xn correspondem aos sinais de entrada; w1, w2, ...wn são os pesos sinápticos do neurônio i; hi é a combinação linear dos sinais de entrada do neurônio i; f (.) é a função de ativação que define a saída do neurônio em termos do nível de ativação em sua entrada; e yi é o sinal de saída do neurônio i. Entradas x1 w1 . ... xn wn Combinção Das Entradas Função De Ativação φ Função De Saída λ y Pesos Sinápticos d Figura 2 - Modelo de um Neurônio Artificial. De acordo com Azevedo (De Azevedo, 2000), dois fatores motivam a pesquisa das RNA’s atualmente: o primeiro é modelar o sistema nervoso com suficiente precisão para obter um comportamento emergente, para desta forma, servir de apoio às hipóteses utilizadas na modelagem e, segundo, construir computadores com um alto grau de paralelismo. Pois quanto maior for o grau de paralelismo, maior será a precisão em relação aos pesos sinápticos, possibilitando desta forma um resultado de saída mais preciso. Metodologia Para a implementação da Rede Neural Artificial foi escolhido o simulador da Neusciences - ActiveX que implementa uma rede Autoorganizável de Kohonen utilizando a linguagem VisualBasic e VisualC. Serão descritos neste artigo, resultados parciais referentes ao treinamento da rede que utiliza aprendizagem competitiva e não supervisionada. O resultado desta simulação será comparado com os algoritmos de aprendizagem competitiva através do Mapa Auto-organizável de Kohonen (aprendizagem competitiva) e com a utilização da técnica Learning Vector of Quantization (LVQ1), a qual consiste em rotular os nodos apresentando a saída desejada, tornando o algoritmo supervisionado. A capacidade de aprendizado presente em uma rede neural é determinado pela topologia das conexões da rede e pela escolha de uma algoritmo de aprendizagem (Guerriere et al, 1991). Novos algoritmos de aprendizagem surgem indicando novas técnicas de pesquisas para garantir um melhor desempenho, principalmente em tarefas de classificação de padrões. Para desenvolver um algoritmo de aprendizagem, devese conhecer as técnicas existentes, a partir do estudo de determinadas técnicas, pode-se propor um algoritmo de busca pela melhor escolha e no wij (new) = wij (old) + α[xi - wij(old)] (1) O algoritmo LVQ1 é uma técnica de aprendizado supervisionada que utiliza informações sobre classes para atualizar o vetor menor tempo possível. Pode-se encontrar na literatura várias técnicas de aprendizagem: segundo Carbonel (Carbonel et all 1984): aprendizado por decorar, por analogia, indução (a partir de exemplos, exploração e descoberta), memorização e dedução. A partir destas técnicas, surgiram os algoritmos de aprendizagem. O aprendizado nas RNA`s abrangem o estudo de duas técnicas, a do aprendizado supervisionado e aprendizado não supervisionado. A diferença entre estas duas técnicas é a presença de dados de treinamento ou um observador que qualifica o desempenho da rede. Para compreender melhor as arquiteturas de rede utilizadas, serão descritos os métodos de aprendizagem propostos neste trabalho. Teuvo Kohonen (Dayhoff, 1992), pesquisador da Universidade de Helsinki iniciou esta nova área de pesquisa utilizando mapas topológicos auto-organizáveis. A rede de Kohonen é uma estrutura de duas (2) camadas, onde a primeira camada corresponde as entradas e a segunda camada , chamada de competitiva, é organizada em uma grade m-dimensional a ser mapeada. Nesta aprendizagem a rede neural utiliza categorias a partir das relações estabelecidas produzindo uma saída correspondente a cada categoria de entrada, a partir da auto-organização dos pesos dos neurônios. Os algoritmos de aprendizagem pesquisados por Kohonen são chamados de Quantização do Vetor de Aprendizagem e são divididos em três algoritmos: LVQ1, LVQ2 e LVQ3. Neste trabalho de pesquisa está sendo utilizada a técnica LVQ1. O modelo padrão de Kohonen é uma rede neural tipo feedforward de treinamento nãosupervisionado. Na aprendizagem competitiva as unidades de entrada competem entre si. É apresentado um conjunto de entradas, não existindo um padrão de saída correspondente. Os pesos são ajustados de acordo com a Equação 1. de pesos, possibilitando desta forma, uma melhora no desempenho da rede. Após cada treinamento da rede o algoritmo LVQ1 compara a saída do sistema com a saída desejada. Os pesos são ajustados conforme a Equação 2: wj (new) = wj (old) + α[x - wj(old)] wj (new) = wj (old) - α[x - wj(old)] se “x” foi classificado corretamente se “x” foi classificado incorretamente A rede mais popular de Kohonen foi implementada no desenvolvimento de um datilógrafo fonético, conhecida como uma “máquina de escrever fonética”, este sistema converge linguagem falada em texto escrito. A rede é utilizada para reconhecer fonemas em fala contínua para o idioma finlandês e o japonês. A rede de Kohonen também tem sido utilizada na exploração de bases de dados (Konkela et al, 1996), na análise de distribuição de renda mundial (Kaski et al, 1996), em sistemas de apoio à decisão de diagnóstico financeiro (Serrano et al, 1996), no controle de processos químicos (Tryba et al, 1991), no controle da qualidade da água (Mpé et al, 1995), na mineração de dados (técnica de data mining) (Back et al, 1996). O Treinamento da Rede Neural Artificial O objetivo de treinar uma rede é ajustar os seus pesos tal que a aplicação de um vetor (ou padrão) de entrada produza um desejado vetor (ou padrão) de saída. Deve-se portanto, no primeiro passo, informar a rede um conjunto de dados que farão parte do conjunto de treinamento. Após a rede ter sido treinada, o segundo passo é apresentrar a rede um novo conjunto de dados que farão parte do conjunto de testes. Desta forma, se a rede tiver sido bem treinada, apresentará a saída desejada corretamente. Para uma compreensão da formação dos conjuntos de treinamento e teste da rede, será descrito uma definição simplificada do domínio a ser representado – as crises convulsivas juntamente com o seu conjunto de treinamento. A Organização Mundial da Saúde (OMS) definiu epilepsia como "um distúrbio do cérebro, de etiologias variadas, caracterizado pelas crises recorrentes conseqüentes à descarga excessiva dos neurônios cerebrais. A característica principal da epilepsia são as crises recorrentes. Porém existem muitos tipos de crise epiléptica, algumas das quais podem ser facilmente confundidas com sintomas de outras doenças – como a hipoglicemia, crise de StokesAdams, narcolepsia e distúrbios psiquiátricos (Da Costa, 1990). Desta forma, é importante a classificação e descrição detalhada das crises epilépticas para se obter um diagnóstico mais preciso. Além disto, a escolha do tratamento antiepiléptico dependerá do tipo de crise, a qual poderá se manifestare através de mais de um tipo de crise no mesmo paciente. Já uma síndrome epiléptica é definida como um distúrbio epiléptico caracterizado por um conjunto (2) de sinais e sintomas que ocorrem simultaneamente. As crises parciais podem permanecer localizadas ou a atividade anormal da crise pode difundir-se a outras partes do cérebro, dando origem a uma crise generalizada. Esse processo é chamado de Crise Parcial Secundariamente Generalizada (CPSG). As crises generalizadas iniciam-se simultaneamente nos dois lados do cérebro. O cérebro inteiro envolve-se no distúrbio, que pode ser transitório ou representar uma desordem crônica. As crises parciais começam em parte do hemisfério do cérebro e são devidas a um distúrbio cerebral localizado (Guerreiro, 1983). Devido à falta de uniformidade na classificação das epilépsias a Liga Internacional instaurou um comitê contra Epilepsia (ILAE internacional para tentar padronizá-la. Eles buscaram os critérios nas informações que podem ser obtidas dos pacientes (história e exame clínico) e nas características do eletroencefalograma. Em geral, a classificação de 1981 tem sido amplamente aceita e é a mais usada. O modelo de desenvolvimento do Sistema Especialista para auxílio ao diagnóstico clínico das crises epilépticas foi baseado nos critérios de classificação do ILAE/81. O processo de diagnóstico das crises epilépticas geralmente depende da descrição cuidadosa das crises pelo paciente, por parente ou testemunha. A história deve incluir a descrição dos sintomas prodrômicos ou iniciais (aura ou crise parcial), as manifestações críticas e os sintomas ou sinais pós-ictais. A maior dificuldade está nas primeiras crises. Quando várias crises já ocorreram, de modo geral, as informações podem ser verificadas por vários informantes ou situações distintas. O fundamental no processo é obter informações precisas sobre a ocorrência temporal dos eventos. Na implementação dos algoritmos estão sendo avaliadas as Crises Parciais Simples (CPS), Crises Parciais Secundariamente Generalizadas (CPSG) e Crises Generalizadas Tônico Clônicas (CGTC). Treinamento da Rede utilizando o simulador Neusciences:ActiveX Para fazer a classificação das crises convulsivas foram utilizados a base de treinamento e teste do simulador da Neusciences:ActiveX, incluindo novos registros de entrada. A base de teste integra 129 padrões de entrada conforme mostra a Figura 3. A tabela da direita informa o tipo de crise: CPS, CPSG e CGTC e a tabela da esquerda descreve o conjunto de registros de entrada dispostos em quatro (4) colunas. Cada coluna poderá ser identificada com os sintomas presentes em uma crise convulsiva. A seguir serão descritos alguns exemplos da nomenclatura dos códigos dos registros de entrada implementados de acordo com as bibliografias consultadas: 1. Sem desmaio inicial, sem comprometimento da consciência, aura visual e luzes piscando são sintomas de uma Crise Parcial Simples de Lobo Occipital – Exemplo 1 com entrada 1, 2, 3 e 4 respectivamente (Guerreiro, 1983); 2. Sem perda inicial da consciência, com comprometimento da consciência, sintomas sensitivos com/ou sem marcha jacksoniana e sensações dolorosas são sintomas de uma Crise Parcial Secundariamente Generalizada de Lobo Parietal – Exemplo 2 com entrada 1, 2, 3 e 4 respectivamente (Guerreiro et al, 1993); 3. Com perda inicial da consciência, convulsões, movimentos tônico clônicos e cianose são sintomas de uma Crise Tônico Clônica Generalizada – Exemplo 4 com entrada 1, 2, 3 e 4 respectivamente (Guerreiro, 1983) 4. Sem perda inicial de consciência, movimentos adversivos da cabeça, manifestações motoras nas pernas, crises freqüentes/curta duração são sintomas de uma Crise Parcial Simples – Exemplo 8 com entradas 1, 2, 3 e 4 respectivamente [Guerreiro et al, 1993). 5. Sem perda inicial de consciência, desconforto epigástrico, percepções emocionais, fenômenos psíquicos são sintomas de uma Crise Parcial Simples – Exemplo 9 com entradas 1, 2, 3 e 4 respectivamente (Guerreiro, 1983). classificações para as crises convulsivas, conforme mostra a Figura 4. Cada posição na tabela representa o neurônio vencedor com seu respectivo padrão de classificação. A tabela da esquerda , composta por uma matriz 5 x 5 , totalizando 25 neurônios artificiais foi classificada com os 129 padrões referente a base de treinamento. A tabela da direita, composta por uma matriz 5 x 5, totalizando 25 neurônios artificiais foi classificada com 20 padrões de entrada que compõem a base de teste, implementada após a rede ter sido treinada. Figura 4 –Treinamento e Teste do Simulador. Treinamento da Rede com a técnica LVQ1 Para fazer a comparação com o resultado do simulador foi desenvolvido um algoritmo que utiliza a aprendizagem supervisionada com a técnica LVQ1 ( Fausett, 1994). O algoritmo foi implementado na linguagem de programação Delphi 4.02. Abaixo a descrição do algoritmo supervisionado: x - training vector (x1, x2, x3 and x4). T - correct category or class for the training vector. Wj - weight vector for jth output unit Cj - category or class represented by jth output unit. || x – wj|| - Euclidean distance between input vector and (weight vectorfor) jth output unit. Figura 3 – Padrões de entrada. Desta forma, todos os registros de entrada que fazem parte do conjunto de treinamento e teste da Rede Kohonen foram padronizados. A taxa de aprendizagem iniciou com 0.5 e foi decrescendo após o número de iterações. Após 5000 épocas de treinamento da Rede Kohonen foram encontrados os seguintes padrões de • Step 0 - initialize reference vectors with learning rate • Step 1 - While stopping condition is false, do Steps 2 – 6 • Step 2 – For each training input vector x, do Steps 3 – 4 • Step3 – Find J so that || x – wj|| is a minimum • Step 4 – Update wj as follows: If T = Cj , then wj (new) = wj (old) + α[x - wj (old)]; If T ≠ Cj , then wj (new) = wj (old) - α[x - wj (old)]. • Step5 – Reduce learning rate. • Setp6 – Test sttoping condition through of a fixed number of iterations. Até o momento a topologia da rede foi configurada com quatro neurônios de saída em uma matriz (2x2). Nesta topologia de rede, apresentam-se 4 entradas ligadas amplamente com os 4 neurônios de saída. Existe um conjunto de 16 pesos implementados aleatoriamente. A taxa de aprendizagem iniciou com 0.5 e foi decrescendo após o número de iterações (Figura 5). Figura 5 – Algoritmo Supervisionado. No algoritmo supervisionado existe um módulo que realiza a gravação dos pesos. Neste caso, um conjunto de pesos aceitáveis poderão serem recuperados na fase de teste do sistema, agilizando desta forma, a classificações dos padrões. Resultado das Técnicas Implementadas Em ambos os algoritmos foram classificados 129 e 20 padrões para o conjunto de treinamento e teste da rede. A topologia da rede é uma matriz 2 x 2, ou seja, quatro neurônios de saída. Após 5000 épocas de treinamento no simulador foram encontrados os seguintes padrões de classificações para as crises convulsivas (Figura 6). O número de neurônios vencedores foi de 100% para as Crises Parciais Simples, 55,26% para as Crises Parciais Secundariamente Generalizadas e 55% para as Crises Generalizadas Tônico Clônicas. No conjunto de treinamento com a técnica LVQ1 ocorreu uma melhora significativa no acerto de neurônios vencedores: 100% para as Crises Parciais Simples, 58,69% para as Crises Parciais Secundariamente Generalizadas e 56,09% para as Crises Generalizadas Tônico Clônicas. Na fase de teste do Simulador a rede apresentou uma taxa de acerto de 100% para as Crises Parciais Simples, 77,77% para as Crises Parciais Secundariamente Generalizadas e 50% para as Crises Generalizadas Tônico Clônicas. Com a utilização da técnica LVQ1, a fase de teste, implementada após a rede ter sido treinada obteve um índice de acerto de 100% nos três tipos de crises classificadas (Figura 7). Conjunto de Treinamento 100 Conjunto de Teste 100 80 60 SIMULADO R 40 LVQ 80 60 SIMULADO R 40 LVQ 20 20 0 0 CPS CPSG CGTC Figura 6 - Conjunto Treinamento. O índice de convergência da rede apresentado pelo simulador foi de 69,76% e 80% para o conjunto de treinamento e teste respectivamente. Com a implementação da técnica LVQ1 o índice aumentou para 71,31% e 100% para o conjunto de treinamento e teste respectivamente, conforme mostra a Figura 8. A CPS CPSG CGTC Figura 7 - Conjunto de Teste. partir destes dados, fez-se uma simulação com uma matriz 5 x 5, apresentando 25 neurônios de saída. Com esta topologia o índice de convergência apresentado pelo simulador foi de 77,5% e 90% no conjunto de treinamento e teste respectivamente, como pode ser observado na Figura 9. Desempenho dos Algoritmos Desempenho dos Algoritmos Matriz 5 x 5 100 Conjunto Treinament o 80 60 Conjunto de Teste 40 20 100 80 Conjunto de Treinamento 60 40 Conjunto de Teste 20 0 0 Simulador LVQ Figura 8 – Resultados do Simulador x LVQ1 Em uma matriz 2 x 2. Conclusões Foi escolhido o algoritmo auto-organizável de Kohonen, por que este algoritmo é similar ao mapeamento realizado pelo cérebro humano, os quais, assim como o cérebro, permitem a representação das informações N-dimensionais em um espaço M-dimensional. A escolha pelo algoritmo da Neusciences - ActiveX foi em razão de que ele possui a facilidade de simular várias topologias de rede automaticamente, o que contribui na capacidade de auto-organização aplicados no reconhecimento dos padrões, possuindo rápida execução após a fase de treinamento e teste terem sido finalizadas. De acordo com os resultados do simulador, a base de treinamento da rede mostrou um desempenho satisfatório em 69,76% dos neurônios utilizados na classificação de padrões em uma matriz 2 x 2. Apenas 30,24% dos neurônios da rede não obtiveram um índice alto de convergência. A taxa de acerto no conjunto de teste foi de 80%. Através da implementação do algoritmo de Kohonen com a técnica LVQ1 e utilizando uma configuração 2 x 2 , ou seja, quatro neurônios de saída, o conjunto referente a base de treinamento apresentou os seguintes resultados: 71,31% da rede obtiveram uma boa convergência e 28,69% não obtiveram um bom índice de convergência. No conjunto de teste da rede obteve uma índice de classificação de 100%. Pode-se observar que com a utilização da técnica LVQ1 os resultados em ambos os conjuntos obtiveram índices de classificação mais elevados em relação ao simulador. Observou-se também que quanto maior o número de neurônios de saída, melhor o índice de convergência da rede. Os dois algoritmos convergiram melhor na classificação das Crises Parciais Simples. Verificou-se que os valores de entrada para as Crises Parciais Secundariamente Generalizadas e as Tônico Clônicas são muito próximos, por este motivo não atingiram um bom índice de convergência. Simulador LVQ Figura 9 – Resultados do Simulador x LVQ1 Em uma matriz 5 x 5. Os próximos trabalhos estão concentrados na remodelagem dos valores de entrada para a implementação em uma matriz 5 x 5 que utiliza 25 neurônios de saída utilizando a técnica LVQ1. Referências Artificial Intelligence Approach, Springer – Verlag, p. 3-23. Back, B., Sere, K., Vanharanta, H. (1996), “Data mining account numbers using self- organizing Finnish Artificial Intelligence maps”, Conference, p. 35-47. Barreto, J.M. (1996), Conexionismo e a Resolução de Problemas, Tese apresentada no Concurso para Professor Titular, Departamento de Informática e Estatística, Universidade Federal de Santa Catarina, Brasil. Carbonel, J. G. et al (1984), “An overview of machine learning”, In: Machine Learning. Commission on Classification and Terminology of the International League Against Epilepsy (1981), “Proposal for revised clinical and electroencephalographic classification on epilepsies seizures”, Epilepsia, n. 22, p. 489501. Da Costa, J. C. (1990), Epilepsy: A Lancet Review, London: Biogalênica Products. Dayhoff, J. E. (1992), Neural Networks Architectures, New York: Van Nostrand Reinhold. De Azevedo, F. M. (1993), Contribuition to the Study of Neural Networks in Dynamical Expert Systems, Tese de Doutorado, Institut d’Informatique, FUNDP, Namur, Bélgica. De Azevedo, F. M. (1997), “Uma proposta de modelos formais de neurônios e redes neurais artificiais”, In: III Congresso Brasileiro de Redes Neurais (CBRN’97), ISBN 85-9003821-1, p. 503-514, Florianópolis, Brasil. De Azevedo, F.M., Brasil, L.M., De Oliveira, R.C. L. (2000), Redes Neurais com Aplicações em Controle e em Sistemas Especialistas, Florianóplis: Bookstore, p. 401. Fausett, L. (1994), Fundamentals ofr Neural Networks: Architectures, Algorithms and Applications, New Jersey: Prentice Hall, Upper Saddle River. Gallant, S.I. (1988), “Connectionist Expert Systems”, Comunications ofr the ACM, v. 31, p. 152-169. Guerreiro, C. A. (1983), Liga Brasileira de Epilepsia, “Diagnóstico Diferencial entre as Crises TônicoClônicas Generalizadas e Crises Parciais Secundariamente Generalizadas”, Rio de Janeiro. Guerreiro, C. A., Guerreiro, M. M. (1993), Epilepsia, São Paulo: Lemos. Guerriere, M. R. J., DETSKY, S. (1991), “Neural Networks: What Are They?” , Annals of Internal Medicine, v. 115, n. 11. Guyton, A. C. (1997), Tratado de Fisiologia Médica, Rio de Janeiro: Guanabara Koogan. Hebb, D. (1979), Psicologia, Rio de Janeiro: Livraria Ateneu. Hinton, G.E. (1989), Connectionist learning procedure, Artificial Intelligence. Kaski, S., Kohonen T. (1996), Structures of welfare and poverty in the word discovered by self-organizing maps. Technical report, Laboratory of Computer and Information Science – Helsinki University of Technology. Kohonen, T. (1987), “State of the art in neural computing”, IEEE First International Conference on Neural Networks, v. 1, p. 7790. Kohonen, T. (2001), Self-Organizing Maps, 3ª ed., Berlin Heidelberg: Springer-Verlag. Konkela, T., Kaski, S., Lagus K., Kohonen T. (1996), “Exploration of full-text database with self-organizing maps”, IEEE International Conference on Neural Networks-ICNN’96, p. 56-61. Moisés, H.N., Santos, T.H.F. (1993), Santos Biologia, São Paulo: Nova Cultural. Mpé, A., Deveughéle S., Clément M. (1995), “Using self-organizing feature maps for water monitoring”, Proceedings of the ICANN`95 Conference, Forescating & Marketing, p. 1-6. Pandya, A. S., Macy, R.B. (1996), Pattern recognition with Neural Networks in C ++, CRC Press, Florida: Boca Raton. Serrano C. C. (1996), “Self-organizing neural networks for financial diagnosis”, Decision Support Systems, v. 17, n. 13, p. 227-238. Tryba V., Goser K. (1991), “Self-organizing feature maps for proccess control in chemistry”, International Conference on Artificial Neural p. 847-852. Networks-ICANN’91,
Documentos relacionados
Do neurônio biológico ao neurônio das redes neurais
que padrões retirados de uma “base de treinamento” são apresentados à rede neural, um por vez. Existe também um “professor”, que recebe os mesmos padrões que a rede neural. O professor conhece as r...
Leia mais