Exploração de Bases de Dados Médicas Utilizando Redes Neurais

Transcrição

Exploração de Bases de Dados Médicas Utilizando Redes Neurais
Exploração de Bases de Dados Médicas Utilizando Redes Neurais
Artificiais Auto-Organizáveis
Lucimar F. de Carvalho1, Candice Abella S. Dani1, Hugo T. de Carvalho2, Silvia M.
Nassar3 , Fernando M. Azevedo3, Diego Dozza4, Ana Luisa C. Brasil 4
1
Curso de Ciência da Computação, Dpto. de Informática e Estatística, UPF/RS
2
Médico Especialista – HC/HSVP - Passo Fundo/RS
3
Curso de Pós-Graduação-Ciência da Computação e Engenharia Biomédica, UFSC/SC
4
Alunos Bolsistas – FAPERGS e PIBIC/UPF
[email protected], [email protected], [email protected], [email protected],
[email protected], [email protected], [email protected], [email protected]
Resumo - O objetivo deste trabalho é a implementação de técnicas utilizadas no processo de aprendizagem
em Redes Neurais Artificiais Auto-organizáveis (RNA’s). Inicialmente a rede será treinada a partir do
simulador da Neusciences - ActiveX que utiliza o algoritmo padrão de Kohonen com a aprendizagem
competitiva e não supervisionada. O resultado da simulação será comparado com o algoritmo que utiliza
aprendizagem supervisionada através da técnica Learning Vector of Quantization (LVQ1). O domínio
escolhido para a implementação dos algoritmos de aprendizagem foi a aplicação no Diagnóstico Clínico das
Crises Convulsivas, baseado na Classificação International League Against Epilepsy ILAI/81[4]. De acordo
com os resultados encontrados do simulador e do algoritmo que utiliza a técnica LVQ1, as bases de
treinamento da rede mostraram um índice de convergência de 69,76% e 71,31% respectivamente; as
bases de teste apresentaram 80% e 100% respectivamente, em uma matriz 2 x 2. A partir destes resultados
observou-se que, com a utilização da técnica LVQ1 e uma topologia de rede 5 x 5, ocorre uma melhora
significativa no reconhecimento de padrões. No final serão descritos resultados mais precisos em relação às
matrizes utilizadas em ambos os algoritmos.
Palavras-chave: Inteligência Artificial, Redes Neurais Artificiais, Crise Convulsiva.
Introdução
Redes que utilizam uma topologia de autoorganização foram pesquisadas por Teuvo
Kohonen e podem ser encontradas na sua obra,
Self-Organization and Associative Memory
(Kohonen, 2001). São redes que mapeiam
informações
sensoriais
distribuídas
em
representações de duas ou mais dimensões. Os
resultados da aprendizagem encontrados nestas
RNA`s são similares aos encontrados no cérebro
humano, dando origem a maneira como as
informações são armazenadas e assimiladas
artificialmente. As RNA`s incorporaram alguma
forma de aprendizagem e podem evoluir com a
experiência adquirida, através do conceito de
generalização.
As RNA`s foram pesquisados inicialmente
por Gallant (Gallant, 1988). através de uma rede
direta para diagnosticar duas doenças a partir de
seis sintomas apresentados pelos pacientes.
Quando se modela um procedimento de ensino e
aprendizagem
através
de
técnicas
computacionais, pode-se deduzir na forma de
transmitir conhecimentos organizadamente. O
grande desafio encontra-se em descobrir
processos de ensino e aprendizagem para que o
computador tenha um comportamento inteligente,
informando ao computador como ele deve se
comportar aos diferentes tipos de entradas
recebidas. Um das maneiras de informar ao
computador como ele deve se comportar em uma
abordagem conexionista é através dos algoritmos
de aprendizagem utilizados nas RNA’s. É através
destes algoritmos que as redes neurais
conseguem
aprender
um
conjunto
de
conhecimentos (padrões) após encontrar
um
conjunto de pesos ideal. Estes pesos vão permitir
à rede realizar o processamento desejado, para
em uma próxima etapa, generalizá-los em um
conjunto maior. Desta forma o conhecimento em
uma Rede Neural Artificial está contido na melhor
escolha
dos
seus
pesos
sinápticos
e,
principalmente na arquitetura de rede escolhida.
Algumas RNA`s dependendo do sinal de
entrada que recebem, podem ter seus valores de
saída associados a uma resposta através do
aprendizado
supervisionado
ou
nãosupervisionado. Para a compreensão melhor
destas redes, será descrito uma visão simplificada
envolvendo as Redes Neurais Biológicas e as
Redes Neurais Artificiais.
Redes Neurais Biológicas
O sistema nervoso é inigualável quanto à
vasta complexidade de ações de controle que
pode exercer sendo composto por mais de 100
bilhões (1011) de neurônios (Guyton, 1997).
Existem aproximadamente 100 trilhões (1014) de
conexões (sinapses) o que torna o cérebro uma
estrutura extremamente complexa.
O descobridor do neurônio foi o anatomista
italiano Camilo Golgi em 1975, através de sua
técnica de tingimento dos neurônios (Moisés et al,
1993). Através deste tingimento, de uma pequena
parte do neurônio, pode-se visualizá-lo, com todas
as suas ramificações. Os neurônios são divididos
em três partes: o corpo da célula (núcleo), os
dendritos e o axônio, conforme mostra a Figura 1.
Neste momento a informação é processada e
novos impulsos são gerados.
Figura 1 – Neurônio Biológico e suas conexões.
A função principal do Sistema Nervoso é
processar as informações que chegam de maneira
a controlar as reações do corpo. Ele combina
estas
informações
com
as
informações
armazenadas pela hereditariedade utilizadas no
controle de suas diversas atividades corporais. As
informações são processadas entre os neurônios,
através das sinapses, a qual conecta um axônio
de um neurônio a um dendrito do outro.
Existem dois tipos de sinapses utilizadas na
transmissão dos sinais: (1) a sinapse química e (2)
a sinapse elétrica (Guyton, 1997). A maioria das
sinapses do Sistema Nervoso Central são as
sinapses químicas. Ambas as sinapses são
utilizadas na transmissão dos sinais ao Sistema
Nervoso Central. Os impulsos elétricos são
recebidos pelos neurônios através dos dendritos,
os quais apresentam a função de receber as
informações de outros neurônios para conduzi-los
ao núcleo (soma) onde são processados. Já o
axônio tem a função de carregar os impulsos
elétricos que foram gerados no núcleo até a
sinapse.
Desta forma pode-se perceber que o
Sistema Nervoso Central recebe literalmente
milhões de bits de informações dos diferentes
órgãos sensoriais e, depois, integra todos para
determinar a resposta a ser dada pelo corpo
(Guyton, 1997). Todo este processo é similar com
a arquitetura das RNA`s.
Redes Neurais Artificiais
Uma RNA`s tem inspiração nos neurônios
biológicos e nos sistemas nervosos (De
Azevedo,1997). É através destes neurônios que a
rede
aprenderá
determinadas informações
fornecidas pelos canais de entrada, tentando
reproduzir o funcionamento do cérebro humano,
pelo menos em parte.
Redes Neurais são organizadas na forma de
grupamento de nós, chamados de camada.
Existem as camadas de entrada, chamadas de
nós de entrada e as camadas de processamento,
chamadas de neurônios. Os nós de entrada não
efetuam o processamento, são utilizados para
alimentar outros nós com sua informação. Os
neurônios recebem informação dos nós de entrada
ou de outros neurônios para efetuar o
processamento. Um neurônio artificial é uma
unidade de processamento de informações
fundamental para a operação de uma rede neural.
A Figura 2 mostra um modelo para o neurônio
dinâmico, neste modelo as entradas wij xj são
combinadas através da função φ, produzindo desta
forma um estado de ativação do neurônio para,
através da função λ produzir a saída do neurônio
[2, 8]. Neste exemplo, d indica a possibilidade de
inclusão de dinâmica no processamento do
neurônio. E as conexões sinápticas são
consideradas como externas ao modelo do
neurônio o que possibilita interpretar a matriz de
conexões como a matriz de pesos de um grafo
representativo da rede neural, processo similar ao
que ocorre no sistema nervoso biológico.
Pode-se definir um neurônio i pelo par de
equações abaixo:
n
hi = ∑ wij xj
j=1
e
yi = f (hi) (1)
onde x1, x2, ... xn correspondem aos sinais de
entrada; w1, w2, ...wn são os pesos sinápticos do
neurônio i; hi é a combinação linear dos sinais de
entrada do neurônio i; f (.) é a função de ativação
que define a saída do neurônio em termos do nível
de ativação em sua entrada; e yi é o sinal de saída
do neurônio i.
Entradas
x1
w1
.
...
xn
wn
Combinção
Das
Entradas
Função
De
Ativação φ
Função
De
Saída λ
y
Pesos Sinápticos
d
Figura 2 - Modelo de um Neurônio Artificial.
De acordo com Azevedo (De Azevedo,
2000), dois fatores motivam a pesquisa das RNA’s
atualmente: o primeiro é modelar o sistema
nervoso com suficiente precisão para obter um
comportamento emergente, para desta forma,
servir de apoio às hipóteses utilizadas na
modelagem e, segundo, construir computadores
com um alto grau de paralelismo. Pois quanto
maior for o grau de paralelismo, maior será a
precisão em relação aos pesos sinápticos,
possibilitando desta forma um resultado de saída
mais preciso.
Metodologia
Para a implementação da Rede Neural
Artificial foi escolhido o simulador da Neusciences
- ActiveX que implementa uma rede Autoorganizável de Kohonen utilizando a linguagem
VisualBasic e VisualC. Serão descritos neste
artigo,
resultados
parciais
referentes
ao
treinamento da rede que utiliza aprendizagem
competitiva e não supervisionada. O resultado
desta simulação será comparado com os
algoritmos de aprendizagem competitiva através
do
Mapa
Auto-organizável
de
Kohonen
(aprendizagem competitiva) e com a utilização da
técnica Learning Vector of Quantization (LVQ1), a
qual consiste em rotular os nodos apresentando a
saída
desejada,
tornando
o
algoritmo
supervisionado.
A capacidade de aprendizado presente em
uma rede neural é determinado pela topologia das
conexões
da rede e pela escolha de uma
algoritmo de aprendizagem (Guerriere et al, 1991).
Novos algoritmos de aprendizagem surgem
indicando novas técnicas de pesquisas para
garantir um melhor desempenho, principalmente
em tarefas de classificação de padrões. Para
desenvolver um algoritmo de aprendizagem, devese conhecer as técnicas existentes, a partir do
estudo de determinadas técnicas, pode-se propor
um algoritmo de busca pela melhor escolha e no
wij (new) = wij (old) + α[xi - wij(old)]
(1)
O algoritmo LVQ1 é uma técnica de
aprendizado
supervisionada
que
utiliza
informações sobre classes para atualizar o vetor
menor tempo possível. Pode-se encontrar na
literatura várias técnicas de aprendizagem:
segundo Carbonel (Carbonel et all 1984):
aprendizado por decorar, por analogia, indução (a
partir de exemplos, exploração e descoberta),
memorização e dedução. A partir destas técnicas,
surgiram os algoritmos de aprendizagem.
O aprendizado nas RNA`s abrangem o
estudo de duas técnicas, a do aprendizado
supervisionado e aprendizado não supervisionado.
A diferença entre estas duas técnicas é a
presença de dados de treinamento ou um
observador que qualifica o desempenho da rede.
Para compreender melhor as arquiteturas
de rede utilizadas, serão descritos os métodos de
aprendizagem propostos neste trabalho.
Teuvo
Kohonen
(Dayhoff,
1992),
pesquisador da Universidade de Helsinki iniciou
esta nova área de pesquisa utilizando mapas
topológicos auto-organizáveis. A rede de Kohonen
é uma estrutura de duas (2) camadas, onde a
primeira camada corresponde as entradas e a
segunda camada , chamada de competitiva, é
organizada em uma grade m-dimensional a ser
mapeada. Nesta aprendizagem a rede neural
utiliza categorias a partir das relações
estabelecidas
produzindo
uma
saída
correspondente a cada categoria de entrada, a
partir da auto-organização dos pesos dos
neurônios. Os algoritmos de aprendizagem
pesquisados por Kohonen são chamados de
Quantização do Vetor de Aprendizagem e são
divididos em três algoritmos: LVQ1, LVQ2 e LVQ3.
Neste trabalho de pesquisa está sendo utilizada a
técnica LVQ1.
O modelo padrão de Kohonen é uma rede
neural tipo feedforward de treinamento nãosupervisionado. Na aprendizagem competitiva as
unidades de entrada competem entre si. É
apresentado um conjunto de entradas, não
existindo um padrão de saída correspondente. Os
pesos são ajustados de acordo com a Equação 1.
de pesos, possibilitando desta forma, uma melhora
no desempenho da rede. Após cada treinamento
da rede o algoritmo LVQ1 compara a saída do
sistema com a saída desejada. Os pesos são
ajustados conforme a Equação 2:
wj (new) = wj (old) + α[x - wj(old)]
wj (new) = wj (old) - α[x - wj(old)]
se “x” foi classificado corretamente
se “x” foi classificado incorretamente
A rede mais popular de Kohonen foi
implementada no desenvolvimento de um
datilógrafo fonético, conhecida como uma
“máquina de escrever fonética”, este sistema
converge linguagem falada em texto escrito. A
rede é utilizada para reconhecer fonemas em fala
contínua para o idioma finlandês e o japonês. A
rede de Kohonen também tem sido utilizada na
exploração de bases de dados (Konkela et al,
1996), na análise de distribuição de renda mundial
(Kaski et al, 1996), em sistemas de apoio à
decisão de diagnóstico financeiro (Serrano et al,
1996), no controle de processos químicos (Tryba
et al, 1991), no controle da qualidade da água
(Mpé et al, 1995), na mineração de dados (técnica
de data mining) (Back et al, 1996).
O Treinamento da Rede Neural Artificial
O objetivo de treinar uma rede é ajustar os
seus pesos tal que a aplicação de um vetor (ou
padrão) de entrada produza um desejado vetor (ou
padrão) de saída. Deve-se portanto, no primeiro
passo, informar a rede um conjunto de dados que
farão parte do conjunto de treinamento. Após a
rede ter sido treinada, o segundo passo é
apresentrar a rede um novo conjunto de dados
que farão parte do conjunto de testes. Desta
forma, se
a rede tiver sido bem treinada,
apresentará a saída desejada corretamente.
Para uma compreensão da formação dos
conjuntos de treinamento e teste da rede, será
descrito uma definição simplificada do domínio a
ser representado – as crises convulsivas
juntamente com o seu conjunto de treinamento.
A Organização Mundial da Saúde (OMS)
definiu epilepsia como "um distúrbio do cérebro,
de etiologias variadas, caracterizado pelas crises
recorrentes conseqüentes à descarga excessiva
dos neurônios cerebrais. A característica principal
da epilepsia são as crises recorrentes. Porém
existem muitos tipos de crise epiléptica, algumas
das quais podem ser facilmente confundidas com
sintomas de outras doenças – como a
hipoglicemia, crise de StokesAdams, narcolepsia e
distúrbios psiquiátricos (Da Costa, 1990). Desta
forma, é importante a classificação e descrição
detalhada das crises epilépticas para se obter um
diagnóstico mais preciso. Além disto, a escolha do
tratamento antiepiléptico dependerá do tipo de
crise, a qual poderá se manifestare através de
mais de um tipo de crise no mesmo paciente. Já
uma síndrome epiléptica é definida como um
distúrbio epiléptico caracterizado por um conjunto
(2)
de
sinais
e
sintomas
que
ocorrem
simultaneamente.
As crises parciais podem permanecer
localizadas ou a atividade anormal da crise pode
difundir-se a outras partes do cérebro, dando
origem a uma crise generalizada. Esse processo
é chamado de Crise Parcial Secundariamente
Generalizada (CPSG). As crises generalizadas
iniciam-se simultaneamente nos dois lados do
cérebro. O cérebro inteiro envolve-se no distúrbio,
que pode ser transitório ou representar uma
desordem crônica. As crises parciais começam em
parte do hemisfério do cérebro e são devidas a um
distúrbio cerebral localizado (Guerreiro, 1983).
Devido à falta de uniformidade na
classificação das epilépsias a Liga Internacional
instaurou um comitê
contra Epilepsia (ILAE
internacional para tentar padronizá-la. Eles
buscaram os critérios nas informações que podem
ser obtidas dos pacientes (história e exame
clínico)
e
nas
características
do
eletroencefalograma. Em geral, a classificação de
1981 tem sido amplamente aceita e é a mais
usada. O modelo de desenvolvimento do Sistema
Especialista para auxílio ao diagnóstico clínico das
crises epilépticas foi baseado nos critérios de
classificação do ILAE/81. O processo de
diagnóstico das crises epilépticas geralmente
depende da descrição cuidadosa das crises pelo
paciente, por parente ou testemunha. A história
deve incluir a descrição dos sintomas prodrômicos
ou iniciais (aura ou crise parcial), as manifestações
críticas e os sintomas ou sinais pós-ictais. A maior
dificuldade está nas primeiras crises. Quando
várias crises já ocorreram, de modo geral, as
informações podem ser verificadas por vários
informantes ou situações distintas. O fundamental
no processo é obter informações precisas sobre a
ocorrência
temporal
dos
eventos.
Na
implementação dos algoritmos estão sendo
avaliadas as Crises Parciais Simples (CPS),
Crises Parciais Secundariamente Generalizadas
(CPSG) e Crises Generalizadas Tônico Clônicas
(CGTC).
Treinamento da Rede utilizando o simulador
Neusciences:ActiveX
Para fazer a classificação das crises
convulsivas foram utilizados a base de treinamento
e teste do simulador da Neusciences:ActiveX,
incluindo novos registros de entrada. A base de
teste integra 129 padrões de entrada conforme
mostra a Figura 3.
A tabela da direita informa o tipo de crise:
CPS, CPSG e CGTC e a tabela da esquerda
descreve o conjunto de registros de entrada
dispostos em quatro (4) colunas. Cada coluna
poderá ser identificada com os sintomas presentes
em uma crise convulsiva. A seguir serão descritos
alguns exemplos da nomenclatura dos códigos
dos registros de entrada implementados de acordo
com as bibliografias consultadas:
1. Sem desmaio inicial, sem comprometimento
da consciência, aura visual e luzes piscando são
sintomas de uma Crise Parcial Simples de Lobo
Occipital – Exemplo 1 com entrada 1, 2, 3 e 4
respectivamente (Guerreiro, 1983);
2. Sem perda inicial da consciência, com
comprometimento da consciência, sintomas
sensitivos com/ou sem marcha jacksoniana e
sensações dolorosas são sintomas de uma Crise
Parcial Secundariamente Generalizada de Lobo
Parietal – Exemplo 2 com entrada 1, 2, 3 e 4
respectivamente (Guerreiro et al, 1993);
3. Com perda inicial da consciência, convulsões,
movimentos tônico clônicos e cianose são
sintomas de uma Crise Tônico Clônica
Generalizada – Exemplo 4 com entrada 1, 2, 3 e 4
respectivamente (Guerreiro, 1983)
4. Sem perda inicial de consciência, movimentos
adversivos da cabeça, manifestações motoras nas
pernas, crises freqüentes/curta duração são
sintomas de uma Crise Parcial Simples – Exemplo
8 com entradas 1, 2, 3 e 4 respectivamente
[Guerreiro et al, 1993).
5. Sem perda inicial de consciência, desconforto
epigástrico, percepções emocionais, fenômenos
psíquicos são sintomas de uma Crise Parcial
Simples – Exemplo 9 com entradas 1, 2, 3 e 4
respectivamente (Guerreiro, 1983).
classificações para as crises convulsivas,
conforme mostra a Figura 4. Cada posição na
tabela representa o neurônio vencedor com seu
respectivo padrão de classificação. A tabela da
esquerda , composta por uma matriz 5 x 5 ,
totalizando 25 neurônios artificiais foi classificada
com os 129 padrões referente a base de
treinamento. A tabela da direita, composta por
uma matriz 5 x 5, totalizando 25 neurônios
artificiais foi classificada com 20 padrões de
entrada que compõem a base de teste,
implementada após a rede ter sido treinada.
Figura 4 –Treinamento e Teste do Simulador.
Treinamento da Rede com a técnica LVQ1
Para fazer a comparação com o resultado
do simulador foi desenvolvido um algoritmo que
utiliza a aprendizagem supervisionada com a
técnica LVQ1 ( Fausett, 1994). O algoritmo foi
implementado na linguagem de programação
Delphi 4.02. Abaixo a descrição do algoritmo
supervisionado:
x - training vector (x1, x2, x3 and x4).
T - correct category or class for the training vector.
Wj - weight vector for jth output unit
Cj - category or class represented by jth output
unit.
|| x – wj|| - Euclidean distance between input
vector and (weight vectorfor) jth output unit.
Figura 3 – Padrões de entrada.
Desta forma, todos os registros de entrada
que fazem parte do conjunto de treinamento e
teste da Rede Kohonen foram padronizados. A
taxa de aprendizagem iniciou com 0.5 e foi
decrescendo após o número de iterações. Após
5000 épocas de treinamento da Rede Kohonen
foram encontrados os seguintes padrões de
• Step 0 - initialize reference vectors with
learning rate
• Step 1 - While stopping condition is false, do
Steps 2 – 6
• Step 2 – For each training input vector x, do
Steps 3 – 4
• Step3 – Find J so that || x – wj|| is a minimum
• Step 4 – Update wj as follows:
If T = Cj , then
wj (new) = wj (old) + α[x - wj (old)];
If T ≠ Cj , then
wj (new) = wj (old) - α[x - wj (old)].
• Step5 – Reduce learning rate.
• Setp6 – Test sttoping condition through of a
fixed number of iterations.
Até o momento a topologia da rede foi
configurada com quatro neurônios de saída em
uma matriz (2x2). Nesta topologia de rede,
apresentam-se 4 entradas ligadas amplamente
com os 4 neurônios de saída. Existe um conjunto
de 16 pesos implementados aleatoriamente. A
taxa de aprendizagem iniciou com 0.5 e foi
decrescendo após o número de iterações (Figura
5).
Figura 5 – Algoritmo Supervisionado.
No algoritmo supervisionado existe um
módulo que realiza a gravação dos pesos. Neste
caso, um conjunto de pesos aceitáveis poderão
serem recuperados na fase de teste do sistema,
agilizando desta forma, a classificações dos
padrões.
Resultado das Técnicas Implementadas
Em ambos os algoritmos foram classificados
129 e 20 padrões para o conjunto de treinamento
e teste da rede. A topologia da rede é uma matriz
2 x 2, ou seja, quatro neurônios de saída. Após
5000 épocas de treinamento no simulador foram
encontrados
os
seguintes
padrões
de
classificações para as crises convulsivas (Figura
6). O número de neurônios vencedores foi de
100% para as Crises Parciais Simples, 55,26%
para as Crises Parciais Secundariamente
Generalizadas
e
55%
para
as
Crises
Generalizadas Tônico Clônicas. No conjunto de
treinamento com a técnica LVQ1 ocorreu uma
melhora significativa no acerto de neurônios
vencedores: 100% para as Crises Parciais
Simples, 58,69% para as Crises Parciais
Secundariamente Generalizadas e 56,09% para
as Crises Generalizadas Tônico Clônicas.
Na fase de teste do Simulador a rede
apresentou uma taxa de acerto de 100% para as
Crises Parciais Simples, 77,77% para as Crises
Parciais Secundariamente Generalizadas e 50%
para as Crises Generalizadas Tônico Clônicas.
Com a utilização da técnica LVQ1, a fase de
teste, implementada após a rede ter sido treinada
obteve um índice de acerto de 100% nos três tipos
de crises classificadas (Figura 7).
Conjunto de Treinamento
100
Conjunto de Teste
100
80
60
SIMULADO
R
40
LVQ
80
60
SIMULADO
R
40
LVQ
20
20
0
0
CPS
CPSG CGTC
Figura 6 - Conjunto Treinamento.
O índice de convergência da rede
apresentado pelo simulador foi de 69,76% e 80%
para o conjunto de treinamento e teste
respectivamente. Com a implementação da
técnica LVQ1 o índice aumentou para 71,31% e
100% para o conjunto de treinamento e teste
respectivamente, conforme mostra a Figura 8. A
CPS
CPSG
CGTC
Figura 7 - Conjunto de Teste.
partir destes dados, fez-se uma simulação com
uma matriz 5 x 5, apresentando 25 neurônios de
saída. Com esta topologia o índice de
convergência apresentado pelo simulador foi de
77,5% e 90% no conjunto de treinamento e teste
respectivamente, como pode ser observado na
Figura 9.
Desempenho dos Algoritmos
Desempenho dos Algoritmos
Matriz 5 x 5
100
Conjunto
Treinament
o
80
60
Conjunto
de Teste
40
20
100
80
Conjunto de
Treinamento
60
40
Conjunto de
Teste
20
0
0
Simulador
LVQ
Figura 8 – Resultados do Simulador x LVQ1
Em uma matriz 2 x 2.
Conclusões
Foi escolhido o algoritmo auto-organizável
de Kohonen, por que este algoritmo é similar ao
mapeamento realizado pelo cérebro humano, os
quais, assim como o cérebro, permitem a
representação das informações N-dimensionais
em um espaço M-dimensional. A escolha pelo
algoritmo da Neusciences - ActiveX foi em razão
de que ele possui a facilidade de simular várias
topologias de rede automaticamente, o que
contribui na capacidade de auto-organização
aplicados no
reconhecimento dos padrões,
possuindo rápida execução após a fase de
treinamento e teste terem sido finalizadas.
De acordo com os resultados do simulador,
a base de treinamento da rede mostrou um
desempenho satisfatório em 69,76% dos
neurônios utilizados na classificação de padrões
em uma matriz 2 x 2. Apenas 30,24% dos
neurônios da rede não obtiveram um índice alto
de convergência. A taxa de acerto no conjunto de
teste foi de 80%. Através da implementação do
algoritmo de Kohonen com a técnica LVQ1 e
utilizando uma configuração 2 x 2 , ou seja, quatro
neurônios de saída, o conjunto referente a base de
treinamento apresentou os seguintes resultados:
71,31% da rede obtiveram uma boa convergência
e 28,69% não obtiveram um bom índice de
convergência. No conjunto de teste da rede obteve
uma índice de classificação de 100%.
Pode-se observar que com a utilização da
técnica LVQ1 os resultados em ambos os
conjuntos obtiveram índices de classificação mais
elevados em relação ao simulador. Observou-se
também que quanto maior o número de neurônios
de saída, melhor o índice de convergência da
rede.
Os dois algoritmos convergiram melhor na
classificação das Crises Parciais Simples.
Verificou-se que os valores de entrada para as
Crises Parciais Secundariamente Generalizadas e
as Tônico Clônicas são muito próximos, por este
motivo não atingiram um bom índice de
convergência.
Simulador
LVQ
Figura 9 – Resultados do Simulador x LVQ1
Em uma matriz 5 x 5.
Os próximos trabalhos estão concentrados
na remodelagem dos valores de entrada para a
implementação em uma matriz 5 x 5 que utiliza 25
neurônios de saída utilizando a técnica LVQ1.
Referências
Artificial Intelligence Approach, Springer – Verlag,
p. 3-23.
Back, B., Sere, K., Vanharanta, H. (1996), “Data
mining account numbers using self- organizing
Finnish
Artificial
Intelligence
maps”,
Conference, p. 35-47.
Barreto, J.M. (1996), Conexionismo e a Resolução
de Problemas, Tese apresentada no Concurso
para Professor Titular, Departamento de
Informática e Estatística, Universidade Federal
de Santa Catarina, Brasil.
Carbonel, J. G. et al (1984), “An overview of
machine learning”, In: Machine Learning.
Commission on Classification and Terminology of
the International League Against Epilepsy
(1981), “Proposal for revised clinical and
electroencephalographic
classification
on
epilepsies seizures”, Epilepsia, n. 22, p. 489501.
Da Costa, J. C. (1990), Epilepsy: A Lancet Review,
London: Biogalênica Products.
Dayhoff, J. E. (1992), Neural Networks
Architectures, New York: Van Nostrand
Reinhold.
De Azevedo, F. M. (1993), Contribuition to the
Study of Neural Networks in Dynamical Expert
Systems, Tese de Doutorado, Institut
d’Informatique, FUNDP, Namur, Bélgica.
De Azevedo, F. M. (1997), “Uma proposta de
modelos formais de neurônios e redes neurais
artificiais”, In: III Congresso Brasileiro de
Redes Neurais (CBRN’97), ISBN 85-9003821-1, p. 503-514, Florianópolis, Brasil.
De Azevedo, F.M., Brasil, L.M., De Oliveira, R.C.
L. (2000), Redes Neurais com Aplicações em
Controle e em Sistemas Especialistas,
Florianóplis: Bookstore, p. 401.
Fausett, L. (1994), Fundamentals ofr Neural
Networks: Architectures, Algorithms and
Applications, New Jersey: Prentice Hall, Upper
Saddle River.
Gallant, S.I. (1988), “Connectionist Expert
Systems”, Comunications ofr the ACM, v. 31,
p. 152-169.
Guerreiro, C. A. (1983), Liga Brasileira de
Epilepsia, “Diagnóstico Diferencial entre as
Crises TônicoClônicas Generalizadas e
Crises
Parciais
Secundariamente
Generalizadas”, Rio de Janeiro.
Guerreiro, C. A., Guerreiro, M. M. (1993),
Epilepsia, São Paulo: Lemos.
Guerriere, M. R. J., DETSKY, S. (1991), “Neural
Networks: What Are They?” , Annals of Internal
Medicine, v. 115, n. 11.
Guyton, A. C. (1997), Tratado de Fisiologia
Médica, Rio de Janeiro: Guanabara Koogan.
Hebb, D. (1979), Psicologia, Rio de Janeiro:
Livraria Ateneu.
Hinton, G.E. (1989), Connectionist learning
procedure, Artificial Intelligence.
Kaski, S., Kohonen T. (1996), Structures of
welfare and poverty in the word discovered by
self-organizing maps. Technical report,
Laboratory of Computer and Information
Science – Helsinki University of Technology.
Kohonen, T. (1987), “State of the art in neural
computing”,
IEEE
First
International
Conference on Neural Networks, v. 1, p. 7790.
Kohonen, T. (2001), Self-Organizing Maps, 3ª ed.,
Berlin Heidelberg: Springer-Verlag.
Konkela, T., Kaski, S., Lagus K., Kohonen T.
(1996), “Exploration of full-text database with
self-organizing maps”, IEEE International
Conference on Neural Networks-ICNN’96, p.
56-61.
Moisés, H.N., Santos, T.H.F. (1993), Santos
Biologia, São Paulo: Nova Cultural.
Mpé, A., Deveughéle S., Clément M. (1995),
“Using self-organizing feature maps for water
monitoring”, Proceedings of the ICANN`95
Conference, Forescating & Marketing, p. 1-6.
Pandya,
A. S., Macy, R.B. (1996), Pattern
recognition with Neural Networks in C ++, CRC
Press, Florida: Boca Raton.
Serrano C. C. (1996), “Self-organizing neural
networks for financial diagnosis”, Decision
Support Systems, v. 17, n. 13, p. 227-238.
Tryba V., Goser K. (1991), “Self-organizing feature
maps for proccess control in chemistry”,
International Conference on Artificial Neural
p.
847-852.
Networks-ICANN’91,

Documentos relacionados

Do neurônio biológico ao neurônio das redes neurais

Do neurônio biológico ao neurônio das redes neurais que padrões retirados de uma “base de treinamento” são apresentados à rede neural, um por vez. Existe também um “professor”, que recebe os mesmos padrões que a rede neural. O professor conhece as r...

Leia mais