iscte – escola de gestão - INESC-ID

Transcrição

Controlo com Múltiplos Modelos
do Bloqueio Neuromuscular
PEDRO SIMÕES OLIVEIRA
Dissertação para obtenção do Grau de Mestre em
Engenharia Electrotécnica e de Computadores
Júri
Presidente: Prof. Carlos Jorge Ferreira Silvestre
Orientador: Prof. João Manuel Lage de Miranda Lemos
Vogais:
Prof. João Miguel Raposo Sanches
Setembro de 2008
Agradecimentos
Quero começar por agradecer ao meu orientador, o Professor João Miranda Lemos pela
conança em mim depositada, pela sua disponibilidade, o seu apoio e as suas sugestões.
Agradeço ainda o seu esforço para que me fosse atribuída uma bolsa.
Um devido agradecimento, também para a FCT pela atribuição da referida bolsa de
investigação.
Queria agradecer à Professora Teresa Mendonça (Faculdade de Ciências da Universidade do Porto) pelos dados cedidos sobre os modelos do bloqueio neuromuscular, e ainda
pela simpatia e esclarecimentos prestados.
Agradeço aos Professores João Hespanha (University of California, Santa Barbara) e
Jorge Marques pela disponibilidade demonstrada em ajudar-me, pelas suas sugestões e
contribuições no Controlo Comutado e Métodos de Agregação, respectivamente.
Queria ainda expressar a minha gratidão para com todos os professores que contribuiram para a minha formação pessoal e como engenheiro.
Agradeço também a todas as pessoas que de uma ou outra forma contribuiriam para
a realização desta tese.
Aos meus amigos, um grande abraço! Vocês são os melhores. E à minha namorada
Ana obrigado pelo teu apoio e paciência.
Finalmente, aos meus pais um agradecimento especial por sempre acreditarem em mim
e me apoiarem nas minhas escolhas e decisões, e aos meus avós uma dedicatória especial.
O trabalho descrito nesta tese foi realizado no âmbito do projecto IDeA - Integrated
Design for Automation of Anaesthesia, PDTC/EEA-ACR/69288/2006.
i
ii
Resumo
A ligação entre Engenharia e Medicina, devido aos recentes desenvolvimentos cientícos
e tecnológicos na área da saúde e dos cuidados médicos, tem vindo a permitir integrar
aspectos fundamentais e aplicações concretas da engenharia nos meios de investigação,
diagnóstico e terapia das ciências médicas. Em particular, no que diz respeito à Anestesia
Geral existem de momento diversas soluções para o problema do controlo do nível do
bloqueio neuromuscular por infusão contínua de um relaxante muscular. Estas vão desde
o simples PID até métodos com controladores robustos ou adaptativos.
Nesta tese, pretende-se melhorar o desempenho de sistemas existentes em que os controladores são PID, passando a usar controladores baseados em técnicas polinomiais com
colocação de pólos.
Dado o elevado grau de incerteza na dinâmica dos pacientes, devido a uma grande
variabilidade intra e inter-pacientes é sugerida a utilização de um controlador adaptativo
baseado em múltiplos modelos comutados com supervisor. Nesta trabalho são comparados
dois tipos de supervisores, ambos tendo como objectivo a minimização do erro de predição.
A construção de um banco de controladores foi realizado, em que o número de controladores é substancialmente inferior ao número de modelos (do banco de modelos do
supervisor). Para tal é necessário criar agregados de modelos, de forma a que os centróides
de cada agregado representem da melhor forma o comportamento dinâmico dos modelos
do respectivo conjunto e em que apenas para os centróides se projectam controladores.
Desenvolveu-se uma interface gráca em
MATLAB,
para uma demonstração mais
ecaz da comparação entre os diferentes controladores e entre as diferentes variantes em
relação ao esquema de controlo (supervisor, nível de ruído, perturbações, . . . ).
Palavras-chave:
Biomedecina, anestesia, bloqueio neuromuscular, controlo, colo-
cação de pólos, controlo comutado supervisionado, múltiplos modelos, métodos de agregação.
iii
iv
Abstract
Due to recent scientic and technological development in the health area and medical care,
the connection between Engineering and Medicine, has been allowing the integration of
fundamental issues and feasible applications of engineering in research, diagnostic and
therapy means of medical sciences.
In particular, with respect to General Aneasthesia
there are at the moment several solutions to the problem of controlling the neuromuscular
blockade level by continuous infusion of a muscle relaxant. These range from simple PID
to methods with robust or adaptive controllers.
The objective of this thesis is to improve the performance of existing systems where the
controllers are PID, using pole placement with polynomial techniques to the controllers
project.
The high degree of uncertainty in the patients dynamic due to both intra and interpatient variability suggests that multiple models-based switching supervisory controller
technique provide a suitble solution. A comparative study between two supervisores is
presented, both having the goal of minimizing a prediction error.
A construction of a bank of controllers was performed, in which the number of controllers is much smaller than the number of models (of the supervisory bank of models).
Hence, it is necessary a clustering of models, in which the centroids of each cluster are
choosen in order to better represent the dynamical behavior of the models of the respective
cluster and for only the centroids it is designed a controller.
It has been developed a graphical interface in
MATLAB, for a better demonstration
of the results and to a more eective comparation between the several control strategies
and parameters in the simulations (supervisor, noise level, disturbances, . . . ).
Keywords:
Biomedicine, anesthesia, neuromuscular blockade, control, pole place-
ment, supervisory switched control, multiple models, clustering methods.
v
vi
Conteúdo
Resumo
iii
Abstract
v
Lista de Tabelas
xi
Lista de Figuras
xiii
Acrónimos
xvii
Lista de Símbolos
xix
1 Introdução
1
1.1
Motivação e Enquadramento . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.2
Estado da Arte
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.3
Estrutura da Tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
1.4
Contribuições da Tese
5
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Bloqueio Neuromuscular
7
2.1
Modelo do Bloqueio Neuromuscular . . . . . . . . . . . . . . . . . . . . . .
7
2.2
Linearização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
2.3
Caracterização da Resposta ao
. . . . . . . . . . . . . . . . .
12
2.4
Estrutura do Controlador e da Referência . . . . . . . . . . . . . . . . . . .
14
Bolus
Inicial
3 Projecto dos Controladores Locais
3.1
17
Projecto do Controlador Polinomial . . . . . . . . . . . . . . . . . . . . . .
17
3.1.1
18
Controlador Polinomial . . . . . . . . . . . . . . . . . . . . . . . . .
vii
Conteúdo
3.1.2
Cancelamento de Pólos e Zeros
. . . . . . . . . . . . . . . . . . . .
3.1.3
Separação da Resposta a Perturbações e Sinais de Comando
20
. . . .
21
Melhoria do Desempenho . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
3.2.1
Rejeição de Erro e Perturbações em Regime Estacionário . . . . . .
22
3.2.2
Robustez e Rejeição de Ruído
. . . . . . . . . . . . . . . . . . . . .
23
3.3
Controlador do NMB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
3.4
Estudo Comparativo
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
3.4.1
Exemplo 1: sem termos de melhoria de desempenho . . . . . . . . .
26
3.4.2
Exemplo 2: acção integral
28
3.4.3
Exemplo 3: rejeição do ruído de alta frequência
3.4.4
Exemplo 4: robustez
3.4.5
Exemplo 5:
3.4.6
Exemplo 6: efeito do observador
3.2
Am
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . .
28
. . . . . . . . . . . . . . . . . . . . . . . . . .
30
em função do modelo e do ruído . . . . . . . . . . .
32
Ac0
. . . . . . . . . . . . . . . . . .
4 Controlo Comutado com Múltiplos Modelos
32
35
4.1
Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
4.2
Estrutura do Controlador Comutado
36
4.3
Esquema com Integrador Comum e Anti-colagem
. . . . . . . . . . . . . .
38
4.4
Lógica de Decisão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
4.4.1
Tempo de Permanência . . . . . . . . . . . . . . . . . . . . . . . . .
41
4.4.2
Histerese com Escala Independente
. . . . . . . . . . . . . . . . . .
41
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42
4.5
4.6
Multi-Estimadores
. . . . . . . . . . . . . . . . . . . . .
4.5.1
Estimador do Erro de Predição com Índices de Desempenho
. . . .
42
4.5.2
Estimador por minimização do erro quadrático médio . . . . . . . .
45
Estudo Comparativo
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
48
4.6.1
Exemplo 1: lógica de decisão . . . . . . . . . . . . . . . . . . . . . .
49
4.6.2
Exemplo 2: ltro de predição
. . . . . . . . . . . . . . . . . . . . .
51
4.6.3
Exemplo 3: multi-estimador
. . . . . . . . . . . . . . . . . . . . . .
53
5 Métodos de Agregação de Modelos
55
5.1
Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
5.2
Métrica de Vinnicombe . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
57
viii
Conteúdo
5.3
5.4
Métodos de Agregação
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
5.3.1
Algoritmo Intuitivo . . . . . . . . . . . . . . . . . . . . . . . . . . .
59
5.3.2
Algoritmo K-médias adaptado ao Controlo Comutado . . . . . . . .
61
5.3.3
Algoritmo Aglomerativo
. . . . . . . . . . . . . . . . . . . . . . . .
63
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
65
Estudo Comparativo
6 Resultados das Simulações para o NMB
6.1
. . . . . . . . . . . . . . . . . . . . . . . . . .
69
6.1.1
Em Regime Transitório . . . . . . . . . . . . . . . . . . . . . . . . .
70
6.1.2
Em Regime Estacionário . . . . . . . . . . . . . . . . . . . . . . . .
71
Vantagens do Controlo Comutado . . . . . . . . . . . . . . . . . . . . . . .
71
6.2.1
Variabilidade Inter-pacientes . . . . . . . . . . . . . . . . . . . . . .
71
6.2.2
Variabilidade Intra-pacientes . . . . . . . . . . . . . . . . . . . . . .
71
6.3
Discussão dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
6.4
O Problema do Ruído no Controlo Comutado
. . . . . . . . . . . . . . . .
77
6.4.1
Filtragem do Ruído . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
6.4.2
Exemplos
77
6.2
Parâmetros de Desempenho
69
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7 Conclusões e Trabalho Futuro
81
7.1
Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
81
7.2
Trabalho Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
83
A Parâmetros da Resposta ao Bolus Inicial
85
B Método de Resposta ao Escalão de Ziegler-Nichols
89
C Tabelas dos Agregados
91
Bibliograa
111
ix
x
Lista de Tabelas
2.1
Parâmetros de 4 respostas ao
5.1
Dados sobre
δν
Dados sobre
δν
inicial.
. . . . . . . . . . . . . . . . . .
13
dos agregados em função do método de agregação, casos
com 7 centróides.
5.2
bolus
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
66
dos agregados em função do método de agregação, casos
com 12 centróides.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1
Parâmetros de desempenho em função do sistema de controlo.
A.1
Parâmetros da resposta ao
67
. . . . . . .
75
inicial. . . . . . . . . . . . . . . . . . . . .
85
C.1
Algoritmo Intuitivo com 7 centróides. . . . . . . . . . . . . . . . . . . . . .
92
C.2
Algoritmo K-médias adaptado ao Controlo Comutado com 7 centróides. . .
95
C.3
Algoritmo Aglomerativo com 7 centróides.
98
C.4
Algoritmo Intuitivo com 12 centróides.
C.5
Algoritmo K-médias adaptado ao Controlo Comutado com 12 centróides.
C.6
Algoritmo Aglomerativo com 12 centróides. . . . . . . . . . . . . . . . . . . 107
bolus
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . 101
. 104
xi
xii
Lista de Figuras
2.1
Diagrama de blocos do modelo do bloqueio neuromuscular [1].
2.2
Resposta induzida por um
bolus
de
500 µg kg −1
de
. . . . . . .
8
atracúrio em t = 0 min
em 100 modelos simulados, [2]. . . . . . . . . . . . . . . . . . . . . . . . . .
9
2.3
Esquema para a comparação entre o sistema não linear e linearizado.
2.4
Comparação das respostas para incrementos de
2.5
Integral do erro da resposta dos sistemas em função de
2.6
Caracterização da resposta ao
2.7
Exemplo de 4 respostas ao
2.8
Esquema de controlo para o bloqueio neuromuscular, [1].
. . . . . . . . . .
14
2.9
Perle da referência desejada para o nível do bloqueio neuromuscular, [3]. .
15
3.1
Esquema de um controlador polinomial.
18
3.2
Esquema do sistema com sinais de comando e perturbações (perturbação
à entrada
3.3
v
. . .
11
. . . . . .
11
. . . . . . . . .
12
inicial, [1]. . . . . . . . . . . . . . . . .
13
inicial. . . . . . . . . . . . . . . . . . . . .
14
bolus
bolus
M56
n).
. . . . . . . . . . . . . . . .
3.4
u(t) [µg kg −1 ].
em
t = 150 min.
M56
−1
M56
r(t) [%],
. . . . . . . . . . . . . . . . . . . . .
com ruído de variância unitária.
sposta do nível de bloqueio neuromuscular
3.6
r(t) [%],
M56
de bloqueio neuromuscular
27
(a) - re-
(b) - acção de controlo
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Simulação para o modelo
27
com uma perturbação na acção de controlo
u(t) [µg kg ].
u(t) [µg kg −1 ].
(b) - acção de
(a) - resposta do nível de bloqueio neuromuscular
3.5
r(t) [%],
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
sem termos de melhoria de desempenho.
controlo
δu.
. . . . . . . . . . . . . . . . . . .
e ruído de observação na saída
{−8, −3, 3, 8}%.
28
com acção integral. (a) - resposta do nível
r(t) [%],
u(t) [µg kg −1 ].
29
xiii
Lista de Figuras
3.7
bloqueio neuromuscular
3.8
M56
r(t) [%],
M56
M69
de bloqueio neuromuscular
3.10 Simulação para o modelo
Am ∈ {0.75, 0.85}.
Am ∈ {0.8, 0.94}.
r(t) [%],
u(t) [µg kg ].
com
M69
com
Am ∈ {0.7, 0.8}
u(t) [µg kg ].
u(t) [µg kg −1 ].
M10
com
M39
com
r(t) [%],
Am ∈ {0.8, 0.94}
Sd .
M10
com
u(t) [µg kg −1 ].
(a) -
e
e
M10
com
(b) - acção de
Ac0 ∈ {0.97}.
Am ∈ {0.8, 0.92 ± 0.2i}
u(t) [µg kg ].
r(t) [%],
e
32
(a) -
r(t) [%],
33
Ac0 ∈ {0.2}.
(b) - acção de
Am ∈ {0.8, 0.92 ± 0.2i}
−1
31
Ac0 ∈ {0.85}.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
r(t) [%], (b) - acção de controlo
controlo
(a) -
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
controlo
e termo
Am ∈ {0.8, 0.92 ± 0.2i}
resposta do nível de bloqueio neuromuscular
u(t) [µg kg ].
Sd .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
−1
e termo
30
controlo
u(t) [µg kg −1 ].
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
Am ∈ {0.7, 0.8}
29
(a) - resposta do nível
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
−1
. .
(a) - resposta do
−1
u(t) [µg kg −1 ].
r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ].
com
M56
(a) - resposta do nível de
com
nível de bloqueio neuromuscular
3.9
Sd .
com o termo
e
33
Ac0 ∈ {0.5}.
(b) - acção de
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
4.1
Esquema do Controlador Comutado, [4].
4.2
Supervisor Baseado na Estimativa.
4.3
Esquema de
anti-colagem
para o controlador polinomial, [5].
4.4
Esquema de
anti-colagem
para o controlo comutado com integrador comum. 40
4.5
Lógica de Decisão do tipo Tempo de Permanência, [4].
4.6
Lógica de Decisão do tipo
4.7
- sinais de comutação
xiv
σ
. . . . . . . . . . . . . . . . . . .
37
. . . . . . . . . . . . . . . . . . . . . .
37
. . . . . . . .
. . . . . . . . . . .
Histerese com Escala Independente, [4].
M56
com
τD = 5 .
. . . . .
39
41
42
r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c)
e índice de classe
φ.
. . . . . . . . . . . . . . . . .
49
Lista de Figuras
4.8
neuromuscular
de comutação
4.9
r(t) [%],
σ
M56 com h = 1.
e índice de classe
σ
(a) - resposta do nível de bloqueio
M69
φ. .
com
u(t) [µg kg −1 ],
. . . . . . . . . . . . . . . . . . . . .
λp = 0.975.
e índice de classe
M69
com
φ.
. . . . . . . . . . . . . . . . .
λ0 = 0.85
e
limiar
u(t) [µg kg −1 ], (c) - sinais de comutação σ
λp (t)
em função de
σ
M85
ec (t).
de
r(t) [%],
- variação de
50
controlo
(c) - sinais
ec (t)
em
51
0.1%.
(b) - acção de
e índice de classe
φ, (d)
. . . . . . . . . . . . . . . . . . . .
52
e estimador LMS. (a) - resposta do nível de
φ.
. . . . . . . . . . . . . . . . .
53
5.1
Espaço de modelos e a sua agregação. . . . . . . . . . . . . . . . . . . . . .
56
5.2
Taxonomia das metodologias de agregação [6]. . . . . . . . . . . . . . . . .
58
5.3
Exemplo de um
5.4
Agregação em 7 classes com base em
5.5
Agregação em 12 classes com base em
5.6
Critérios de dessimilação entre agregados: distância máxima e distância
mínima, [7].
6.1
dendograma
usando um método aglomerativo [7].
T 10 − T 80
T 10 − T 80
M69
com o controlador
−1
u(t) [µg kg ].
. . . . . . . . . . . .
61
. . . . . . . . . . .
62
P.
C4 Am ∈ {0.8, 0.92}
M69
com o controlador comutado.
u(t) [µg kg ],
(c) - sinais de comutação
σ
r(t) [%],
63
e
r(t) [%],
. . . . . . . . . . . . . . . . . . . . .
sposta do nível de bloqueio neuromuscular
6.3
e
59
−1
P.
e
. . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ac0 ∈ {0.89}.
6.2
e índice de classe
72
(a) - re-
e índice de classe
Simulação com o controlador comutado, em que entre
φ.
. . . . . . .
t = 180 min
73
até
t = 300 min os parâmetros de M10 variam linearmente de forma a igualarem
os parâmetros de
r(t) [%],
M69 .
e índice de classe
φ.
u(t) [µg kg −1 ],
(c) - sinais de comutação
σ
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
74
xv
Lista de Figuras
6.4
Simulação efectuada para o modelo
M9
controlo
- .
6.5
−1
u(t) [µg kg ], (c) - sinais de comutação σ
M23
controlo
−1
u(t) [µg kg ], (c) - sinais de comutação σ
M76
controlo
u(t) [µg kg −1 ], (c) - sinais de comutação σ
r(t) [%],
e índice de classe
r(t) [%],
φ, (d)
R
e
L
79
(b) - acção de
e índice de classe
φ, (d)
80
a partir da resposta ao escalão, do
método de resposta ao escalão de Ziegler-Nichols [1].
xvi
(b) - acção de
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Determinação dos parâmetros
78
B.1
φ, (d)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
- .
e índice de classe
6.6
(b) - acção de
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
- .
r(t) [%],
. . . . . . . . . . . .
89
Acrónimos
ARX
Auto Regressivo com entrada eXógena (Auto Regressive
with eXogeneous input)
EMG
ElectroMioGraa (ElectroMyoGraphy)
LMS
Estimador por minimização do erro quadrático médio (Least
Mean Squares estimator)
MAPE
Mediana do Erro Absoluto de Desempenho (Median Absolut
Peformance Error)
MDPE
Mediana do Erro de Desempenho (Median Peformance Error)
MSE
Erro Quadrático Médio (Mean Squared Error)
NMB
Bloqueio NeuroMuscular (NeuroMuscular Blockade)
PE
Erro de Desempenho (Performance Error)
PID
Proprocional Integral Derivativo (Proportional Integral
Derivative)
PEPI
Estimador do Erro de Predição com
Índices de Desempenho (Prediction Error Performance
Index estimator)
TOF
Comboio-de-Quatro (Train-Of-Four)
ZOH
Retentor de Ordem Zero (Zero Order Hold)
xvii
xviii
Lista de Símbolos
rc
referência
u
acção de controlo
r
nível do bloqueio neuromuscular
cp
concentração no plasma
c
variável intermédia no modelo do NMB
ce
concentração de efeito
a1
parâmetro do modelo do NMB dependente do paciente
a2
λ1
λ2
λ
C50
τ
γ
M
banco de modelos
Mi
modelo
N
número de modelos do banco
r
eq
incremento de
eq
valor de
δce
ce
rd (r )
r
M
M
em regime estacionário
r
incremento de
eq
eq
do banco de modelos
valor desejado para o
δr
c
i
ce
ganho estático da equação de Hill linearizada
u
r = req
u
valor de
δu
incremento de
T 80
tempo decorrido entre o
que produz
u
bolus
inicial e
r
decair até
80%
xix
T 10
bolus
tempo decorrido entre o bolus
S
declive no ponto de inexão da descida de
P
persistência, tempo durante o qual
C
banco de controladores
Nc
número de controladores do banco
C(k)
centróide/controlador
Ci
controlador
tcl
instante de comutação para controlo em cadeia fechada
tref
tempo a partir do qual
refi
nível desejado para
tcc
instante de comutação para o controlo comutado
q
operador avanço
q −1
operador atraso
A
denominador do modelo do processo
B
numerador do modelo do processo
R
polinómio do controlador polinomial
S
T
Acl
polinómio da equação característica em cadeia fechada
t0
ganho do polinómio
Ac0
+
polinómio observador do controlador
T 50
A
−
A
B+
B
xx
−
tempo decorrido entre o
i
k
inicial e
r
decair até
50%
inicial e
r
decair até
10%
r
está abaixo dos 5%
C
do banco de controladores,
do banco de controladores
rc
T
r
rc
k = 1, . . . , Nc
C , i = 1, . . . , N
sobe gradualmente até
req
antes da subida até ao equilíbrio
para que tenha ganho estático desejado
termos a cancelar do denominador do processo
termos a não cancelar do denominador do processo
termos a cancelar do numerador do processo
termos a não cancelar do numerador do processo
Hm
função de transferência em cadeia fechada
Bm
numerador da função de transferência em cadeia fechada
Am
denominador da função de transferência em cadeia fechada
x
saída do processo sem ruído adicionado à saída
w
perturbação na entrada do processo
n
ruído adicionado à saída do processo
Rd
termo de rejeição de erro e perturbações em regime estacionário
λi
número de integradores no controlador
Sd
termo de rejeição de ruído de alta frequência
L
ganho de malha
K
ganho estático do modelo do processo
σ
sinal de comutação
φ
sinal índice de classe
y
medida da saída no controlo comutado
ŷi
estimativa da saída para o modelo
epi
erro de predição para o modelo
πpi
índice de desempenho para o modelo
λp
constante do ltro de predição
λ0
valor mínimo do ltro de predição variável
Aaw
polinómio observador de
∆u
acção de controlo na entrada do esquema de
sat()
saturação na acção de controlo
v
acção de controlo na entrada da saturação
τD
tempo de permanência (
h
constante de histerese
Ai
denominador do modelo
Bi
numerador do modelo
ēi
perturbação não modelada no modelo
Ap0
polinómio observador no PEPI
ec
erro de seguimento
s
valor correcto na saída do processo
si
valor correcto na saída do modelo
ω
polinómio observador no LMS
b
desvio na saída do processo
bi
desvio na saída do modelo
Kf
Amostra nal do tempo discreto
αi
ltragem do
epi
no LMS
βi
ltragem do
epi
no LMS
i
i
i
anti-windup
anti-windup
dwell-time )
i
i
i
i
i
xxi
xxii
λl
factor de esquecimento no LMS
P
espaço de parâmetros do modelo do processo
δν
distância de Vinnicombe
dmin
distância mínima entre os pares de pontos de agregados diferentes
dmax
distância máxima entre os pares de pontos de agregados diferentes
ts
tempo de estabelecimento entre
λn
constante do ltro de ruído
±1%
Capítulo 1
Introdução
1.1
Motivação e Enquadramento
O recente progresso no desenvolvimento de tecnologias no âmbito dos sensores e actuadores, assim como na modelação de sistemas biológicos, tem aberto um leque cada vez
maior de áreas de aplicação para o controlo automático.
Em particular no campo da
anestesia, grandes esforços têm sido feitos para o desenvolvimento de ferramentes de
monitorização e criação de modelos farmacocinéticos/farmacodinâmicos.
Através do uso da automação, o anestesista [8] é libertado de tarefas repetitivas podendo assim concentrar-se na supervisão do paciente, nomeadamente para tomar decisões
que requerem conhecimentos especícos de medicina. A automação tem ainda a vantagem
de ser um procedimento mais sistemático, assegurando um seguimento mais apertado das
referências das variáveis siológicas que se pretendem regular, reduzindo as quantidades
de fármacos administrados. Para além disso, na cirurgia animal, por razões económicas,
muitas vezes o cirurgião faz também o papel de anestesista, pelo que a automação permite
com um custo inferior fornecer uma ajuda para o melhoramento global de uma cirurgia.
A anestesia geral [1] tem três componentes:
a hipnose (profundidade de anestesia,
associada à perda de consciência), analgesia (destinada a impedir a dor) e a areexia
(paralisia obtida pela bloqueio neuromuscular). Para cada uma destas componentes, existe um grupo de agentes (fármacos), nomeadamente os hipnóticos (retiram a consciência),
os analgésicos (aliviam a dor) e os relaxantes musculares (bloqueadores neuromusculares).
Os últimos bloqueiam os impulsos dos nervos para que o músculo não contraia, facilitando
assim a cirurgia. Neste trabalho, estuda-se o uso do
atracúrio, como relaxante muscular.
Sendo o sistema a estudar biológico, existem diversas restrições e diculdades no âmbito
do controlo, tais como: variabilidade entre os índividuos, não-linearidades, variações no
1
Capítulo 1. Introdução
tempo da dinâmica do paciente, restrições na acção de controlo (a dose dos fármacos
administrados tem que ser não negativa) e os níveis de ruído asssociados às medições dos
sensores.
A medida do nível do bloqueio neuromuscular é realizada através da estimulação do
nervo periférico ulnar [1], sendo o registo é efectuado através de um electromiograma
(EMG). Em geral, os estimuladores do nervo geram uma série de 4 pulsos de estimulação
(TOF) em intervalos de 0.5
segundos, cada com duração de 0.2 milisegundos.
A estimu-
lação é aplicada com a corrente supramaximal, estimada (com aumento da corrente até o
EMG car constante) após a anestesia, mas antes da administração do relaxante muscular.
Existindo sensores e actuadores, e podendo ser denida uma relação dinâmica entre
ambos (através de um sistema de equações diferenciais ou de diferenças) é possível abordar
o problema da dosagem de fármaco a administrar por forma a que o efeito seja o desejado,
com base em métodos de controlo por realimentação. Nesta tese, a atenção centra-se sobre
o controlo do nível do bloqueio neuromuscular.
1.2
Estado da Arte
Nas últimas décadas têm sido desenvolvidos diversos esquemas de controlo para o problema do bloqueio neuromuscular, com o objectivo de ultrapassar os problemas da não
linearidade e elevada incerteza associada à dinâmica da resposta de um paciente. Estes esquemas vão desde simples controladores PID, até controladores complexos baseados numa
variadade de métodos, nomeadamente adaptativos, de lógica difusa, robustos, baseados
em supervisores e recorrendo a métodos híbridos de identicação de parâmetros.
As primeiras utilizações de controlo automático aplicado ao bloqueio neuromuscular,
remontam a 1976 [9], em que foi usado um PID como controlador e os testes foram realizados com uma ovelha. Estes permitiram concluir que era possível o uso do controlo
automático em cirurgia, com as vantagens de ter um seguimento preciso da referência
desejada para o nível do bloqueio neuromuscular e uma redução da dose de fármaco administrada.
A partir de 1985 surgiram as primeiras aplicações do sistema de controlo
automático em pessoas [10], também neste caso o controlador era um PID. Em [11] foram
incorporadas diversas modicações num PID digital, de forma a acomodar algumas das
especicidades do bloqueio neuromuscular. Os ganhos do controlador eram automaticamente ajustados para uma referência desejada através de uma técnica de calendarização de
ganhos, tendo sido também criada uma referência variavél no tempo de modo a ajustarse aos requesitos clínicos.
2
Apesar de os resultados serem satisfatórios (referência em
1.3. Estrutura da Tese
regime estacionário no nível desejado), permaneciam alguns problemas como respostas
oscilatórias ou uma sobrelevação inicial.
Constatando-se que um controlador PID de
parâmetros xos não conseguiria obter um bom desempenho em todos os casos clínicos,
vericou-se um aumento da investigação em estratégias de controlo mais avançadas.
Em [12, 13] é apresentado um controlador adaptativo baseado em modelos farmacocinéticos/farmacodinâmicos que conseguiam manter um nível estável de paralesia, ajustando o relaxante muscular à medida que era pedido, minimizando assim a quantidade
de fármaco administrada comparando a administração de sucessivos
bolus.
Nos últimos anos, tem sido proposta uma nova abordagem para o controlo adaptativo,
baseada em controladores supervisonados comutados com múltiplos modelos/controladores.
Com esta estratégia pretendia-se resolver os problemas da elevada variabilidade inter e
intra-pacientes. Nesta abordagem descrita em [1], os controladores locais são PID anados segundo a regra de colacação de pólos dominante. Os ensaios clínicos obtiveram bons
resultados, conseguindo o algoritmo estabilizar qualquer dinâmica do paciente sem impôr
restrições
a priori
no banco de modelos/controladores.
Outra abordagem para resolver este problema é descrita em [14], no qual se utiliza
um método híbrido para estimação dos parâmetros do modelo do paciente, baseado num
algoritmo de ajuste de curvas e numa rede neuronal. Esta informação é usada para prever
a taxa de infusão que deve ser administrada em regime estacionário. Apesar dos resultados
em simulação serem muito promissores, ainda não existem ensaios clínicos.
1.3
Estrutura da Tese
Esta tese está organizada do seguinte modo.
Após este capítulo de introdução, que
introduz e formula o problema, o capítulo 2 é dedicado à obtenção e caracterização
dos modelos necessários ao projecto do controlador.
cocinético/farmacodinâmico para o
A resposta de um paciente ao
bolus
atracúrio,
Descreve-se um modelo farma-
do qual se obtém uma versão linearizada.
inicial é caracterizada em termos de parâmetros. O
capítulo termina com a descrição da estrutura do controlador e da do perl da referência
a utilizar no controlo do bloqueio neuromuscular.
No capítulo 3 apresenta-se o algoritmo de projecto dos controladores locais, sendo
apresentado o algoritmo de colocação de pólos, que vai sendo desenvolvido gradualmente,
aumentando a sua capacidade com o aumento da sua complexidade.
Em seguida, o
controlador do NMB é projectado segundo o algoritmo apresentado nas secções anteriores.
No nal é apresentado um estudo comparativo entre os diversos níveis de capacidade do
3
Capítulo 1. Introdução
controlador e ainda se demonstra o efeito de alguns parâmetros na resposta do sistema.
O capítulo 4 dedica-se ao sistema de controlo supervisionado comutado com múltiplos
modelos. Após apresentar a estrutura do mesmo, é descrito um esquema de
anti-colagem
adaptado ao controlo comutado, seguida da descrição dos blocos de lógica de decisão e
multi-estimador.
Para o caso em que o multi-estimador é variável apresentam-se duas
soluções para o ltro de predição, em que o factor de esquecimento do ltro pode ser xo
ou variável. No nal é realizado um estudo comparativo, entre o desempenho das várias
soluções propostas para os diversos blocos do supervisor.
No capítulo 5 apresenta-se um estudo sobre a construção do banco de controladores,
em que o número de controladores é bastante inferior ao número de modelos, atráves de
métodos de agregação, os quais usam uma métrica adequada ao problema da classicação
de modelos em classes para sistemas de controlo realimentados. No m do capítulo são
discutidas as diferenças entre os vários bancos de controladores obtidos.
O capítulo 6 começa por apresentar os parâmetros de desempenho que, usualmente,
se consideram, para o bloqueio neuromuscular.
Em seguida são apresentadas alguns
exemplos que visam demonstrar as vantagens do controlo comutado. Depois, apresentase uma tabela com dados sobre os resultados dos vários sistemas de controlo testados e são
discutidos os resultados obtidos. Por último aborda-se o problema do ruído no controlo
comutado.
Finalmente, no capítulo 7 tiram-se as conclusões nais sobre os diversos tópicos abordados na tese e apresentam-se sugestões para futuros trabalhos sobre os temas discutidos.
No apêndice A pode ser observada uma tabela com os parâmetros das respostas ao
inicial de 100 modelos para o
atracúrio.
bolus
O apêndice B faz uma breve revisão do Método
de Resposta ao Escalão de Ziegler-Nichols e da sua aplicação no controlo do bloqueio
neuromuscular.
No apêndice C apresentam-se tabelas com os bancos de controladores
construídos para os diversos métodos de agregação e números de contradores, e ainda
os resultados dos parâmetros de desempenho para simulações com diferentes tipos de
estimadores.
De salientar, o facto de os capítulos terem sido escritos de modo a se poderem ler de
maneira independente uns dos outros, tentando assim mapear, ao máximo, os capítulos na
descrição dos diversos métodos de projecto (controladores locais, supervisor e construção
do banco de controladores).
4
1.4. Contribuições da Tese
1.4
Contribuições da Tese
Esta tese tem como objectivo melhorar os sistemas de controlo do bloqueio neuromuscular
já existentes, tendo como ponto de partida o trabalho realizado em [1]. Em primeiro lugar,
pretende-se substituir os controladores locais, PID's, por controladores robustos projectados através da colocação de pólos segundo uma abordagem polinomial.
Em segundo
lugar, melhorar o desempenho do controlador supervisionado comutado com múltiplos
modelos/controladores, testando a hipótese de ter um banco de controladores menor que
o banco de modelos.
No capítulo 3 está descrito o método de projecto do algoritmo de colocação de pólos,
segundo uma abordagem polinomial, em geral, e aplicado ao tema em questão.
No capítulo 4 é proposto um novo esquema para o controlador supervisionado, com
menos controladores, com dois tipos de estimadores diferentes e ainda diferentes lógicas de decisão.
Propõe-se ainda uma ligeira alteração no factor de esquecimento do
ltro de predição, quando se usa o estimador PEPI, tornando-o adaptável a uma medida da excitação na entrada do processo. O estimador baseado na minimização de um
custo quadrático em presença de
desvios
desconhecidos foi sugerido pelo Professor João
Hespanha. Apresenta-se ainda um esquema de
anti-colagem,
para um controlador com
colocação de pólos, adaptado ao controlo comutado.
Por último, no capítulo 5 é apresentado um estudo sobre a construção do banco de
controladores, nomeademente sobre os métodos de agregação de modelos e sobre métrica
usada para o efeito. Em relação aos métodos de agregação apresentam-se várias alternativas, sendo que umas usam informação da estrutura do bloqueio neuromuscular, enquanto
outras não. Apresenta-se um método de agregação automático que tem como objectivo
não ser necessário ter informação sobre o problema de modo a que em problemas de
elevada dimensionalidade este possa ser utilizado.
5
6
Capítulo 2
Bloqueio Neuromuscular
Neste capítulo é realizada uma descrição do bloqueio neuromuscular, nomeadamente em
termos dos modelos farmacocinéticos/farmacodinâmicos para o
estudo.
atracúrio,
fármaco em
Em seguida será obtida uma versão linearizada dos mesmos, necessária para
o projecto dos controladores, como se poderá ver no capítulo 3. Neste ponto, foi ainda
realizado um estudo comparativo entre o as respostas dos sistema não linear e linearizado,
de forma a se comparar o comportamento de ambos em torno do ponto de equilíbrio, o que
permite obter conclusões sobre a adequação da aproximação efectuada com a linearização.
Em seguida caracteriza-se a resposta de um paciente ao
bolus
inicial em termos de
parâmetros que permitam realizar uma classicação dos modelos, o que ajuda na especicação da dinâmica dos controladores e como se poderá ver no capítulo 5 permite criar
um método de agregação de modelos para a construção do banco de controladores para o
controlo comutado.
Por último, descreve-se a estrutura do controlador e apresenta-se o perl da referência
para o bloqueio neuromuscular.
2.1
Modelo do Bloqueio Neuromuscular
A resposta dinâmica do bloqueio neuromuscular para o
atracúrio
pode ser modelada por
uma série de blocos lineares, a que está acopulada uma não linearidade estática, como se
observa na Figura 2.1 (estrutura do tipo Wiener). O primeiro bloco descreve a relação
entre a taxa de infusão
u(t) [µg kg −1 min−1 ]
e a concentração no plasma
cp (t) [µg ml−1 ],
7
Capítulo 2. Bloqueio Neuromuscular
sendo descrita pelo seguinte sistema de equações de estado


x˙1 (t) = −λ1 x1 (t) + a1 u(t)



x˙2 (t) = −λ2 x2 (t) + a2 u(t)
2

P


 cp (t) = xi (t)
(2.1)
i=1
em que
e
xi (i = 1, 2) são variáveis de estado implicitamente denidas por (2.1), ai [µg ml−1 ]
λi [min−1 ] (i = 1, 2)
são parâmetros dependentes dos pacientes.
Seguem-se 2 blocos
lineares,
ċ(t) = −λc(t) + cp (t)
e
que permitem relacionar a
−1
ce (t) [µg ml ].
Aqui,
1
1
c˙e (t) = − ce (t) + c(t)
τ
τ
concentração no plasma cp (t)
com a concentração de efeito,
c(t) é uma variável intermédia e λ [min−1 ] e τ [min] são parâmetros
dependentes do paciente. De notar, que o bloco 3 não está presente no standard de modelos desenvolvidos para o
atracúrio, mas a inclusão deste permite uma melhor replicação
das respostas observadas experimentalmente [2]. O último bloco modela a resposta farmacodinâmica induzida pela concentração de efeito
r(t) [%]
ce (t) no nível do bloqueio neuromuscular
através da equação de Hill
r(t) =
onde os parameteros
C50 [µg ml−1 ]
dentes do paciente. A variável
e
γ
γ
100C50
γ
C50
+ ce (t)γ
(2.2)
(adimensional) são também parâmetros depen-
r(t), está normalizada entre 0 e 100, em que 100 corresponde
à actividade muscular total e 0 à paralesia muscular total.
Figura 2.1: Diagrama de blocos do modelo do bloqueio neuromuscular [1].
Os relaxantes musculares como o
atracúrio são usualmente administrados por um bolus
inicial que em poucos minutos induz a paralesia total no paciente. De forma a cobrir uma
gama abrangente de comportamentos, em [2] foi gerado aleatoriamente um banco de
8
2.2. Linearização
modelos
M = {Mj , j = 1, . . . , 100}
assumindo uma distribuição de probabilidade log-
normal multidimensional para os parâmetros
uniforme para
τ
no intervalo
[0, 3.5] min.
a1 , a2 , λ1 , λ2 , λ, C50 e γ
e uma distribuição
A Figura 2.2 replica os resultados de [2].
Figura 2.2: Resposta induzida por um bolus de 500 µg kg −1 de atracúrio em t = 0 min em 100 modelos
simulados, [2].
2.2
Linearização
Para o projecto do controlador segundo técnicas polinomiais é necessária a obtenção da
função de transferência discreta do modelo do paciente, como se verá no capítulo 3.
Assim, tendo em conta a não-linearidade presente na equação de Hill (2.2) é necessária a
sua linearização, por forma a obter-se a função de transferência linearizada do modelo do
paciente.
Seja
r = f (ce ) dado por (2.2).
Numa vizinhança do ponto de equilíbrio
(req , ceq
e ) tem-se
req + δr = f (ceq
e + δce )
em que
δr
e
δce
são incrementos de
r
e
ce
em torno dos respectivos valores de equilíbrio.
Desprezando os termos de ordem superior da série de Taylor, obtém-se
δr = rd (req ) δce
(2.3)
9
onde
2
∂f γ req 100 − req 1− γ1
rd (r ) =
=
−
∂ce r=req
C50 100
req
eq
(2.4)
representa o ganho estático não linear da equação de Hill linearizada em torno do ponto
de trabalho considerado [3].
Efectuou-se um estudo comparativo entre o modelo não linear e linearizado em torno
de um ponto de equilíbrio. De notar que quando se menciona o ponto de equilíbrio está-se
a indicar a referência desejada para o nível do bloqueio neuromuscular. A totalidade das
simulações efectuaram-se com uma referência de
10%, pois este é valor usado normalmente
como se pode constatar na secção 2.4.
Na Figura 2.3 está representado o diagrama com o esquema da simulação efectuada
para comparar as respostas dos sistemas linear e não linear. Na entrada do sistema não
ueq ,
linear está o valor da taxa de infusão contínua
que é o valor que produz em regime
estacionário na saída a referência desejada. Este é calculado através do Teorema do Valor
Final
ceq
e = lim sCe (s) = lim s
s→0
s→0
1
ueq a1
a2 λ
τ
+
s s + λ1 s + λ2 s + λ s +
e logo
eq
ceq
e = u
a
1
+
λ1
a2 λ2
Reorganizando a equação de Hill (2.2) em função de
r
ceq
e
= C50
γ
1
τ
ce
(2.5)
tem-se
100 − req
req
(2.6)
Finalmente, juntando (2.5) e (2.6) obtém-se
C50
ueq = q
γ
a1
λ1
100−req
req
+
a2
λ2
(2.7)
Já na entrada do sistema linearizado, forneceu-se um incremento de dose de fármaco
(δu nas Figuras) em
nos
t = 250 min (instante a partir do qual o sistema não linear estabiliza
10%, para o modelo testado).
Este é somado à entrada do sistema não linear, como se
observa na Figura 2.3. Testou-se o modelo
incremento de
eq
u
entre
{−8, 8}%
M40
para uma referência de
com um passo de 1%. Na Figura 2.4 representaram-se
4 casos de respostas para incrementos de
{−8, −3, 3, 8}%.
Na Figura 2.5 pode observar-se o integral do erro, para
incremento
10
δu.
10%, variando-se o
t ≥ 250 mins
em função do
2.2. Linearização
Figura 2.3: Esquema para a comparação entre o sistema não linear e linearizado.
Figura 2.4: Comparação das respostas para incrementos de {−8, −3, 3, 8}%.
11
Figura 2.5: Integral do erro da resposta dos sistemas em função de δu.
Da análise da Figura 2.4, conclui-se que para variações maiores ou iguais a
|8|% o
erro
estático será superior a 1%. De notar, que a resposta do sistema não linear não é simétrica
em relação a variações positivas e negativas, sendo que se registaram piores resultados,
i.e., integral do erro estático maior, para variações negativas, ver Figura 2.5.
Conclui-se assim, que a linearização dá uma aproximação adequada, de forma a que o
projecto do controlador possa exibir bons resultados.
2.3
Caracterização da Resposta ao
A resposta de um paciente ao
bolus
inicial e a respectiva caracterização em termos de
parâmetros pode ser observada na Figura 2.6.
início da administração do
nominadados
bolus
Bolus Inicial
Estes são os tempos decorridos entre o
e o nível da resposta decair para os 80%, 50% e 10%, de-
T 80, T 50 e T 10, respectivamente.
Existem ainda dois parâmetros adicionais,
S , o declive no ponto de inexão no decaimento do nível do bloqueio neuromuscular, e P ,
o parâmetro de persistência que dá uma ideia da duração do efeito do
bolus
no paciente,
sendo denido como o tempo durante o qual o nível da resposta está abaixo dos 5%.
Na Figura 2.7 podem ser observadas 4 respostas ao
diferenças que podem existir entre pacientes.
12
bolus
inicial, exemplicativas das
Os parâmetros de caracterização das re-
2.3. Caracterização da Resposta ao Bolus Inicial
Figura 2.6: Caracterização da resposta ao bolus inicial, [1].
spostas desses mesmos modelos são na Tabela 2.1.
Tabela 2.1: Parâmetros de 4 respostas ao bolus inicial.
Modelo
T 80 [min]
T 50 [min]
T 10 [min]
S
P [min]
M10
1
4.33
1.33
4.67
1.33
5.67
1.67
5.67
1.67
8.33
2.33
8.33
-167.13
-29.22
-96.79
-29.35
41.33
35.67
38.33
49.67
M39
M56
M69
Da análise da Figura 2.7 e da Tabela 2.1 pode, de uma maneira simplista, dividir-se o
banco de modelos em 2 tipos: lentos e rápidos. Os modelos
mais rápida,
os modelos
M69
i.e.,
M39
e
M10
e
M56
têm uma resposta
o fármaco administrado actua mais rapidamente, em comparação com
M69 .
Estes últimos têm um decaimento mais lento e ainda o modelo
tem uma persistência maior, ou seja, o fármaco demora mais tempo a ser absorvido
comparativamente aos restantes modelos.
As especicações do controlador, são dadas em termos de pólos, como se verá no
capítulo 3, especialmente tendo em conta o tempo de estabelecimento da função de transferência em cadeia fechada. Assim os termos rápido e/ou lento ajudam à associação com
a especicação do controlador.
13
Figura 2.7: Exemplo de 4 respostas ao
bolus
inicial.
A tabela completa dos parâmetros de caracterização da resposta ao bolus inicial pode
ser observada no apêndice A
2.4
Estrutura do Controlador e da Referência
O controlo do bloqueio neuromuscular é efectuado através da infusão contínua do fármaco
coordenada por um computador digital. Este implementa o algoritmo do controlador a
utilizar, a partir da referência desejada e do nível do bloqueio neuromuscular, determinando a taxa de infusão necessária a ser administrada. Na Figura 2.8, pode ser observado
o esquema de controlo a utilizar.
Figura 2.8: Esquema de controlo para o bloqueio neuromuscular, [1].
14
2.4. Estrutura do Controlador e da Referência
No esquema da Figura 2.8 pode ser observado um bloco correspondente à saturação
do actuador,
i.e.,
existe um limite físico para a dose administrada, sendo este um valor
não negativo. Inicialmente, no projecto dos controladores locais (capítulo 3), admitiu-se
que existia um único valor máximo e que este representava o limite da seringa, tendo
sido admitido o valor de
2000 µg kg −1 min−1 .
Mais tarde, com o controlador comutado,
efectuaram-se as seguintes restrições adicionais na saturação


 0 v(t) ≤ 0
sat(v) =
10 v(t) ≥ 10, 0 ≤ t < 100


20 v(t) ≥ 20, t ≥ 100,
(2.8)
de forma a evitar que, em alguns casos, a resposta do paciente permanecesse em
0%
e
principalmente com o objectivo de melhor o desempenho na presença de ruído.
Como referido na secção 2.1, o paciente é submetido a um
bolus
inicial, que produz
uma relaxação muscular total em poucos minutos. Assim, o controlador apenas começa a
funcionar
tcl min
depois da administração do
do paciente e do tempo [11], ver Figura 2.9.
valor baixo
refi
durante os primeiros tref
bolus.
A referência desejada é dependente
Inicialmente a referência é mantida num
min sendo a partir deste instante gradualmente
elevada até ao nível de relaxamento desejado em regime estacionário, que usalmente é de
rc = 10%.
Esta escolha da referência reecte um compromisso entre a variabilidade das
respostas dos pacientes ao
como valores típicos
bolus
e o nível de ruído na medida do sensor, sendo sugeridos
refi = 2.5%, tcl = 10 min, tref = 30 min em [11].
Estes valores serão
os usados nas simulações efectuadas, sendo para a subida gradual da referência após os
tcl min
a ordem com um tempo de estabelecimento de
usado um sistema de 1
40 min.
Assim, as simulações usam todas a mesma referência para diferentes modelos testados.
Figura 2.9: Perle da referência desejada para o nível do bloqueio neuromuscular, [3].
Para além do perle da referência, é sugerido que durante o período entre tcl e tref
min,
15
o controlador a utilizar seja apenas um controlador proporcional.
Tal deve-se ao facto
de caso o controlador a utilizar tenha efeito integral, este iria acumular erro em excesso
devido ao efeito do
bolus
inicial ser dominante e o controlo
período referido. Em [11] o valor de
tref
u
estar saturado durante o
servia para indicar o momento a partir do qual
a referência deveria subir gradualmente até ao nível desejado em regime estacionário e
o momento a partir do qual o controlador a utilizar deveria ser ligado. Neste trabalho
optou-se por desacopular estas variáveis, cando
tref
apenas com o signicado ligado ao
perl da referência e tcc com o valor do instante de comutação do controlador proporcional
para o controlador comutado.
O valor do ganho do controlador proporcional é calculado segundo o método da resposta
ao escalão de Ziegler-Nichols [1], ver apêndice B.
16
Capítulo 3
Projecto dos Controladores Locais
Este capítulo apresenta o projecto do controlador, o qual é concebido segundo uma abordagem polinomial [5]. A ideia da colocação de pólos, é encontrar o controlador que dá
origem a um sistema em cadeia fechada com os pólos especicados.
O projecto de um controlador polinomial recorre a descrições de entrada/saída do
processo que foram obtidas na secção 2.2. Pretende-se projectar um controlador com dois
graus de liberdade, em que a solução de uma equação algébrica, a equação
diofantina,
será determinante no dimensionamento do mesmo. O projecto do controlador vai sendo
apresentado de uma forma gradual, aumento a sua complexidade consoante a exigência
que se lhe exige.
Após a descrição do método de projecto do controlador polinomial
apresenta-se um exemplo da aplicação do método ao bloqueio neuromuscular.
No nal, apresentam-se diversos exemplos com o intuito de demonstrar o efeito de
alguns aspectos importantes no projecto do controlador polinomial. O método de projecto
apresentado neste capítulo será usado no projecto dos controladores locais do banco de
controladores do controlo comutado para a resolução do problema do controlo do bloqueio
neuromuscular com múltiplos modelos
3.1
Projecto do Controlador Polinomial
Nas subsecções seguintes apresenta-se a estrutura do controlador polinomial, sendo efectuada uma descrição pormenorizada em termos das equações e condições nos polinómios
do controlador. Em seguida, apresentam-se alguns aspectos do projecto do controlor que
permitem a especicação da função de transferência em cadeia fechada.
17
Capítulo 3. Projecto dos Controladores Locais
3.1.1 Controlador Polinomial
Após a linearização efectuada na secção 2.2, discretizou-se o modelo segundo o método
ZOH,
com um tempo de amostragem de 20
segundos
[1].
Assim, o sistema é descrito
pelo seguinte modelo entrada/saída
onde
A(q)r(k) = B(q)u(k)
(3.1)
A(q) e B(q) são polinomios no operador avanço q .
Pretende-se projectar um contro-
lador com o esquema da Figura 3.1, com uma saída
u e duas entradas rc
últimas, têm o signicado mencionado na secção 2.4, e em que
no operado
q.
R, S
e
e
r, em que estas
T
são polinómios
Do esquema da Figura 3.1, deduz-se a seguinte lei de controlo
Figura 3.1: Esquema de um controlador polinomial.
R(q)u(k) = T (q)rc (k) − S(q)r(k)
(3.2)
Para que esta seja causal é necessário que
(
∂R ≥ ∂T
∂R ≥ ∂S
em que
(3.3)
∂R = grau de R.
Para resolver o problema do projecto do controlador, determina-se a equação característica do sistema em cadeia fechada e exploram-se as condições que esta impõe. Eliminando
u(k)
em (3.2), obtém-se a seguinte função de transferência em cadeia fechada
B(z)T (z)
r
=
c
r
A(z)R(z) + B(z)S(z)
(3.4)
a qual tem como equação característica
A(z)R(z) + B(z)S(z) = 0
18
(3.5)
3.1. Projecto do Controlador Polinomial
O problema da colocação de pólos resume-se à resolução de uma equação denominada
equação
diofantina
A(z)R(z) + B(z)S(z) = Acl (z)
que cálcula as soluções para
R(z)
e
S(z),
partir de
A(z), B(z)
(3.6)
e
Acl (z),
o polinómio
característico especicado para a cadeia fechada.
Para garantir a causalidade, o polinómio característico deve ser factorizado da seguinte
forma
Acl (z) = Ac (z)Ac0 (z)
(3.7)
controlador, no qual se especica a dinâmica pretendida para o sistema, e o polinómio observador A0 (z) que permite aumentar a ordem
do controlador. Para que o observador não afecte a dinâmica do sistema, este deverá ser
sendo
Ac (z)
um factor de
denominado o polinómio
T (z).
Assim, com
T (z) = t0 Ac0 (z)
(3.8)
os sinais de comando são introduzidos de tal forma que não geram erros por parte do observador. O parametro t0 é escolhido consoante o ganho estático desejado para o sistema.
A solução da equação (3.6) tem innitas soluções, mas como foi referido anteriormente
existem restrições de causalidade nos polinómios do controlador.
Se o tempo de cál-
culo do sinal de controlo num computador for substancialmente inferior ao período de
amostragem, é natural que se despreze o tempo de cálculo do sinal, como é o caso do bloqueio neuromuscular. Assim, as condições de causalidade (3.3) podem ser simplicadas
em
∂R = ∂S = ∂T
(3.9)
Num problema de controlo, o objectivo consiste em projectar um controlador causal
com a menor ordem possível.
projectar os polinómios
Aqui entram as
observador
e
controlador
Soluções de Ordem Mínima, i.e.,
de forma a que as soluções da equação
diofantina, produzam um controlador de ordem mínima.
1
Assim, tem-se
∂S < ∂A
Pode assim com toda a generalidade escolher-se um polinómio que, no máximo, terá ordem
∂S = ∂A − 1
(3.10)
Para que o controlador introduza o mínimo de atraso possível, as duas desigualdades
presentes em (3.3) devem ser consideradas igualdades. Logo, o termo
1 deixou-se
A(z)R(z) domina a
cair o argumento indicativo da variável independente nos polinómios de modo a simplicar a escrita.
19
ordem em termos do polinómio característico (já que o modelo do processo é causal,
∂A > ∂B =⇒ ∂A + ∂R = ∂Ac + ∂Ac0 ),
i.e.,
ou seja,
∂Ac0 = 2∂A − ∂Ac − 1
(3.11)
3.1.2 Cancelamento de Pólos e Zeros
Até agora não se considerou o facto de se poderem cancelar zeros e/ou pólos do processo
por forma a projectar o controlador, impondo um modelo de referência. Nos casos, em
que estes sejam bem amortecidos é possível cancelá-los. Assume-se que os polinómios
e
B
A
são factorizáveis em
(
A = A+ A−
(3.12)
B = B+B−
onde
A+
e
B+
sãos os factores a cancelar, e para que a factorização seja única, são
2
escolhidos de tal forma que sejam mónicos .
podem cancelar termos bem condicionados,
Como se referiu anteriormente, apenas se
i.e.,
as raízes dos polinómios
A+
e
B+
têm
que estar dentro do círculo de raio unitário. Isto porque um pólo que é cancelado tem
que ser um zero do controlador e vice-versa, como se pode ver pelas novas formas dos
polinómios
R, S
e
T

+

 R = B R̄
S = A+ S̄


T = A+ T̄
(3.13)
Substituindo (3.13) em (3.4), obtém-se a nova função de transferência em cadeia fechada,
a qual tem de satisfazer a equação
r
T̄ B −
A+ T̄ B + B −
=
=
rc
A+ B + (A− R̄ + B − S̄)
A¯cl
Como se pode observar, os termos
A+
e
B+
aparecem no polinómio característico nal,
tendo por isso mesmo de ser estáveis e bem amortecidos.
diofantina
20
Isto signica, que a equação
a resolver é agora dada por
A− R̄ + B − S̄ = Acl = Ac Ac0
2 coeciente
(3.14)
do termo de maior ordem unitário.
(3.15)
3.1. Projecto do Controlador Polinomial
o que implica novas condições de ordem (com
∂A− + ∂ R̄ = ∂Ac + ∂Ac0 ):


∂ S̄ = ∂A− − 1



 ∂S = ∂R = ∂A− + ∂A+ − 1

∂ R̄ = ∂R − ∂B +



 ∂Ac = 2∂A− − ∂A + ∂A+ − ∂B + − 1
(3.16)
c
0
No caso particular do problema considerado é
∂ S̄ = ∂A− − 1.
3.1.3 Separação da Resposta a Perturbações e Sinais de Comando
Nesta secção pretende-se introduzir o conceito de uma abordagem mais geral, ou seja,
projectar o controlador de forma a que resposta do sistema a sinais de comando esteja
completamente separada da resposta a perturbações. Esta propriedade que se pretende
dotar o controlador, dá-lhe uma liberdade suplementar. Considere-se a função de transferência em cadeia fechada desejada dada por
Hm =
Bm
ym
= c
Am
r
Para a obtenção de um seguimento perfeito, o polinómio
Bm ,
pois
B−
(3.17)
B−
tem que ser um factor de
não pode ser cancelado, pelo que
Bm = B̄m B −
(3.18)
Pela restrição de causalidade que tem que ser respeitada, pelo que
∂Am − ∂Bm ≥ ∂A − ∂B
i.e.,
o atraso não pode ser menor do que o do processo.
(3.19)
Redenindo novamente os
polinómios do controlador como

+

 R = Am B R̄
S = Am A+ S̄


T = B̄m A+ Ac0 Ac
(3.20)
obtém-se após manipulação algébrica uma nova lei de controlo dada por
u=
em que os polinómios
R̄ e S̄
Bm A c A+ S̄
r + + (ym − r)
Am B
B R̄
(3.21)
são obtidos através da resolução de (3.15). Com esta especi-
cação, a resposta a sinais de comando é dada pela função de transferência especicada em
21
(3.17), enquanto a resposta a perturbações é imposta pelos polinómios
A0
e
Ac .
Esta é a
solução mais geral, mas apenas foi aqui dada a conhecer, para salientar a opção tomada.
Optou-se por projectar um controlador de grau inferior, em que a resposta a sinais de
comando foi tomada como prioritária (ym
= r).
Isto não signica, que se tenha negli-
genciado a resposta a perturbações (a secção 3.2 abordará este problema). Neste ponto,
apenas foi efectuada uma opção em termos de simplicidade de projecto.
Assim, o polinómio característico
pelo que se passa a usar
Am
Ac
especica a dinâmica de (3.17),
i.e., Ac = Am
a partir deste ponto, quando se pretender falar da dinâmica
especicada para o sistema. Finalmente, o controlador de ordem inferior ca denido com

+

 R = B R̄
S = A+ S̄


T = B¯m A+ Ac
(3.22)
0
3.2
Melhoria do Desempenho
Considera-se agora o efeito das perturbações e como melhorar o desempenho do controlador às mesmas. Assumem-se dois tipos de perturbações, uma perturbação
na entrada do processo e o outro tipo de perturbação como sendo ruído,
sinal de saída
r.
n,
v
que actua
na medida do
O sistema é ilustrado pela Figura 3.2.
Figura 3.2: Esquema do sistema com sinais de comando e perturbações (perturbação à entrada v e ruído
de observação na saída n).
3.2.1 Rejeição de Erro e Perturbações em Regime Estacionário
Pela observação da Figura 3.2, é possível deduzir a seguinte expressão
x=
22
BR
v
AR + BS
(3.23)
3.2. Melhoria do Desempenho
v , na resposta do sistema.
que ajuda a compreender o efeito da perturbação na carga
Para
que o erro em regime estacionário seja nulo, é necessário que o ganho estático da função
de transferência (3.23) seja nulo.
B(1) 6= 0
z−
B(1)R(1) = 0
Logo,
isto signica que é necessário que
R(1) = 0.
e como para o caso em estudo
Assim,
R
terá que ter como factor
1, i.e., o controlador terá que ter acção integral. O no de integradores,
do tipo de perturbação que se considere. Normalmente
escalão e
λ=2
λi = 1
para perturbações do tipo rampa. Assim,
(
R
λi ,
depende
para perturbações do tipo
é redenido como
R = B + R̄ Rd
(3.24)
Rd = (q − 1)λi
Para o caso em concreto consideram-se perturbações do tipo escalão, pelo que
λi = 1.
A
acção integral é duplamente desejável, já que o ganho de malha dado por
L=
BS
AR
(3.25)
deve ser elevado nas baixas frequências, para permitir a rejeição de perturbações de baixas
frequências. Isto é garantido pela inclusão da acção integral.
O aumento da ordem do controlador, com a inclusão de um integrador, implica que a
ordem do polinómio
diofantina
observador
aumente de acordo com o termo introduzido. A equação
a resolver passa a ser dada por
A− Rd R̄ + B − S̄ = Am Ac0
com
∂A− + ∂Rd + ∂ R̄ = ∂Am + ∂Ac0
e logo


∂ S̄ = ∂A− + ∂Rd − 1



 ∂S = ∂R = ∂A− + ∂A+ + ∂R − 1
d
+

∂ R̄ = ∂R − ∂B − ∂Rd



 ∂Ac = 2∂A− − ∂A + ∂A+ + ∂R − ∂B + − 1
m
0
(3.26)
(3.27)
d
3.2.2 Robustez e Rejeição de Ruído
O ruído de medida do sensor é tipicamente ruído de alta frequência. A maior frequência
possível de se obter num sistema amostrado é a frequência de Nyquist. Esta corresponde
no plano discreto a
S
z = −1.
deverá ter um factor
Para que o ruído não inuencie o sinal de saída, o polinómio
z + 1.
Da Figura 3.2 também é possível retirar a seguinte equação
x=−
BS
n
AR + BS
(3.28)
23
Logo,
S
é também redenido como
(
S = A+ S̄ Sd
(3.29)
Sd = q + 1
Como foi referido na subsecção 3.2.1, o aumento da ordem do controlador tem como
consequência o aumento da ordem do polinómio
observador.
Então, a equação
diofantina
passa a ser dada por
A− Rd R̄ + B − Sd S̄ = Am Ac0
(3.30)
resultando nas seguintes condições de ordem


∂ S̄ = ∂A− + ∂Rd − 1



 ∂S = ∂R = ∂A− + ∂A+ + ∂S + ∂R − 1
d
d
+
 ∂ R̄ = ∂R − ∂B − ∂Rd



 ∂Ac = 2∂A− − ∂A + ∂A+ + ∂S + ∂R − ∂B + − 1
m
0
3.3
d
(3.31)
d
Controlador do NMB
Introduzido o método de projecto de um controlador polinomial, considera-se nesta secção
a sua aplicação à colocação de pólos para o bloqueio neuromuscular, NMB (
blockade ).
neuromuscular
Em primeira instância é necessária a análise do modelo de um paciente, ou
seja, dos seus pólos e zeros. Escolheu-se, de uma forma arbitrária o modelo
M56
do banco
de modelos, referido na secção 2.1, como modelo do paciente para o qual se demonstra o
método de projecto. Este tem a seguinte função de transferência factorizada
M56 =
B(q)
−3.204 × 10−4 (q + 3.409)(q − 0.9717)(q + 0.2441)
=
A(q)
(q − 0.987)(q − 0.9696)(q − 0.9193)(q − 0.7652)
(3.32)
Após análise dos pólos e zeros, decidiu-se não se cancelar nenhum pólo e cancelar os zeros
bem amortecidos em
−0.2441
e
0.97173 .
De notar que apesar dos valores serem para um
modelo especíco, para os outros modelos a localização dos pólos não varia de forma a que
se possa repensar em outro cancelamento diferente do efectuado. Ficam assim denidos
os polinómios
A
e
B


A+ = 1



 A− = A

B + = (q + 0.2441)(q − 0.9717)



 B − = K(q + 3.409)
3 realizaram-se
(3.33)
testes sem o cancelamento do zero em 0.9717, mas os péssimos resultados levaram a que não se colocasse
mais essa hipótese.
24
3.3. Controlador do NMB
em que
K = −3.204 × 10−4 .
A especicações da função de transferência desejada (3.17), têm apenas de obedecer à
restrição dada por (3.19). Tomando a desigualdade como igualdade para que o atraso seja
o mínimo possível e
∂Am = ∂A
de forma à solução da equação
diofantina
ser de ordem
mínima, obtém-se
∂Bm = ∂Am − ∂A + ∂B = 3
assim a partir de (3.18) tem-se
∂ B̄m = ∂Bm − ∂B − = 3 − 1 = 2
e logo
B̄m = t0 q 2
ou seja,
B̄m
(3.34)
é um atraso multiplicado por um ganho, tal como na equação (3.8). Para que
resposta do sistema tenha um ganho estático unitário é necessário que
Bm (1)
B̄m (1)B − (1)
=
=1
Am (1)
Am (1)
(3.35)
donde, substituindo (3.34) em (3.35) obtém-se
t0 =
Em relação à dinâmica de
Am ,
Am (1)
B − (1)
(3.36)
dado ser um polinómio de 4
a ordem, o polinómio vai
ser especicado geralmente por meio de dois pares de pólos complexos conjugados, não
signicando isto que as raízes não possam ser reais. Os valores em concreto serão indicados
posteriormente na secção 3.4.
Atendendo a que se pretende ter um sistema estável, as
raízes terão de estar no círculo de raio unitário.
Pretende-se ainda que a resposta do
sistema não manifeste uma sobrelevação inicial e tenha um tempo de estabelecimento o
mais curto possível, mas tal dependerá em grande parte da resposta do paciente ao
bolus
inicial como se pode constatar na secção 2.3.
O polinómio
observador verica a equação (3.31), pois prentende-se dotar o controlador
das propriedades de rejeição de perturbações e ruído de alta frequência, referidas na secção
3.2. Logo, o grau do observador será
∂Ac0 = 2 × 4 − 4 + 0 + 1 + 1 − 2 − 1 = 3
A escolha das raízes do
observador
não é imediata, impondo um compromisso entre ro-
bustez do sistema face a erros de modelação e da sensibilidade aos efeitos do ruído de
alta frequência. Este assunto será abordado com maior detalhe na secção 3.4, restando
25
apenas dizer que inicialmente se escolhem todas as raízes na origem, de forma a que os
transitórios de observação se extingam o mais rapidamente possível. Como consequência
tem-se
Ac0 = q 3
Os polinómios do controlador
R, S
e
T
(3.37)
cam implicitamente denidos através da equação
(3.22) e de (3.33) até (3.37). O polinómio
Am
denido como
Am = (q − 0.7 + 0.1i)(q − 0.7 − 0.1i)(q − 0.85)(q − 0.85)
é equivalente à seguinte notação
(3.38)
Am ∈ {0.7 ± 0.1i, 0.85}, sendo esta traduzida da seguinte
forma: o primeiro elemento representa um par de pólos complexos conjugados e o segundo
uma raíz dupla, sendo esta a notação usada ao longo da tese.
Com a denição de
Am
anterior, resultam os seguintes polinómios do controlador

5
4
3
2

 R = q − 0.4498q − 1.0650q − 1.2626q + 0.6227q + 0.1597
S = 103 (−0.8229q 5 + 1.9222q 4 − 0.6949q 3 − 1.5209q 2 + 1.5170q − 0.4021)


T = −1.5939q 5
3.4
(3.39)
Estudo Comparativo
Nesta secção, são apresentados resultados obtidos com o método de projecto descrito
na secção 3.3, sendo a maioria deles retirados do relatório técnico [15]. De referir, que
as simulações que se apresentam nesta secção foram efectuadas recorrendo à ferramenta
Simulink
do programa
MATLAB.
Nos restantes capítulos em que as simulações são
efectuadas com o esquema do controlador comutado, as simulações efectuaram-se através
de código. Tal não invalida, de forma alguma, as conclusões retiradas sobre o desempenho
de um controlador com colocação de pólos para o bloqueio neuromuscular nesta secção.
Pretende-se apresentar nesta secção um estudo comparativo entre os diversos níveis de
complexidade do controlador e entre as diferenças de especicação dos controladores para
diferentes modelos. Em seguida apresentam-se três exemplos que demonstram a relação
causa-efeito dos termos de melhoria de desempenho.
3.4.1 Exemplo 1: sem termos de melhoria de desempenho
Este exemplo consiste num controlador projectado para o modelo
adicionados os termos de melhoria de desempenho
Rd
e
Sd .
M56 , em que não foram
Na Figura 3.3 podem ser
observadas as respostas do nível do bloqueio neuromuscular (a) e da acção de controlo
26
3.4. Estudo Comparativo
(b), tendo sido realizado um
zoom
nas áreas de interesse de ambos as respostas.
simulação da Figura 3.3 a dinâmica especicada foi dada por
Na
Am ∈ {0.7 ± 0.1i, 0.85}.
c
Em relação aos pólos do polinómio observador, A0 , estes foram colocados na origem
de forma a que a sua acção se extinga o mais rapidamente possível, não inuenciado a
dinâmica especicada para
Am .
Os pólos do observador serão sempre colocados na origem
caso não se adicione ruído à saída do processo.
Figura 3.3: Simulação para o modelo M56 sem termos de melhoria de desempenho. (a) - resposta do
nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ].
Como se pode observar na Figura 3.3, o controlador polinomial teve um seguimento
bastante bom, mas mesmo assim existe um erro estático em regime estacionário de 0.2%.
Na Figura 3.4, observa-se a resposta do mesmo modelo com o mesmo controlador, mas
com uma perturbação na acção de controlo (na bomba que controla a seringa de infusão)
de
20 µg kg −1 ,
no instante
150 min.
Figura 3.4: Simulação para o modelo M56 com uma perturbação na acção de controlo em t = 150 min.
(a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ].
27
O sistema de controlo rejeitou a perturbação, mesmo sem o termo de rejeição de perturbações, devendo-se isto ao facto do próprio modelo ter um pólo perto 1.
Na Figura 3.5 estão as mesmas respostas para o mesmo modelo mas com ruído, com
uma variância unitária, adicionado na saída.
Atendendo a que na presença de ruído é
necessário mudar as especicações do controlador, tando na dinâmica prentedida como
na dinâmica do observador, é necessário tornar-los mais lentos,
origem.
Ficando assim
Am ∈ {0.85, 0.89}
c
e A0
∈ {0.92}.
i.e.,
afastar os pólos da
De referir ainda que nas
simulações com ruído não se utilizou o controlador proporcional, começando assim o
controlador polinomial a trabalhar após
tcl min
(ver secção 2.4), o que permitiu eliminar
uma sobrelevação inicial que ocorreria com o uso do controlador proporcional.
Figura 3.5: Simulação para o modelo M56 com ruído de variância unitária. (a) - resposta do nível de
bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ].
3.4.2 Exemplo 2: acção integral
Neste exemplo, ver Figura 3.6, demonstra-se o efeito da adição de termo
Rd ,
ou seja, da
acção integral, no sistema de controlo. O modelo e dinâmica especicada são os mesmos
(caso sem ruído).
Como seria de esperar, pela observação da Figura 3.6, o erro estático em regime estacionário foi eliminado com a adição da acção integral.
3.4.3 Exemplo 3: rejeição do ruído de alta frequência
Com a introdução do termo
Sd no controlador (ver subsecção 3.2.2), a resposta na presença
de ruído melhora signicativamente, não sendo afectada caso não exista ruído. Na Figura
3.7 pode ser visualizada a resposta ao mesmo modelo,
28
M56 ,
com
Am ∈ {0.8, 0.92 ± 0.2i},
Figura 3.6: Simulação para o modelo M56 com acção integral. (a) - resposta do nível de bloqueio
neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ].
Ac0 ∈ {0.95}
e ruído com uma potência de
0.1.
Figura 3.7: Simulação para o modelo M56 com o termo Sd . (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ].
Comparando as Figuras 3.5 e 3.7, conclui-se que de facto o termo
obtenção de um melhor seguimento. A inclusão do factor
Sd
permitiu a
z + 1 no polinómio S
revelou-se
de grande importância no projecto do controlador com colocação de pólos para o NMB,
isto porque sem este termo e com o termo de acção integral e ruído não se conseguiram
obter respostas adequadas.
O termo
Sd
não permite apenas melhorar o seguimento da referência na presença de
ruído, é também capaz de dotar o controlador de robustez. O exemplo seguinte explica e
demonstra esse mesmo facto.
29
3.4.4 Exemplo 4: robustez
Com a inclusão do termo
Sd
a função de sensibilidade tem o valor unitário na frequência
de Nyquist, isto permite uma maior margem de estabilidade, com consequências directas
nas especicações do controlador. Nas Figuras 3.8 e 3.9 apresentam-se duas simulações
para os modelos
M56
que os pólos de
Am
e
M69 ,
respectivamente, sem a inclusão do termo
Sd
tivessem de ser ajustados à medida de cada caso.
o que implicou
Como se pode
Figura 3.8: Simulação para o modelo M56 com Am ∈ {0.75, 0.85}. (a) - resposta do nível de bloqueio
Figura 3.9: Simulação para o modelo M69 com Am ∈ {0.8, 0.94}. (a) - resposta do nível de bloqueio
observar em ambas as guras, o seguimento da referência foi bom, mas foi necessário
escolher uma dinâmica de
rápido, como o
M56 ,
Am
de acordo com o respectivo modelo.
é necessário uma dinâmica em cadeia fechada com um tempo de
estabelecimento menor, do que o caso com um modelo lento, como o
30
Para um modelo
M69 , em que o tempo
de estabelecimento foi cerca de
19.8 min
mais lento. Este tempo de estabelecimento é
calculado a partir da resposta ao escalão unitário da função de transferência em cadeia
fechada
Hm
(não confundir com o tempo de estabelecimento denido na secção 6.1) em
que se dene o tempo de estabelecimento da saída em torno da referência. Se se impusesse
uma dinâmica mais rápida em relação à anterior, por exemplo
Am ∈ {0.7, 0.8},
estes dois
sistemas teriam respostas na acção de controlo instáveis, em que o nível do bloqueio
neuromuscular cava permanentemente saturado nos
0%.
Por essa razão não se colocam
os grácos dessas simulações. Contudo, nas Figuras 3.10 e 3.11 podem ser observadas as
simulações efectuadas com
M56
e
M69 ,
Am ∈ {0.7, 0.8}
e com termo de robustez
Sd
para os modelos
respectivamente.
Figura 3.10: Simulação para o modelo M56 com Am ∈ {0.7, 0.8} e termo Sd . (a) - resposta do nível de
Figura 3.11: Simulação para o modelo M69 com Am ∈ {0.7, 0.8} e termo Sd . (a) - resposta do nível de
Analisando as Figuras 3.10 e 3.11 conclui-se que, de facto, o termo
Sd permite aumentar
31
a margem de estabilidade.
Em seguida apresenta-se um exemplo que demonstra as diferenças nas especicações do
controlador, nomeadamente nos pólos de
Am ,
consoante o tipo do modelo, tendo já sido
abordado neste exemplo anterior. Com este exemplo pretende-se dar um maior destaque
a este pormenor e ainda mostrar a inuência do ruído na especicação de
Am
e de
Ac0 .
3.4.5 Exemplo 5: Am em função do modelo e do ruído
Com ruído de potência
0.01 adicionado à saída do sistema, é necessário tornar a dinâmica
especicada para a cadeia fechada mais lenta. Esta será ainda mais lenta caso o modelo
a controlar seja um modelo dos chamados lentos. Nas Figuras 3.12 e 3.13 apresentam-se
duas simulações para os modelos
M10
(rápido) e
M39
(lento), respectivamente.
Figura 3.12: Simulação para o modelo M10 com Am ∈ {0.8, 0.92 ± 0.2i} e Ac0 ∈ {0.85}. (a) - resposta do
A dinâmica especicada para o modelo rápido tem um tempo de estabelecimento
16 min
mais rápido do que para o modelo lento. De notar ainda que, os pólos do obser-
vador foram retirados da origem, devido ao facto de se ter adicionado ruído na simulação.
O efeito dos pólos do observador na presença de ruído será discutida no seguinte exemplo.
3.4.6 Exemplo 6: efeito do observador Ac0
A escolha do observador segundo [5], obedece a um
tradeo
entre a sensibilidade a per-
turbações na entrada do processo e a sensibilidade ao ruído na medida dos sensores. Caso
se pretenda ter em conta a rejeição de perturbações na entrada, o observador deverá ser
rápido, usualmente é colocado na origem, mas tal permite, caso exista ruído, que este
inuencie negativamente a resposta do sistema. Caso a rejeição de ruído fosse mais im-
32
Figura 3.13: Simulação para o modelo M39 com Am ∈ {0.8, 0.94} e Ac0 ∈ {0.97}. (a) - resposta do nível
de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ].
portante, as raízes do observador deveriam ser colocadas em por exemplo
0.9,
tornando o
observador mais lento. Com isto o ruído seria reduzido, mas a atenuação das perturbações
na entrada não seria tão ecaz. Por estas razões nas simulações em que não se adiciona
ruído, o observador é colocado na origem, caso contrário torna-se o observador bastante
mais lento. As perturbações na entrada para o bloqueio neuromuscular não são preocupantes, pois como foi visto no
mesmo sem o termo
Exemplo 1
o sistema rejeita perturbações na entrada
Rd .
Nas Figuras 3.14 e 3.15 podem ser visualizada duas simulações para o mesmo modelo,
M10 ,
com a mesma dinâmica
Am ,
mas com observadores,
Ac0 ,
distintos.
Analisando o conjunto das Figuras 3.12, 3.14 e 3.15 em que o único parâmetro de simulação variável é o observador,
Ac0 ,
conrma-se exactamente o esperado. À medida que o
33
observador cou mais lento de
34
0.2 para 0.5 até 0.85 a resposta melhorou signicativamente.
Capítulo 4
Controlo Comutado com Múltiplos
Modelos
Neste capítulo é descrito o controlador comutado com múltiplos modelos. Esta estratégia
de controlo é baseada num banco de modelos e na comutação de um número nito de
controladores, de acordo com um critério de selecção baseado na minimização do erro
de identicação/predição. Existem três blocos fundamentais: multi-estimador, lógica de
decisão e banco de controladores. Para os dois primeiros são apresentados técnicas alternativas. A construção do banco de controladores é descrita, posteriormente, no capítulo
5.
4.1
Introdução
Em sistemas complexos, onde está presente uma elevada incerteza no conhecimento do
sistema a controlar, as metodologias tradicionais de controlo não fornecem um desempenho
satisfatório. Tal facto levou ao desenvolvimento de novas estratégias de controlo, de que
é exemplo o controlo comutado [16, 17, 18, 19].
No controlo comutado é construído um banco de controladores candidatos, existindo
ao longo do tempo uma comutação do controlador em uso, tendo em conta as medidas
efectuadas na saída do sistema.
A comutação obedece a uma lógica projectada com o
objectivo de usar as medidas efectuadas no processo para decidir se o desempenho do
controlador em uso se deve manter ou não, escolhendo então a melhor alternativa [4].
A principal diferença entre o controlo comutado considerado nesta tese e os algoritmos
adaptativos baseados numa anação contínua é o uso de lógica no supervisor de forma a
controlar o processo de aprendizagem. É possível classicar estes algoritmos em classes de
35
Capítulo 4. Controlo Comutado com Múltiplos Modelos
controladores, algoritmos que usem supervisores híbridos (combinam dinâmica contínua e
controladores supervisionados, enquanto algoritmos que
usem leis de anamento contínuo são conhecidos como controladores adaptativos.
Nos últimos anos, a utilização de controladores supervisionados tem emergido como
uma alternativa aos controladores adaptativos, sendo este facto devido às vantagens delógica discreta) são denominados
scritas em [20] e resumidas aqui de seguida:
Adaptação Rápida.
Dado que o sinal de comutação não está restrito a variar continua-
mente, isto permite uma adaptação mais rápida a mudanças repentinas na dinâmica
do sistema a controlar. Ter uma adaptação rápida é crítico em algumas aplicações
como é o caso do controlo do bloqueio neuromuscular, pois o desempenho pode
deteriorár-se signicativamente devido a uma súbita alteração na dinâmica do paciente.
Flexibilidade e Modularidade.
O controlo supervisionado tem uma arquitectura mod-
ular, permitindo assim a separação entre o banco de controladores e o mecanismo de
identicação,
i.e., o supervisor.
Isto permite utilizar qualquer técnica desejada para
o projecto dos controladores (neste trabalho usa-se a colocação de pólos baseada em
técnicas polinomiais), enquanto que com o controlo adaptativo os controladores têm
de ser projectados à medida do mecanismo de anação, deixando pouca liberdade
para o projecto do controlador.
Separação entre Supervisão e Controlo.
Entre tempos de comutação o processo está
ligado a um dos controladores candidatos e a dinâmica do supervisor não interfere
na evolução do resultado do sistema em cadeia fechada. Isto simplica consideravelmente a análise do algoritmo global. Esta separação permite ainda que não linearidades que se manifestem no supervisor não interram na dinâmica do sistema. Caso
o processo e o controlador candadidato sejam lineares, o sistema em cadeia fechado é
linear entre tempos de comutação, tal não acontece com o controlo adaptativo, onde
o sistema em cadeia fechada é sempre não linear.
4.2
Estrutura do Controlador Comutado
A estrutura do controlador comutado pode ser observada na Figura 4.1, onde
o sinal de controlo,
σ
w
perturbações e ruído no sistema a controlar,
o sinal de comutação e
φ
a medida da saída,
o sinal índice de classe.
Existem dois tipos de supervisores, os
36
y
u representa
Baseados no Desempenho que são caracter-
4.2. Estrutura do Controlador Comutado
Figura 4.1: Esquema do Controlador Comutado, [4].
izados por tentar estimar directamente o desempenho dos controladores candidatos, sem
estimarem o modelo do processo. Neste trabalhado é usado um outro tipo de supervisor,
Baseado na Estimativa.
Este método foi sugerido pelo Professor João Hespanha e cor-
responde a uma particularização de [4], em que se pretende determinar qual dos modelos
do banco está mais próximo do modelo do processo.
Na Figura 4.2 está representado o esquema do supervisor usado. Este é composto por
três blocos: multi-estimador, índice de desempenho e lógica de decisão. A saída do
estimador
gera estimativas da saída
ypi ,
pelo valor de saída medido do processo
y
com
i = 1, . . . , N .
multi-
Estas ao serem subtraídas
originam os erros de predição
epi .
Ao erro de
predição é realizada uma ltragem.
Figura 4.2: Supervisor Baseado na Estimativa.
O multi-estimador é projectado segundo o princípio geral que se o modelo do processo
pertence ao banco de modelos, então a correspondente estimativa de saída
a saída do processo
y
e assim o erro predição
ep
ŷ
deve igualar
deve ser pequeno. Assim cada
ep
pode ser
pensado como uma medida da versomilhança que o modelo do processo esteja no banco
37
de modelos,
M.
O projecto dos multi-estimadores será analisado na secção 4.5.
Após a obtenção do erro de predição
ep
é gerado um índice de desempenho
πp
que
dá uma medida da potência do erro de predição. A obtenção dos índices de desempenho
será analisada também na secção 4.5, dado que estes estão intimamente ligados ao tipo
de multi-estimador.
A lógica de decisão é o bloco nal que tem como objectivo comparar os índices de
desempenho, escolhendo assim aquele que tiver o menor índice de desempenho para ser
o controlador que está ligado ao processo. Estas decisões contínuas geram o sinal de comutação
σ.
Na secção 4.4 são descritas duas implementações, com abordagens diferentes,
para a lógica de decisão.
Como foi referido na secção 2.1 está dísponivel um conjunto de modelos
1, . . . , N },
visor.
sendo este conjunto usado para formar o banco de modelos presente no super-
Nos trabalhos realizados em [16, 17, 18] com controladores comutados o banco
de controladores,
(N
M = {Mj , j =
= Nc ).
modelo
Mj ,
C = {Cj , j = 1, . . . , Nc }
Assim cada controlador
com
Cj
tem a mesma dimensão do banco de modelos
era projectado e/ou anado para o respectivo
j = 1, . . . , N .
Nesta tese, é proposta uma alteração no banco de controladores. Pretende-se avaliar
o desempenho de um banco de controladores com um número bastante inferior de controladores em relação ao número de modelos. Isto signica que cada controlador é projectado para um conjunto de modelos e não apenas para um modelo. Com esta alteração
pretende-se obter um melhor desempenho do supervisor nomeadamente na convergência
para o modelo do paciente. Dado que um controlador está ligado a um conjunto de modelos, caso o sinal de comutação esteja dentro desse mesmo conjunto não haverá alteração
de controlador, evitando assim possíveis transitórios indesejáveis, instabilidades e excesso
de comutação. Por isso foi criado o sinal índice de classe,
φ,
que é equivalente ao sinal de
comutação, mas comuta apenas entre os modelos que são controladores.
Para os algoritmos de controlo em que não seja possível ter um projecto automático
de um número elevado de controladores e seja necessário projectar um a um, esta nova
abordagem é também claramente benéca.
A construção do banco de controladores, é
abordada e discutida no capítulo 5.
4.3
Esquema com Integrador Comum e Anti-colagem
Como se pode ver na Figura 4.1 à saída do banco de controladores existe um integrador
comum a todos os controladores. Tal deve-se à necessidade de assegurar uma transferência
38
4.3. Esquema com Integrador Comum e Anti-colagem
suave entre controladores diferentes [16]. Assim, caso o projecto dos controladores locais
tenha um termo integral este deve ser retirado ou reformulado.
Com a introdução da acção integral, e estando esta em série com uma saturação podem
existir problemas. Se o erro gerado pelo sinal de controlo é grande o suciente para que o
integrador sature o actuador, a realimentação será quebrada, pois o integrador permanece
saturado mesmo se a saída do processo se alterar. Assim sendo, o integrador de um sistema instável, pode integrar até um valor elevado. Quando o erro car menor, o integral
vai demorar demasiado tempo até retornar a um valor normal. Este efeito é conhecido
como
colagem (windup ).
É necessária a concepção de um esquema que evite estes efeitos
indesejados. Em [15] resolveu-se este problema a partir do esquema de
anti-colagem
para
controladores PID, adaptado aos controladores locais projectados com técnicas polinomiais. Em [5] é descrito outra abordagem para a resolução do problema em que o controlador
local é projectado segundo técnicas polinomiais, a qual se descreve em seguida. Na Figura
4.3 pode ser observado um diagrama do referido esquema.
Figura 4.3: Esquema de anti-colagem para o controlador polinomial, [5].
Seja
Aaw (q)
o polinómio característico desejado do observador de
deve ser mónico, estável e da ordem do controlador. Adicionando
anti-colagem,
Aaw (q)u(k)
este
em ambos
os membros de (3.2) obtém-se
Aaw u = T rc − Sr + (Aaw − R)u
(4.1)
Assim, do esquema da Figura 4.3 é possível retirar o par de equações
(
Aaw v = T rc − Sr + (Aaw − R)u
u = sat(v)
equivalentes a (4.1) quando a variável de controlo
saturação a dinâmica é imposta pelo observador
u
Aaw .
não está saturada.
(4.2)
Caso exista
Apresenta-se agora uma versão
39
deste esquema de
anti-colagem
adaptado ao controlo comutado, em que os polinómios
estão representados no operador atraso
q −1
(como se pode ver pelo
∗),
o qual pode ser
observado na Figura 4.4. A parte à esquerda na Figura 4.4, representa o controlador em
Figura 4.4: Esquema de anti-colagem para o controlo comutado com integrador comum.
uso, enquanto a parte da direita representa o esquema de
comum. Como é referido na secção 3.2.1, o polinómio
anti-colagem
com o integrador
R é dado pela equação (3.24), assim
em regime de funcionamente linear a função de transferência do esquema de
anti-colagem
com o integrador comum é dada por
1
∆u
1
1
A∗aw
=
= ∗ =
A∗aw −Rd∗
u
Rd
1 − q −1
1 − A∗
(4.3)
aw
que como seria de esperar é a função de transferência de um integrador.
4.4
Lógica de Decisão
O índice
σ
do controlador ligado ao processo é determinado pela lógica de decisão, que
segue o princípio que o modelo com melhor desempenho implica o melhor desempenho
do respectivo controlador.
Nesta secção são apresentados dois mecanismos, o
Tempo
de Permanência e a Histerese com Escala Independente, que têm o objectivo de
evitar comutação de alta frequência entre controladores e prevenir assim instabilidade que
poderia ocorrer devido a uma comutação demasiado rápida.
40
4.4. Lógica de Decisão
4.4.1 Tempo de Permanência
Esta lógica é descrita pormenorizadamente em [16] e um esquema representativo pode ser
observado na Figura 4.5.
Figura 4.5: Lógica de Decisão do tipo Tempo de Permanência, [4].
Este mecanismo impõe um período de tempo mínimo para que um controlador que
tenha sido escolhido como o controlador a utilizar esteja ligado ao processo. Este período
de tempo mínimo é denominado
tempo de permanência, τD .
Este pode ser também
denido como o mínimo intervalo de tempo entre descontinuidades sucessivas do sinal de
comutação.
4.4.2 Histerese com Escala Independente
A ideia por detrás desta lógica [19] é diminuir a comutação baseando-se na observação do
tempo de permanência
Figura 4.6 está presente o esquema da lógica de decisão com histerese.
crescimento dos erros de predição em vez de forçar um
Em cada instante, o índice de desempenho do modelo actualmente em uso
parado com os valores dos outros modelos
Sendo que caso a desigualdade retorne
n,
πp
xo. Na
πρ
é com-
de acordo com a equação da Figura 4.6.
o que signica que o desempenho do modelo
actual se degradou ao ponto de ser necessário escolher um novo modelo, que será o que
tiver o menor índice de desempenho
πp .
Caso contrário, apesar de
πρ
poder não ser o
menor índice de desempenho este valor ainda está relativamente perto do mínimo, não
sendo por isso necessário realizar alteração do sinal de comutação e evitando assim a comutação excessiva. O relativamente perto depende da constante de histere,
h,
que é uma
constante positiva.
41
Figura 4.6: Lógica de Decisão do tipo Histerese
4.5
com Escala Independente,
[4].
Multi-Estimadores
Nesta secção são apresentados dois tipos de multi-estimadores e são discutidas as diferenças entre ambos.
4.5.1 Estimador do Erro de Predição com Índices de Desempenho
Esta abordagem para o estimador é baseada na dinâmica de um observador.
Os esti-
madores são construídos segundo [16] tendo já sido aplicado este método na resolução do
problema de controlar o bloqueio neuromuscular em anestesia com bons resultados [1].
Prediction Error Performance Index ) em algumas
O estimador será referido como PEPI (
partes de forma a tornar o texto mais compacto.
Seja cada modelo
Mj = (Aj , Bj )
com
j = 1, . . . , N
representado pelo seguinte modelo
ARX
Aj (q −1 )yj (k) = Bj (q −1 )u(k − 1) + ēj (k)
onde se assumiu atraso unitário (m
= n − 1),
(4.4)
tal como se verica no modelo do bloqueio
neuromuscular, ver secção 3.3. Assim

n
P

 Aj (q −1 ) = 1 + aj,i q −i
i=1
m
P

−1
 Bj (q ) = bj,i q −i
i=0
são os polinómios no operador atraso
de
42
n
e
m,
q −1 ,
respectivamente para todos o
em que
Aj
j = 1, . . . , N .
é mónico e
Em (4.4)
Bj
ēj (k)
com ordens xas
é uma sequência
4.5. Multi-Estimadores
de variáveis independentes e identicamente distribuidas de média nula, representando
perturbações não modeladas.
Considere-se agora o problema de concepção dos preditores, através da inserção em
(4.4) do polinómio observador
n
X
A0 (q ) = 1 +
a0,i q −i
−1
i=0
Adicione-se
Ap0 (q −1 )yj (k) − Aj (q −1 )yj (k)
em ambos os membros de (4.4) resultando em
Ap0 yj (k) = (Ap0 − Aj )yj (k) + Bj u(k − 1) + ēj (k)
1
(4.5)
A equação (4.5) motiva a denição do seguinte estimador
ŷj (k) = (Ap0 − Aj )
1
1
p y(k) + Bj p u(k − 1)
A0
A0
(4.6)
A ideia por detrás da equação (4.6) é de que se o modelo do processo coincidir com o
modelo
Mj , y
deve coincidir com
yj ,
o que implica
y(k) − yj (k) = yj (k) − ŷj (k) =
e dado que
Ap0
1
ēj (k)
Ap0
(4.7)
é escolhido de modo a ser estável, a parte deterministica da estimativa
ŷj
deve ser assimptóticamente exacta.
Como se pode constatar em (4.7) o erro de predição é uma ltragem passa-baixo
das perturbações.
Se for escolhido um observador rápido,
i.e.,
com todas as raízes do
p
polinómio A0 na origem, não existe ltragem. De modo a conferir propriedades de robustez
com respeito à dinâmica não modelada, uma escolha adequada das raízes do observador
é feita escolhendo as raízes no segmento real entre 0 e 1 (observador mais lento).
Implementação
Apresentam-se agora os passos para a o cálculo da estimativa
1. Realizar as actualizações de
yf (k)
e
uf (k)
ŷj (k)
através de

n
P

 yf (k) = y(k) − a0,i yf (k − i)
i=0
n
P

 uf (k) = u(k) − a0,i uf (k − i)
(4.8)
i=0
1 deixou-se
cair o argumento indicativo da variável independente nos polinómios de modo a simplicar a escrita.
43
2. Calcular a estimativa através de
ŷj (k) = θjT xE (k)
com
θj
(4.9)
denido como
a0,1 − aj,1


.

.
.


 a0,n − aj,n
θj := 

bj,0


.

.
.

bj,m












e a estimativa de estado partilhada dada por






xE (k) := 






yf (k − 1)
.
.
.
yf (k − n)
uf (k − 1)
.
.
.
uf (k − m − 1)











Índice de Desempenho
Como referido na secção 4.2, após a obtenção do erro de predição
índice de desempenho
πp
ep ,
é produzido um
calculado através da seguinte ltragem passa-baixo
πp (k) = λp πp (k − 1) + (1 − λp )e2p (k)
A constante do ltro
0 ≤ λp ≤ 1
Em [16, 17, 18] é utilizado um
(4.10)
pode ser interpretada como um factor de esquecimento.
λp
constante, neste trabalho usa-se um factor de esqueci-
mento variável, que foi um factor determinante no sucesso do trabalho realizado em [21].
A ideia por detrás de um
λp
variável é que a adaptação deverá ser maior ou menor
consoante a excitação na entrada. Mas a escolha do seu valor envolve um
um
λp
elevado a adaptação é muito lenta, enquanto para um
λp
tradeo.
Para
baixo a adaptação é
demasiado agressiva resultando na perda de informação relevante e adaptação excessiva.
A heurística é a de quando existe pouca excitação na entrada o esquecimento de dados
passados deve ser suspensa, através da escolha
λp
deve ser igualada a uma constante especicada
pode ser realizada segundo duas métricas:
44
λ = 1.
λ0 .
Caso exista excitação suciente,
A medida de excitação na entrada
1. erro de predição ep = yp − y
2. erro de controlo ec = rc − y
Assim durante um período em que a métrica escolhida exceda um certo
colocado em
λ0 < 1.
dados passados.
Caso contrário,
A escolha do
sistema em questão.
λ
limiar
limiar, λp
é
é colocado a 1 e não existe esquecimento dos
é diferente para cada métrica e dependente do
Neste trabalho, optou-se ainda por colocar
λp = 0.975
metade do limiar é excedido. Assim, caso o erro esteja acima do limiar
λp = λ0 = 0.85,
quando o erro começar a diminuir até apenas exceder metade do limiar
nalmente quando estiver abaixo de metado do limiar
quando o
λp = 0.975
e
λp = 1.
Desvios em Relação à Linearização
Dado que o modelo do paciente é não linear e sendo necessária a descrição dos modelos
do banco segundo modelos de entrada/saída
secção 2.2). Existe assim um desvio de
pode ser resolvido derivando
(
y
e
y
e
(Aj , Bj ),
u
foi realizada uma linearização (ver
na entrada do supervisor. Este problema
u
usupervisor (k) = u(k) − u(k − 1)
(4.11)
ysupervisor (k) = y(k) − y(k − 1)
Esta derivada resolve o problema referido, mas tem o inconveniente de uma derivada
aumentar o ruído de alta frequência. Com o intuito de resolver o problema dos desvios,
sem aumentar, o ruído é apresentado outro multi-estimador na secção 4.5.2.
4.5.2 Estimador por minimização do erro quadrático médio
Apresenta-se agora uma abordagem diferente para a estimação da resposta dos modelos
ŷi , em que se resolve um problema da minimização do erro de predição calculando o desvio
para cada modelo. Este assunto é abordado com maior detalhe em [20]. O texto que a
seguir se apresenta, tem como base notas cedidas pelo Professor João Hespanha, sobre
Least Mean Squares ) em
o problema dos desvios. O estimador será referido como LMS (
algumas partes de forma a tornar o texto mais compacto. Considere-se a seguinte situação
em que o modelo do processo é dado por
(
As = Bu
y =s+b
(4.12)
45
e onde os polinómios
AeB
são desconhecidos (modelo do paciente),
b
pois podem ser medidos, enquanto
valor correcto
s.
y
e
u são conhecidos
(desconhecido) representa o desvio em relação ao
O seguinte preditor é assimptóticamente correcto para o modelo de
(4.12)
A
B
ŝ = 1 −
s+ u
ω
ω
onde
ω
(4.13)
é um polinómio estável, que realiza uma ltragem no erro de predição. A partir
de (4.12) e (4.13) obtém-se
A
B
ŷ = ŝ + b = 1 −
s+ u+b
ω
ω
(4.14)
O mesmo raciocínio pode ser aplicado para os múltiplos modelos
(
Ai si = Bi u
(4.15)
yi = si + bi
usando para estes o seguinte preditor
Bi
Ai s + u + bi
ŷi = 1 −
ω
ω
Dado que
y.
(4.16)
s não está disponível, é necessário expressar os preditores em função da medida
Para tal, substitui-se
s
por
y − bi
o que é correcto para o modelo em causa:
Ai Bi
Ai Bi
Ai
ŷi = 1 −
(y − bi ) + u + bi = 1 −
y + u + bi
ω
ω
ω
ω
ω
(4.17)
O erro de predição é assim dado por
ŷi − y = −
Ai
Bi
(y − bi ) + u
ω
ω
Este preditor possui assim a propriedade fundamental de que se existir
(na medida em que
Ai = A, Bi = B
ŷi − y = −
e
bi = b)
(4.18)
model matching
tém-se
Bi
A
B
A
B
Ai
(y − bi ) + u = − (y − b) + u = − s + u → 0
ω
ω
ω
ω
ω
ω
e, como foi referido anteriormente, o preditor (4.13) é assimptóticamentel exacto.
Obtida uma expressão para o preditor, formula-se agora o problema de optimização.
Num instante
Kf
pretende-se escolher o modelo que minimiza o erro de predição
arg min
i∈M
46
Kf
X
k=0
(yi (k) − y(k))2
(4.19)
Para a geração do erro de predição pode ser usada a linearidade nos desvios
bi
da seguinte
forma:
y i − y = α i + bi β i
(4.20)
Comparando (4.18) e (4.20) tem-se
αi := −
onde
Ai
Bi
y+ u
ω
ω
βi := −
1 representa um escalão unitário na entrada.
Ai
1
ω
(4.21)
Isto permite expressar a selecção do
modelo (4.19) como
Kf
X
arg min
(αi (k) + bi βi (k))2
i∈M
(4.22)
k=0
Desenvolvendo o quadrado obtém-se
Kf
Kf
Kf
X
X
X
2
2
arg min
αi (k) + 2bi
αi (k)βi (k) + bi
βi2 (k)
i∈M
k=0
k=0
É possível obter uma solução de
bi ∈ R
(4.23)
k=0
em forma fechada, derivando (4.23) e igualando a
zero, obtendo-se:
Kf
P
bopt
i
=
αi (k)βi (k)
k=0
− K
Pf
βi (k)2
k=0
(4.24)
Substituindo a solução óptima (4.24) na equação de selecção do modelo (4.23), resulta em
P
Kf
Kf
arg min
i∈M
X
αi2 (k) −
k=0
2
αi (k)βi (k)
k=0
Kf
P
(4.25)
βi (k)2
k=0
Como se pode constatar esta estratégia de multi-estimador não segue exactamente o
esquema da Figura 4.2, na medida em que não se calcula directamente
quência
ep .
ŷ
nem por conse-
Assim, de forma a seguir o esquema conceptual da Figura 4.2, o problema de
optimização é equivalente a considerar-se a seguinte denição para os índices de desempenho
P
Kf
Kf
πpi (k) =
X
k=0
αi2 (k) −
2
αi (k)βi (k)
k=0
Kf
P
(4.26)
βi
(k)2
k=0
47
Pode colocar-se a questão de mostrar que
P
Kf
Kf
X
αi2 (k) −
k=0
2
αi (k)βi (k)
k=0
Kf
P
≥0
(4.27)
βi (k)2
k=0
para qualquer
αi , βi .
Desenvolvendo (4.27) obtém-se
Kf
Kf
Kf
X
2 X
X
2
αi (k)βi (k) ≤
αi (k) βi (k)2
k=0
k=0
sendo esta equação validada pela
(4.28)
k=0
Desigualdade de Cauchy-Schwarz
dada por
|< α, β >|2 ≤k α k . k β k
Factor de Esquecimento
O problema de optimização (4.19) também pode ser formulado adicionando um factor de
esquecimento
0 < λl ≤ 1
Kf
X
Kf −k
arg min
λlms
(yi (k) − y(k))2
i∈M
(4.29)
k=0
o que implica a redenição do índice de desempenho para
P
Kf
Kf
πpi (k) =
X
λK−k
αi2 (k) −
l
k=0
4.6
Kf −k
λl
k=0
Kf
P
αi (k)βi (k)
2
(4.30)
K −k
λl f βi (k)2
k=0
Estudo Comparativo
Nesta secção pretende-se efectuar uma comparação entre as diversas soluções propostas
para blocos do supervisor do controlador comutado. De forma a que as comparações sejam
efectuadas nas mesmas condições, escolheu-se como banco de controladores o presente na
Tabela C.1, sendo este um dos bancos de controladores construídos recorrendo aos métodos
descritos no capítulo 5.
48
4.6.1 Exemplo 1: lógica de decisão
Escolheu-se arbitrariamente o estimador do tipo PEPI (denido em 4.5.1) com um ltro
de predição variável, para efectuar a comparação entre as lógicas de decisão: tempo de
permanência e histerese com escala independente.
simulação efectuda para o modelo
M56
Na Figura 4.7 está representada a
com um tempo de permanência
τD = 5
instantes
de amostragem.
Figura 4.7: Simulação para o modelo M56 com τD = 5. (a) - resposta do nível de bloqueio neuromuscular
r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ e índice de classe φ.
Na Figura 4.8 pode ser observada a simulação para o mesmo modelo, mas com uma
constante de histerese
h = 1.
Analisando as Figuras 4.7a) e 4.8a), conclui-se que com ambas as lógicas o desempenho
do sistema de controlo foi bom. Neste exemplo, é mais interessante analisar os grácos (c)
em que se representam os sinais de comutação (traço sólido), de agregação (tracejado),
modelo nal do sinal de comutação (*, à direita), modelo do centróide nal do sinal de
agregação (*,ao centro) e modelo do centróide do qual pertence o modelo do paciente (*,
à esquerda). Assim, comparando os grácos de (c) constata-se que, apesar de em ambas
49
Figura 4.8: Simulação para o modelo M56 com h = 1. (a) - resposta do nível de bloqueio neuromuscular
r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ e índice de classe φ.
as situações o sinal índice de classe ter convergido para o centróide pretendido, no caso
em que se utilizou o tempo de permanência, existiu um excesso de comutação em relação
à situação com histerese, e o sinal de comutação parece ainda não ter convergido para o
seu valor nal.
Não se pode armar categoricamente a supremacia de uma lógica de decisão sobre a
outra, ambos os casos dão bons resultados, sendo que na maioria das vezes acontece algo
semelhante ao caso exemplicado. Considerando ainda a ideia por detrás de cada lógica,
a histerese é uma lógica pensada com o intuito não só de evitar o excesso de comutação,
mas também com o objectivo que a convergência esteja dentro de um dado limiar. Assim,
pode-se considerar a histerese com escala independente uma melhor escolha para a lógica
de decisão. De referir que estas simulações foram efectuadas com um
o intuito de originar uma maior adaptação,
i.e.,
λ = 0.9
(xo), com
um possível excesso de comutação, de
forma a que se podessem retirar conclusões sobre o desempenho das lógicas de decisão.
50
4.6.2 Exemplo 2: ltro de predição
Com este exemplo o estimador só poderia ser o do tipo Observador, pois só para este
foi denido o ltro de predição. Deseja-se efectuar uma comparação entre um ltro de
predição em que o parâmetro do ltro (factor de esquecimento),
ltro em que
λp
λp ,
é constante e um
varia consoante o erro de seguimento ou de predição estar dentro dum
certo limiar. Na Figura 4.9 pode ser observada a simulação efectuada para o modelo
e para um factor de esquecimento constante com
M69
λp = 0.975.
Figura 4.9: Simulação para o modelo M69 com λp = 0.975. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ e índice de classe
φ.
Na Figura 4.10 pode ser visualizada a simulação para o mesmo modelo, mas com ltro
de predição variável com
e um limiar de erro em
λ0 = 0.85, erro de controlo como medida da excitação na entrada
0.1%.
A variação do valor do ltro de predição em função do erro
de controlo pode ser visualizada em (d) em que se representam o erro de controlo (ec ,
tracejado) e o factor de esquecimento (λp , traço sólido).
Comparando as Figuras 4.9 e 4.10 constata-se que o desempenho do sistema com um
51
Figura 4.10: Simulação para o modelo M69 com λ0 = 0.85 e limiar de ec (t) em 0.1%. (a) - resposta do
nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação
σ e índice de classe φ, (d) - variação de λp (t) em função de ec (t).
factor de esquecimento variável foi superior, visto que o tempo de estabelecimento foi
64 min
mais rápido. Isto deveu-se, neste caso, ao facto da adaptação ter sido demasiado
lenta no caso com
com o
λp
λp
constante, o que originou que a convergência fosse mais lenta. Já
variável, a adaptação foi mais rápida permitindo uma convergência mais rápida
e como consequência um melhor desempenho do controlador comutado. Pode-se arguir
que o valor usado para o factor de esquecimento constante foi demasiado elevado e caso
contrário o resultado poderia ser semelhante ao do
λp
variável. Este facto é verdade, neste
caso, pondendo noutros não se aplicar. Esta é, portanto, a vantagem do esquema com
λp
variável, que permite uma adaptação consoante o desempenho que o controlador esteja a
fornecer.
52
4.6.3 Exemplo 3: multi-estimador
A comparação entre os estimadores LMS e PEPI é efectuada no capítulo 6, onde se apresentam e discutem os resultados das extensas simulações efectuadas. Como nos exemplos
anteriores se usou o estimador PEPI, nesta secção apenas se dá um exemplo do funcionamento típico do estimador LMS. Como se verá no capítulo 6 a taxa de convergência
deste estimador é substancialmente inferior ao estimador PEPI, mas consegue produzir
um desempenho semelhante. O estimador LMS caracteriza-se ainda por uma rápida convergência para o modelo nal, realizando por isso poucas comutações de controladores.
Na Figura 4.11 pode ser observado esse mesmo exemplo, com o modelo
M85
e com a
constante de histerese unitária.
Figura 4.11: Simulação para o modelo M85 e estimador LMS. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ e índice de classe
φ.
53
54
Capítulo 5
Métodos de Agregação de Modelos
Este capítulo apresenta um método para a construção de um banco de controladores,
para ser usado no controlo comutado. A partir de um banco de modelos que se assume
disponível realiza-se uma classicação no espaço dos modelos, por exemplo no espaço
dos parâmetros. Um importante passo na realização da classicação é a escolha de uma
métrica para a distância entre modelos, apresentando-se uma solução na secção 5.2. Em
seguida descrevem-se alguns métodos de agregação, com abordagens distintas. Uns utilizam a estrutura do problema a resolver, enquanto os outros são cegos em relação ao
problema em questão. No nal, é apresentado um estudo comparativo entre os métodos
de agregação.
5.1
Introdução
Nesta tese foi colocado o desao de apresentar uma metodologia para a construção de um
banco de controladores a partir de um banco de modelos, com um número de controladores
substancialmente inferior ao número de modelos. Se não existisse um banco de modelos
poderia usar-se a teoria de [22] onde é descrito um método para a determinação de um
conjunto de modelos para os quais é projectado um conjunto de controladores, para um
esquema de controlo comutado. Considere-se então que se tem à disposição um banco de
modelos
M = {Mj = M (P), j = 1, . . . , N }
onde para o bloqueio neuromuscular se tem
P = [a1
a2
λ1
λ2
λ C50
γ
τ ] ∈ R8
(5.1)
55
Capítulo 5. Métodos de Agregação de Modelos
De forma a obter um número de controladores candidatos
a seguinte partição de
M
em
Nc
Nc N
é necessário realizar
subconjuntos
M=
Nc
[
M(k)
k=1
de maneira a que os modelos em
M(k)
sejam bem regulados pelos controlador
C(k),
em
que
C(k) = Cj
k = 1, . . . , Nc
j = 1, . . . , N
sendo o banco de controladores então denido por
C=
Nc
[
C(k)
k=1
De notar, que nas partes do texto onde o assunto em discussão se centra nos métodos de
agregação o termo controlador será substituido pelo termo centróide e
C(k)
identica a
classe e respectivo centróide. Na Figura 5.1 está representado um exemplo simplicado
do espaço de modelos (que pode ser caracterizado através do espaço dos parâmetros do
modelo do paciente) onde se podem ver os agregados compostos por modelos e por um
modelo central que é o modelo do controlador,
i.e.,
o modelo para o qual o controlador
desse agregado será projectado.
Figura 5.1: Espaço de modelos e a sua agregação.
56
5.2. Métrica de Vinnicombe
Denido o problema, coloca-se agora a questão de como a realizar a partição. Esta é
realizada através de algoritmos de classicação que recebem como argumento o número de
controladores/classes pretendidos(as) e retornam as classes e ainda os centróides (modelos
centrais/controladores) de cada classe.
5.2
Métrica de Vinnicombe
Um factor importante na classicação dos modelos é a denição de uma métrica adequada.
Pretende-se utilizar uma métrica que seja adequada ao problema em questão, ou seja,
que se dois modelos estiverem perto nessa métrica, tal implique que se um controlador
estabilizar um dos modelos também o faça para o outro. A utilização da norma euclidiana
não possui as propriedades desejadas. Com efeito, é possível dar exemplos de sistemas
arbitrariamente perto neste sentido para os quais não há um único controlador que
estabilize ambos.
A distância de Vinnicombe [23], conhecida como
propriedades desejadas.
por
gap
fornece uma medida com as
Esta métrica tem uma topologia igual à da métrica conhecida
[24]. A métrica de Vinnicombe tem a vantagem de não ser tão conservativa em
comparação com a métrica
ν -gap
ν -gap,
gap.
Isto na medida em que se a proximidade na métrica
não for capaz de garantir que um processo perturbado seja estabilizado por um
controlador no qual resulta um certo nível de desempenho mínimo para um dado processo
original, então existe algum controlador que atinge esse mínimo no processo original, e
algum modelo que atinge a condição de proximidade de Vinnicombe. Assim é armado
em [22], que a distância de Vinnicombe é uma métrica mais relevante no domínio do
controlo.
Para dois modelos com iguais dimensões de entrada e saída, a distância de Vinnicombe
é denida como
δν (M1 , M2 ) = k(I + M2 M2∗ )−1/2 (M2 − M1 )(I + M1∗ M1 )−1/2 k∞
(5.2)
e toma valores entre
0 ≤ δν (M1 , M2 ) ≤ 1
Valores baixos relativamente a 1 indicam que um controlador que estabilize
estabilizar
M2
M1
deve
e ainda que os ganhos em malha fechada dos dois sistemas em cadeia
fechada serão semelhantes. Um valor de 0 signica que os modelos são iguais, enquanto
que um valor de 1 signica que os modelos são bastante diferentes.
57
5.3
Métodos de Agregação
Existe uma extensa bibliograa sobre métodos de classicação e algoritmos de agregação,
tendo-se recorrido nesta secção às seguintes referências [6, 25, 7]. A agregação é a classicação não supervisionada de padrões em grupos (agregados), nos quais os seus elementos
devem partilhar atributos comuns.
Diz-se não supervisionada quando se assume que
não existe o conhecimento de decisões anteriores correctas, ou seja, não está disponível
um conjunto de treino classicado.
Os métodos propostos pertencem aos métodos não
paramétricos, pois não se referem a um modelo explícito para os dados que pretendem
classicar.
Estes métodos procuram realizar a classicação a partir da estrutura dos
padrões de treino [7]. Existem diversos critérios de classicação. Um dos mais populares
consiste em identicar grupos compactos de dados concentrados em torno de representantes das classes, designados por centróides. Um segundo critério baseia-se na noção de
distância a um conjunto de pontos. Procura-se que o padrão a classicar esteja próximo
de um padrão de treino da classe em que for classicado (método do vizinho mais próximo). Na Figura 5.2 pode ser observada a representação da taxonomia das metodologias
de agregação.
Figura 5.2: Taxonomia das metodologias de agregação [6].
Num nível superior, existe uma diferença nas abordagens
hierárquica e particional, em
que os métodos hierárquicos produzem uma série de partições aninhadas, enquanto os
particionais apenas produzem uma única.
Os algoritmos hierárquicos criam agregados sucessivamente a partir de agregados já
estabelecidos, podendo estes ser de dois tipos: aglomerativos ou partitivos. Os algoritmos
aglomerativos seguem a abordagem baixo-para-cima, começando cada elemento como
58
5.3. Métodos de Agregação
um agregado e existindo uma fusão sucessiva de agregados em agregados de maior dimensão. Nos partitivos passa-se o oposto: o algoritmo começa com todos os elementos num
único agregado e em cada passo há a divisão dos agregados em agregados menores.
A
representação mais natural do agregamento hierárquico é através de uma árvore denominada
dendograma, que pode ser observado um exemplo na Figura 5.3, representando os
elementos agrupados e os níveis de similaridade a que cada grupo pertence.
Figura 5.3: Exemplo de um dendograma usando um método aglomerativo [7].
Os algoritmos particionais obtêm uma única partição dos dados em vez de uma estrutura de agregação. Estes métodos têm a desvantagem de para dados de elevada dimensão
a construção de
dendogramas
ser computacionalmente proibitiva. Normalmente, estes al-
goritmos criam agregados através da optimização de uma função de custo, sendo o critério
mais usado o dos mínimos quadrados.
Apresentam-se em seguida três métodos de agregação para o controlo comutado.
O
primeiro é um método em que se analisa o sistema especíco a controlar, mas que tem
a desvantagem de não poder ser usado para outro problema. O segundo é um método
particional que pode usar como inicialização do primeiro método. O terceiro é um método
hierárquico aglomerativo que é totalmente independente do problema a utilizar, mas
que apenas faz a classicação,
i.e.,
cria os agregados não denindo o centróide.
Para
a obtenção dos centróides utiliza-se uma parte do algoritmo do segundo método.
5.3.1 Algoritmo Intuitivo
O primeiro método de agregação apresentado utiliza a estrutura do problema para realizar
a classicação. Pretende-se obter uma caracterização em termos de variáveis dos modelos
do paciente, mas dado que um modelo é caracterizado por oito parâmetros, ver equação
(5.1), tal torna a tarefa bastante complicada.
O ideal seria ter duas variáveis em a
59
que a sua representação no espaço fosse simples de analisar, e ainda que essas variáveis
traduzissem grandezas intuitivas.
Na secção 2.3 caracterizou-se a resposta do paciente ao
de cinco parâmetros:
T 80, T 50, T 10, S e P .
bolus inicial, através da denição
Estes parâmetros têm um signicado intuitivo
de perceber, ao contrário dos parâmetros de (5.1). Em [2] são usados os valores de
T 10
T 50
e
para a anação automática dos controladores PID, sugerindo-se uma caracterização
mais profunda em termos da resposta ao
bolus
inicial.
bolus
Nesta tese optou-se por simplicar a resposta ao
inicial em termos de dois
parâmetros que dessem: uma medida da rapidez da descida e outro da rapidez com que
a resposta começa a subir. Deniu-se assim o parâmetro
do tempo de decaimento da resposta,
i.e.,
T 10 − T 80
que dá uma medida
do tempo que o fármaco leva a ser absorvido
inicialmente.
Para o segundo parâmetro não foi necessária uma nova denição pois o
P
já tem o signicado pretendido, ou seja, dá uma medida do tempo em que
parâmetro
o fármaco administrado no
bolus
inicial é absorvido pelo paciente.
Na Figura 5.4 pode ser observada a representação dos 100 modelos no espaço dos
parâmetros
T 10 − T 80
e
P.
Tendo em conta a distribuição dos pontos representativos
dos modelos realizou-se a partição em classes, podendo ver-se a tracejado a separação das
mesmas.
Escolheu-se um modelo em cada classe de maneira arbitrária para ser o modelo representativo da classe,
i.e.,
o centróide ao qual é associado um controlador.
Após esta
escolha, para cada agregado calculou-se a cadeia fechada obtida, acoplando o controlador
do centróide a cada modelo do respectivo agregado. Determinou-se assim se existia algum modelo para o qual o controlador originasse pólos da cadeia fechada instáveis. Se tal
acontecesse, ou se modicava o controlador, ou se escolhia um outro modelo a associar ao
controlador até não existir nenhum modelo em que o seu respectivo controlador originasse
um sistema instável em cadeia fechada quando acoplado aos outros modelos da mesma
classe. Os * representam os centróides de cada classe, ou seja, modelos aos quais estão
associados os controladores. De referir que os modelos
sentação,
M67
e
M71
coincidem nesta repre-
i.e., existiu perda de informação na passagem das cinco para as duas variáveis.
Tal seria de esperar e constitui uma desvantagem da redução do número de variáveis, mas
em que o ganho de desempenho o justica plenamente.
Por forma a avaliar qual a inuência do número de controladores (classes) no desempenho do sistema de controlo comutado, obteve-se uma agregação com mais classes,
i.e.,
com mais controladores. Para este efeito, analisando a Figura 5.4 optou-se por realizar
partição nas classes com maior densidade de modelos, como são as classes
60
C(3), C(6)
e
Figura 5.4: Agregação em 7 classes com base em T 10 − T 80 e P .
C(7).
Na Figura 5.5 pode ser observado o resultado da partição e da agregação em 12
classes.
5.3.2 Algoritmo K-médias adaptado ao Controlo Comutado
k-médias [26]. Este
algortimo faz parte dos algoritmos que usam o critério de mínimos quadrados como função
Descreve-se agora um método baseado no algoritmo de agregação
de custo a optimizar.
Este é o critério mais intuitivo e mais frequentemente usado em
técnicas de agregação com partição, funcionado bem com conjuntos de dados compactos
k-médias é o mais simples e mais usado dos
algoritmos que usam o critério de mínimos quadrados. Os passos do algoritmo k-médias
e conjuntos de dados isolados. O algoritmo
adaptado ao problema do controlo comutado com múltiplos modelos são:
1. Inicialização dos Centróides.
2. Classicação.
M,
Inicialização aleatória dos centróides.
Consiste na atribuição de cada modelo
M
ao centróide mais próximo,
de acordo com.
Mi ∈ M(k) : k = argmin δν (C(k), Mi )
k
61
Figura 5.5: Agregação em 12 classes com base em T 10 − T 80 e P .
em que
Mi , 1 ≤ i ≤ Nc
designa cada um dos centróides e
Nc
o número total de
classes.
3. Actualização dos Centróides.
Consiste na redenição dos centróides tendo em conta
a nova denição das classes, passando estes a ocupar o ponto médio dos modelos da
sua classe.
O algortimo começa com a inicialização dos centróides no passo
maior problema no algorimo
k-médias
1.
Dado que o
é a sensibilidade à inicialização dos centróides
apresentada-se uma opção alternativa, em que a inicialização já está perto da óptima.
Esta hipótese consiste em partir da agregação obtida pelo método
intuitivo apresentado
na secção 5.3.1, o que implica que não só a inicialização foi efectuada mas também a
classicação, começando o algoritmo, neste caso, no passo
3.
Esta abordagem tem, no
entanto, a desvantagem de implicar o conhecimento do problema em questão. No passo
2
cada modelo é classicado na classe do centróide mais próximo.
Por último, em
3
é
recalculado o centróide tendo em conta as alterações nas classes, tomando o centróide no
ponto médio dos modelos em cada classe. De notar que, no algoritmo
k-médias
original,
o ponto médio ocorreria muito provavalmente fora do conjunto dos modelos, enquanto
nesta versão o centróide
62
Mk
é obrigado a pertencer ao conjunto dos modelos
M(k),
da
classe
ao
k.
Em seguida começa a recursividade no algoritmo, voltando ao passo
2 e depois
3 até não existirem mais alterações na composição das classes e respectivos centróides.
5.3.3 Algoritmo Aglomerativo
Os métodos da
ligação simples
[27] e da
ligação completa
[28] diferem na maneira em
que são caracterizadas as similaridades entre um par de agregados. No método da
simples
ligação
é usada a distância mínima entre todos os pares de modelos retirados de dois
agregados (um modelo do primeiro agregado e outro do segundo). Já no método da
completa
ligação
a distância entre dois agregados é o máximo de todas as distância entre pares
de modelos em dois agregados. Em qualquer dos casos, dois agregados são aglomerados
para formarem um agregado maior baseado no critério da distância mínima. Na Figura
5.6 pode ser observada a diferença dos critérios de distorção entre agregados.
Figura 5.6: Critérios de dessimilação entre agregados: distância máxima e distância mínima, [7].
Método da Ligação Simples
Este método usa como, critério de dissemelhança entre agregados, a distância mínima,
dmin ,
denida como
dmin (Mi , Mj ) =
onde
k, k̄ = 1, . . . , Nc , k 6= k̄
e
min
Mi ∈M(k),Mj ∈M(k̄)
i, j = 1, . . . , N .
δν (Mi , Mj )
(5.3)
O algoritmo é iniciado com um número
de agregados igual ao número de modelos. A junção de dois agregados,
corresponde à ligação dos pares de pontos mais próximos nos agregados
M(i)
M(i)
e
e
M(j),
M(j).
63
Dado que as ligações entre agregados são sempre entre agregados diferentes, o grafo
resultante nunca produz cadeias fechadas ou circuitos, na terminologia da teoria dos
grafos, gerando uma árvore. Se for permitido que se continui até todos os subconjuntos
estarem ligados em expansão, o resultado é uma árvore de expansão.
expansão é um caminho de qualquer nó para outro nó da árvore.
Uma árvore de
Contudo, pode ser
demonstrado que a soma dos comprimentos das ligações da árvore resultante não excede
a soma das ligações de qualquer outra árvore de expansão. Como a árvore liga todos os
pontos de
M,
e a soma dos comprimentos dos ramos é mínima, tal implica que qualquer
árvore que ligue todos os elementos de
M
tem comprimento superior.
Esta árvore é
designada por árvore de expansão mínima [25].
A separação dos pontos em agregados é realizada quando a distância entre as classes
mais próximos excede um limiar xo
δν (M(k), M(k̄) < limiar
k 6= k̄ e k, k̄ = 1, . . . , Nc
O algoritmo termina quando se chega ao número de classes especicadas. Este método
sofre do chamado
efeito de encadeamento, ou seja, tem a tendência para gerar agregados
alongados (cadeias de pontos próximos) ou espalhados. De referir que devido a este defeito
do algoritmo para o caso do
e usando como métrica a
se o
ν -gap,
efeito de encadeamento
com o banco de modelos disponíveis
os resultados não foram os mais adequados. Observou-
em que a maioria dos agregados estavam isolados com um
só elemento e um ou outro com as restantes cadeias alongadas.
o método da
ligação completa,
Tal não acontece com
sendo esse o escolhido para ser o método hierárquico e
aglomerativo para aplicação no controlo comutado do bloqueio neuromuscular.
Método da Ligação Completa
Este método usa, como critério de dissemelhança entre agregados, a distância máxima,
dmax ,
denida como
dmax (Mi , Mj ) =
onde
k, k̄ = 1, . . . , Nc , k 6= k̄
ligação simples,
e
max
Mi ∈M(k),Mj ∈M(k̄)
i, j = 1, . . . , N .
δν (Mi , Mj )
(5.4)
A inicialização é identica ao método da
em que cada agregado é um dos modelos. Este algoritmo não permite
o crescimento de agregados alongados, produzindo um grafo em que todas as ligações
conectam todos os nós no agregado.
Na terminologia da teoria dos grafos, cada agregado constitui um subgrafo completo.
A distância entre dois agregados é determinada pela maior distância entre dois agregados.
64
Quando os agregados mais próximos são fundidos, o grafo é alterado através da adição
de ramos entre cada par de nós nos dois agregados.
Assim, se se denir o diâmetro
da partição como o maior diâmetro para os agregados da partição, então cada iteração
aumenta o diâmetro da partição o mínimo possível [25].
Para que um ponto pertença a um agregado é necessário que a distância a todos os
pontos do agregado seja inferior a um dado limiar.
Novamente, o algoritmo termina
quando se chega ao número de classes pretendidas.
Dado que estes métodos aglomerativos apenas criam os agregados, não denindo os
centróides de cada classe, é necessário recorrer ao método descrito em 5.3.2.
classicação já ter sido efectuada, apenas é necessário começar no passo
2,
Dada a
em que se
escolhe para centróide o elemento que minimiza a soma das distâncias dos elementos da
classe.
5.4
Estudo Comparativo
Nesta tese foram construídos 6 bancos de controladores, podendo estes ser observados nas
tabelas do apêndice C. A construção de 6 bancos de controladores foi realizada com o
intuito de comparar os vários métodos de agregação (intuitivo, k-médias, aglomerativo) e
ainda avaliar o efeito do número de controladores (7 ou 12) ser maior ou menor. Assim,
a combinação de todos entre métodos de agregação e número de controladores dá os 6
bancos de controladores.
No capítulo 6 realiza-se uma comparação entre o desempenho dos vários bancos de
controladores no sistema de controlo. Nesta secção, efectua-se uma comparação entre os
vários métodos de agregação através da análise das distâncias nos agregados.
Os métodos de agregação tiveram como objectivo construir agregados no espaço dos
modelos, de maneira a que se conseguissem associar modelos, com propriedades semelhantes, formando classes.
E ainda, dentro das classes encontrar um modelo que repre-
sentasse a classe, tal que fosse o modelo mais indicado para o projecto do controlador da
classe.
Como se referiu na secção 5.2, a distância de Vinnicombe dá uma medida indicadora
do quão perto estão modelos, no sentido de se um controlador estabilizar um, também
estabiliza o outro. Assim, recorre-se a esta métrica como medida da avaliação da agregação
efectuada por cada método, na medida em que, se considera como desejável que a média
das distâncias de Vinnicombe, entre o centróide e respectivos modelos, seja a menor
possível dentro em cada classe, assim como, a distância máxima de um centróide para um
65
modelo da classe seja a menor possível. Nas Tabelas 5.1 e 5.2 apresentam-se o número
de modelos, a média das distâncias entre o centróide e os modelos, e o pior caso em cada
centróide,
i.e.,
a maior distância entre um centróide e o respectivo modelo.
Os dados
apresentados em cada agregado estão em função dos métodos de agregação, para 7 e 12
centróides, respectivamente.
Tabela 5.1: Dados sobre δν dos agregados em função do método de agregação, casos com 7 centróides.
C
C(1)
C(2)
C(3)
C(4)
C(5)
C(6)
C(7)
No
m's
8
8
18
3
5
34
24
Intuitivo
média pior caso
0.1884
0.2956
0.1497
0.2620
0.1021
0.2229
0.0989
0.1051
0.0716
0.1056
0.1407
0.3253
0.2004
0.4166
K-médias
m's média pior caso
9
0.1505
0.2850
15
0.0946
0.1905
14
0.0570
0.1703
4
0.0872
0.1520
10
0.0542
0.0766
17
0.0657
0.1074
31
0.1155
0.3119
No
Aglomerativo
22
0.0879
0.1357
19
0.0762
0.2124
27
0.0904
0.1750
21
0.1040
0.2633
5
0.1188
0.1534
3
0.1243
0.1327
3
0.1138
0.1453
No
Em primeira instância interessa analisar se com o método k-médias, em que se partiu
de uma inicialização e classicação dada pelo método intuitivo, se conseguiu de facto
diminuir as distâncias entre os centróides e os seus elementos. Analisando as Tabelas 5.1
e 5.2, nomeadamente as colunas respeitantes aos métodos intuitivo e k-médias, conclui-se
que a média das distâncias do centróide para os seus elementos e a distância máxima entre
o centróide e um seu elemento é sempre menor com o método k-médias, mesmo quando
o número de modelos de um centróide, respeitante ao método k-médias, é maior que um
respeitante ao método intuitivo. Existindo apenas duas excepções, a primeira na Tabela
5.1 em
C(4)
(pior caso superior) e a segunda na Tabela 5.2 no
C(11)
(média e pior caso
superiores).
De notar, que existe um certo grau de correspondência entre os centróides
C(i)
do
método intuitivo para o método k-médias, apesar de no método k-médias se realizarem
novas classicações. O mesmo não acontece com o método aglomerativo, não tendo lógica
compara as distâncias com os outros métodos.
De referir, que o método aglomerativo
implementado de ligação completa foi sugerido pelo Professor Jorge Marques, sendo ainda
cedido pelo mesmo a função
MATLAB que implementa do algoritmo.
A referida função
recebe como argumento uma matriz com as distâncias de todos os modelos para todos
e o número de classes, retornando o número de classes pretendidas e os seus elementos,
mas como se referiu em 5.3.3, é necessário recorrer a parte do método k-médias para a
66
obtenção dos respectivos centróides em cada classe.
Analisando as colunas respeitantes ao método aglomerativo, nas Tabelas 5.1 e 5.2,
constata-se que este método tende a formar classes com muitos modelos e outros com
poucos modelos. Isto em conjunto com a análise das Tabelas C.3 e C.6, conclui-se ainda
que o método tende a realizar partições nas zonas em que os modelos estão mais afastados,
criando classes com um número elevado de elementos em zonas em que os modelos estão
mais próximos. Exemplo disso mesmo são os centróides
C(10) = C52
e
C(12) = C69
que
são modelos muito afastados em relação aos restantes.
Em relação às diferenças dentro do mesmo método, para um número de centróides
diferente, são as esperadas, nomeadamente a média das distâncias e o pior caso diminuiem.
Isto deve-se em parte ao facto de o número de modelos em cada classe ser tendencialmente
menor, o que se deve ao facto de se terem realizado partições nas zonas mais densas em
termos de modelos no método intuitivo, o que também teve consequência no método
k-médias.
Tabela 5.2: Dados sobre δν dos agregados em função do método de agregação, casos com 12 centróides.
C
C(1)
C(2)
C(3)
C(4)
C(5)
C(6)
C(7)
C(8)
C(9)
C(10)
C(11)
C(12)
No
m's
8
8
7
3
10
5
14
5
15
9
5
10
Intuitivo
média pior caso
0.1884
0.2956
0.1497
0.2620
0.0979
0.1950
0.0989
0.1051
0.0665
0.1748
0.0716
0.1056
0.1043
0.1784
0.1051
0.2276
0.1228
0.2263
0.1235
0.2036
0.0808
0.1694
0.1324
0.1846
K-médias
8
0.1499
0.2850
15
0.0946
0.1905
6
0.0698
0.1261
3
0.0548
0.0551
9
0.0300
0.0513
9
0.0552
0.0766
10
0.0511
0.0939
7
0.0502
0.0563
8
0.0540
0.0815
6
0.0669
0.0742
10
0.1004
0.2372
9
0.0641
0.1566
No
Aglomerativo
24
0.0736
0.1303
4
0.0697
0.0966
16
0.0524
0.0958
11
0.0735
0.0990
5
0.0650
0.0737
15
0.0744
0.1032
5
0.0989
0.1143
8
0.0633
0.1170
9
0.0791
0.1542
1
2
0.1159
0.1159
1
-
No
67
68
Capítulo 6
Resultados das Simulações para o NMB
Este capítulo tem como objectivo apresentar e discutir os dados obtidos das simulações do
bloqueio neuromuscular, com os vários sistemas de controlo implementados. Inicialmente,
descrevem-se os parâmetros de desempenho que, normalmente, se consideram para o
bloqueio neuromuscular. Em seguida apresentam-se exemplos das vantagens do controlo
comutado na presença de sistemas em que existe uma elevada incerteza na dinâmica do
processo, em relação a um controlador.
A parte principal do capítulo centra-se na discusão dos resultados das simulações efectuadas para os vários bancos de controladores e estimadores, que juntos formam um
sistema de controlo.
Os dados completos das simulações efectuadas estão presentes no
apêndice C.
Por último são identicados os problemas que o ruído coloca no controlo comutado,
sendo apresentados alguns exemplos.
6.1
Parâmetros de Desempenho
Nesta secção descrevem-se parâmetros que permitem avaliar o desempenho do sistema
de controlo, tendo em conta os requesitos clínicos e de controlo. Alguns dos parâmetros
pretendem dar informação sobre a resposta transitória, enquanto outros avaliam o desempenho da resposta em regime estacionário. Esta descrição tem como base [29], em que se
deniram os parâmetros de desempenho para o bloqueio neuromuscular.
69
Capítulo 6. Resultados das Simulações para o NMB
6.1.1 Em Regime Transitório
O regime transitório corresponde à resposta inicial do controlador e é denida como o
intervalo de tempo entre
30 min.
tref
e os
75 min,
sendo que o valor usado nesta foi de
De acordo com [30], o desempenho do sistema de controlo em cadeia fechada é
caracterizado por um índice denominado erro de desempenho (
calculado como a diferença ponderada entre a medida actual
P Ej =
O
tref =
M DP E
rj
performance error ), P E ,
e a desejada
rjc
rj − rjc
× 100
rjc
é denido como a mediana do
PE
(6.1)
e dá uma medida do desvio constante
que possa existir e reecte se as medidas estão sistematicamente acima ou abaixo do valor
da referência.
M DP E = M edian{P Ej }
(6.2)
Uma medida da exactidão do método de controlo é dada pelo
M AP E ,
denido como a
mediana do erro absoluto de desempenho, ou seja,
M DP E = M edian{|P E|j }
O
W obble
(6.3)
mede o comportamente oscilatório do controlador, sendo denido como
W obble = M edian{|P Ej − M DP E|}
Em que
sendo
j = tinicial , . . . , tf inal ,
tf inal
75 min.
os
O
(6.4)
onde tinicial é o instante após tref em que
Overshoot
r(t) passa os 10%,
é denido como
Overshoot =
max(rj ) − rtf inal
× 100
max(rj )
(6.5)
sendo uma medida da sobrelevação inicial da resposta, desejando-se que esteja seja nulo.
A área ,
A,
é cálculada através de
X
A=(
|rj − rjc |) × ∆t
onde
(6.6)
∆t representa o intervalo de tempo em que a soma é cálculada (que será o respeitante
ao regime transitório). O tempo de estabelecimento,
ts ,
também é um parâmetro impor-
tante, que apesar de não ter sido incluído em [29], é aqui considerado. Este é denido
como o tempo que o sistema leva até que o erro de seguimento esteja em módulo abaixo
de um certo limiar. Nesta tese considerou-se o limiar em
estar entre
9%
tref = 30 min
e
11%.
70
ts
ou seja, a saída deverá
Tendo em conta que a subida gradual da referência começa após
e que a subida leva
como bom todos os
±1%,
inferiores a
40 min
a atingir o valor de nal desejado, considera-se
70 min
e razoáveis até aproximadamente
100 min.
6.2. Vantagens do Controlo Comutado
6.1.2 Em Regime Estacionário
O regime estacionário começa naturalmente após terminar o transitório, ou seja, após os
75 min
até ao m da simulação. Para a avaliação do desempenho em regime estacionário
foram considerados os parâmetros
M DP E , M AP E
e
W obble
anteriormente denidos.
Consideraram-se ainda outros parâmetros como a taxa média de infusão, a média do
nível do bloqueio neuromuscular e o erro quadrático médio (MSE).
6.2
Vantagens do Controlo Comutado
Como se referiu no capítulo 4, o controlo comutado foi concebido com o intuito de resolver os problemas da variabilidade intra e interpacientes. Nesta secção são apresentados
exemplos do desempenho superior do controlo comutado em relação ao uso de um único
controlador.
6.2.1 Variabilidade Inter-pacientes
Na secção 3.4 apresentaram-se uma série de exemplos em que se tinha um controlador
projectado especicamente para o modelo do paciente em questão.
assumir conhecimento
possível saber.
a priori
Pelo que se está a
sobre o modelo do paciente, o que na realidade não é
Na prática, antes da cirurgia, são realizados testes pelo anestesista de
modo a avaliar se o paciente é mais ou menos resistente ao fármaco, mas daí até saber
qual o modelo farmacocinético/farmacodinâmico vai uma grande distância.
Na Figura
6.1 está representado um exemplo de uma simulação em que o modelo do paciente é um
modelo lento,
M69 , e o controlador aplicado é projectado para um modelo intermédio, C4 ,
ver apêndice A.
Como se pode constatar na Figura 6.1a) a resposta é bastante oscilatória e analisando
o comportamento da acção de controlo em (b), este está a oscilar em crescendo indicando
possivelmente instabilidade, ou pelo menos estabilidade crítrica após atingir a saturação.
Em contraponto na Figura 6.2 está representada a simulação para o mesmo modelo do
paciente,
M69 ,
mas com um esquema de controlo comutado (ver Tabela C.2).
6.2.2 Variabilidade Intra-pacientes
Durante uma cirurgia é possível que a dinâmica do paciente varie durante um certo período
de tempo.
Na Figura 6.3 apresenta-se uma simulação que ilustra a seguinte situação:
inicialmente o modelo do paciente era o
M10 ,
em
t = 180 min
começou a variar-se linear-
71
Figura 6.1: Simulação para o modelo M69 com o controlador C4 Am ∈ {0.8, 0.92} e Ac0 ∈ {0.89}. (a) resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ].
mente os parâmetros do modelo farmacocinético/farmacodinâmico para os parâmetros do
modelo
M69 ,
até ao instante nal da simulação.
Como se pode observar na Figura 6.3, após a variação existe um transitório de
até o controlador se adaptar à nova dinâmica. Passados
20 min,
começa novamente a adaptação até atingir o controlador
da classe do novo modelo de paciente
controlador correcto,
6.3
C70 ,
M69
C76 ,
25 min
o controlador comutado
sendo este o controlador
(inicialmente também tinha convergido para o
ver Tabela C.2).
Discussão dos Resultados
Nesta secção apresentam-se e discutem-se os resultados das simulações efectuadas para o
conjunto dos 6 bancos de controladores construído, presentes no apêndice C. De notar, que
cada banco de controladores foi simulado com dois tipos de estimadores, nomeadamente
estimador com Predição do Erro com Índices de Desempenho, PEPI, e estimador com
Minimização do Erro Quadrático Médio, LMS. Assim, são apresentados 12 sistemas de
controlo a comparar, respeitantes à combinação de 3 métodos de agregação com 2 números
possíveis para o número de controladores e 2 estimadores diferentes.
Escolheram-se como parâmetros de avaliação do desempenho do sistema de controlo
o número de casos em que o sinal de comutação converge para um modelo do mesmo
centróide, o
Overshoot
(sobrelvação), o
ts
(tempo de estabelecimento) e o
M SE
(erro
quadrático médio em regime estacionário). O número de convergência é parâmetro importante avaliar, pois espera-se que com um número de convergências maior o desempenho
seja superior, dado que um controlador garante um bom desempenho para os elementos
72
6.3. Discussão dos Resultados
Figura 6.2: Simulação para o modelo M69 com o controlador comutado. (a) - resposta do nível de bloqueio
neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ e índice de
classe φ.
da sua classe, mas não para elementos de outras classes. Os parâmetros
M SE
Overshoot, ts
e
foram escolhidos, em detrimento dos outros parâmetros descritos em 6.1, por terem
um signicado mais intuitivo.
Sendo que o tempo de estabelecimento e sobrelevação
fornecem informação sobre a parte inicial da resposta, enquanto o
M SE
permite avaliar
a resposta em regime estacionário (relembrar que se considera como regime estacionário
a resposta para
t > 75 min).
Na Tabela 6.1 apresentam-se os parâmetros de desempenho do controlador em função
do sistema de controlo identicado da seguinte forma:
controladores -estimador.
método de agregação -número de
73
Figura 6.3: Simulação com o controlador comutado, em que entre t = 180 min até t = 300 min os
parâmetros de M10 variam linearmente de forma a igualarem os parâmetros de M69 . (a) - resposta do
σ e índice de classe φ.
74
6.3. Discussão dos Resultados
Tabela 6.1: Parâmetros de desempenho em função do sistema de controlo.
Overshoot [%]
Sistema de Controlo
intuitivo-7-PEPI
intuitivo-7-LMS
k-médias-7-PEPI
k-médias-7-LMS
aglomerativo-7-PEPI
aglomerativo-7-LMS
intuitivo-12-PEPI
intuitivo-12-LMS
k-médias-12-PEPI
k-médias-12-LMS
aglomerativo-12-PEPI
aglomerativo-12-LMS
convergências
63
27
69
33
26
34
14
14
8
12
20
22
média
2.84
4.62
2.25
4.39
23.41
3.72
7.09
2.88
4.25
3.11
9.51
11.04
ts [min]
pior caso
35
39
35
54
99
36
45
40
50
45
64
99
média
65.22
68.24
66.65
67.09
110.82
68.11
112.07
59.96
86.47
61.61
107.7
91.34
pior caso
96
286
298
250
300
197
300
286
300
157
300
300
M SE [%]
média
0.0205
0.0523
0.3098
0.2804
11.47
0.1222
0.7415
0.0277
0.6008
0.0707
1.5882
1.4983
pior caso
0.34
1.6
29.3
8.35
114
4.47
8.75
1.4
15.9
4.43
17.6
13.2
Em primeiro lugar interessa identicar o sistema de controlo que teve o melhor desempenho. Observando a Tabela 6.1, dois sistemas de controlo destacam-se dos demais,
nomeadamente o intuitivo-7-PEPI e o k-médias-7-PEPI. O sistema intuitivo-7-PEPI foi
o único a apresentar bons resultados em todos os parâmetros de desempenho, nomeadamente o único que apresentou como pior caso de
ts
um valor aceitável. De referir no en-
tanto, que o sistema k-médias-7-PEPI apenas apresentou um modelo que não fornecesse
o desempenho mínimo (ver Tabela C.2 modelo
ts = 108 min
e
M SE = 0.31%.
M68 ),
tendo o pior caso seguinte um
Estes dois sistemas de controlo destacam-se dos demais,
principalmente pelo número de modelos que convergiram para um modelo do mesmo
controlador.
Estes são os únicos casos em que taxa de convergências é superior a 50%
(como o banco utilizado tem 100 modelos, a taxa de convergência é igual ao número de
convergências em %).
Um aspecto importante a comparar é o desempenho dos estimadores do controlador
comutado. Analisando a Tabela 6.1 constata-se que ambos os métodos apresentam bons
resultados em termos de parâmetros de desempenho, mas destacam-se duas diferenças
fundamentais: na convergência e com um número de controladores superior. Em relação
à convergência o LMS tem uma taxa de convergência bastante inferior ao PEPI (nos
casos intuitivo-7-PEPI e k-médias-7-PEPI), mas em termos dos restantes parâmetros apresenta valores semelhantes, apesar de ligeiramente superiores. As diferenças das médias
de
Overshoot
não excedem os 2.5%, das médias de
ts
não passam dos
3.5 min
e em re-
75
lação às médias do
M SE
consegue ser melhor num caso (k-médias-7-LMS) e no outro a
difernça de médias não excede os 0.03%.
Pode assim concluir-se que o método LMS não está dependende do sucesso da taxa de
convergência para que o sistema tenha um bom desempenho De notar que as conclusões
sobre a convergência são relativas, na medida em que se utiliza lógica de decisão (histerese)
para evitar excesso de comutação e ainda, em alguns casos, ltro de predição variável,
em que se o erro estiver abaixo de um certo limiar suspende a comutação.
Isto tem
origem na principal preocupação do sistema de controlo, que é o de se ter uma boa
resposta do paciente, em detrimento do número de convergências poder ser maior, mas
com transitórios indesejáveis ao longo da comutação.
De referir que com o método de agregação aglomerativo o estimador LMS teve melhor
desempenho em todos os parâmetros do que o PEPI, incluindo a taxa de convergência.
Em relação ao número de controladores, o desempenho dos estimadores inverte-se,
tendo o LMS melhor desempenho com qualquer método de agregação e com um número
de controladores superior (com o aglomerativo apenas tem maior média e pior caso de
Overshoot).
O descrescimo de desempenho do PEPI deve-se sobretudo ao facto da taxa
de convergência ter diminuido.
Focando a atenção nos métodos de agregação, interessa saber se a optimização efectuada pelo método k-médias em relação ao método intuitivo tem repercursão no desempenho
do sistema de controlo. A partir dos dados da Tabela 6.1 não é possível armar a superioridade de um método em relação a outro. Isto signica que os parâmetros
T 80 − 10
e
P
descrevem sucientemente bem o modelo, de maneira a que uma classicação no espaço
dos parâmetros
T 80−10 e P
seja adequada. Ambos os métodos de agregação têm valores,
dos parâmetros de desempenho considerados, similares. Rera-se, novamente, que o sistema de controlo que melhor cumpriu todas as especicações foi um sistema de controlo
em que o banco de controladores foi construído através de um método intuitivo.
Ainda sobre os métodos de agregação, interessa saber se o método automático de
agregação, em que não se assume conhecer a estrutura do problema consegue cumprir
as especicações mínimas. A partir dos dados da Tabela 6.1, constata-se que apenas no
sistema de controlo aglomerativo-7-LMS tem um bom desempenho, com valores médios
de
Overshoot, ts
e
M SE
dentro ao nível dos melhores sistemas de controlo já referidos.
Por último, analisa-se, se com a utilização de um número superior de controladores o
desempenho do sistema de controlo aumenta. Em termos de convergência ao contrário
do que seria esperado, a taxa de convergência é menor com um número maior de controladores. Em termos das respostas do paciente no tempo de referir com a excepção dos
76
6.4. O Problema do Ruído no Controlo Comutado
casos com o método de agregação aglomerativo, discutido no parágrafo anterior, para o
estimador PEPI os resultados são piores, enquando para o estimador LMS os resultados
são melhores.
6.4
O Problema do Ruído no Controlo Comutado
Um factor importante na validação de um trabalho de simulação é a sua aproximação
com a realidade.
Num ambiente clínico, os dados são obtidos através de sensores, que
corrompem os dados com ruído. Assim, é importante que o controlador mantenha, dentro
do possível, o desempenho na presença de ruído.
Nesta secção é abordado o problema
que o ruído coloca no controlador, em que inicialmente se apresenta um ltro passa-baixo
e em seguida se apresentam algumas simulações.
6.4.1 Filtragem do Ruído
Para as simulações em que se adicionou o ruído na saída do modelo do paciente, projectouse um ltro passa-baixo com o objectivo de reduzir o ruído de alta frequência. Considerouse um ltro de primeira ordem dado por
rf iltrado (k) = λn rf iltrado (k − 1) + (1 − λn )r(k)
em que
λn
(6.7)
está entre 0 e 1. Tendo em conta a especicidade do problema do bloqueio
neuromuscular, em particular, o facto de inicialmente ser administrado um
resposta varia aproximadamente dos
a partir dos
bolus em que a
100% aos 0% em poucos minutos, o ltro só é ligado
5 min.
6.4.2 Exemplos
Na presença de ruído, a resposta do sistema com o controlador comutado degrada-se,
principalmente em modelos mais lentos e na fase transitória do controlador proporcional
para os controladores do banco
C.
Isto, porque em regime estacionário o controlador segue
a referência com um bom desempenho, mesmo variando a referência à volta dos
10%.
As simulações presentes nas Figuras 6.4, 6.5 e 6.6, foram efectuadas com o estimador
do tipo PEPI e com o banco de controladores de 7 elementos construído com o método
k-médias.
A histerese com
h = 1,
um ltro de predição variável com
foi escolhida como lógica de decisão, sendo usado
λ0 = 0.85
e um limiar do
ec
em 0.1%.
Os grácos
(d) representam a resposta do paciente sem estar ltrada e a resposta ltrada com um
λn = 0.85.
As simulações foram efectuadas com uma variância unitária para o ruído.
77
Figura 6.4: Simulação efectuada para o modelo M9 com ruído de variância unitária. (a) - resposta do
σ e índice de classe φ, (d) - .
As simulações foram efectuadas com os modelos
M9 , M22
cas diferentes em termos dos parâmetros da resposta ao
na Tabela A.
e
bolus
M76
que têm característi-
inicial, como se pode ver
As três respostas dos pacientes têm em comum o facto de apresentarem
problemas no regime transitório, mas não acontecendo o mesmo em regime estacionário.
Este facto deve-se ao transitório inicial do controlador comutado, e para resolver este
problema colocou-se a raíz do polinómio observador de
anti-colagem, Aaw , fora da origem,
mas mesmo assim o problema persistiu. Dado que em tcc
ainda está num nível baixo, aproximadamente
tado em
tcc = 50 min,
= 30 min a resposta do paciente
3%, optou-se por ligar o controlador comu-
cando assim o controlador proporcional ligado até aos
Como se pode ver nas Figuras 6.4, 6.5 e 6.6 em
t = 50 min
50 min.
existe uma alteração radical
da resposta, acontecendo um de dois casos: se a resposta estiver aos 50
minutos
estiver
abaixo da referência a acção de controlo satura no valor superior da saturação, tendo como
consequência uma descida do nível do bloqueio neuromuscular, caso contrário a acção de
controlo satura em 0, o que faz com a resposta apresente uma elevada sobrelevação.
78
6.4. O Problema do Ruído no Controlo Comutado
Nestes exemplos variou-se a referência em pequenos incrementos de
±3%
em torno do
valor nal desejado. Como se pode analisar nos grácos (a), o seguimento em regime estacionário após a mudança de referência, seguiu perfeitamente a mesma, não apresentando
qualquer transitório indesejado.
Por último, como se pode observar nos três casos em (c), existiu pouca ou nenhuma
comutação do controlador comutado. Esta situação vericou-se, mesmo com o outro tipo
de estimador ou método de agregação.
79
80
Capítulo 7
Conclusões e Trabalho Futuro
Neste capítulo nal, resumem-se as conclusões e contribuições principais da tese, sugerindose ainda alguns aspectos, sobre os temas abordados, que poderiam ser melhorados.
7.1
Conclusões
Este tese pretendeu contribuir para o desenvolvimento de métodos de controlo supervisionado com múltiplos modelos, aplicados ao problema do bloqueio neuromuscular.
No capítulo 2, através de testes efectuados, comprovou-se que a linearização obtida
para os modelos do bloqueio neuromuscular constituiam boas aproximações à volta do
ponto de interesse. Sugeriu-se o uso de parâmetros da resposta ao
bolus
inicial, de forma
a se conseguir ganhar intuição para a especicação da dinâmica dos controladores locais,
o que depois foi exemplicado no capítulo 3.
O capítulo 3 apresentou o método de projecto por colocação de pólos, com técnicas
polinomiais, sendo aplicado, pela primeira vez, ao bloqueio neuromuscular com sucesso.
Destacam-se a importância de alguns aspectos como o termo
Rd
(acção integral), adi-
cionado ao controlador, permitiu rejeitar erro estático em regime estacionário, o termo
Sd
permitiu que o controlador funcionasse na presença de ruído, o que em conjunto com a
acção integral não era possível, sendo este um factor determinante no sucesso do projecto.
O termo
Sd
conferiu ainda robustez, na medida em que aumenta a margem de estabili-
dade, permitindo assim uma maior gama de valores para a colocação de pólos. Ainda em
relação ao controlador polinomial, observou-se que os modelos mais lentos necessitavam
de uma especicação dinâmica, pólos de
Am ,
mais lenta do que nos modelos rápidos na
presença de ruído. Este facto, também acontecia sem ruído e sem o termo
Sd
(que como já
foi referido confere robustez ao sistema). Por último, demonstrou-se o efeito do polinómio
81
Capítulo 7. Conclusões e Trabalho Futuro
observador na presença de ruído, em que retirando os pólos da origem o desempenho do
controlador melhorou signicativamente.
No capítulo 4 apresentaram-se soluções para diversos blocos do supervisor. Em particular, a inovadora utilização do estimador LMS aplicado ao bloqueio neuromuscular. Através
de simulações demonstra-se que a histerese com escala independente é uma solução mais
dwell-
adequada para o bloco lógica de decisão, em detrimento do tempo de permanência (
time ), pois evita o excesso de comutação e ainda produz melhores resultados em termos
de convergência para o controlador correcto. Demonstrou-se ainda o desempenho superior
do ltro de predição variável (em oposição ao constante), em que se realizou uma ligeira
alteração ao esquema original apresentado em [21]. Propôs-se ainda um esquema de
colagem
anti-
com integrador comum adaptado aos controladores com colocação de pólos, que
foi um aspecto importante no funcionamento do controlo comutado.
Na discussão sobre os resultados das simulações efectuadas com os diversos estimadores
e bancos de controladores conclui-se que em relação aos estimadores ambos apresentam bons resultados com os diversos bancos de controladores.
Com o estimador PEPI
obtiveram-se os melhores resultados observados, destanco neste estimador a sua taxa de
convergência acima dos 60%, nos dois melhores sistemas de controlo apresentados. Apesar
dos melhores resultados terem sido com o estimador PEPI, vericou-se uma dependência
da taxa de convergência para o sucesso do sistema de controlo, tal não se vericou com
o estimador LMS. O estimador LMS, mesmo com taxas de convergência bastante inferiores conseguiu cumprir perfeitamente as especicações e com um número superior de
controladores teve um desempenho melhor do que o PEPI.
O capítulo 5, apresenta o maior contributo desta tese, que passa pelo desenvolvimento
de métodos (de agregação) para a construção de um banco de controladores, em que o
número de controladores é substancialmente inferior ao número de modelos (do banco
de modelos). Apresentaram-se 3 métodos diferentes tendo todos tido sucesso, na medida
em que os sistemas de controlo com estes bancos obtiveram bons resultados. Um passo
bastante importante para ecácia dos métodos de agregação, nomeadamente os métodos
k-médias e aglomerativo, foi a denição de uma métrica adequada para as distâncias entre
modelos. A métrica escolhida foi a distância de Vinnicombe e dada o sucesso dos métodos
de agregação conclui-se que esta foi uma escolha acertada.
Um dos métodos apresentados é um método intuitivo, na medida em que utiliza a
intuição do problema para efectuar a classicação.
Outro método proposto, parte do
método intuitivo como primeira iteração de inicialização mais classicação, o que signica
que é inicializado numa zona óptima, para depois realizar uma optimização das distâncias
82
7.2. Trabalho Futuro
nas classes (método k-médias). Os resultados demonstrados no capítulo 6, não registaram
diferenças signicativas entre o desempenho dos dois métodos de agregação referidos.
Isto permitiu concluir que os parâmetros denidos com base na resposta ao
bolus
inicial
consegue descrever sucientemente bem o comportamento dos modelos.
Estes métodos obtiveram melhores resultados do que o terceiro método apresentado,
mas têm a desvantagem de utilizarem informação sobre o problema para obterem as
soluções.
Na resolução do problema do bloqueio neuromuscular não se vericou este
problema porque se conseguiu obter uma descrição dos modelos em termos de 2 variáveis,
que como cou demonstrado pelos resultados, são capazes de descrever o comportamento
dos modelos. Noutros problemas, a elevada dimensionalidade do problema e a consequente
falta de intuição pode impossibilitar que algo semelhante se possa fazer.
Deste modo, propôs-se um terceiro método, com o objectivo de ser independente do
problema e totalmente automático. Este é um método aglomerativo de ligação completa,
que como seria de esperar teve um desempenho inferior em relação ao intuitivo e kmédias. Mesmo assim, os sistemas de controlo com os bancos de controladores criados
com o método aglomerativo cumpriram minimamente as especicações pedidas, tendo
sido apresentado um caso em que os resultados estavam ao nível dos melhores obtidos.
Um problema deste método é facto do método de agregação tender a criar centróides
com poucos elementos, nas zonas em que os modelos estão muito afastados, e centróides
com muitos elementos nas zonas de maior densidade de modelos. O que em termos de
aplicação do controlo comutado, obriga a que um controlador de uma classe com muitos
modelos tenha de ser mais robusto, perdendo assim desempenho em alguns modelos da
classe de forma a estabilizar todos os elementos. Esta foi a razão principal encontrada
para os piores resultados deste método.
Em relação ao número de controladores ser maior ou menor, conclui-se que com mais
controladores a taxa de convergência é inferior, que o estimador PEPI funcionou melhor
com menos controladores e o estimador LMS com mais controladores. Assim, a questão do
número de controladores ca de certo modo em aberto, já que os resultados demonstraram
uma dependência em relação ao estimador em utilização.
7.2
Trabalho Futuro
O desempenho evidenciado pelos algoritmos de controlo em conjunto com o desenvolvimento recente de soluções validadas clinicamente para o problema do bloqueio neuromuscular, sugere o uso dos algorimtos de controlo em pacientes submetidos a cirurgia.
83
Capítulo 7. Conclusões e Trabalho Futuro
Em relação ao algoritmo de colocação de pólos através de técnicas polinomiais que é
usado no projecto dos controladores locais, seria interessante ter um método de projecto
automático e robusto para os controladores (pólos de
ser o uso da
mixed sensitivity
Am e Ac0 ).
Uma possibilidade poderia
aplicada a um controlador com dois graus de liberdade.
O perl da referência poderia ser melhorado, tornando-o parametrizável, em função
da identicação inicial do modelo ao longo da descida.
saber o valor de parâmetros como
T 80, T 50 e T 10.
Após o
bolus
inicial é possível
Com este conhecimento, seria possível
escolher mais adequadamente, parâmetros da referência, como
tref .
Outra hipótese seria
usar o método híbrido [14] que estima o modelo farmacocinético/farmacodinâmico nos
instantes iniciais.
Um questão em aberto, é como se poderia melhorar o desempenho do controlo comutado, com o conhecimento da identicação (através do método híbrido referido no
parágrafo anterior) do modelo do paciente ao longo do tempo.
O maior problema que surgiu neste trabalho deveu-se ao ruído com o esquema de controlo comutado, nomeadamente na fase inicial do controlador, pois em regime estacionário
e com mudanças de referência este funcionava adequadamente. Assim, uma solução para
este problema seria bastante benéca em termos de experimentação em pacientes.
Em relação ao banco de controladores, um aspecto que poderia ser melhorado reside
na concepção de um método de projecto dos controladores associados aos centróides das
classes de forma a que cada controlador estabilizasse todos os modelos e não só os da classe
(pelo menos). Um problema desta solução seria provalvemente uma perda de desempenho
em relação aos modelos das classes de cada controlador.
84
Apêndice A
Parâmetros da Resposta ao
Inicial
Este apêndice contém os valores dos parâmetros
acordo com a secção 2.3, para o banco de modelos
Bolus
T 80, T 50, T 10, S
e
P,
calculados de
M = {Mj = 1, . . . , 100}
do
atracúrio.
Tabela A.1: Parâmetros da resposta ao bolus inicial.
Modelo/Parâmetro
T 80 [min]
T 50 [min
T 10 [min]
S
P [min]
M1
2.33
2.67
4.33
-52.94
20.33
M2
3.00
3.67
5.67
-44.03
28.33
M3
1.67
2.33
3.33
-67.99
27.33
M4
1.67
2.33
3.33
-70.12
32.33
M5
1.33
1.67
2.33
-116.26
33.33
M6
1.33
1.33
2.00
-149.62
29.67
M7
2.33
3.00
4.00
-60.63
33.00
M8
2.33
2.67
4.00
-64.84
29.33
M9
1.67
2.00
3.33
-72.27
24.33
M10
1.33
1.33
2.00
-128.02
31.33
M11
1.67
2.00
2.67
-89.00
32.33
M12
1.67
2.00
3.00
-76.83
24.33
M13
1.67
2.00
3.33
-68.79
29.00
M14
3.00
4.33
8.00
-28.80
11.67
M15
1.33
1.33
2.00
-149.11
42.00
M16
2.33
2.67
4.67
-54.44
15.33
M17
1.67
2.00
2.67
-91.03
26.00
M18
1.67
2.00
4.00
-60.03
20.00
M19
2.33
2.67
4.00
-62.77
27.67
M20
1.33
1.33
2.00
-137.65
29.67
M21
2.33
3.00
4.33
-60.82
19.33
85
Apêndice A. Parâmetros da Resposta ao Bolus Inicial
86
Modelo/Parâmetro
T 80 [min]
T 50 [min
T 10 [min]
S
P [min]
M22
1.67
2.00
2.67
-100.96
43.67
M23
1.67
2.00
2.67
-91.79
30.33
M24
2.33
3.00
4.67
-52.77
21.00
M25
2.33
2.67
3.67
-69.85
31.33
M26
1.67
2.00
2.67
-112.23
42.00
M27
1.33
1.67
2.67
-97.25
27.33
M28
2.67
3.67
5.67
-41.94
20.33
M29
2.00
2.33
3.67
-71.84
30.00
M30
2.67
3.00
4.33
-63.83
34.67
M31
2.33
3.00
3.67
-84.04
37.00
M32
1.33
1.67
2.33
-100.53
31.00
M33
1.67
2.00
3.00
-95.88
37.33
M34
2.33
3.00
4.00
-64.03
26.33
M35
1.33
1.33
1.67
-155.83
34.33
M36
3.00
3.67
4.67
-56.68
36.00
M37
3.67
5.00
8.67
-28.46
0.00
M38
1.67
2.00
2.33
-133.80
31.67
M39
5.33
6.67
11.33
-21.64
13.33
M40
1.33
1.67
2.33
-116.68
35.33
M41
2.33
2.67
3.33
-79.01
31.00
M42
1.67
2.00
2.67
-91.27
23.33
M43
1.67
2.00
3.00
-78.87
26.33
M44
3.00
3.67
5.00
-49.63
31.00
M45
2.00
2.33
3.33
-86.97
39.00
M46
1.67
1.67
2.33
-117.27
35.00
M47
1.67
2.00
3.00
-87.30
25.67
M48
1.00
1.33
1.67
-131.97
37.00
M49
2.00
2.33
3.33
-84.12
29.33
M50
1.33
2.00
2.67
-86.39
27.00
M51
1.33
1.67
2.33
-106.92
30.67
M52
1.00
1.00
1.33
-184.96
39.67
M53
2.33
3.00
4.33
-57.36
32.00
M54
2.33
3.00
4.00
-63.44
29.00
M55
2.00
2.33
3.00
-94.92
27.33
M56
1.67
2.00
2.67
-97.48
31.00
M57
2.00
2.33
3.33
-89.45
36.00
M58
1.67
2.00
3.00
-76.57
23.00
M59
1.33
1.67
2.00
-138.08
33.33
M60
2.00
2.33
3.33
-80.31
22.67
M61
1.33
1.67
2.67
-95.73
32.67
M62
3.67
4.67
6.67
-37.08
22.00
Modelo/Parâmetro
T 80 [min]
T 50 [min
T 10 [min]
S
P [min]
M63
1.33
1.67
3.00
-79.74
14.33
M64
1.67
2.00
2.67
-95.63
30.67
M65
1.33
1.67
2.00
-143.48
42.33
M66
1.33
1.67
2.33
-98.07
28.67
M67
1.67
2.00
2.67
-94.10
38.33
M68
1.67
2.00
2.67
-94.71
30.33
M69
5.33
6.67
10.00
-23.81
37.00
M70
1.67
2.00
2.33
-122.10
37.33
M71
1.33
1.67
2.33
-117.50
38.33
M72
1.67
2.00
2.33
-128.59
37.33
M73
2.00
2.67
3.33
-76.47
29.33
M74
2.00
2.33
3.33
-78.29
24.67
M75
2.33
2.67
3.67
-64.17
37.33
M76
3.00
4.00
6.67
-34.46
20.67
M77
2.33
3.00
4.33
-58.38
31.00
M78
2.33
3.00
4.67
-49.45
31.00
M79
1.67
2.00
3.00
-87.26
20.67
M80
1.67
2.00
2.67
-93.31
34.33
M81
3.33
4.33
7.67
-29.29
21.00
M82
1.67
2.00
3.00
-76.65
28.33
M83
1.33
1.67
2.33
-106.30
26.00
M84
1.67
2.00
3.00
-74.91
20.67
M85
1.67
2.00
3.00
-80.21
29.33
M86
1.67
2.00
2.67
-102.24
27.33
M87
1.67
2.00
3.00
-86.47
31.00
M88
2.33
3.00
4.33
-58.09
29.67
M89
1.67
2.00
2.67
-99.12
36.00
M90
1.33
1.67
2.33
-108.56
45.67
M91
1.67
2.00
2.67
-94.98
31.33
M92
1.67
2.00
4.00
-58.50
11.67
M93
1.33
1.67
2.33
-119.26
41.33
M94
1.00
1.33
1.67
-140.21
34.33
M95
1.67
2.33
4.00
-58.63
26.67
M96
2.33
3.00
4.33
-54.51
23.00
M97
1.33
1.33
2.00
-149.27
40.33
M98
2.00
2.33
3.67
-68.88
35.33
M99
1.67
2.00
3.00
-87.70
31.33
M100
2.33
2.67
4.00
-63.00
30.67
87
88
Apêndice B
Método de Resposta ao Escalão de
Ziegler-Nichols
Esta técnica consiste na extracção de dois parâmetros da resposta do sistema em malha
aberta a um escalão unitário [31, 32]. Estes são o valor do declive no ponto de inexão,
R, e o atraso no tempo, L.
A resposta de um sistema genérico a um escalão e a extracção
desses mesmos parâmetros pode ser observada na Figura B.1.
Em [11] é fornecido um
Figura B.1: Determinação dos parâmetros R e L a partir da resposta ao escalão, do método de resposta
ao escalão de Ziegler-Nichols [1].
89
Apêndice B. Método de Resposta ao Escalão de Ziegler-Nichols
algoritmo para o anamento dos ganhos de um controlador PID, a partir do método
da resposta ao escalão de Ziegler-Nichols, aplicado apenas à parte linear do modelo. A
expressão usada para o ganho proporcional é dada por
kp =
1.2 1
RL rd (req )
(B.1)
Mas tendo em conta que se pretende implementar apenas um controlador proporcional,
o ganho será reajustado de acordo com sugerido no método de Ziegler-Nichols, ou seja,
com uma diminuição de 20% no valor do ganho em relação a (B.1).
kp =
1
1
RL rd (req )
(B.2)
Um problema que surge com este método é o de se assumir conhecimento
a priori,
ou
seja, é necessário conhecer a resposta ao escalão do paciente, o que não é desejável. Mas
sendo este um elemento secundário no esquema de controlo global, considerou-se que os
ganhos cálculados através de (B.2) constituem boas aproximações. De referir no entanto,
que existem métodos para o cálculo dos parâmetros
na resposta ao
90
bolus
inicial, nomeadamente
T 50
e
R
T 10,
e
L
[2].
através da informação obtida
Apêndice C
Tabelas dos Agregados
Este apêndice contém 6 tabelas, para os 6 bancos de controladores construídos.
As 3
primeiras tabelas, C.1, C.2 e C.3 referem-se aos bancos de controladores construídos
com 7 controladores e para os métodos de agregação intuitivo, k-médias e aglomerativo,
respectivamente.
Em seguida apresentam-se 3 tabelas, C.4, C.5 e C.6 com os mesmos
métodos, mas com 12 controladores.
Para cada banco de controladores foram realizadas simulações com os dois tipos de
estimadores considerados: PEPI e LMS. As simulações foram efectuadas com histerese
(h
= 1)
(λ0
como lógica de decisão e, no caso PEPI, com um ltro de predição variável
= 0.85
λp = 0.975
e limiar de
ec = 0.1%,
excepção para a Tabela C.3 em que se utilizou um
xo).
As tabelas estão organizadas por classes, começa-se por identicar a classe com
e
k = 1, . . . , Nc ,
à sua direita identica-se o modelo controlador da classe
é o modelo que na coluna das distâncias,
valor nulo. Á direita de
Am
e
Ac0 ,
Ci
δν ,
Ci ,
C(k)
em que
i
do controlador aos elementos da classe tem
apresentam-se as especicações para os pólos do controlador,
e para os pólos do observador da predição
Ap0 .
Os valores apresentados da simulação representam os parâmetros de desempenho do
sistema de controlo considerados:
convergência,
Overshoot, ts
e
M SE .
Sendo que a
coluna da convergência é preenchida da seguinte forma: se o sinal índice de classe convergiu
para o centróide (controlador) da classe não se preenche, caso contrário é colocado um *.
91
Apêndice C. Tabelas dos Agregados
Tabela C.1: Algoritmo Intuitivo com 7 centróides.
92
Modelo
δν
C(1)
C14
M14
0
M28
M37
convergência
Overshoot [%]
PEPI
PEPI
LMS
Am ∈ {0.8, 0.92}
LMS
ts [min]
PEPI
M SE [%]
LMS
Ap0 ∈ {0.5}
PEPI
LMS
Ac0 ∈ {0.89}
0
0
74
57
0.01
0
0.2387
1
5
35
35
0
0
0.1012
35
0
55
52
0
0
M39
0.1512
9
0
78
49
0.04
0
M62
0.2956
35
30
55
59
0
0
M69
0.2912
5
8
58
57
0.02
0.02
M76
0.1502
1
0
67
38
0
0
0
75
42
0.01
0
M81
0.0905
C(2)
C21
0
M1
0.1071
M16
0.1062
M18
0.2216
*
M21
0
*
M24
0.0677
M63
0.2013
M92
0.2620
Am ∈ {0.83, 0.95}
Ap0 ∈ {0.5}
*
Ac0 ∈ {0.85}
*
0
2
64
41
0
0
*
0
0
74
63
0.01
0
*
0
0
69
61
0
0
0
1
59
59
0
0.01
0
9
64
52
0
0
0
1
71
286
0
0.34
*
0
0
70
59
0.01
0
0
0
61
38
0
0
*
M96
0.0817
*
C(3)
C34
Am ∈ {0.83, 0.95}
Ap0 ∈ {0.5}
M2
0.2059
*
7
0
66
42
0
0
M3
0.0487
*
7
0
37
67
0
0.01
M4
0.0381
0
19
66
61
0.01
0
M7
0.0522
0
6
68
51
0
0
M8
0.0164
3
0
62
75
0
0.02
M9
0.1718
0
0
68
61
0
0
M13
0.1748
0
0
69
71
0
0.01
M19
0.0205
4
0
56
72
0
0.01
M29
0.0550
*
0
0
66
72
0.01
0.01
M34
0
*
*
13
2
44
65
0
0
M44
0.1582
*
2
0
70
56
0.01
0
M53
0.1068
0
0
86
79
0.08
0.05
M54
0.0357
2
0
60
74
0
0.01
M77
0.1058
0
0
67
86
0.01
0.34
M78
0.1832
0
0
72
58
0
0
M88
0.0873
0
3
64
84
0.01
0.49
M95
0.2229
1
0
68
44
0
0
M100
0.0520
0
28
92
74
0.15
0.01
Am ∈ {0.8, 0.92}
Ap0
∈ {0.85}
*
*
*
*
*
*
Ac0 ∈ {0.86}
Ac0
C(4)
C98
M30
0.0928
*
*
6
0
89
80
0.34
∈ {0.9}
0.1
M36
0.1051
*
*
13
31
93
91
0.07
0.19
Modelo
convergência
Overshoot [%]
δν
PEPI
PEPI
*
LMS
0
ts [min]
M SE [%]
LMS
PEPI
LMS
PEPI
LMS
26
69
103
0
0.57
M98
0
C(5)
C60
Am ∈ {0.8, 0.92}
M42
0.0860
*
0
0
60
69
0
0
M58
0.0400
*
0
0
58
57
0
0
M60
0
*
0
0
59
57
0
0
M79
0.1056
*
0
0
62
67
0
0
0
0
60
70
0
0.01
Ap0 ∈ {0.8}
M84
0.0548
*
C(6)
C66
Am ∈ {0.83, 0.95}
Ap0 ∈ {0}
M5
0.1460
*
Ac0 ∈ {0.85}
Ac0 ∈ {0.85}
*
0
0
68
74
0.01
0.02
M6
0.2270
*
0
9
40
81
0
0.31
M10
0.1785
*
0
2
58
85
0
0.5
M11
0.1170
*
0
4
67
50
0.01
0
M12
0.1140
*
24
30
59
60
0
0
M17
0.0515
*
0
0
65
44
0.01
0
M20
0.1626
*
*
0
0
58
72
0
0.01
M23
0.0741
*
*
0
0
68
70
0.01
0.01
M25
0.1445
*
0
0
67
72
0.01
0.01
M27
0.1313
*
0
0
68
64
0
0
M32
0.1145
*
*
0
0
62
62
0.01
0
M38
0.2197
*
*
0
39
62
74
0
0.02
M41
0.1234
*
0
0
66
74
0.01
0.01
M43
0.0939
*
2
0
36
58
0
0
M47
0.1486
*
*
14
25
51
62
0
0
M49
0.1422
*
*
3
8
38
78
0
0.04
M50
0.1703
*
0
0
68
67
0
0
M51
0.1846
*
0
0
38
67
0
0
M55
0.1971
*
28
22
96
69
0.32
0.01
M56
0.1205
*
0
0
62
74
0
0.02
M59
0.3253
*
0
0
64
67
0
0.01
M61
0.1383
*
0
0
70
71
0.01
0.01
M64
0.0570
*
*
0
0
65
68
0.01
0
M66
0
*
*
0
6
38
51
0
0
M68
0.2263
*
*
4
0
51
68
0.03
0
M73
0.1745
*
0
0
54
74
0
0.02
M74
0.1014
*
0
2
38
37
0
0
M82
0.0784
*
0
0
65
68
0
0
M83
0.1959
*
*
9
37
34
74
0
0.02
M85
0.1450
*
*
0
0
69
75
0
0.02
M86
0.0792
*
*
0
0
61
44
0
0
M87
0.0851
*
0
0
66
74
0
0.01
M91
0.0326
*
0
0
67
75
0.01
0.01
*
*
*
93
94
Modelo
δν
convergência
Overshoot [%]
PEPI
LMS
PEPI
0
M99
0.1438
*
C(7)
C66
Am ∈ {0.83, 0.95}
M15
0.1087
*
M22
0.2397
M26
0.2522
M31
ts [min]
M SE [%]
LMS
PEPI
LMS
PEPI
LMS
0
70
72
0.01
0.01
Ap0 ∈ {0.5}
Ac0 ∈ {0.85}
0
0
71
57
0.01
0
*
0
0
85
56
0.16
0.01
*
13
0
89
65
0.1
0
0.3136
*
8
0
72
81
0.07
0.07
M33
0.2457
*
0
0
67
74
0.04
0.02
M35
0
0
0
68
68
0.01
0
M40
0.1483
*
0
0
71
62
0.01
0
M45
0.3067
*
6
0
71
77
0.02
0.04
M46
0.1639
*
0
21
69
69
0.01
0.01
M48
0.1398
*
0
0
70
71
0.01
0.01
M52
0.1846
*
0
39
71
159
0.01
1.6
M57
0.2879
*
3
0
87
73
0.14
0.02
M65
0.0850
*
0
14
72
73
0.01
0.02
M67
0.2429
*
0
0
74
73
0.03
0.02
M70
0.1402
*
*
0
1
71
50
0.01
0
M71
0.1230
*
*
0
0
72
55
0.01
0
M72
0.1479
*
*
0
0
72
50
0.01
0
M75
0.4166
*
*
2
0
72
79
0
0.05
M80
0.3061
*
0
0
70
73
0.01
0.01
M89
0.1833
*
0
0
70
70
0.01
0.01
M90
0.1882
*
24
0
80
78
0.09
0.04
M93
0.1628
*
0
0
70
58
0.02
0
M94
0.0737
0
32
67
75
0
0.02
M97
0.1478
0
0
72
69
0.01
0.01
*
*
*
*
Tabela C.2: Algoritmo K-médias adaptado ao Controlo Comutado com 7 centróides.
convergência
Overshoot [%]
PEPI
PEPI
LMS
ts [min]
Modelo
δν
C(1)
C76
M14
0.1502
0
0
72
58
0
0
M28
0.1106
1
6
35
35
0
0
M37
0.0765
0
0
67
58
0
0
M39
0.1652
9
0
77
44
0.03
0
M62
0.1534
35
30
56
58
0
0
M69
0.2850
7
10
58
65
0.02
0.02
M76
0
2
0
65
38
0
0
M78
0.1543
0
0
69
58
0
0
M81
0.1085
0
0
73
42
0
0
Am ∈ {0.8, 0.92}
Am ∈ {0.83, 0.95}
LMS
PEPI
M SE [%]
LMS
Ap0 ∈ {0.5}
Ap0
PEPI
LMS
Ac0 ∈ {0.89}
Ac0
C(2)
C16
M1
0.0723
*
0
0
61
56
0
0
M9
0.0536
*
0
0
67
57
0.01
0
M13
0.0751
*
0
0
67
58
0.01
0
*
0
0
75
62
0.01
0
*
0
0
68
60
0
0
*
0
0
62
59
0
0
∈ {0.85}
M16
0
M18
0.1186
M24
0.0950
M27
0.0784
*
0
0
67
66
0.01
0
M50
0.0777
*
0
8
68
58
0.01
0.04
M61
0.0848
*
0
25
69
104
0.01
0.73
M63
0.1245
*
0
0
69
158
0
0.36
M85
0.0710
*
0
0
67
52
0.01
0
M92
0.1905
*
0
0
69
59
0
0
M95
0.0961
*
*
0
0
66
42
0
0
M96
0.0921
*
*
0
0
57
39
0
0
*
0
0
69
59
0.01
0
M99
0.0941
C(3)
C4
M2
0.1703
M3
0.0427
M4
0
M7
*
∈ {0.5}
*
Am ∈ {0.75 ± 0.2i, 0.92}
*
Ap0 ∈ {0.5}
Ac0 ∈ {0.85}
*
8
0
63
42
0
0
*
5
2
53
37
0
0
0
0
64
59
0
0
0.0400
0
0
66
58
0
0
M8
0.0278
3
0
56
55
0.01
0
M19
0.0261
2
0
54
38
0.01
0
M34
0.0381
*
12
4
42
56
0
0
M44
0.1235
*
1
0
66
58
0
0
M53
0.0691
*
0
0
66
57
0
0
M54
0.0262
1
0
56
54
0.01
0
M77
0.0705
1
0
63
53
0
0
M88
0.0494
0
0
61
59
0
0
M98
0.0289
0
0
67
61
0
0
*
*
95
96
convergência
Overshoot [%]
PEPI
PEPI
Modelo
δν
M100
0.0283
C(4)
C30
M30
0
*
*
0
0
67
61
M36
0.0545
*
*
3
0
69
M45
0.1520
*
*
0
0
70
M75
0.0551
*
*
0
3
69
63
C(5)
C58
M17
0.0430
M21
0.0643
M23
0.0535
M42
0.0744
M58
0
M60
0.0400
M74
0.0460
M79
0.0766
M82
0.0574
M84
0.0323
LMS
ts [min]
7
Am ∈ {0.8, 0.92}
M SE [%]
LMS
PEPI
LMS
0
62
57
Ap0 ∈ {0.85}
PEPI
LMS
0.01
0
Ac0 ∈ {0.9}
0
0
62
0
0
63
0.02
0
0
0.01
Am ∈ {0.8, 0.92}
Ap0
*
0
0
63
56
0
0
0
0
59
68
0
0
*
0
0
67
57
0.01
0
*
0
0
59
67
0
0.01
*
0
0
58
61
0
0
*
0
0
59
52
0
0
*
0
0
38
37
0
0
*
0
0
62
68
0
0.01
*
0
0
63
55
0
0
*
0
0
60
61
0
0
*
*
*
*
Am ∈ {0.83, 0.95}
Ac0
∈ {0.8}
Ap0
Ac0
∈ {0}
∈ {0.85}
C(6)
C87
∈ {0.85}
M11
0.0464
*
*
0
0
68
73
0
0.01
M12
0.0528
*
*
25
27
61
57
0
0
M25
0.0637
*
*
0
0
63
57
0
0
M29
0.0646
*
*
0
0
64
56
0
0
M32
0.1028
*
*
0
0
62
60
0
0
M41
0.0511
*
*
0
0
67
56
0.01
0
M43
0.0395
*
*
0
6
36
74
0
0.01
M47
0.1074
*
*
14
42
52
85
0.01
0.16
M49
0.0645
*
5
22
51
86
0.01
0.53
M56
0.0637
*
*
0
0
64
54
0
0
M64
0.0326
*
*
0
0
64
66
0.01
0
M66
0.0851
*
*
0
0
38
60
0
0
M73
0.0913
*
*
0
0
52
62
0
0
M80
0.0269
*
*
0
0
69
59
0.01
0
M86
0.0922
*
*
0
0
58
57
0
0
M87
0
*
*
0
0
65
56
0
0
M91
0.0672
*
*
0
0
66
58
0.01
0
C(7)
C70
Am ∈ {0.83, 0.95}
Ap0
M5
0.0925
0
54
66
120
0
8.35
M6
0.1275
1
0
43
74
0
0.01
M10
0.1441
0
0
59
79
0.01
0.05
M15
0.0539
0
0
68
86
0.01
0.43
M20
0.1368
0
0
56
70
0
0.01
*
∈ {0.5}
Ac0
∈ {0.85}
convergência
Overshoot [%]
PEPI
LMS
PEPI
Modelo
δν
M22
0.1042
*
M26
0.1600
*
M31
0.1812
M33
M35
M38
0.0986
M40
0.0623
M46
0.0273
M48
0.1643
M51
0.0824
M52
0.3119
M55
0.1283
M57
0.1526
M59
0.1515
M65
ts [min]
M SE [%]
LMS
PEPI
LMS
PEPI
1
1
84
66
0.16
0
9
13
87
80
0.05
0.05
*
0
0
108
85
0.37
0.51
0.1103
*
7
0
67
76
0.03
0.02
0.1402
*
0
0
65
66
0
0
0
0
64
74
0
0.01
*
0
2
71
49
0.02
0
*
0
0
90
72
0.34
0.01
0
2
69
114
0.01
2.08
7
0
50
59
0.01
0
0
2
70
104
0.01
0.62
30
24
54
63
0
0
*
0
0
64
63
0.04
0
*
0
0
76
64
0.03
0
0.0675
*
0
0
71
92
0.01
2.64
M67
0.1048
*
9
0
67
56
0.05
0
M68
0.0981
*
6
0
298
65
29.30
0
M70
0
0
13
87
99
0.14
0.13
M71
0.0251
0
17
69
119
0.02
7.93
M72
0.0551
0
34
81
106
0.07
1.35
M83
0.0734
12
15
73
50
0.03
0
M89
0.0908
0
0
69
250
0
0.12
M90
0.0852
*
0
26
61
87
0
0.28
M93
0.1048
*
2
7
67
58
0
0.01
M94
0.1815
0
0
64
70
0
0.01
M97
0.1487
0
44
72
97
0.01
1.53
*
*
LMS
97
Tabela C.3: Algoritmo Aglomerativo com 7 centróides.
98
convergência
Overshoot [%]
PEPI
PEPI
Modelo
δν
C(1)
C85
LMS
M1
0.0846
*
*
Am ∈ {0.8, 0.92}
LMS
ts [min]
PEPI
LMS
Ap0 ∈ {0.75}
0
0
M SE [%]
PEPI
LMS
Ac0 ∈ {0.9}
64
50
0
0
M9
0.0421
*
*
0
0
66
64
0
0
M13
0.0418
*
*
61
0
133
67
11.82
0
M16
0.0710
*
*
1
0
59
64
0
0
M17
0.1328
*
*
0
0
64
62
0
0
M23
0.0915
*
62
0
117
66
16.11
0
M24
0.0909
*
*
0
0
64
45
0
0
M27
0.0590
*
*
0
0
66
68
0
0
M29
0.1152
*
*
1
0
115
64
4.17
0
M42
0.1009
*
3
0
236
62
66.74
0
M50
0.0694
*
*
0
0
66
66
0
0
M58
0.1126
*
*
11
0
67
61
0.33
0
M60
0.1357
*
*
2
0
62
56
0
0
M61
0.0314
*
4
0
103
69
2.15
0
M74
0.1266
*
18
0
127
37
3.71
0
M79
0.1082
*
0
1
68
63
0.05
0.01
M82
0.0927
*
46
0
103
64
3.06
0
M84
0.1339
9
0
80
62
0.39
0
63
0
123
68
17.73
0
1
0
80
56
0.09
0
*
3
0
149
61
7.84
0
9
17
121
106
6.74
0.2
*
M85
0
M21
0.0638
*
*
M96
0.0851
*
M99
0.0562
*
C(2)
C4
Am ∈ {0.83, 0.95}
Ap0 ∈ {0.5}
M2
0.1703
*
0
0
56
42
0
M3
0.0427
15
24
124
64
3.21
0
M4
0
1
2
115
76
2.49
0.02
M7
0.0400
46
0
125
70
4.35
0.01
*
Ac0 ∈ {0.85}
0
M8
0.0278
52
0
118
65
7.7
0
M19
0.0261
53
5
124
38
8.83
0
M30
0.0947
47
0
123
82
4.7
0.2
M34
0.0381
54
4
120
36
7.83
0
M36
0.1024
37
16
129
90
1.78
0.12
M44
0.1235
0
0
67
134
0.05
0.45
M53
0.0691
34
0
143
68
1.36
0
M54
0.0262
13
0
121
65
3.59
0
M62
0.2124
28
33
62
66
0
0
M75
0.0623
2
0
125
88
2.62
0.1
M77
0.0705
41
24
131
81
2.47
0.06
M78
0.1582
0
0
67
62
0.01
0
*
*
*
convergência
Overshoot [%]
PEPI
PEPI
LMS
PEPI
LMS
PEPI
LMS
ts [min]
M SE [%]
Modelo
δν
M88
0.0494
5
16
126
68
2.63
0
M98
0.0289
1
0
126
72
3.48
0.02
M100
0.0283
45
0
124
76
4.01
0.02
Am ∈ {0.7 ± 0.2i, 0.92}
Ap0
Ac0
C(3)
C56
M11
0.0257
*
*
56
0
110
74
10.27
0.01
M12
0.0929
*
*
79
30
135
58
114.17
0
M22
0.1378
*
*
0
0
109
83
7.89
0.12
M25
0.0814
*
*
47
0
114
62
5.83
0
M31
0.1750
*
*
0
0
110
65
6.54
0.01
M32
0.0696
*
*
2
0
103
47
5.02
0
M33
0.0941
*
*
0
0
111
74
7.78
0.02
M41
0.0390
*
*
7
0
109
67
6.24
0
M43
0.0767
*
69
0
124
36
33.39
0
M45
0.1418
*
*
0
0
111
83
7.11
0.16
M47
0.0474
*
*
27
19
166
53
8.08
0
M49
0.0453
*
14
9
126
42
6.2
0
M51
0.0882
*
1
0
135
68
7.78
0
M55
0.0834
*
73
34
136
58
53.22
0
M56
0
*
*
68
0
117
43
29.55
0
M57
0.1293
*
*
51
0
109
75
6.66
0.02
M64
0.0832
*
*
68
0
111
67
22.58
0
M66
0.1205
*
26
0
108
59
4.66
0
M67
0.1186
*
*
0
0
111
72
7.71
0.01
M68
0.1217
*
*
0
0
120
50
7.06
0
M73
0.0695
*
*
11
20
118
62
4.95
0
M80
0.0890
*
*
6
0
113
64
6.97
0
M86
0.0815
*
*
0
0
61
63
0
0
M87
0.0637
*
*
11
0
108
58
5.56
0
M89
0.0846
*
*
2
0
111
64
9.03
0
M90
0.0831
*
*
59
0
114
88
11.64
0.69
*
*
66
0
104
67
9.97
0
*
M91
0.1069
C(4)
C65
M5
0.0781
*
M6
0.0731
*
M10
0.0933
*
M15
0.0720
*
M20
0.1029
*
*
M26
0.2092
*
M35
0.0850
*
M38
0.0321
*
M40
0.0640
*
Am ∈ {0.8, 0.92}
*
∈ {0.5}
LMS
Ap0 ∈ {0.85}
∈ {0.85}
Ac0 ∈ {0.9}
0
0
89
64
2.27
0
78
29
125
69
47.43
0
80
0
264
59
96.53
0
68
21
195
115
63.17
4.47
61
0
105
58
8.16
0
*
50
0
103
74
4.63
0.02
*
62
0
99
61
0.2
0
6
3
103
75
7.35
0.01
14
0
120
65
7.18
0
*
*
99
100
convergência
Overshoot [%]
ts [min]
M SE [%]
Modelo
δν
PEPI
LMS
PEPI
LMS
PEPI
LMS
PEPI
LMS
M46
0.0935
*
*
66
0
116
73
13.79
0.01
M48
0.1195
*
*
1
0
101
65
5.53
0
M52
0.2633
*
73
5
284
110
63.09
2.11
M59
0.1181
*
74
0
229
197
37.37
0.64
M65
0
*
*
99
0
300
74
105.97
0.01
M70
0.0675
*
*
3
0
111
71
6.89
0.01
M71
0.0550
*
*
2
0
107
75
5.38
0.02
M72
0.0935
*
*
5
0
113
75
7.57
0.02
M83
0.0743
*
6
36
34
74
0
0.01
M93
0.1354
*
*
9
0
130
69
10.5
0.01
M94
0.1468
*
*
4
0
63
60
0.01
0
M97
0.1036
*
*
68
14
236
73
46.16
0.01
C(5)
C37
Am ∈ {0.8, 0.92}
Ap0
M14
0.1012
*
*
0
0
67
63
0.01
0
M28
0.1440
*
*
0
8
60
35
0
0
M37
0
*
0
0
66
58
0
0
M76
0.0765
*
*
0
2
40
38
0
0
M95
0.1534
*
*
0
0
61
68
0.04
0
Ac0
∈ {0.8}
∈ {0.85}
C(6)
C63
Am ∈ {0.83, 0.95}
Ap0
M18
0.1327
*
*
0
0
63
63
0
0
M63
0
*
*
1
0
67
188
0
2.61
*
*
0
0
67
59
0
0
Ac0
∈ {0}
∈ {0.85}
M92
0.1159
C(7)
C39
M39
0
0
0
65
45
0.01
0
M69
0.1453
0
0
73
70
0.01
0.01
M81
0.0824
0
0
63
42
0
0
Am ∈ {0.83, 0.95}
Ap0 ∈ {0.7}
Ac0 ∈ {0.85}
Tabela C.4: Algoritmo Intuitivo com 12 centróides.
Modelo
δν
C(1)
C14
M14
convergência
Overshoot [%]
PEPI
PEPI
LMS
LMS
ts [min]
PEPI
M SE [%]
LMS
PEPI
LMS
Am ∈ {0.8, 0.92}
Ap0 ∈ {0.5}
0
*
22
0
294
57
0.95
0
M28
0.2387
*
6
5
121
35
0.42
0
M37
0.1012
*
0
0
57
56
0
0
M39
0.1512
*
33
0
300
44
8.75
0
M62
0.2956
*
44
29
300
59
6.82
0
M69
0.2912
*
41
8
300
57
4.88
0.02
M76
0.1502
*
8
0
300
38
7.30
0
*
0
0
55
42
0
0
M81
0.0905
C(2)
C21
M1
0.1071
M16
0.1062
M18
0.2216
*
M21
0
*
M24
0.0677
*
M63
0.2013
*
M92
0.2620
*
*
M96
0.0817
C(3)
C88
Am ∈ {0.83, 0.95}
Ap0 ∈ {0.5}
*
Ac0 ∈ {0.89}
Ac0 ∈ {0.85}
*
0
0
55
48
0
0
*
0
0
69
56
0
0
*
0
0
57
60
0
0
0
2
68
54
0
0
0
0
54
48
0
0
5
1
57
286
0
0.34
*
0
0
57
59
0
0
*
6
0
57
39
0.02
0
*
Am ∈ {0.75, 0.85}
Ap0 ∈ {0.89}
Ac0 ∈ {0.91}
M2
0.1238
*
*
30
0
299
42
6.26
0
M44
0.0790
*
*
34
0
300
53
4.12
0
M53
0.0203
*
39
3
300
51
2.95
0
M77
0.0401
*
37
0
300
75
3.9
0.01
M78
0.1294
*
16
0
120
58
0.27
0
M88
0
*
4
0
300
67
2.86
0
0
61
44
0.02
0
*
*
M95
0.1950
C(4)
C98
*
7
M30
0.0928
*
*
18
0
298
M36
0.1051
*
*
45
11
M98
0
*
3
27
Am ∈ {0.75, 0.88}
Ap0
Am ∈ {0.83, 0.95}
Ap0 ∈ {0.85}
Ac0 ∈ {0.85}
53
3.28
0
300
70
3.87
0.01
59
108
0.02
0.75
Ac0
C(5)
C34
∈ {0.9}
∈ {0.85}
M3
0.0487
*
*
8
0
74
37
0.07
0
M4
0.0381
*
*
17
7
126
48
0.34
0
M7
0.0522
*
*
12
0
106
51
0.22
0
M8
0.0164
*
*
2
0
55
59
0
0
M9
0.1718
*
*
0
0
57
54
0
0
M13
0.1748
*
*
2
0
59
52
0
0
M19
0.0205
*
*
9
0
74
39
0.09
0
M29
0.0550
*
*
4
0
57
56
0.01
0
M34
0
*
*
5
2
56
70
0.02
0.01
101
Overshoot [%]
PEPI
LMS
Modelo
δν
PEPI
LMS
M54
0.0357
*
*
5
M100
0.0520
*
*
20
Am ∈ {0.8, 0.9}
ts [min]
M SE [%]
PEPI
LMS
PEPI
LMS
0
67
58
0.02
0
8
298
48
2.43
0
Ap0
∈ {0.75}
Ac0
C(6)
C60
M42
0.0860
*
*
0
0
55
60
0
0
M58
0.0400
*
*
0
0
55
55
0
0
M60
0
*
*
0
0
56
56
0
0
M79
0.1056
*
*
0
0
61
67
0
0
M84
0.0548
*
*
0
0
71
62
0.01
0
Am ∈ {0.8, 0.88}
Ap0
∈ {0.75}
Ac0
∈ {0.85}
C(7)
C82
M12
0.0827
*
*
15
27
40
58
0
0
M25
0.0993
*
*
7
0
71
58
0.03
0
M27
0.0974
*
*
0
0
57
69
0
0.01
M43
0.0693
*
*
1
5
54
36
0
0
M47
0.1784
*
*
2
16
49
50
0
0
M49
0.1419
*
*
0
12
51
75
0
0.03
M50
0.1303
*
*
0
0
57
58
0
0.03
M61
0.0902
*
*
0
1
60
56
0
0
M73
0.1562
*
*
0
0
71
56
0.01
0
M74
0.0375
*
*
1
1
54
37
0
0
M82
0
*
*
0
0
57
53
0
0
M85
0.0927
*
*
1
0
59
51
0
0
M87
0.0811
*
*
0
0
71
75
0.01
0.02
M99
0.0985
*
0
0
57
54
0
0
Am ∈ {0.8, 0.88}
Ap0
∈ {0.52}
C(8)
102
convergência
C70
Ac0
∈ {0.85}
∈ {0.85}
M31
0
*
*
24
0
299
55
2.94
0
M33
0.0945
*
*
0
0
60
53
0
0
M45
0.0463
*
*
24
0
300
56
1.72
0
M57
0.0519
*
*
34
0
300
53
1.72
0
M75
0.2276
*
*
15
0
65
60
0.34
0
C(9)
C66
Am ∈ {0.8, 0.88}
Ap0
Ac0
∈ {0.7}
∈ {0.85}
M5
0.1460
*
0
0
56
59
0
0.03
M11
0.1170
*
4
0
56
53
0.01
0
M17
0.0515
*
0
0
56
55
0
0
M23
0.0741
*
0
0
57
60
0
0
M32
0.1145
*
0
0
55
71
0
0.01
M41
0.1234
*
4
0
68
58
0.01
0
M51
0.1846
*
2
0
64
58
0
0
M55
0.1971
*
19
23
61
57
0.01
0
M56
0.1205
*
3
0
67
58
0.01
0
M64
0.0570
*
0
0
71
73
0.01
0.01
M66
0
*
0
0
57
59
0
0
*
*
convergência
Overshoot [%]
PEPI
LMS
PEPI
Modelo
δν
M68
0.2263
*
M83
0.1959
*
M86
0.0792
M SE [%]
LMS
PEPI
LMS
PEPI
LMS
6
0
300
71
1.62
0.01
0
11
47
42
0
0
*
0
0
54
45
0
0
*
0
0
71
58
0.01
0
M91
0.0326
C(10)
C67
M22
0.0407
*
*
18
7
297
56
1.01
M26
0.1497
*
*
13
0
299
61
1.92
0
M40
0.1212
*
*
0
0
57
70
0
0.01
M67
0
*
*
0
0
62
55
0.16
0
M71
0.1235
*
*
0
8
59
50
0
0
M80
0.2036
*
*
0
0
57
60
0
0
M89
0.1061
*
*
0
0
55
59
0
0
M90
0.0945
*
*
1
5
65
58
0
0
M93
0.1489
*
*
9
0
298
58
0.92
0
Am ∈ {0.8, 0.94}
Ap0
∈ {0.52}
C(11)
C10
*
ts [min]
Am ∈ {0.75, 0.82}
Ap0 ∈ {0.75}
Ac0 ∈ {0.85}
Ac0
0
∈ {0.85}
M6
0.0537
*
*
0
0
56
55
0
0
M10
0
*
*
0
0
57
55
0
0
M20
0.0299
*
*
0
0
56
53
0
0
M38
0.0703
*
*
0
0
58
56
0
0
M59
0.1694
*
*
1
0
59
56
0
0
Am ∈ {0.83, 0.95}
Ap0
0.1087
*
*
0
0
60
70
0
0.01
0
*
*
0
0
59
60
0
0
M46
0.1639
*
*
4
17
64
69
0.02
0.01
M48
0.1398
*
*
0
0
57
58
0
0
M52
0.1846
*
*
19
40
300
186
1.77
1.4
M65
0.0850
*
*
0
6
60
54
0
0
M70
0.1402
*
*
0
0
59
53
0
0
M72
0.1479
*
*
0
0
59
55
0
0
M94
0.0737
*
*
0
6
58
56
0
0.05
M97
0.1478
*
*
0
0
59
62
0
0
C(12)
C35
M15
M35
Ac0
∈ {0.5}
∈ {0.85}
103
Tabela C.5: Algoritmo K-médias adaptado ao Controlo Comutado com 12 centróides.
104
convergência
Overshoot [%]
PEPI
PEPI
Modelo
δν
C(1)
C76
M14
0.1502
*
M28
0.1106
*
M37
0.0765
M39
0.1652
*
M62
0.1534
M69
0.2850
M76
0
M81
0.1085
C(2)
C16
M1
LMS
Am ∈ {0.8, 0.92}
*
LMS
ts [min]
PEPI
M SE [%]
LMS
Ap0 ∈ {0.98}
PEPI
LMS
Ac0 ∈ {0.89}
33
2
300
61
3.24
0
9
6
59
35
0.1
0
0
0
59
56
0
0
5
0
300
44
8.57
0
*
7
30
300
58
4.66
0
*
20
10
300
65
15.94
0.02
*
23
0
298
38
4.13
0
*
50
0
300
42
6.95
0
Am ∈ {0.83, 0.95}
Ap0 ∈ {0.5}
0.0723
*
*
0
0
55
51
0
0
Ac0 ∈ {0.85}
M9
0.0536
*
*
0
0
58
55
0
0
M13
0.0751
*
*
2
0
59
53
0
0
M16
0
*
0
0
67
62
0.01
0
M18
0.1186
*
*
0
0
62
59
0
0
M24
0.0950
*
*
0
0
54
59
0
0
M27
0.0784
*
*
0
0
59
71
0
0.01
M50
0.0777
*
*
0
0
58
57
0
0
M61
0.0848
*
*
0
23
59
106
0
0.63
M63
0.1245
*
5
9
57
157
0
0.09
M85
0.0710
*
*
0
0
58
52
0
0
M92
0.1905
*
*
0
0
57
59
0
0
M95
0.0961
*
*
7
0
60
42
0.02
0
M96
0.0921
*
*
3
0
56
38
0
0
M99
0.0941
*
*
1
0
74
55
0.01
0
Am ∈ {0.75, 85}
Ap0
∈ {0.89}
Ac0
C(3)
C53
M2
0.1066
*
*
11
0
300
41
3.33
0
M44
0.0627
*
*
15
0
132
58
0.37
0
M53
0
*
*
13
0
85
57
0.14
0
M77
0.0335
*
*
14
0
77
53
0.1
0
M78
0.1261
*
*
14
0
81
58
0.08
0
0
75
58
0.05
0
*
12
∈ {0.91}
M88
0.0203
C(4)
C30
M30
0
*
*
9
0
73
61
0.06
M36
0.0545
*
*
2
0
58
62
0.03
0
M75
0.0551
*
*
0
4
59
63
0
0.01
C(5)
C8
M3
M4
M7
Am ∈ {0.83, 0.95}
Ap0 ∈ {0.85}
Ac0 ∈ {0.85}
0
Am ∈ {0.75, 0.88}
Ap0 ∈ {0.9}
0.0513
*
*
2
2
56
37
0
0
0.0278
*
*
11
0
73
60
0.01
0
0.0426
*
*
6
0
58
58
0.01
0
Ac0 ∈ {0.85}
Modelo
convergência
Overshoot [%]
δν
PEPI
LMS
PEPI
LMS
PEPI
LMS
PEPI
LMS
ts [min]
M SE [%]
M8
0
*
*
0
0
56
52
0
0
M19
0.0267
*
*
2
0
56
38
0
0
M34
0.0164
*
*
0
5
56
64
0
0
M54
0.0205
*
*
0
0
55
51
0
0
M98
0.0178
*
*
1
0
57
61
0
0
M100
0.0366
*
*
11
0
72
56
0.02
0
∈ {0.75}
Ac0
C(6)
C58
M17
0.0430
*
*
0
0
56
55
0
0
M21
0.0643
*
*
0
13
56
108
0
0.11
M23
0.0535
*
*
0
0
57
54
0
0
M42
0.0744
*
*
26
0
300
68
2.26
0.01
M58
0
*
*
21
0
300
67
0.59
0
M60
0.0400
*
*
17
0
300
56
1.43
0
M79
0.0766
*
*
1
0
80
68
0.07
0.01
M82
0.0574
*
*
0
0
57
47
0
0
*
*
0
2
63
60
0
0
M84
0.0323
C(7)
C43
M12
Am ∈ {0.8, 0.9}
Ap0
∈ {0.85}
Am ∈ {0.8, 0.88}
Ap0 ∈ {0.75}
0.0275
*
*
15
27
41
59
0
0
M25
0.0528
*
*
0
0
56
55
0
0
M29
0.0578
*
*
0
0
56
53
0
0
M43
0
*
*
0
0
55
70
0
0.01
M64
0.0389
*
*
0
0
56
71
0
0.01
M66
0.0939
*
*
0
0
58
58
0
0
M74
0.0372
*
*
0
0
55
37
0
0
M80
0.0372
*
*
0
0
57
58
0
0
M87
0.0395
*
*
0
0
73
53
0.01
0
M91
0.0747
*
*
0
0
74
55
0.01
0
Am ∈ {0.8, 0.88}
Ap0
∈ {0.52}
Ac0 ∈ {0.85}
Ac0
C(8)
C57
M22
0.0532
*
*
0
0
62
71
∈ {0.85}
0
0.01
M31
0.0519
*
*
1
0
57
90
0
0.6
M33
0.0491
*
*
0
0
59
73
0
0.02
M45
0.0398
*
*
0
0
61
88
0
0.3
M55
0.0563
*
15
24
41
49
0
0
M57
0
*
*
1
0
63
65
0
0
M67
0.0509
*
*
0
3
61
56
0
0
C(9)
C56
Am ∈ {0.8, 0.88}
Ap0
M11
0.0257
*
0
0
56
67
0
0.01
M32
0.0696
*
0
0
57
75
0
0.02
M41
0.0390
*
0
0
57
53
0
0
M47
0.0474
*
0
15
34
49
0
0
M49
0.0453
0
29
54
62
0
0
*
Ac0
∈ {0.7}
∈ {0.85}
105
Modelo
106
δν
M56
0
M73
0.0695
M86
0.0815
convergência
Overshoot [%]
PEPI
LMS
PEPI
LMS
PEPI
LMS
PEPI
*
0
0
56
49
0
0
*
0
0
53
69
0
0.01
*
0
0
56
63
0
0.01
Am ∈ {0.75, 0.82}
Ap0
∈ {0.75}
*
ts [min]
M SE [%]
Ac0
LMS
C(10)
C51
M5
0.0742
*
*
0
9
58
57
∈ {0.85}
0
0.02
M51
0
*
*
0
0
55
65
0
0
M68
0.0710
*
*
0
0
53
70
0
0.01
M83
0.0649
*
*
0
8
54
34
0
0
M89
0.0542
*
*
0
0
57
58
0
0.01
*
*
0
23
55
89
0
0.28
M90
0.0703
C(11)
C6
M6
0
*
*
0
0
57
48
0
0
M10
0.0537
*
*
0
0
58
59
0
0
M20
0.0686
*
*
0
0
57
58
0
0
M35
0.0650
*
*
0
0
58
71
0
0.01
M38
0.0526
*
*
0
0
58
79
0
0.05
M48
0.0796
*
*
0
45
57
109
0
4.43
M52
0.2372
*
36
0
300
87
7.87
0.23
M59
0.1184
*
*
0
0
58
69
0
0.01
M94
0.1374
*
*
0
0
58
59
0
0
M97
0.0912
*
*
0
0
58
64
0
0
Am ∈ {0.8, 0.84}
Ap0 ∈ {0.52}
Ac0 ∈ {0.85}
C(12)
C71
Am ∈ {0.83, 0.95}
Ap0
M15
0.0353
*
*
0
0
60
69
0
0
M26
0.1566
*
*
4
8
60
61
0.01
0.02
M40
0.0623
*
*
0
1
58
51
0
0
M46
0.0442
*
*
0
0
59
73
0
0.02
M65
0.0550
*
*
0
0
58
71
0
0
M70
0.0251
*
*
0
8
59
61
0
0.03
M71
0
*
*
0
3
59
64
0
0
M72
0.0415
*
*
0
0
59
80
0
0.06
M93
0.0924
*
*
0
2
59
61
0
0
Ac0
∈ {0.5}
∈ {0.85}
Tabela C.6: Algoritmo Aglomerativo com 12 centróides.
convergência
Overshoot [%]
PEPI
PEPI
LMS
δν
C(1)
C82
M9
0.0989
*
*
47
17
300
102
7.97
0.2
M12
0.0827
*
*
19
26
48
68
0
0
M17
0.0483
*
*
0
0
60
58
0
0
M21
0.0607
*
45
0
300
60
5.96
0
M23
0.0410
*
*
0
0
63
59
0
0
M27
0.0974
*
*
0
0
62
61
0
0
M29
0.0579
*
*
0
0
62
89
0
0.14
M42
0.0750
*
56
0
300
60
14.91
0
M43
0.0693
*
*
0
3
59
37
0
0
M50
0.1303
*
*
38
12
300
108
10.76
2.01
M58
0.0574
*
*
48
0
300
58
8.89
0
M60
0.0449
*
*
64
0
300
59
16.09
0
M61
0.0902
*
*
0
14
66
111
0
2.65
M64
0.0610
*
*
0
0
63
44
0
0
M66
0.0784
*
*
0
0
63
58
0
0
M74
0.0375
*
*
0
0
59
56
0
0
M79
0.1086
*
1
0
87
61
0.08
0
M80
0.0559
*
*
0
13
64
90
0
0.1
M82
0
*
*
0
0
63
63
0
0
M84
0.0824
*
*
57
46
300
300
11.55
6.95
M87
0.0811
*
*
44
0
300
68
12.15
0
M91
0.0609
*
*
55
0
300
56
17.61
0
M99
0.0985
*
*
58
14
300
101
13.24
1.45
C(2)
C2
Am ∈ {0.78, 0.85}
PEPI
M SE [%]
Modelo
Am ∈ {0.83, 0.95}
LMS
ts [min]
LMS
Ap0 ∈ {0.75}
PEPI
LMS
Ac0 ∈ {0.85}
Ap0 ∈ {0.75}
Ac0 ∈ {0.85}
M2
0
*
26
6
231
45
1.07
0.03
M44
0.0519
*
14
0
95
74
0.23
0.01
M62
0.0606
*
*
32
20
297
48
2.11
0.02
*
*
0
0
66
55
0.04
0
M78
0.0966
C(3)
C54
M3
0.0526
*
*
1
0
60
38
0
0
M4
0.0262
*
*
7
0
63
57
0.01
0
M7
0.0430
*
*
5
0
64
62
0.01
0
M8
0.0205
*
0
0
62
67
0.01
0.01
M19
0.0370
*
0
26
61
300
0.01
2.07
M25
0.0772
*
0
2
62
93
0.01
0.11
M30
0.0786
*
8
4
63
59
0.01
0.03
M34
0.0357
*
8
1
60
37
0
0
M36
0.0958
*
*
6
0
65
75
0.03
0.02
M53
0.0833
*
*
12
0
90
67
0.11
0
Am ∈ {0.75 ± 0.2i, 0.92}
*
Ap0 ∈ {0.5}
Ac0 ∈ {0.85}
107
convergência
Overshoot [%]
δν
PEPI
PEPI
LMS
PEPI
LMS
PEPI
LMS
M54
0
*
1
1
61
51
0.01
0.04
M75
0.0545
*
1
2
65
62
0.01
0.02
M77
0.0787
*
*
10
0
72
73
0.03
0.01
M88
0.0653
*
*
8
0
63
68
0.02
0
M98
0.0200
*
1
2
64
57
0.01
0.04
M100
0.0176
*
6
3
62
52
0.01
0
Modelo
*
Am ∈ {0.75 ± 0.2i, 0.85}
Ap0
∈ {0.5}
M SE [%]
Ac0
C(4)
C5
M5
0
*
*
0
37
63
97
0
1.88
M10
0.0854
*
*
0
0
62
60
0
0
M20
0.0755
*
*
0
59
61
99
0
1.21
M32
0.0613
*
*
0
45
62
300
0
10.18
M48
0.0990
*
*
0
11
62
64
0
0
M65
0.0781
*
*
0
11
64
115
0
7.84
M83
0.0567
*
*
2
5
34
69
0
0
M86
0.0896
*
*
0
0
60
58
0
0
M89
0.0524
*
*
0
54
62
90
0
1.63
M90
0.0582
*
*
0
2
57
108
0
1.6
M97
0.0788
*
*
0
11
64
97
0
1.72
Am ∈ {0.8, 0.92}
Ap0
Ac0
∈ {0.7}
∈ {0.86}
C(5)
C35
M6
0.0650
*
*
0
6
59
66
0
0.01
M35
0
*
*
0
0
63
72
0
0
M38
0.0665
*
*
0
30
62
69
0
0
M59
0.0550
*
0
0
62
73
0
0
M94
0.0737
*
0
4
62
79
0
0.2
∈ {0.85}
Am ∈ {0.8, 0.92}
Ap0
∈ {0.7}
0
20
62
154
0
13.26
Ac0
C(6)
C55
M11
0.0976
M22
0.0692
*
0
39
66
281
0
12.15
M31
0.1032
*
0
0
62
151
0
12.81
M33
0.0405
*
0
8
63
56
0
0
M41
0.0970
*
0
0
62
73
0
0.01
M45
0.0840
*
0
0
64
82
0
0.17
M47
0.0676
6
9
34
70
0
0
M49
0.0906
*
0
0
60
67
0
0
M51
0.0619
*
0
42
59
300
0
12.57
M55
0
23
52
49
67
0
0
M56
0.0834
0
12
61
131
0
8.05
M57
0.0563
*
0
36
61
85
0
0.25
M67
0.0517
*
0
15
62
71
0
0
M68
0.0583
*
0
23
59
300
0
6.85
M73
0.0806
*
0
28
59
300
0
3.83
Am ∈ {0.8, 0.92}
Ap0
C(7)
108
LMS
ts [min]
C81
∈ {0.5}
Ac0
∈ {0.85}
∈ {0.7}
convergência
Overshoot [%]
ts [min]
M SE [%]
Modelo
δν
PEPI
LMS
PEPI
LMS
PEPI
LMS
PEPI
LMS
M14
0.0905
*
*
4
0
68
59
0.03
0
M37
0.1143
*
0
0
67
60
0
0
M39
0.0824
*
*
8
0
300
59
2.51
0
M76
0.1085
*
*
25
0
300
39
1.02
0
M81
0
*
*
33
0
300
56
1.92
0
Ac0
C(8)
C72
M15
0.0519
*
*
0
0
64
75
0
0.01
M26
0.1170
*
*
0
27
63
88
0
0.48
M40
0.0891
*
*
0
66
63
90
0
2.9
M46
0.0337
*
*
0
41
62
151
0
2.89
M70
0.0551
*
0
14
63
114
0
8.02
M71
0.0415
*
0
4
64
120
0
1.6
M72
0
*
0
15
63
117
0
9.96
M93
0.0549
*
0
99
64
300
0
9.16
Am ∈ {0.8, 0.92}
Ap0
C(9)
C1
Am ∈ {0.8, 0.92}
Ap0
∈ {0.5}
Ac0
∈ {0.5}
∈ {0.85}
∈ {0.85}
M1
0
*
*
41
0
300
58
4.56
0
M13
0.0617
*
*
0
0
66
93
0
0.08
M16
0.0723
*
*
12
34
68
78
0
0.03
M18
0.1542
*
54
24
300
71
8.41
0
M24
0.0542
*
*
30
0
300
55
6.53
0
M28
0.1022
*
*
5
1
62
35
0.01
0
M85
0.0846
*
*
0
1
66
55
0
0
M95
0.0652
*
*
0
0
66
55
0
0
M96
0.0385
*
*
0
0
61
52
0
0
C(10)
C52
M52
0
Am ∈ {0.8, 0.92}
Ap0
*
6
*
0
Ac0
∈ {0.5}
63
88
∈ {0.85}
0
2.47
C(11)
C92
Am ∈ {0.8, 0.92}
Ap0
M63
0.1159
*
0
1
63
80
0
0.1
M92
0
*
0
0
64
57
0
0
Am ∈ {0.8, 0.92}
Ap0
∈ {0.92}
0
300
C(12)
C69
M69
0
*
30
Ac0
∈ {0.5}
Ac0
58
∈ {0.85}
∈ {0.85}
10.88
0
109
110
Bibliograa
[1] H. Magalhães,
Contributions to neuromuscular blockade control.
PhD thesis, Univer-
sidade do Porto, 2006.
[2] Lago, P., T.Mendonça e L. Gonçalves, On-line autocalibration of a pid controller of
Proceedings of the 1998 IEEE
International Conference on Control Applications. Triste, Itália.
neuromuscular blockade, pp. 363367, IEEE, 1998.
Métodos e algoritmos para o controlo de sistemas biológicos: aplicação
ao controlo do bloqueio neuromuscular. PhD thesis, Universidade do Porto, 1993.
[3] T. Mendonça,
[4] J. Hespanha,
Tutorial on Supervisory Control.
Dep. Electrical and Computer Engi-
neering, Univ. of California, 2002.
[5] K. Åström and B. Wittenmark,
Computer-Controlled Systems: Theory and Design.
New Jersey, USA: Prentice Hall, 1997.
[6] A.K. Jain, M. N. Murty and P. J. Flynn, Data clustering: A review, 1999.
[7] J. S. Marques,
Reconhecimento de Padrões: Métodos Estatísticos e Neuronais. Lisbon,
Portugal: IST Press, 2005.
[8] J. M. Lemos, N. Roma, T. Mendonça, L.Sousa, B. Costa, C. S. Nunes, S. Esteves, P.
Amorim, L. Antunes, Development of an integrated control system for anaesthesia
automation, Portuguese Conference on Automatic Control, 2008.
[9] Cass, N. , D. Lampard, W. Brown and J. Coles, Computer controlled muscle relaxation: a comparison of four muscle relaxants in the sheep,
Care, vol. 4, pp. 1622, 1976.
Anaesthesia Intensive
[10] Asbury, A. and D. Linkens, Clinical automatic control of neuromuscular blockade,
Anaesthesia, vol. 41, pp. 316320, 1986.
[11] Mendonça, T. and P.Lago, PID control strategies for the automatic control of neuromuscular blockade,
Control Engineering Practice,
vol. 6, no. 10, pp. 12251231,
1998.
111
Bibliograa
[12] Schwilden, H. and K. Olkkola, Use of a pharmacokinetic-dynamic model for the automatic feedback control of atracurium,
European Journal of Clinical Pharmacology,
vol. 40, pp. 293296, 1991.
[13] Kansanaho, M. and K. Olkkola, Performance assessment of and adaptive modelbased feedback controller: Comparisson between atracurium, mivacurium, rocuronium and vecuronium,
Journal of Clinical Monitoring and Computing,
vol. 13,
pp. 217224, 1996.
[14] Hugo Alonso, Teresa Mendonça, Paula Rocha, A hybrid method for parameter estimation and its application to biomedical systems,
in Biomedecine, vol. 89, pp. 112122, 2008.
Computer Methods and Programs
[15] P. Oliveira, Controlo do bloqueio neuromuscular:
Uma abordagem polinomial,
Tech. Rep. 43, Inesc-id, 2008.
[16] A. S. Morse, Supervisory control of families of linear set-point controllers - part 1:
exact matching,
IEEE Trans. on Automat. Contr., vol. 41, pp. 14131431, 1996.
[17] Narendra, K. and J. Balakrishnan, Adaptive control using multiple models,
Transactions on Automatic Control, vol. 42, no. 2, pp. 171187, 1997.
IEEE
[18] Mendonça, T., P. Lago, H. Magalhães, A. Neves and P. Rocha, On-line multiple
model switching control implementation: a case study, (Lisbon, Portugal), Proceedings of the 10th Mediterranean Conference on Control and Automation (MED'02),
2002.
[19] J. Hespanha,
Logic-Based Switching Algorithms in Control.
PhD thesis, Yale Univer-
sity, 1998.
[20] J.P. Hespanha, D. Liberzon and A.S. Morse, Overcoming the limitations of adaptive
control by means of logic-based switching,
Systems and Control Letters,
vol. 49,
no. 1.
[21] Böling, J.M., et al, Multi-model adaptive control of a simulated ph neutralization
process,
Control Engineering Practice, 2007.
doi:10.1016/j.conengprac.2006.11.008.
[22] B. D. O. Anderson, T.S. Brinsmead, F. De Bruyne, J. Hespanha, D. Liberzon, A.
S. Morse, Multiple model adaptive control. part 1:
Finite controller coverings,
International Journal of Robust Nonlinear Control, vol. 10, pp. 909929, 2000.
[23] G. Vinnicombe, Frequency domain uncertainty and the graph topology,
Transactions on Automatic Control, vol. 38, no. 9, pp. 13711383, 1993.
IEEE
[24] A. El-Sakkatry, The gap metric: robustness of stabilization of feedback systems,
IEEE Transactions on Automatic Control, vol. 38, no. 3, pp. 240247, 1985.
112
Bibliograa
[25] R. Duda, P. Hart and D. Stork,
[26] Univ. California Press, ed.,
Pattern Classication.
John Wiley, 2000.
Some Methods for Classication and Analysis of Multi-
variate Observations, vol. 1, Proc. 5th Berkeley Symp. Math. Stat. and Prob., 1967.
[27] Sneath, P. H. A. and Sokal, R. R.,
Numerical Taxonomy.
London, UK: Freeman,
1973.
[28] B. King, Step-wise clustering procedures,
sociation, vol. 69, pp. 86101, 1967.
Journal of the American Statistical As-
[29] Margarida M. Silveira, T. Mendonça, S. Esteves, Personalized neuromuscular blockade through control: Clinical and technical evaluation, (Vancouver, Canada), 30th
Annual International IEEE EMBS Conference, 2008.
[30] J. Varvel, D. Donoho, S. Shafe, Measuring the predictive performance of computercontrolled infusion pumps,
J. Pharmacokinetic Biopharm, vol. 20, pp. 6394, 1992.
[31] J. Zigler and N.Nichols, Optimum settings for automatic controllers,
Transactions
of American Society of Mechanical Engineers, vol. 64, pp. 759768, 1942.
[32] J. Zigler and N.Nichols, Process lags in automatic control circuits,
Transactions of
American Society of Mechanical Engineers, vol. 65, pp. 433444, 1943.
113

iscte – escola de gestão - INESC-ID

Transcrição

Documentos relacionados

Multi-Tester Pro

Controlador de trânsito aéreo

Detalhes PDF - Global Satisfaction

LIEBHERR CAVE DE ENVELHECIMENTO E CONSERVAÇÃO WKt

Controlador de Tráfego Aéreo - Cidade das Profissões

Legionella

terminal portátil para controlar tempo de obra

Belfast Model School for Girls

Ficha de Unidade Curricular (FUC) de Introdução à Gestão

Software de rede para controlo do cumprimento das regras