iscte – escola de gestão - INESC-ID
Transcrição
iscte – escola de gestão - INESC-ID
Controlo com Múltiplos Modelos do Bloqueio Neuromuscular PEDRO SIMÕES OLIVEIRA Dissertação para obtenção do Grau de Mestre em Engenharia Electrotécnica e de Computadores Júri Presidente: Prof. Carlos Jorge Ferreira Silvestre Orientador: Prof. João Manuel Lage de Miranda Lemos Vogais: Prof. João Miguel Raposo Sanches Setembro de 2008 Agradecimentos Quero começar por agradecer ao meu orientador, o Professor João Miranda Lemos pela conança em mim depositada, pela sua disponibilidade, o seu apoio e as suas sugestões. Agradeço ainda o seu esforço para que me fosse atribuída uma bolsa. Um devido agradecimento, também para a FCT pela atribuição da referida bolsa de investigação. Queria agradecer à Professora Teresa Mendonça (Faculdade de Ciências da Universidade do Porto) pelos dados cedidos sobre os modelos do bloqueio neuromuscular, e ainda pela simpatia e esclarecimentos prestados. Agradeço aos Professores João Hespanha (University of California, Santa Barbara) e Jorge Marques pela disponibilidade demonstrada em ajudar-me, pelas suas sugestões e contribuições no Controlo Comutado e Métodos de Agregação, respectivamente. Queria ainda expressar a minha gratidão para com todos os professores que contribuiram para a minha formação pessoal e como engenheiro. Agradeço também a todas as pessoas que de uma ou outra forma contribuiriam para a realização desta tese. Aos meus amigos, um grande abraço! Vocês são os melhores. E à minha namorada Ana obrigado pelo teu apoio e paciência. Finalmente, aos meus pais um agradecimento especial por sempre acreditarem em mim e me apoiarem nas minhas escolhas e decisões, e aos meus avós uma dedicatória especial. O trabalho descrito nesta tese foi realizado no âmbito do projecto IDeA - Integrated Design for Automation of Anaesthesia, PDTC/EEA-ACR/69288/2006. i ii Resumo A ligação entre Engenharia e Medicina, devido aos recentes desenvolvimentos cientícos e tecnológicos na área da saúde e dos cuidados médicos, tem vindo a permitir integrar aspectos fundamentais e aplicações concretas da engenharia nos meios de investigação, diagnóstico e terapia das ciências médicas. Em particular, no que diz respeito à Anestesia Geral existem de momento diversas soluções para o problema do controlo do nível do bloqueio neuromuscular por infusão contínua de um relaxante muscular. Estas vão desde o simples PID até métodos com controladores robustos ou adaptativos. Nesta tese, pretende-se melhorar o desempenho de sistemas existentes em que os controladores são PID, passando a usar controladores baseados em técnicas polinomiais com colocação de pólos. Dado o elevado grau de incerteza na dinâmica dos pacientes, devido a uma grande variabilidade intra e inter-pacientes é sugerida a utilização de um controlador adaptativo baseado em múltiplos modelos comutados com supervisor. Nesta trabalho são comparados dois tipos de supervisores, ambos tendo como objectivo a minimização do erro de predição. A construção de um banco de controladores foi realizado, em que o número de controladores é substancialmente inferior ao número de modelos (do banco de modelos do supervisor). Para tal é necessário criar agregados de modelos, de forma a que os centróides de cada agregado representem da melhor forma o comportamento dinâmico dos modelos do respectivo conjunto e em que apenas para os centróides se projectam controladores. Desenvolveu-se uma interface gráca em MATLAB, para uma demonstração mais ecaz da comparação entre os diferentes controladores e entre as diferentes variantes em relação ao esquema de controlo (supervisor, nível de ruído, perturbações, . . . ). Palavras-chave: Biomedecina, anestesia, bloqueio neuromuscular, controlo, colo- cação de pólos, controlo comutado supervisionado, múltiplos modelos, métodos de agregação. iii iv Abstract Due to recent scientic and technological development in the health area and medical care, the connection between Engineering and Medicine, has been allowing the integration of fundamental issues and feasible applications of engineering in research, diagnostic and therapy means of medical sciences. In particular, with respect to General Aneasthesia there are at the moment several solutions to the problem of controlling the neuromuscular blockade level by continuous infusion of a muscle relaxant. These range from simple PID to methods with robust or adaptive controllers. The objective of this thesis is to improve the performance of existing systems where the controllers are PID, using pole placement with polynomial techniques to the controllers project. The high degree of uncertainty in the patients dynamic due to both intra and interpatient variability suggests that multiple models-based switching supervisory controller technique provide a suitble solution. A comparative study between two supervisores is presented, both having the goal of minimizing a prediction error. A construction of a bank of controllers was performed, in which the number of controllers is much smaller than the number of models (of the supervisory bank of models). Hence, it is necessary a clustering of models, in which the centroids of each cluster are choosen in order to better represent the dynamical behavior of the models of the respective cluster and for only the centroids it is designed a controller. It has been developed a graphical interface in MATLAB, for a better demonstration of the results and to a more eective comparation between the several control strategies and parameters in the simulations (supervisor, noise level, disturbances, . . . ). Keywords: Biomedicine, anesthesia, neuromuscular blockade, control, pole place- ment, supervisory switched control, multiple models, clustering methods. v vi Conteúdo Resumo iii Abstract v Lista de Tabelas xi Lista de Figuras xiii Acrónimos xvii Lista de Símbolos xix 1 Introdução 1 1.1 Motivação e Enquadramento . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Estado da Arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.3 Estrutura da Tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.4 Contribuições da Tese 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Bloqueio Neuromuscular 7 2.1 Modelo do Bloqueio Neuromuscular . . . . . . . . . . . . . . . . . . . . . . 7 2.2 Linearização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.3 Caracterização da Resposta ao . . . . . . . . . . . . . . . . . 12 2.4 Estrutura do Controlador e da Referência . . . . . . . . . . . . . . . . . . . 14 Bolus Inicial 3 Projecto dos Controladores Locais 3.1 17 Projecto do Controlador Polinomial . . . . . . . . . . . . . . . . . . . . . . 17 3.1.1 18 Controlador Polinomial . . . . . . . . . . . . . . . . . . . . . . . . . vii Conteúdo 3.1.2 Cancelamento de Pólos e Zeros . . . . . . . . . . . . . . . . . . . . 3.1.3 Separação da Resposta a Perturbações e Sinais de Comando 20 . . . . 21 Melhoria do Desempenho . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3.2.1 Rejeição de Erro e Perturbações em Regime Estacionário . . . . . . 22 3.2.2 Robustez e Rejeição de Ruído . . . . . . . . . . . . . . . . . . . . . 23 3.3 Controlador do NMB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 3.4 Estudo Comparativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3.4.1 Exemplo 1: sem termos de melhoria de desempenho . . . . . . . . . 26 3.4.2 Exemplo 2: acção integral 28 3.4.3 Exemplo 3: rejeição do ruído de alta frequência 3.4.4 Exemplo 4: robustez 3.4.5 Exemplo 5: 3.4.6 Exemplo 6: efeito do observador 3.2 Am . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 . . . . . . . . . . . . . . . . . . . . . . . . . . 30 em função do modelo e do ruído . . . . . . . . . . . 32 Ac0 . . . . . . . . . . . . . . . . . . 4 Controlo Comutado com Múltiplos Modelos 32 35 4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 4.2 Estrutura do Controlador Comutado 36 4.3 Esquema com Integrador Comum e Anti-colagem . . . . . . . . . . . . . . 38 4.4 Lógica de Decisão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.4.1 Tempo de Permanência . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.4.2 Histerese com Escala Independente . . . . . . . . . . . . . . . . . . 41 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.5 4.6 Multi-Estimadores . . . . . . . . . . . . . . . . . . . . . 4.5.1 Estimador do Erro de Predição com Índices de Desempenho . . . . 42 4.5.2 Estimador por minimização do erro quadrático médio . . . . . . . . 45 Estudo Comparativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 4.6.1 Exemplo 1: lógica de decisão . . . . . . . . . . . . . . . . . . . . . . 49 4.6.2 Exemplo 2: ltro de predição . . . . . . . . . . . . . . . . . . . . . 51 4.6.3 Exemplo 3: multi-estimador . . . . . . . . . . . . . . . . . . . . . . 53 5 Métodos de Agregação de Modelos 55 5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 5.2 Métrica de Vinnicombe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 viii Conteúdo 5.3 5.4 Métodos de Agregação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 5.3.1 Algoritmo Intuitivo . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 5.3.2 Algoritmo K-médias adaptado ao Controlo Comutado . . . . . . . . 61 5.3.3 Algoritmo Aglomerativo . . . . . . . . . . . . . . . . . . . . . . . . 63 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 Estudo Comparativo 6 Resultados das Simulações para o NMB 6.1 . . . . . . . . . . . . . . . . . . . . . . . . . . 69 6.1.1 Em Regime Transitório . . . . . . . . . . . . . . . . . . . . . . . . . 70 6.1.2 Em Regime Estacionário . . . . . . . . . . . . . . . . . . . . . . . . 71 Vantagens do Controlo Comutado . . . . . . . . . . . . . . . . . . . . . . . 71 6.2.1 Variabilidade Inter-pacientes . . . . . . . . . . . . . . . . . . . . . . 71 6.2.2 Variabilidade Intra-pacientes . . . . . . . . . . . . . . . . . . . . . . 71 6.3 Discussão dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 6.4 O Problema do Ruído no Controlo Comutado . . . . . . . . . . . . . . . . 77 6.4.1 Filtragem do Ruído . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 6.4.2 Exemplos 77 6.2 Parâmetros de Desempenho 69 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Conclusões e Trabalho Futuro 81 7.1 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 7.2 Trabalho Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 A Parâmetros da Resposta ao Bolus Inicial 85 B Método de Resposta ao Escalão de Ziegler-Nichols 89 C Tabelas dos Agregados 91 Bibliograa 111 ix x Lista de Tabelas 2.1 Parâmetros de 4 respostas ao 5.1 Dados sobre δν Dados sobre δν inicial. . . . . . . . . . . . . . . . . . . 13 dos agregados em função do método de agregação, casos com 7 centróides. 5.2 bolus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 dos agregados em função do método de agregação, casos com 12 centróides. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Parâmetros de desempenho em função do sistema de controlo. A.1 Parâmetros da resposta ao 67 . . . . . . . 75 inicial. . . . . . . . . . . . . . . . . . . . . 85 C.1 Algoritmo Intuitivo com 7 centróides. . . . . . . . . . . . . . . . . . . . . . 92 C.2 Algoritmo K-médias adaptado ao Controlo Comutado com 7 centróides. . . 95 C.3 Algoritmo Aglomerativo com 7 centróides. 98 C.4 Algoritmo Intuitivo com 12 centróides. C.5 Algoritmo K-médias adaptado ao Controlo Comutado com 12 centróides. C.6 Algoritmo Aglomerativo com 12 centróides. . . . . . . . . . . . . . . . . . . 107 bolus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 . 104 xi xii Lista de Figuras 2.1 Diagrama de blocos do modelo do bloqueio neuromuscular [1]. 2.2 Resposta induzida por um bolus de 500 µg kg −1 de . . . . . . . 8 atracúrio em t = 0 min em 100 modelos simulados, [2]. . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.3 Esquema para a comparação entre o sistema não linear e linearizado. 2.4 Comparação das respostas para incrementos de 2.5 Integral do erro da resposta dos sistemas em função de 2.6 Caracterização da resposta ao 2.7 Exemplo de 4 respostas ao 2.8 Esquema de controlo para o bloqueio neuromuscular, [1]. . . . . . . . . . . 14 2.9 Perle da referência desejada para o nível do bloqueio neuromuscular, [3]. . 15 3.1 Esquema de um controlador polinomial. 18 3.2 Esquema do sistema com sinais de comando e perturbações (perturbação à entrada 3.3 v . . . 11 . . . . . . 11 . . . . . . . . . 12 inicial, [1]. . . . . . . . . . . . . . . . . 13 inicial. . . . . . . . . . . . . . . . . . . . . 14 bolus bolus M56 n). . . . . . . . . . . . . . . . . 3.4 u(t) [µg kg −1 ]. em t = 150 min. M56 −1 M56 r(t) [%], . . . . . . . . . . . . . . . . . . . . . com ruído de variância unitária. sposta do nível de bloqueio neuromuscular 3.6 r(t) [%], M56 de bloqueio neuromuscular 27 (a) - re- (b) - acção de controlo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Simulação para o modelo 27 com uma perturbação na acção de controlo u(t) [µg kg ]. Simulação para o modelo u(t) [µg kg −1 ]. (b) - acção de (a) - resposta do nível de bloqueio neuromuscular (b) - acção de controlo 3.5 r(t) [%], . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Simulação para o modelo 22 sem termos de melhoria de desempenho. (a) - resposta do nível de bloqueio neuromuscular controlo δu. . . . . . . . . . . . . . . . . . . . e ruído de observação na saída Simulação para o modelo {−8, −3, 3, 8}%. 28 com acção integral. (a) - resposta do nível r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. 29 xiii Lista de Figuras 3.7 Simulação para o modelo bloqueio neuromuscular 3.8 M56 r(t) [%], M56 Simulação para o modelo Simulação para o modelo M69 de bloqueio neuromuscular 3.10 Simulação para o modelo Am ∈ {0.75, 0.85}. Am ∈ {0.8, 0.94}. r(t) [%], u(t) [µg kg ]. com M69 com Am ∈ {0.7, 0.8} u(t) [µg kg ]. u(t) [µg kg −1 ]. M10 com M39 com r(t) [%], Am ∈ {0.8, 0.94} Sd . M10 com u(t) [µg kg −1 ]. (a) - e e M10 com (b) - acção de Ac0 ∈ {0.97}. Am ∈ {0.8, 0.92 ± 0.2i} u(t) [µg kg ]. r(t) [%], e 32 (a) - r(t) [%], 33 Ac0 ∈ {0.2}. (b) - acção de Am ∈ {0.8, 0.92 ± 0.2i} (a) - resposta do nível de bloqueio neuromuscular −1 31 Ac0 ∈ {0.85}. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.15 Simulação para o modelo 31 r(t) [%], (b) - acção de controlo (a) - resposta do nível de bloqueio neuromuscular controlo (a) - . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.14 Simulação para o modelo controlo e termo Am ∈ {0.8, 0.92 ± 0.2i} resposta do nível de bloqueio neuromuscular u(t) [µg kg ]. Sd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.13 Simulação para o modelo −1 e termo 30 r(t) [%], (b) - acção de controlo (a) - resposta do nível de bloqueio neuromuscular controlo u(t) [µg kg −1 ]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.12 Simulação para o modelo 30 r(t) [%], (b) - acção de controlo Am ∈ {0.7, 0.8} resposta do nível de bloqueio neuromuscular 29 (a) - resposta do nível . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.11 Simulação para o modelo −1 . . (a) - resposta do (b) - acção de controlo resposta do nível de bloqueio neuromuscular −1 u(t) [µg kg −1 ]. r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. com M56 (a) - resposta do nível de (b) - acção de controlo com nível de bloqueio neuromuscular 3.9 Sd . com o termo e 33 Ac0 ∈ {0.5}. (b) - acção de . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 4.1 Esquema do Controlador Comutado, [4]. 4.2 Supervisor Baseado na Estimativa. 4.3 Esquema de anti-colagem para o controlador polinomial, [5]. 4.4 Esquema de anti-colagem para o controlo comutado com integrador comum. 40 4.5 Lógica de Decisão do tipo Tempo de Permanência, [4]. 4.6 Lógica de Decisão do tipo 4.7 Simulação para o modelo bloqueio neuromuscular - sinais de comutação xiv σ . . . . . . . . . . . . . . . . . . . 37 . . . . . . . . . . . . . . . . . . . . . . 37 . . . . . . . . . . . . . . . . . . . Histerese com Escala Independente, [4]. M56 com τD = 5 . . . . . . 39 41 42 (a) - resposta do nível de r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) e índice de classe φ. . . . . . . . . . . . . . . . . . 49 Lista de Figuras 4.8 Simulação para o modelo neuromuscular de comutação 4.9 r(t) [%], σ M56 com h = 1. (b) - acção de controlo e índice de classe Simulação para o modelo bloqueio neuromuscular - sinais de comutação σ (a) - resposta do nível de bloqueio M69 φ. . com u(t) [µg kg −1 ], . . . . . . . . . . . . . . . . . . . . . λp = 0.975. (a) - resposta do nível de e índice de classe M69 com φ. . . . . . . . . . . . . . . . . . λ0 = 0.85 e limiar u(t) [µg kg −1 ], (c) - sinais de comutação σ λp (t) em função de 4.11 Simulação para o modelo bloqueio neuromuscular - sinais de comutação σ M85 ec (t). de r(t) [%], (a) - resposta do nível de bloqueio neuromuscular - variação de 50 r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) 4.10 Simulação para o modelo controlo (c) - sinais ec (t) em 51 0.1%. (b) - acção de e índice de classe φ, (d) . . . . . . . . . . . . . . . . . . . . 52 e estimador LMS. (a) - resposta do nível de r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) φ. . . . . . . . . . . . . . . . . . 53 5.1 Espaço de modelos e a sua agregação. . . . . . . . . . . . . . . . . . . . . . 56 5.2 Taxonomia das metodologias de agregação [6]. . . . . . . . . . . . . . . . . 58 5.3 Exemplo de um 5.4 Agregação em 7 classes com base em 5.5 Agregação em 12 classes com base em 5.6 Critérios de dessimilação entre agregados: distância máxima e distância mínima, [7]. 6.1 dendograma usando um método aglomerativo [7]. T 10 − T 80 T 10 − T 80 M69 com o controlador −1 u(t) [µg kg ]. . . . . . . . . . . . . 61 . . . . . . . . . . . 62 P. C4 Am ∈ {0.8, 0.92} Simulação para o modelo M69 com o controlador comutado. u(t) [µg kg ], (c) - sinais de comutação σ r(t) [%], 63 e r(t) [%], . . . . . . . . . . . . . . . . . . . . . sposta do nível de bloqueio neuromuscular 6.3 e 59 (a) - resposta do nível de bloqueio neuromuscular (b) - acção de controlo −1 P. e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Simulação para o modelo Ac0 ∈ {0.89}. 6.2 e índice de classe 72 (a) - re- (b) - acção de controlo e índice de classe Simulação com o controlador comutado, em que entre φ. . . . . . . . t = 180 min 73 até t = 300 min os parâmetros de M10 variam linearmente de forma a igualarem os parâmetros de r(t) [%], M69 . (a) - resposta do nível de bloqueio neuromuscular (b) - acção de controlo e índice de classe φ. u(t) [µg kg −1 ], (c) - sinais de comutação σ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 xv Lista de Figuras 6.4 Simulação efectuada para o modelo M9 com ruído de variância unitária. (a) - resposta do nível de bloqueio neuromuscular controlo - . 6.5 −1 u(t) [µg kg ], (c) - sinais de comutação σ M23 controlo −1 u(t) [µg kg ], (c) - sinais de comutação σ M76 controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ r(t) [%], e índice de classe r(t) [%], φ, (d) R e L 79 (b) - acção de e índice de classe φ, (d) 80 a partir da resposta ao escalão, do método de resposta ao escalão de Ziegler-Nichols [1]. xvi (b) - acção de . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Determinação dos parâmetros 78 com ruído de variância unitária. (a) - resposta do nível de bloqueio neuromuscular B.1 φ, (d) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Simulação efectuada para o modelo - . e índice de classe com ruído de variância unitária. (a) - resposta do nível de bloqueio neuromuscular 6.6 (b) - acção de . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Simulação efectuada para o modelo - . r(t) [%], . . . . . . . . . . . . 89 Acrónimos ARX Auto Regressivo com entrada eXógena (Auto Regressive with eXogeneous input) EMG ElectroMioGraa (ElectroMyoGraphy) LMS Estimador por minimização do erro quadrático médio (Least Mean Squares estimator) MAPE Mediana do Erro Absoluto de Desempenho (Median Absolut Peformance Error) MDPE Mediana do Erro de Desempenho (Median Peformance Error) MSE Erro Quadrático Médio (Mean Squared Error) NMB Bloqueio NeuroMuscular (NeuroMuscular Blockade) PE Erro de Desempenho (Performance Error) PID Proprocional Integral Derivativo (Proportional Integral Derivative) PEPI Estimador do Erro de Predição com Índices de Desempenho (Prediction Error Performance Index estimator) TOF Comboio-de-Quatro (Train-Of-Four) ZOH Retentor de Ordem Zero (Zero Order Hold) xvii xviii Lista de Símbolos rc referência u acção de controlo r nível do bloqueio neuromuscular cp concentração no plasma c variável intermédia no modelo do NMB ce concentração de efeito a1 parâmetro do modelo do NMB dependente do paciente a2 parâmetro do modelo do NMB dependente do paciente λ1 parâmetro do modelo do NMB dependente do paciente λ2 parâmetro do modelo do NMB dependente do paciente λ parâmetro do modelo do NMB dependente do paciente C50 parâmetro do modelo do NMB dependente do paciente τ parâmetro do modelo do NMB dependente do paciente γ parâmetro do modelo do NMB dependente do paciente M banco de modelos Mi modelo N número de modelos do banco r eq incremento de eq valor de δce ce rd (r ) r M M em regime estacionário r em regime estacionário incremento de eq eq do banco de modelos valor desejado para o δr c i ce ganho estático da equação de Hill linearizada u r = req u valor de δu incremento de T 80 tempo decorrido entre o que produz em regime estacionário u bolus inicial e r decair até 80% xix T 10 bolus tempo decorrido entre o bolus S declive no ponto de inexão da descida de P persistência, tempo durante o qual C banco de controladores Nc número de controladores do banco C(k) centróide/controlador Ci controlador tcl instante de comutação para controlo em cadeia fechada tref tempo a partir do qual refi nível desejado para tcc instante de comutação para o controlo comutado q operador avanço q −1 operador atraso A denominador do modelo do processo B numerador do modelo do processo R polinómio do controlador polinomial S polinómio do controlador polinomial T polinómio do controlador polinomial Acl polinómio da equação característica em cadeia fechada t0 ganho do polinómio Ac0 + polinómio observador do controlador T 50 A − A B+ B xx − tempo decorrido entre o i k inicial e r decair até 50% inicial e r decair até 10% r está abaixo dos 5% C do banco de controladores, do banco de controladores rc T r rc k = 1, . . . , Nc C , i = 1, . . . , N sobe gradualmente até req antes da subida até ao equilíbrio para que tenha ganho estático desejado termos a cancelar do denominador do processo termos a não cancelar do denominador do processo termos a cancelar do numerador do processo termos a não cancelar do numerador do processo Hm função de transferência em cadeia fechada Bm numerador da função de transferência em cadeia fechada Am denominador da função de transferência em cadeia fechada x saída do processo sem ruído adicionado à saída w perturbação na entrada do processo n ruído adicionado à saída do processo Rd termo de rejeição de erro e perturbações em regime estacionário λi número de integradores no controlador Sd termo de rejeição de ruído de alta frequência L ganho de malha K ganho estático do modelo do processo σ sinal de comutação φ sinal índice de classe y medida da saída no controlo comutado ŷi estimativa da saída para o modelo epi erro de predição para o modelo πpi índice de desempenho para o modelo λp constante do ltro de predição λ0 valor mínimo do ltro de predição variável Aaw polinómio observador de ∆u acção de controlo na entrada do esquema de sat() saturação na acção de controlo v acção de controlo na entrada da saturação τD tempo de permanência ( h constante de histerese Ai denominador do modelo Bi numerador do modelo ēi perturbação não modelada no modelo Ap0 polinómio observador no PEPI ec erro de seguimento s valor correcto na saída do processo si valor correcto na saída do modelo ω polinómio observador no LMS b desvio na saída do processo bi desvio na saída do modelo Kf Amostra nal do tempo discreto αi ltragem do epi no LMS βi ltragem do epi no LMS i i i anti-windup anti-windup dwell-time ) i i i i i xxi xxii λl factor de esquecimento no LMS P espaço de parâmetros do modelo do processo δν distância de Vinnicombe dmin distância mínima entre os pares de pontos de agregados diferentes dmax distância máxima entre os pares de pontos de agregados diferentes ts tempo de estabelecimento entre λn constante do ltro de ruído ±1% Capítulo 1 Introdução 1.1 Motivação e Enquadramento O recente progresso no desenvolvimento de tecnologias no âmbito dos sensores e actuadores, assim como na modelação de sistemas biológicos, tem aberto um leque cada vez maior de áreas de aplicação para o controlo automático. Em particular no campo da anestesia, grandes esforços têm sido feitos para o desenvolvimento de ferramentes de monitorização e criação de modelos farmacocinéticos/farmacodinâmicos. Através do uso da automação, o anestesista [8] é libertado de tarefas repetitivas podendo assim concentrar-se na supervisão do paciente, nomeadamente para tomar decisões que requerem conhecimentos especícos de medicina. A automação tem ainda a vantagem de ser um procedimento mais sistemático, assegurando um seguimento mais apertado das referências das variáveis siológicas que se pretendem regular, reduzindo as quantidades de fármacos administrados. Para além disso, na cirurgia animal, por razões económicas, muitas vezes o cirurgião faz também o papel de anestesista, pelo que a automação permite com um custo inferior fornecer uma ajuda para o melhoramento global de uma cirurgia. A anestesia geral [1] tem três componentes: a hipnose (profundidade de anestesia, associada à perda de consciência), analgesia (destinada a impedir a dor) e a areexia (paralisia obtida pela bloqueio neuromuscular). Para cada uma destas componentes, existe um grupo de agentes (fármacos), nomeadamente os hipnóticos (retiram a consciência), os analgésicos (aliviam a dor) e os relaxantes musculares (bloqueadores neuromusculares). Os últimos bloqueiam os impulsos dos nervos para que o músculo não contraia, facilitando assim a cirurgia. Neste trabalho, estuda-se o uso do atracúrio, como relaxante muscular. Sendo o sistema a estudar biológico, existem diversas restrições e diculdades no âmbito do controlo, tais como: variabilidade entre os índividuos, não-linearidades, variações no 1 Capítulo 1. Introdução tempo da dinâmica do paciente, restrições na acção de controlo (a dose dos fármacos administrados tem que ser não negativa) e os níveis de ruído asssociados às medições dos sensores. A medida do nível do bloqueio neuromuscular é realizada através da estimulação do nervo periférico ulnar [1], sendo o registo é efectuado através de um electromiograma (EMG). Em geral, os estimuladores do nervo geram uma série de 4 pulsos de estimulação (TOF) em intervalos de 0.5 segundos, cada com duração de 0.2 milisegundos. A estimu- lação é aplicada com a corrente supramaximal, estimada (com aumento da corrente até o EMG car constante) após a anestesia, mas antes da administração do relaxante muscular. Existindo sensores e actuadores, e podendo ser denida uma relação dinâmica entre ambos (através de um sistema de equações diferenciais ou de diferenças) é possível abordar o problema da dosagem de fármaco a administrar por forma a que o efeito seja o desejado, com base em métodos de controlo por realimentação. Nesta tese, a atenção centra-se sobre o controlo do nível do bloqueio neuromuscular. 1.2 Estado da Arte Nas últimas décadas têm sido desenvolvidos diversos esquemas de controlo para o problema do bloqueio neuromuscular, com o objectivo de ultrapassar os problemas da não linearidade e elevada incerteza associada à dinâmica da resposta de um paciente. Estes esquemas vão desde simples controladores PID, até controladores complexos baseados numa variadade de métodos, nomeadamente adaptativos, de lógica difusa, robustos, baseados em supervisores e recorrendo a métodos híbridos de identicação de parâmetros. As primeiras utilizações de controlo automático aplicado ao bloqueio neuromuscular, remontam a 1976 [9], em que foi usado um PID como controlador e os testes foram realizados com uma ovelha. Estes permitiram concluir que era possível o uso do controlo automático em cirurgia, com as vantagens de ter um seguimento preciso da referência desejada para o nível do bloqueio neuromuscular e uma redução da dose de fármaco administrada. A partir de 1985 surgiram as primeiras aplicações do sistema de controlo automático em pessoas [10], também neste caso o controlador era um PID. Em [11] foram incorporadas diversas modicações num PID digital, de forma a acomodar algumas das especicidades do bloqueio neuromuscular. Os ganhos do controlador eram automaticamente ajustados para uma referência desejada através de uma técnica de calendarização de ganhos, tendo sido também criada uma referência variavél no tempo de modo a ajustarse aos requesitos clínicos. 2 Apesar de os resultados serem satisfatórios (referência em 1.3. Estrutura da Tese regime estacionário no nível desejado), permaneciam alguns problemas como respostas oscilatórias ou uma sobrelevação inicial. Constatando-se que um controlador PID de parâmetros xos não conseguiria obter um bom desempenho em todos os casos clínicos, vericou-se um aumento da investigação em estratégias de controlo mais avançadas. Em [12, 13] é apresentado um controlador adaptativo baseado em modelos farmacocinéticos/farmacodinâmicos que conseguiam manter um nível estável de paralesia, ajustando o relaxante muscular à medida que era pedido, minimizando assim a quantidade de fármaco administrada comparando a administração de sucessivos bolus. Nos últimos anos, tem sido proposta uma nova abordagem para o controlo adaptativo, baseada em controladores supervisonados comutados com múltiplos modelos/controladores. Com esta estratégia pretendia-se resolver os problemas da elevada variabilidade inter e intra-pacientes. Nesta abordagem descrita em [1], os controladores locais são PID anados segundo a regra de colacação de pólos dominante. Os ensaios clínicos obtiveram bons resultados, conseguindo o algoritmo estabilizar qualquer dinâmica do paciente sem impôr restrições a priori no banco de modelos/controladores. Outra abordagem para resolver este problema é descrita em [14], no qual se utiliza um método híbrido para estimação dos parâmetros do modelo do paciente, baseado num algoritmo de ajuste de curvas e numa rede neuronal. Esta informação é usada para prever a taxa de infusão que deve ser administrada em regime estacionário. Apesar dos resultados em simulação serem muito promissores, ainda não existem ensaios clínicos. 1.3 Estrutura da Tese Esta tese está organizada do seguinte modo. Após este capítulo de introdução, que introduz e formula o problema, o capítulo 2 é dedicado à obtenção e caracterização dos modelos necessários ao projecto do controlador. cocinético/farmacodinâmico para o A resposta de um paciente ao bolus atracúrio, Descreve-se um modelo farma- do qual se obtém uma versão linearizada. inicial é caracterizada em termos de parâmetros. O capítulo termina com a descrição da estrutura do controlador e da do perl da referência a utilizar no controlo do bloqueio neuromuscular. No capítulo 3 apresenta-se o algoritmo de projecto dos controladores locais, sendo apresentado o algoritmo de colocação de pólos, que vai sendo desenvolvido gradualmente, aumentando a sua capacidade com o aumento da sua complexidade. Em seguida, o controlador do NMB é projectado segundo o algoritmo apresentado nas secções anteriores. No nal é apresentado um estudo comparativo entre os diversos níveis de capacidade do 3 Capítulo 1. Introdução controlador e ainda se demonstra o efeito de alguns parâmetros na resposta do sistema. O capítulo 4 dedica-se ao sistema de controlo supervisionado comutado com múltiplos modelos. Após apresentar a estrutura do mesmo, é descrito um esquema de anti-colagem adaptado ao controlo comutado, seguida da descrição dos blocos de lógica de decisão e multi-estimador. Para o caso em que o multi-estimador é variável apresentam-se duas soluções para o ltro de predição, em que o factor de esquecimento do ltro pode ser xo ou variável. No nal é realizado um estudo comparativo, entre o desempenho das várias soluções propostas para os diversos blocos do supervisor. No capítulo 5 apresenta-se um estudo sobre a construção do banco de controladores, em que o número de controladores é bastante inferior ao número de modelos, atráves de métodos de agregação, os quais usam uma métrica adequada ao problema da classicação de modelos em classes para sistemas de controlo realimentados. No m do capítulo são discutidas as diferenças entre os vários bancos de controladores obtidos. O capítulo 6 começa por apresentar os parâmetros de desempenho que, usualmente, se consideram, para o bloqueio neuromuscular. Em seguida são apresentadas alguns exemplos que visam demonstrar as vantagens do controlo comutado. Depois, apresentase uma tabela com dados sobre os resultados dos vários sistemas de controlo testados e são discutidos os resultados obtidos. Por último aborda-se o problema do ruído no controlo comutado. Finalmente, no capítulo 7 tiram-se as conclusões nais sobre os diversos tópicos abordados na tese e apresentam-se sugestões para futuros trabalhos sobre os temas discutidos. No apêndice A pode ser observada uma tabela com os parâmetros das respostas ao inicial de 100 modelos para o atracúrio. bolus O apêndice B faz uma breve revisão do Método de Resposta ao Escalão de Ziegler-Nichols e da sua aplicação no controlo do bloqueio neuromuscular. No apêndice C apresentam-se tabelas com os bancos de controladores construídos para os diversos métodos de agregação e números de contradores, e ainda os resultados dos parâmetros de desempenho para simulações com diferentes tipos de estimadores. De salientar, o facto de os capítulos terem sido escritos de modo a se poderem ler de maneira independente uns dos outros, tentando assim mapear, ao máximo, os capítulos na descrição dos diversos métodos de projecto (controladores locais, supervisor e construção do banco de controladores). 4 1.4. Contribuições da Tese 1.4 Contribuições da Tese Esta tese tem como objectivo melhorar os sistemas de controlo do bloqueio neuromuscular já existentes, tendo como ponto de partida o trabalho realizado em [1]. Em primeiro lugar, pretende-se substituir os controladores locais, PID's, por controladores robustos projectados através da colocação de pólos segundo uma abordagem polinomial. Em segundo lugar, melhorar o desempenho do controlador supervisionado comutado com múltiplos modelos/controladores, testando a hipótese de ter um banco de controladores menor que o banco de modelos. No capítulo 3 está descrito o método de projecto do algoritmo de colocação de pólos, segundo uma abordagem polinomial, em geral, e aplicado ao tema em questão. No capítulo 4 é proposto um novo esquema para o controlador supervisionado, com menos controladores, com dois tipos de estimadores diferentes e ainda diferentes lógicas de decisão. Propõe-se ainda uma ligeira alteração no factor de esquecimento do ltro de predição, quando se usa o estimador PEPI, tornando-o adaptável a uma medida da excitação na entrada do processo. O estimador baseado na minimização de um custo quadrático em presença de desvios desconhecidos foi sugerido pelo Professor João Hespanha. Apresenta-se ainda um esquema de anti-colagem, para um controlador com colocação de pólos, adaptado ao controlo comutado. Por último, no capítulo 5 é apresentado um estudo sobre a construção do banco de controladores, nomeademente sobre os métodos de agregação de modelos e sobre métrica usada para o efeito. Em relação aos métodos de agregação apresentam-se várias alternativas, sendo que umas usam informação da estrutura do bloqueio neuromuscular, enquanto outras não. Apresenta-se um método de agregação automático que tem como objectivo não ser necessário ter informação sobre o problema de modo a que em problemas de elevada dimensionalidade este possa ser utilizado. 5 6 Capítulo 2 Bloqueio Neuromuscular Neste capítulo é realizada uma descrição do bloqueio neuromuscular, nomeadamente em termos dos modelos farmacocinéticos/farmacodinâmicos para o estudo. atracúrio, fármaco em Em seguida será obtida uma versão linearizada dos mesmos, necessária para o projecto dos controladores, como se poderá ver no capítulo 3. Neste ponto, foi ainda realizado um estudo comparativo entre o as respostas dos sistema não linear e linearizado, de forma a se comparar o comportamento de ambos em torno do ponto de equilíbrio, o que permite obter conclusões sobre a adequação da aproximação efectuada com a linearização. Em seguida caracteriza-se a resposta de um paciente ao bolus inicial em termos de parâmetros que permitam realizar uma classicação dos modelos, o que ajuda na especicação da dinâmica dos controladores e como se poderá ver no capítulo 5 permite criar um método de agregação de modelos para a construção do banco de controladores para o controlo comutado. Por último, descreve-se a estrutura do controlador e apresenta-se o perl da referência para o bloqueio neuromuscular. 2.1 Modelo do Bloqueio Neuromuscular A resposta dinâmica do bloqueio neuromuscular para o atracúrio pode ser modelada por uma série de blocos lineares, a que está acopulada uma não linearidade estática, como se observa na Figura 2.1 (estrutura do tipo Wiener). O primeiro bloco descreve a relação entre a taxa de infusão u(t) [µg kg −1 min−1 ] e a concentração no plasma cp (t) [µg ml−1 ], 7 Capítulo 2. Bloqueio Neuromuscular sendo descrita pelo seguinte sistema de equações de estado x˙1 (t) = −λ1 x1 (t) + a1 u(t) x˙2 (t) = −λ2 x2 (t) + a2 u(t) 2 P cp (t) = xi (t) (2.1) i=1 em que e xi (i = 1, 2) são variáveis de estado implicitamente denidas por (2.1), ai [µg ml−1 ] λi [min−1 ] (i = 1, 2) são parâmetros dependentes dos pacientes. Seguem-se 2 blocos lineares, ċ(t) = −λc(t) + cp (t) e que permitem relacionar a −1 ce (t) [µg ml ]. Aqui, 1 1 c˙e (t) = − ce (t) + c(t) τ τ concentração no plasma cp (t) com a concentração de efeito, c(t) é uma variável intermédia e λ [min−1 ] e τ [min] são parâmetros dependentes do paciente. De notar, que o bloco 3 não está presente no standard de modelos desenvolvidos para o atracúrio, mas a inclusão deste permite uma melhor replicação das respostas observadas experimentalmente [2]. O último bloco modela a resposta farmacodinâmica induzida pela concentração de efeito r(t) [%] ce (t) no nível do bloqueio neuromuscular através da equação de Hill r(t) = onde os parameteros C50 [µg ml−1 ] dentes do paciente. A variável e γ γ 100C50 γ C50 + ce (t)γ (2.2) (adimensional) são também parâmetros depen- r(t), está normalizada entre 0 e 100, em que 100 corresponde à actividade muscular total e 0 à paralesia muscular total. Figura 2.1: Diagrama de blocos do modelo do bloqueio neuromuscular [1]. Os relaxantes musculares como o atracúrio são usualmente administrados por um bolus inicial que em poucos minutos induz a paralesia total no paciente. De forma a cobrir uma gama abrangente de comportamentos, em [2] foi gerado aleatoriamente um banco de 8 2.2. Linearização modelos M = {Mj , j = 1, . . . , 100} assumindo uma distribuição de probabilidade log- normal multidimensional para os parâmetros uniforme para τ no intervalo [0, 3.5] min. a1 , a2 , λ1 , λ2 , λ, C50 e γ e uma distribuição A Figura 2.2 replica os resultados de [2]. Figura 2.2: Resposta induzida por um bolus de 500 µg kg −1 de atracúrio em t = 0 min em 100 modelos simulados, [2]. 2.2 Linearização Para o projecto do controlador segundo técnicas polinomiais é necessária a obtenção da função de transferência discreta do modelo do paciente, como se verá no capítulo 3. Assim, tendo em conta a não-linearidade presente na equação de Hill (2.2) é necessária a sua linearização, por forma a obter-se a função de transferência linearizada do modelo do paciente. Seja r = f (ce ) dado por (2.2). Numa vizinhança do ponto de equilíbrio (req , ceq e ) tem-se req + δr = f (ceq e + δce ) em que δr e δce são incrementos de r e ce em torno dos respectivos valores de equilíbrio. Desprezando os termos de ordem superior da série de Taylor, obtém-se δr = rd (req ) δce (2.3) 9 Capítulo 2. Bloqueio Neuromuscular onde 2 ∂f γ req 100 − req 1− γ1 rd (r ) = = − ∂ce r=req C50 100 req eq (2.4) representa o ganho estático não linear da equação de Hill linearizada em torno do ponto de trabalho considerado [3]. Efectuou-se um estudo comparativo entre o modelo não linear e linearizado em torno de um ponto de equilíbrio. De notar que quando se menciona o ponto de equilíbrio está-se a indicar a referência desejada para o nível do bloqueio neuromuscular. A totalidade das simulações efectuaram-se com uma referência de 10%, pois este é valor usado normalmente como se pode constatar na secção 2.4. Na Figura 2.3 está representado o diagrama com o esquema da simulação efectuada para comparar as respostas dos sistemas linear e não linear. Na entrada do sistema não ueq , linear está o valor da taxa de infusão contínua que é o valor que produz em regime estacionário na saída a referência desejada. Este é calculado através do Teorema do Valor Final ceq e = lim sCe (s) = lim s s→0 s→0 1 ueq a1 a2 λ τ + s s + λ1 s + λ2 s + λ s + e logo eq ceq e = u a 1 + λ1 a2 λ2 Reorganizando a equação de Hill (2.2) em função de r ceq e = C50 γ 1 τ ce (2.5) tem-se 100 − req req (2.6) Finalmente, juntando (2.5) e (2.6) obtém-se C50 ueq = q γ a1 λ1 100−req req + a2 λ2 (2.7) Já na entrada do sistema linearizado, forneceu-se um incremento de dose de fármaco (δu nas Figuras) em nos t = 250 min (instante a partir do qual o sistema não linear estabiliza 10%, para o modelo testado). Este é somado à entrada do sistema não linear, como se observa na Figura 2.3. Testou-se o modelo incremento de eq u entre {−8, 8}% M40 para uma referência de com um passo de 1%. Na Figura 2.4 representaram-se 4 casos de respostas para incrementos de {−8, −3, 3, 8}%. Na Figura 2.5 pode observar-se o integral do erro, para incremento 10 δu. 10%, variando-se o t ≥ 250 mins em função do 2.2. Linearização Figura 2.3: Esquema para a comparação entre o sistema não linear e linearizado. Figura 2.4: Comparação das respostas para incrementos de {−8, −3, 3, 8}%. 11 Capítulo 2. Bloqueio Neuromuscular Figura 2.5: Integral do erro da resposta dos sistemas em função de δu. Da análise da Figura 2.4, conclui-se que para variações maiores ou iguais a |8|% o erro estático será superior a 1%. De notar, que a resposta do sistema não linear não é simétrica em relação a variações positivas e negativas, sendo que se registaram piores resultados, i.e., integral do erro estático maior, para variações negativas, ver Figura 2.5. Conclui-se assim, que a linearização dá uma aproximação adequada, de forma a que o projecto do controlador possa exibir bons resultados. 2.3 Caracterização da Resposta ao A resposta de um paciente ao bolus inicial e a respectiva caracterização em termos de parâmetros pode ser observada na Figura 2.6. início da administração do nominadados bolus Bolus Inicial Estes são os tempos decorridos entre o e o nível da resposta decair para os 80%, 50% e 10%, de- T 80, T 50 e T 10, respectivamente. Existem ainda dois parâmetros adicionais, S , o declive no ponto de inexão no decaimento do nível do bloqueio neuromuscular, e P , o parâmetro de persistência que dá uma ideia da duração do efeito do bolus no paciente, sendo denido como o tempo durante o qual o nível da resposta está abaixo dos 5%. Na Figura 2.7 podem ser observadas 4 respostas ao diferenças que podem existir entre pacientes. 12 bolus inicial, exemplicativas das Os parâmetros de caracterização das re- 2.3. Caracterização da Resposta ao Bolus Inicial Figura 2.6: Caracterização da resposta ao bolus inicial, [1]. spostas desses mesmos modelos são na Tabela 2.1. Tabela 2.1: Parâmetros de 4 respostas ao bolus inicial. Modelo T 80 [min] T 50 [min] T 10 [min] S P [min] M10 1 4.33 1.33 4.67 1.33 5.67 1.67 5.67 1.67 8.33 2.33 8.33 -167.13 -29.22 -96.79 -29.35 41.33 35.67 38.33 49.67 M39 M56 M69 Da análise da Figura 2.7 e da Tabela 2.1 pode, de uma maneira simplista, dividir-se o banco de modelos em 2 tipos: lentos e rápidos. Os modelos mais rápida, os modelos M69 i.e., M39 e M10 e M56 têm uma resposta o fármaco administrado actua mais rapidamente, em comparação com M69 . Estes últimos têm um decaimento mais lento e ainda o modelo tem uma persistência maior, ou seja, o fármaco demora mais tempo a ser absorvido comparativamente aos restantes modelos. As especicações do controlador, são dadas em termos de pólos, como se verá no capítulo 3, especialmente tendo em conta o tempo de estabelecimento da função de transferência em cadeia fechada. Assim os termos rápido e/ou lento ajudam à associação com a especicação do controlador. 13 Capítulo 2. Bloqueio Neuromuscular Figura 2.7: Exemplo de 4 respostas ao bolus inicial. A tabela completa dos parâmetros de caracterização da resposta ao bolus inicial pode ser observada no apêndice A 2.4 Estrutura do Controlador e da Referência O controlo do bloqueio neuromuscular é efectuado através da infusão contínua do fármaco coordenada por um computador digital. Este implementa o algoritmo do controlador a utilizar, a partir da referência desejada e do nível do bloqueio neuromuscular, determinando a taxa de infusão necessária a ser administrada. Na Figura 2.8, pode ser observado o esquema de controlo a utilizar. Figura 2.8: Esquema de controlo para o bloqueio neuromuscular, [1]. 14 2.4. Estrutura do Controlador e da Referência No esquema da Figura 2.8 pode ser observado um bloco correspondente à saturação do actuador, i.e., existe um limite físico para a dose administrada, sendo este um valor não negativo. Inicialmente, no projecto dos controladores locais (capítulo 3), admitiu-se que existia um único valor máximo e que este representava o limite da seringa, tendo sido admitido o valor de 2000 µg kg −1 min−1 . Mais tarde, com o controlador comutado, efectuaram-se as seguintes restrições adicionais na saturação 0 v(t) ≤ 0 sat(v) = 10 v(t) ≥ 10, 0 ≤ t < 100 20 v(t) ≥ 20, t ≥ 100, (2.8) de forma a evitar que, em alguns casos, a resposta do paciente permanecesse em 0% e principalmente com o objectivo de melhor o desempenho na presença de ruído. Como referido na secção 2.1, o paciente é submetido a um bolus inicial, que produz uma relaxação muscular total em poucos minutos. Assim, o controlador apenas começa a funcionar tcl min depois da administração do do paciente e do tempo [11], ver Figura 2.9. valor baixo refi durante os primeiros tref bolus. A referência desejada é dependente Inicialmente a referência é mantida num min sendo a partir deste instante gradualmente elevada até ao nível de relaxamento desejado em regime estacionário, que usalmente é de rc = 10%. Esta escolha da referência reecte um compromisso entre a variabilidade das respostas dos pacientes ao como valores típicos bolus e o nível de ruído na medida do sensor, sendo sugeridos refi = 2.5%, tcl = 10 min, tref = 30 min em [11]. Estes valores serão os usados nas simulações efectuadas, sendo para a subida gradual da referência após os tcl min a ordem com um tempo de estabelecimento de usado um sistema de 1 40 min. Assim, as simulações usam todas a mesma referência para diferentes modelos testados. Figura 2.9: Perle da referência desejada para o nível do bloqueio neuromuscular, [3]. Para além do perle da referência, é sugerido que durante o período entre tcl e tref min, 15 Capítulo 2. Bloqueio Neuromuscular o controlador a utilizar seja apenas um controlador proporcional. Tal deve-se ao facto de caso o controlador a utilizar tenha efeito integral, este iria acumular erro em excesso devido ao efeito do bolus inicial ser dominante e o controlo período referido. Em [11] o valor de tref u estar saturado durante o servia para indicar o momento a partir do qual a referência deveria subir gradualmente até ao nível desejado em regime estacionário e o momento a partir do qual o controlador a utilizar deveria ser ligado. Neste trabalho optou-se por desacopular estas variáveis, cando tref apenas com o signicado ligado ao perl da referência e tcc com o valor do instante de comutação do controlador proporcional para o controlador comutado. O valor do ganho do controlador proporcional é calculado segundo o método da resposta ao escalão de Ziegler-Nichols [1], ver apêndice B. 16 Capítulo 3 Projecto dos Controladores Locais Este capítulo apresenta o projecto do controlador, o qual é concebido segundo uma abordagem polinomial [5]. A ideia da colocação de pólos, é encontrar o controlador que dá origem a um sistema em cadeia fechada com os pólos especicados. O projecto de um controlador polinomial recorre a descrições de entrada/saída do processo que foram obtidas na secção 2.2. Pretende-se projectar um controlador com dois graus de liberdade, em que a solução de uma equação algébrica, a equação diofantina, será determinante no dimensionamento do mesmo. O projecto do controlador vai sendo apresentado de uma forma gradual, aumento a sua complexidade consoante a exigência que se lhe exige. Após a descrição do método de projecto do controlador polinomial apresenta-se um exemplo da aplicação do método ao bloqueio neuromuscular. No nal, apresentam-se diversos exemplos com o intuito de demonstrar o efeito de alguns aspectos importantes no projecto do controlador polinomial. O método de projecto apresentado neste capítulo será usado no projecto dos controladores locais do banco de controladores do controlo comutado para a resolução do problema do controlo do bloqueio neuromuscular com múltiplos modelos 3.1 Projecto do Controlador Polinomial Nas subsecções seguintes apresenta-se a estrutura do controlador polinomial, sendo efectuada uma descrição pormenorizada em termos das equações e condições nos polinómios do controlador. Em seguida, apresentam-se alguns aspectos do projecto do controlor que permitem a especicação da função de transferência em cadeia fechada. 17 Capítulo 3. Projecto dos Controladores Locais 3.1.1 Controlador Polinomial Após a linearização efectuada na secção 2.2, discretizou-se o modelo segundo o método ZOH, com um tempo de amostragem de 20 segundos [1]. Assim, o sistema é descrito pelo seguinte modelo entrada/saída onde A(q)r(k) = B(q)u(k) (3.1) A(q) e B(q) são polinomios no operador avanço q . Pretende-se projectar um contro- lador com o esquema da Figura 3.1, com uma saída u e duas entradas rc últimas, têm o signicado mencionado na secção 2.4, e em que no operado q. R, S e e r, em que estas T são polinómios Do esquema da Figura 3.1, deduz-se a seguinte lei de controlo Figura 3.1: Esquema de um controlador polinomial. R(q)u(k) = T (q)rc (k) − S(q)r(k) (3.2) Para que esta seja causal é necessário que ( ∂R ≥ ∂T ∂R ≥ ∂S em que (3.3) ∂R = grau de R. Para resolver o problema do projecto do controlador, determina-se a equação característica do sistema em cadeia fechada e exploram-se as condições que esta impõe. Eliminando u(k) em (3.2), obtém-se a seguinte função de transferência em cadeia fechada B(z)T (z) r = c r A(z)R(z) + B(z)S(z) (3.4) a qual tem como equação característica A(z)R(z) + B(z)S(z) = 0 18 (3.5) 3.1. Projecto do Controlador Polinomial O problema da colocação de pólos resume-se à resolução de uma equação denominada equação diofantina A(z)R(z) + B(z)S(z) = Acl (z) que cálcula as soluções para R(z) e S(z), partir de A(z), B(z) (3.6) e Acl (z), o polinómio característico especicado para a cadeia fechada. Para garantir a causalidade, o polinómio característico deve ser factorizado da seguinte forma Acl (z) = Ac (z)Ac0 (z) (3.7) controlador, no qual se especica a dinâmica pretendida para o sistema, e o polinómio observador A0 (z) que permite aumentar a ordem do controlador. Para que o observador não afecte a dinâmica do sistema, este deverá ser sendo Ac (z) um factor de denominado o polinómio T (z). Assim, com T (z) = t0 Ac0 (z) (3.8) os sinais de comando são introduzidos de tal forma que não geram erros por parte do observador. O parametro t0 é escolhido consoante o ganho estático desejado para o sistema. A solução da equação (3.6) tem innitas soluções, mas como foi referido anteriormente existem restrições de causalidade nos polinómios do controlador. Se o tempo de cál- culo do sinal de controlo num computador for substancialmente inferior ao período de amostragem, é natural que se despreze o tempo de cálculo do sinal, como é o caso do bloqueio neuromuscular. Assim, as condições de causalidade (3.3) podem ser simplicadas em ∂R = ∂S = ∂T (3.9) Num problema de controlo, o objectivo consiste em projectar um controlador causal com a menor ordem possível. projectar os polinómios Aqui entram as observador e controlador Soluções de Ordem Mínima, i.e., de forma a que as soluções da equação diofantina, produzam um controlador de ordem mínima. 1 Assim, tem-se ∂S < ∂A Pode assim com toda a generalidade escolher-se um polinómio que, no máximo, terá ordem ∂S = ∂A − 1 (3.10) Para que o controlador introduza o mínimo de atraso possível, as duas desigualdades presentes em (3.3) devem ser consideradas igualdades. Logo, o termo 1 deixou-se A(z)R(z) domina a cair o argumento indicativo da variável independente nos polinómios de modo a simplicar a escrita. 19 Capítulo 3. Projecto dos Controladores Locais ordem em termos do polinómio característico (já que o modelo do processo é causal, ∂A > ∂B =⇒ ∂A + ∂R = ∂Ac + ∂Ac0 ), i.e., ou seja, ∂Ac0 = 2∂A − ∂Ac − 1 (3.11) 3.1.2 Cancelamento de Pólos e Zeros Até agora não se considerou o facto de se poderem cancelar zeros e/ou pólos do processo por forma a projectar o controlador, impondo um modelo de referência. Nos casos, em que estes sejam bem amortecidos é possível cancelá-los. Assume-se que os polinómios e B A são factorizáveis em ( A = A+ A− (3.12) B = B+B− onde A+ e B+ sãos os factores a cancelar, e para que a factorização seja única, são 2 escolhidos de tal forma que sejam mónicos . podem cancelar termos bem condicionados, Como se referiu anteriormente, apenas se i.e., as raízes dos polinómios A+ e B+ têm que estar dentro do círculo de raio unitário. Isto porque um pólo que é cancelado tem que ser um zero do controlador e vice-versa, como se pode ver pelas novas formas dos polinómios R, S e T + R = B R̄ S = A+ S̄ T = A+ T̄ (3.13) Substituindo (3.13) em (3.4), obtém-se a nova função de transferência em cadeia fechada, a qual tem de satisfazer a equação r T̄ B − A+ T̄ B + B − = = rc A+ B + (A− R̄ + B − S̄) A¯cl Como se pode observar, os termos A+ e B+ aparecem no polinómio característico nal, tendo por isso mesmo de ser estáveis e bem amortecidos. diofantina 20 Isto signica, que a equação a resolver é agora dada por A− R̄ + B − S̄ = Acl = Ac Ac0 2 coeciente (3.14) do termo de maior ordem unitário. (3.15) 3.1. Projecto do Controlador Polinomial o que implica novas condições de ordem (com ∂A− + ∂ R̄ = ∂Ac + ∂Ac0 ): ∂ S̄ = ∂A− − 1 ∂S = ∂R = ∂A− + ∂A+ − 1 ∂ R̄ = ∂R − ∂B + ∂Ac = 2∂A− − ∂A + ∂A+ − ∂B + − 1 (3.16) c 0 No caso particular do problema considerado é ∂ S̄ = ∂A− − 1. 3.1.3 Separação da Resposta a Perturbações e Sinais de Comando Nesta secção pretende-se introduzir o conceito de uma abordagem mais geral, ou seja, projectar o controlador de forma a que resposta do sistema a sinais de comando esteja completamente separada da resposta a perturbações. Esta propriedade que se pretende dotar o controlador, dá-lhe uma liberdade suplementar. Considere-se a função de transferência em cadeia fechada desejada dada por Hm = Bm ym = c Am r Para a obtenção de um seguimento perfeito, o polinómio Bm , pois B− (3.17) B− tem que ser um factor de não pode ser cancelado, pelo que Bm = B̄m B − (3.18) Pela restrição de causalidade que tem que ser respeitada, pelo que ∂Am − ∂Bm ≥ ∂A − ∂B i.e., o atraso não pode ser menor do que o do processo. (3.19) Redenindo novamente os polinómios do controlador como + R = Am B R̄ S = Am A+ S̄ T = B̄m A+ Ac0 Ac (3.20) obtém-se após manipulação algébrica uma nova lei de controlo dada por u= em que os polinómios R̄ e S̄ Bm A c A+ S̄ r + + (ym − r) Am B B R̄ (3.21) são obtidos através da resolução de (3.15). Com esta especi- cação, a resposta a sinais de comando é dada pela função de transferência especicada em 21 Capítulo 3. Projecto dos Controladores Locais (3.17), enquanto a resposta a perturbações é imposta pelos polinómios A0 e Ac . Esta é a solução mais geral, mas apenas foi aqui dada a conhecer, para salientar a opção tomada. Optou-se por projectar um controlador de grau inferior, em que a resposta a sinais de comando foi tomada como prioritária (ym = r). Isto não signica, que se tenha negli- genciado a resposta a perturbações (a secção 3.2 abordará este problema). Neste ponto, apenas foi efectuada uma opção em termos de simplicidade de projecto. Assim, o polinómio característico pelo que se passa a usar Am Ac especica a dinâmica de (3.17), i.e., Ac = Am a partir deste ponto, quando se pretender falar da dinâmica especicada para o sistema. Finalmente, o controlador de ordem inferior ca denido com + R = B R̄ S = A+ S̄ T = B¯m A+ Ac (3.22) 0 3.2 Melhoria do Desempenho Considera-se agora o efeito das perturbações e como melhorar o desempenho do controlador às mesmas. Assumem-se dois tipos de perturbações, uma perturbação na entrada do processo e o outro tipo de perturbação como sendo ruído, sinal de saída r. n, v que actua na medida do O sistema é ilustrado pela Figura 3.2. Figura 3.2: Esquema do sistema com sinais de comando e perturbações (perturbação à entrada v e ruído de observação na saída n). 3.2.1 Rejeição de Erro e Perturbações em Regime Estacionário Pela observação da Figura 3.2, é possível deduzir a seguinte expressão x= 22 BR v AR + BS (3.23) 3.2. Melhoria do Desempenho v , na resposta do sistema. que ajuda a compreender o efeito da perturbação na carga Para que o erro em regime estacionário seja nulo, é necessário que o ganho estático da função de transferência (3.23) seja nulo. B(1) 6= 0 z− B(1)R(1) = 0 Logo, isto signica que é necessário que R(1) = 0. e como para o caso em estudo Assim, R terá que ter como factor 1, i.e., o controlador terá que ter acção integral. O no de integradores, do tipo de perturbação que se considere. Normalmente escalão e λ=2 λi = 1 para perturbações do tipo rampa. Assim, ( R λi , depende para perturbações do tipo é redenido como R = B + R̄ Rd (3.24) Rd = (q − 1)λi Para o caso em concreto consideram-se perturbações do tipo escalão, pelo que λi = 1. A acção integral é duplamente desejável, já que o ganho de malha dado por L= BS AR (3.25) deve ser elevado nas baixas frequências, para permitir a rejeição de perturbações de baixas frequências. Isto é garantido pela inclusão da acção integral. O aumento da ordem do controlador, com a inclusão de um integrador, implica que a ordem do polinómio diofantina observador aumente de acordo com o termo introduzido. A equação a resolver passa a ser dada por A− Rd R̄ + B − S̄ = Am Ac0 com ∂A− + ∂Rd + ∂ R̄ = ∂Am + ∂Ac0 e logo ∂ S̄ = ∂A− + ∂Rd − 1 ∂S = ∂R = ∂A− + ∂A+ + ∂R − 1 d + ∂ R̄ = ∂R − ∂B − ∂Rd ∂Ac = 2∂A− − ∂A + ∂A+ + ∂R − ∂B + − 1 m 0 (3.26) (3.27) d 3.2.2 Robustez e Rejeição de Ruído O ruído de medida do sensor é tipicamente ruído de alta frequência. A maior frequência possível de se obter num sistema amostrado é a frequência de Nyquist. Esta corresponde no plano discreto a S z = −1. deverá ter um factor Para que o ruído não inuencie o sinal de saída, o polinómio z + 1. Da Figura 3.2 também é possível retirar a seguinte equação x=− BS n AR + BS (3.28) 23 Capítulo 3. Projecto dos Controladores Locais Logo, S é também redenido como ( S = A+ S̄ Sd (3.29) Sd = q + 1 Como foi referido na subsecção 3.2.1, o aumento da ordem do controlador tem como consequência o aumento da ordem do polinómio observador. Então, a equação diofantina passa a ser dada por A− Rd R̄ + B − Sd S̄ = Am Ac0 (3.30) resultando nas seguintes condições de ordem ∂ S̄ = ∂A− + ∂Rd − 1 ∂S = ∂R = ∂A− + ∂A+ + ∂S + ∂R − 1 d d + ∂ R̄ = ∂R − ∂B − ∂Rd ∂Ac = 2∂A− − ∂A + ∂A+ + ∂S + ∂R − ∂B + − 1 m 0 3.3 d (3.31) d Controlador do NMB Introduzido o método de projecto de um controlador polinomial, considera-se nesta secção a sua aplicação à colocação de pólos para o bloqueio neuromuscular, NMB ( blockade ). neuromuscular Em primeira instância é necessária a análise do modelo de um paciente, ou seja, dos seus pólos e zeros. Escolheu-se, de uma forma arbitrária o modelo M56 do banco de modelos, referido na secção 2.1, como modelo do paciente para o qual se demonstra o método de projecto. Este tem a seguinte função de transferência factorizada M56 = B(q) −3.204 × 10−4 (q + 3.409)(q − 0.9717)(q + 0.2441) = A(q) (q − 0.987)(q − 0.9696)(q − 0.9193)(q − 0.7652) (3.32) Após análise dos pólos e zeros, decidiu-se não se cancelar nenhum pólo e cancelar os zeros bem amortecidos em −0.2441 e 0.97173 . De notar que apesar dos valores serem para um modelo especíco, para os outros modelos a localização dos pólos não varia de forma a que se possa repensar em outro cancelamento diferente do efectuado. Ficam assim denidos os polinómios A e B A+ = 1 A− = A B + = (q + 0.2441)(q − 0.9717) B − = K(q + 3.409) 3 realizaram-se (3.33) testes sem o cancelamento do zero em 0.9717, mas os péssimos resultados levaram a que não se colocasse mais essa hipótese. 24 3.3. Controlador do NMB em que K = −3.204 × 10−4 . A especicações da função de transferência desejada (3.17), têm apenas de obedecer à restrição dada por (3.19). Tomando a desigualdade como igualdade para que o atraso seja o mínimo possível e ∂Am = ∂A de forma à solução da equação diofantina ser de ordem mínima, obtém-se ∂Bm = ∂Am − ∂A + ∂B = 3 assim a partir de (3.18) tem-se ∂ B̄m = ∂Bm − ∂B − = 3 − 1 = 2 e logo B̄m = t0 q 2 ou seja, B̄m (3.34) é um atraso multiplicado por um ganho, tal como na equação (3.8). Para que resposta do sistema tenha um ganho estático unitário é necessário que Bm (1) B̄m (1)B − (1) = =1 Am (1) Am (1) (3.35) donde, substituindo (3.34) em (3.35) obtém-se t0 = Em relação à dinâmica de Am , Am (1) B − (1) (3.36) dado ser um polinómio de 4 a ordem, o polinómio vai ser especicado geralmente por meio de dois pares de pólos complexos conjugados, não signicando isto que as raízes não possam ser reais. Os valores em concreto serão indicados posteriormente na secção 3.4. Atendendo a que se pretende ter um sistema estável, as raízes terão de estar no círculo de raio unitário. Pretende-se ainda que a resposta do sistema não manifeste uma sobrelevação inicial e tenha um tempo de estabelecimento o mais curto possível, mas tal dependerá em grande parte da resposta do paciente ao bolus inicial como se pode constatar na secção 2.3. O polinómio observador verica a equação (3.31), pois prentende-se dotar o controlador das propriedades de rejeição de perturbações e ruído de alta frequência, referidas na secção 3.2. Logo, o grau do observador será ∂Ac0 = 2 × 4 − 4 + 0 + 1 + 1 − 2 − 1 = 3 A escolha das raízes do observador não é imediata, impondo um compromisso entre ro- bustez do sistema face a erros de modelação e da sensibilidade aos efeitos do ruído de alta frequência. Este assunto será abordado com maior detalhe na secção 3.4, restando 25 Capítulo 3. Projecto dos Controladores Locais apenas dizer que inicialmente se escolhem todas as raízes na origem, de forma a que os transitórios de observação se extingam o mais rapidamente possível. Como consequência tem-se Ac0 = q 3 Os polinómios do controlador R, S e T (3.37) cam implicitamente denidos através da equação (3.22) e de (3.33) até (3.37). O polinómio Am denido como Am = (q − 0.7 + 0.1i)(q − 0.7 − 0.1i)(q − 0.85)(q − 0.85) é equivalente à seguinte notação (3.38) Am ∈ {0.7 ± 0.1i, 0.85}, sendo esta traduzida da seguinte forma: o primeiro elemento representa um par de pólos complexos conjugados e o segundo uma raíz dupla, sendo esta a notação usada ao longo da tese. Com a denição de Am anterior, resultam os seguintes polinómios do controlador 5 4 3 2 R = q − 0.4498q − 1.0650q − 1.2626q + 0.6227q + 0.1597 S = 103 (−0.8229q 5 + 1.9222q 4 − 0.6949q 3 − 1.5209q 2 + 1.5170q − 0.4021) T = −1.5939q 5 3.4 (3.39) Estudo Comparativo Nesta secção, são apresentados resultados obtidos com o método de projecto descrito na secção 3.3, sendo a maioria deles retirados do relatório técnico [15]. De referir, que as simulações que se apresentam nesta secção foram efectuadas recorrendo à ferramenta Simulink do programa MATLAB. Nos restantes capítulos em que as simulações são efectuadas com o esquema do controlador comutado, as simulações efectuaram-se através de código. Tal não invalida, de forma alguma, as conclusões retiradas sobre o desempenho de um controlador com colocação de pólos para o bloqueio neuromuscular nesta secção. Pretende-se apresentar nesta secção um estudo comparativo entre os diversos níveis de complexidade do controlador e entre as diferenças de especicação dos controladores para diferentes modelos. Em seguida apresentam-se três exemplos que demonstram a relação causa-efeito dos termos de melhoria de desempenho. 3.4.1 Exemplo 1: sem termos de melhoria de desempenho Este exemplo consiste num controlador projectado para o modelo adicionados os termos de melhoria de desempenho Rd e Sd . M56 , em que não foram Na Figura 3.3 podem ser observadas as respostas do nível do bloqueio neuromuscular (a) e da acção de controlo 26 3.4. Estudo Comparativo (b), tendo sido realizado um zoom nas áreas de interesse de ambos as respostas. simulação da Figura 3.3 a dinâmica especicada foi dada por Na Am ∈ {0.7 ± 0.1i, 0.85}. c Em relação aos pólos do polinómio observador, A0 , estes foram colocados na origem de forma a que a sua acção se extinga o mais rapidamente possível, não inuenciado a dinâmica especicada para Am . Os pólos do observador serão sempre colocados na origem caso não se adicione ruído à saída do processo. Figura 3.3: Simulação para o modelo M56 sem termos de melhoria de desempenho. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. Como se pode observar na Figura 3.3, o controlador polinomial teve um seguimento bastante bom, mas mesmo assim existe um erro estático em regime estacionário de 0.2%. Na Figura 3.4, observa-se a resposta do mesmo modelo com o mesmo controlador, mas com uma perturbação na acção de controlo (na bomba que controla a seringa de infusão) de 20 µg kg −1 , no instante 150 min. Figura 3.4: Simulação para o modelo M56 com uma perturbação na acção de controlo em t = 150 min. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. 27 Capítulo 3. Projecto dos Controladores Locais O sistema de controlo rejeitou a perturbação, mesmo sem o termo de rejeição de perturbações, devendo-se isto ao facto do próprio modelo ter um pólo perto 1. Na Figura 3.5 estão as mesmas respostas para o mesmo modelo mas com ruído, com uma variância unitária, adicionado na saída. Atendendo a que na presença de ruído é necessário mudar as especicações do controlador, tando na dinâmica prentedida como na dinâmica do observador, é necessário tornar-los mais lentos, origem. Ficando assim Am ∈ {0.85, 0.89} c e A0 ∈ {0.92}. i.e., afastar os pólos da De referir ainda que nas simulações com ruído não se utilizou o controlador proporcional, começando assim o controlador polinomial a trabalhar após tcl min (ver secção 2.4), o que permitiu eliminar uma sobrelevação inicial que ocorreria com o uso do controlador proporcional. Figura 3.5: Simulação para o modelo M56 com ruído de variância unitária. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. 3.4.2 Exemplo 2: acção integral Neste exemplo, ver Figura 3.6, demonstra-se o efeito da adição de termo Rd , ou seja, da acção integral, no sistema de controlo. O modelo e dinâmica especicada são os mesmos (caso sem ruído). Como seria de esperar, pela observação da Figura 3.6, o erro estático em regime estacionário foi eliminado com a adição da acção integral. 3.4.3 Exemplo 3: rejeição do ruído de alta frequência Com a introdução do termo Sd no controlador (ver subsecção 3.2.2), a resposta na presença de ruído melhora signicativamente, não sendo afectada caso não exista ruído. Na Figura 3.7 pode ser visualizada a resposta ao mesmo modelo, 28 M56 , com Am ∈ {0.8, 0.92 ± 0.2i}, 3.4. Estudo Comparativo Figura 3.6: Simulação para o modelo M56 com acção integral. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. Ac0 ∈ {0.95} e ruído com uma potência de 0.1. Figura 3.7: Simulação para o modelo M56 com o termo Sd . (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. Comparando as Figuras 3.5 e 3.7, conclui-se que de facto o termo obtenção de um melhor seguimento. A inclusão do factor Sd permitiu a z + 1 no polinómio S revelou-se de grande importância no projecto do controlador com colocação de pólos para o NMB, isto porque sem este termo e com o termo de acção integral e ruído não se conseguiram obter respostas adequadas. O termo Sd não permite apenas melhorar o seguimento da referência na presença de ruído, é também capaz de dotar o controlador de robustez. O exemplo seguinte explica e demonstra esse mesmo facto. 29 Capítulo 3. Projecto dos Controladores Locais 3.4.4 Exemplo 4: robustez Com a inclusão do termo Sd a função de sensibilidade tem o valor unitário na frequência de Nyquist, isto permite uma maior margem de estabilidade, com consequências directas nas especicações do controlador. Nas Figuras 3.8 e 3.9 apresentam-se duas simulações para os modelos M56 que os pólos de Am e M69 , respectivamente, sem a inclusão do termo Sd tivessem de ser ajustados à medida de cada caso. o que implicou Como se pode Figura 3.8: Simulação para o modelo M56 com Am ∈ {0.75, 0.85}. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. Figura 3.9: Simulação para o modelo M69 com Am ∈ {0.8, 0.94}. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. observar em ambas as guras, o seguimento da referência foi bom, mas foi necessário escolher uma dinâmica de rápido, como o M56 , Am de acordo com o respectivo modelo. é necessário uma dinâmica em cadeia fechada com um tempo de estabelecimento menor, do que o caso com um modelo lento, como o 30 Para um modelo M69 , em que o tempo 3.4. Estudo Comparativo de estabelecimento foi cerca de 19.8 min mais lento. Este tempo de estabelecimento é calculado a partir da resposta ao escalão unitário da função de transferência em cadeia fechada Hm (não confundir com o tempo de estabelecimento denido na secção 6.1) em que se dene o tempo de estabelecimento da saída em torno da referência. Se se impusesse uma dinâmica mais rápida em relação à anterior, por exemplo Am ∈ {0.7, 0.8}, estes dois sistemas teriam respostas na acção de controlo instáveis, em que o nível do bloqueio neuromuscular cava permanentemente saturado nos 0%. Por essa razão não se colocam os grácos dessas simulações. Contudo, nas Figuras 3.10 e 3.11 podem ser observadas as simulações efectuadas com M56 e M69 , Am ∈ {0.7, 0.8} e com termo de robustez Sd para os modelos respectivamente. Figura 3.10: Simulação para o modelo M56 com Am ∈ {0.7, 0.8} e termo Sd . (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. Figura 3.11: Simulação para o modelo M69 com Am ∈ {0.7, 0.8} e termo Sd . (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. Analisando as Figuras 3.10 e 3.11 conclui-se que, de facto, o termo Sd permite aumentar 31 Capítulo 3. Projecto dos Controladores Locais a margem de estabilidade. Em seguida apresenta-se um exemplo que demonstra as diferenças nas especicações do controlador, nomeadamente nos pólos de Am , consoante o tipo do modelo, tendo já sido abordado neste exemplo anterior. Com este exemplo pretende-se dar um maior destaque a este pormenor e ainda mostrar a inuência do ruído na especicação de Am e de Ac0 . 3.4.5 Exemplo 5: Am em função do modelo e do ruído Com ruído de potência 0.01 adicionado à saída do sistema, é necessário tornar a dinâmica especicada para a cadeia fechada mais lenta. Esta será ainda mais lenta caso o modelo a controlar seja um modelo dos chamados lentos. Nas Figuras 3.12 e 3.13 apresentam-se duas simulações para os modelos M10 (rápido) e M39 (lento), respectivamente. Figura 3.12: Simulação para o modelo M10 com Am ∈ {0.8, 0.92 ± 0.2i} e Ac0 ∈ {0.85}. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. A dinâmica especicada para o modelo rápido tem um tempo de estabelecimento 16 min mais rápido do que para o modelo lento. De notar ainda que, os pólos do obser- vador foram retirados da origem, devido ao facto de se ter adicionado ruído na simulação. O efeito dos pólos do observador na presença de ruído será discutida no seguinte exemplo. 3.4.6 Exemplo 6: efeito do observador Ac0 A escolha do observador segundo [5], obedece a um tradeo entre a sensibilidade a per- turbações na entrada do processo e a sensibilidade ao ruído na medida dos sensores. Caso se pretenda ter em conta a rejeição de perturbações na entrada, o observador deverá ser rápido, usualmente é colocado na origem, mas tal permite, caso exista ruído, que este inuencie negativamente a resposta do sistema. Caso a rejeição de ruído fosse mais im- 32 3.4. Estudo Comparativo Figura 3.13: Simulação para o modelo M39 com Am ∈ {0.8, 0.94} e Ac0 ∈ {0.97}. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. portante, as raízes do observador deveriam ser colocadas em por exemplo 0.9, tornando o observador mais lento. Com isto o ruído seria reduzido, mas a atenuação das perturbações na entrada não seria tão ecaz. Por estas razões nas simulações em que não se adiciona ruído, o observador é colocado na origem, caso contrário torna-se o observador bastante mais lento. As perturbações na entrada para o bloqueio neuromuscular não são preocupantes, pois como foi visto no mesmo sem o termo Exemplo 1 o sistema rejeita perturbações na entrada Rd . Nas Figuras 3.14 e 3.15 podem ser visualizada duas simulações para o mesmo modelo, M10 , com a mesma dinâmica Am , mas com observadores, Ac0 , distintos. Figura 3.14: Simulação para o modelo M10 com Am ∈ {0.8, 0.92 ± 0.2i} e Ac0 ∈ {0.2}. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. Analisando o conjunto das Figuras 3.12, 3.14 e 3.15 em que o único parâmetro de simulação variável é o observador, Ac0 , conrma-se exactamente o esperado. À medida que o 33 Capítulo 3. Projecto dos Controladores Locais Figura 3.15: Simulação para o modelo M10 com Am ∈ {0.8, 0.92 ± 0.2i} e Ac0 ∈ {0.5}. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. observador cou mais lento de 34 0.2 para 0.5 até 0.85 a resposta melhorou signicativamente. Capítulo 4 Controlo Comutado com Múltiplos Modelos Neste capítulo é descrito o controlador comutado com múltiplos modelos. Esta estratégia de controlo é baseada num banco de modelos e na comutação de um número nito de controladores, de acordo com um critério de selecção baseado na minimização do erro de identicação/predição. Existem três blocos fundamentais: multi-estimador, lógica de decisão e banco de controladores. Para os dois primeiros são apresentados técnicas alternativas. A construção do banco de controladores é descrita, posteriormente, no capítulo 5. 4.1 Introdução Em sistemas complexos, onde está presente uma elevada incerteza no conhecimento do sistema a controlar, as metodologias tradicionais de controlo não fornecem um desempenho satisfatório. Tal facto levou ao desenvolvimento de novas estratégias de controlo, de que é exemplo o controlo comutado [16, 17, 18, 19]. No controlo comutado é construído um banco de controladores candidatos, existindo ao longo do tempo uma comutação do controlador em uso, tendo em conta as medidas efectuadas na saída do sistema. A comutação obedece a uma lógica projectada com o objectivo de usar as medidas efectuadas no processo para decidir se o desempenho do controlador em uso se deve manter ou não, escolhendo então a melhor alternativa [4]. A principal diferença entre o controlo comutado considerado nesta tese e os algoritmos adaptativos baseados numa anação contínua é o uso de lógica no supervisor de forma a controlar o processo de aprendizagem. É possível classicar estes algoritmos em classes de 35 Capítulo 4. Controlo Comutado com Múltiplos Modelos controladores, algoritmos que usem supervisores híbridos (combinam dinâmica contínua e controladores supervisionados, enquanto algoritmos que usem leis de anamento contínuo são conhecidos como controladores adaptativos. Nos últimos anos, a utilização de controladores supervisionados tem emergido como uma alternativa aos controladores adaptativos, sendo este facto devido às vantagens delógica discreta) são denominados scritas em [20] e resumidas aqui de seguida: Adaptação Rápida. Dado que o sinal de comutação não está restrito a variar continua- mente, isto permite uma adaptação mais rápida a mudanças repentinas na dinâmica do sistema a controlar. Ter uma adaptação rápida é crítico em algumas aplicações como é o caso do controlo do bloqueio neuromuscular, pois o desempenho pode deteriorár-se signicativamente devido a uma súbita alteração na dinâmica do paciente. Flexibilidade e Modularidade. O controlo supervisionado tem uma arquitectura mod- ular, permitindo assim a separação entre o banco de controladores e o mecanismo de identicação, i.e., o supervisor. Isto permite utilizar qualquer técnica desejada para o projecto dos controladores (neste trabalho usa-se a colocação de pólos baseada em técnicas polinomiais), enquanto que com o controlo adaptativo os controladores têm de ser projectados à medida do mecanismo de anação, deixando pouca liberdade para o projecto do controlador. Separação entre Supervisão e Controlo. Entre tempos de comutação o processo está ligado a um dos controladores candidatos e a dinâmica do supervisor não interfere na evolução do resultado do sistema em cadeia fechada. Isto simplica consideravelmente a análise do algoritmo global. Esta separação permite ainda que não linearidades que se manifestem no supervisor não interram na dinâmica do sistema. Caso o processo e o controlador candadidato sejam lineares, o sistema em cadeia fechado é linear entre tempos de comutação, tal não acontece com o controlo adaptativo, onde o sistema em cadeia fechada é sempre não linear. 4.2 Estrutura do Controlador Comutado A estrutura do controlador comutado pode ser observada na Figura 4.1, onde o sinal de controlo, σ w perturbações e ruído no sistema a controlar, o sinal de comutação e φ a medida da saída, o sinal índice de classe. Existem dois tipos de supervisores, os 36 y u representa Baseados no Desempenho que são caracter- 4.2. Estrutura do Controlador Comutado Figura 4.1: Esquema do Controlador Comutado, [4]. izados por tentar estimar directamente o desempenho dos controladores candidatos, sem estimarem o modelo do processo. Neste trabalhado é usado um outro tipo de supervisor, Baseado na Estimativa. Este método foi sugerido pelo Professor João Hespanha e cor- responde a uma particularização de [4], em que se pretende determinar qual dos modelos do banco está mais próximo do modelo do processo. Na Figura 4.2 está representado o esquema do supervisor usado. Este é composto por três blocos: multi-estimador, índice de desempenho e lógica de decisão. A saída do estimador gera estimativas da saída ypi , pelo valor de saída medido do processo y com i = 1, . . . , N . multi- Estas ao serem subtraídas originam os erros de predição epi . Ao erro de predição é realizada uma ltragem. Figura 4.2: Supervisor Baseado na Estimativa. O multi-estimador é projectado segundo o princípio geral que se o modelo do processo pertence ao banco de modelos, então a correspondente estimativa de saída a saída do processo y e assim o erro predição ep ŷ deve igualar deve ser pequeno. Assim cada ep pode ser pensado como uma medida da versomilhança que o modelo do processo esteja no banco 37 Capítulo 4. Controlo Comutado com Múltiplos Modelos de modelos, M. O projecto dos multi-estimadores será analisado na secção 4.5. Após a obtenção do erro de predição ep é gerado um índice de desempenho πp que dá uma medida da potência do erro de predição. A obtenção dos índices de desempenho será analisada também na secção 4.5, dado que estes estão intimamente ligados ao tipo de multi-estimador. A lógica de decisão é o bloco nal que tem como objectivo comparar os índices de desempenho, escolhendo assim aquele que tiver o menor índice de desempenho para ser o controlador que está ligado ao processo. Estas decisões contínuas geram o sinal de comutação σ. Na secção 4.4 são descritas duas implementações, com abordagens diferentes, para a lógica de decisão. Como foi referido na secção 2.1 está dísponivel um conjunto de modelos 1, . . . , N }, visor. sendo este conjunto usado para formar o banco de modelos presente no super- Nos trabalhos realizados em [16, 17, 18] com controladores comutados o banco de controladores, (N M = {Mj , j = = Nc ). modelo Mj , C = {Cj , j = 1, . . . , Nc } Assim cada controlador com Cj tem a mesma dimensão do banco de modelos era projectado e/ou anado para o respectivo j = 1, . . . , N . Nesta tese, é proposta uma alteração no banco de controladores. Pretende-se avaliar o desempenho de um banco de controladores com um número bastante inferior de controladores em relação ao número de modelos. Isto signica que cada controlador é projectado para um conjunto de modelos e não apenas para um modelo. Com esta alteração pretende-se obter um melhor desempenho do supervisor nomeadamente na convergência para o modelo do paciente. Dado que um controlador está ligado a um conjunto de modelos, caso o sinal de comutação esteja dentro desse mesmo conjunto não haverá alteração de controlador, evitando assim possíveis transitórios indesejáveis, instabilidades e excesso de comutação. Por isso foi criado o sinal índice de classe, φ, que é equivalente ao sinal de comutação, mas comuta apenas entre os modelos que são controladores. Para os algoritmos de controlo em que não seja possível ter um projecto automático de um número elevado de controladores e seja necessário projectar um a um, esta nova abordagem é também claramente benéca. A construção do banco de controladores, é abordada e discutida no capítulo 5. 4.3 Esquema com Integrador Comum e Anti-colagem Como se pode ver na Figura 4.1 à saída do banco de controladores existe um integrador comum a todos os controladores. Tal deve-se à necessidade de assegurar uma transferência 38 4.3. Esquema com Integrador Comum e Anti-colagem suave entre controladores diferentes [16]. Assim, caso o projecto dos controladores locais tenha um termo integral este deve ser retirado ou reformulado. Com a introdução da acção integral, e estando esta em série com uma saturação podem existir problemas. Se o erro gerado pelo sinal de controlo é grande o suciente para que o integrador sature o actuador, a realimentação será quebrada, pois o integrador permanece saturado mesmo se a saída do processo se alterar. Assim sendo, o integrador de um sistema instável, pode integrar até um valor elevado. Quando o erro car menor, o integral vai demorar demasiado tempo até retornar a um valor normal. Este efeito é conhecido como colagem (windup ). É necessária a concepção de um esquema que evite estes efeitos indesejados. Em [15] resolveu-se este problema a partir do esquema de anti-colagem para controladores PID, adaptado aos controladores locais projectados com técnicas polinomiais. Em [5] é descrito outra abordagem para a resolução do problema em que o controlador local é projectado segundo técnicas polinomiais, a qual se descreve em seguida. Na Figura 4.3 pode ser observado um diagrama do referido esquema. Figura 4.3: Esquema de anti-colagem para o controlador polinomial, [5]. Seja Aaw (q) o polinómio característico desejado do observador de deve ser mónico, estável e da ordem do controlador. Adicionando anti-colagem, Aaw (q)u(k) este em ambos os membros de (3.2) obtém-se Aaw u = T rc − Sr + (Aaw − R)u (4.1) Assim, do esquema da Figura 4.3 é possível retirar o par de equações ( Aaw v = T rc − Sr + (Aaw − R)u u = sat(v) equivalentes a (4.1) quando a variável de controlo saturação a dinâmica é imposta pelo observador u Aaw . não está saturada. (4.2) Caso exista Apresenta-se agora uma versão 39 Capítulo 4. Controlo Comutado com Múltiplos Modelos deste esquema de anti-colagem adaptado ao controlo comutado, em que os polinómios estão representados no operador atraso q −1 (como se pode ver pelo ∗), o qual pode ser observado na Figura 4.4. A parte à esquerda na Figura 4.4, representa o controlador em Figura 4.4: Esquema de anti-colagem para o controlo comutado com integrador comum. uso, enquanto a parte da direita representa o esquema de comum. Como é referido na secção 3.2.1, o polinómio anti-colagem com o integrador R é dado pela equação (3.24), assim em regime de funcionamente linear a função de transferência do esquema de anti-colagem com o integrador comum é dada por 1 ∆u 1 1 A∗aw = = ∗ = A∗aw −Rd∗ u Rd 1 − q −1 1 − A∗ (4.3) aw que como seria de esperar é a função de transferência de um integrador. 4.4 Lógica de Decisão O índice σ do controlador ligado ao processo é determinado pela lógica de decisão, que segue o princípio que o modelo com melhor desempenho implica o melhor desempenho do respectivo controlador. Nesta secção são apresentados dois mecanismos, o Tempo de Permanência e a Histerese com Escala Independente, que têm o objectivo de evitar comutação de alta frequência entre controladores e prevenir assim instabilidade que poderia ocorrer devido a uma comutação demasiado rápida. 40 4.4. Lógica de Decisão 4.4.1 Tempo de Permanência Esta lógica é descrita pormenorizadamente em [16] e um esquema representativo pode ser observado na Figura 4.5. Figura 4.5: Lógica de Decisão do tipo Tempo de Permanência, [4]. Este mecanismo impõe um período de tempo mínimo para que um controlador que tenha sido escolhido como o controlador a utilizar esteja ligado ao processo. Este período de tempo mínimo é denominado tempo de permanência, τD . Este pode ser também denido como o mínimo intervalo de tempo entre descontinuidades sucessivas do sinal de comutação. 4.4.2 Histerese com Escala Independente A ideia por detrás desta lógica [19] é diminuir a comutação baseando-se na observação do tempo de permanência Figura 4.6 está presente o esquema da lógica de decisão com histerese. crescimento dos erros de predição em vez de forçar um Em cada instante, o índice de desempenho do modelo actualmente em uso parado com os valores dos outros modelos Sendo que caso a desigualdade retorne n, πp xo. Na πρ é com- de acordo com a equação da Figura 4.6. o que signica que o desempenho do modelo actual se degradou ao ponto de ser necessário escolher um novo modelo, que será o que tiver o menor índice de desempenho πp . Caso contrário, apesar de πρ poder não ser o menor índice de desempenho este valor ainda está relativamente perto do mínimo, não sendo por isso necessário realizar alteração do sinal de comutação e evitando assim a comutação excessiva. O relativamente perto depende da constante de histere, h, que é uma constante positiva. 41 Capítulo 4. Controlo Comutado com Múltiplos Modelos Figura 4.6: Lógica de Decisão do tipo Histerese 4.5 com Escala Independente, [4]. Multi-Estimadores Nesta secção são apresentados dois tipos de multi-estimadores e são discutidas as diferenças entre ambos. 4.5.1 Estimador do Erro de Predição com Índices de Desempenho Esta abordagem para o estimador é baseada na dinâmica de um observador. Os esti- madores são construídos segundo [16] tendo já sido aplicado este método na resolução do problema de controlar o bloqueio neuromuscular em anestesia com bons resultados [1]. Prediction Error Performance Index ) em algumas O estimador será referido como PEPI ( partes de forma a tornar o texto mais compacto. Seja cada modelo Mj = (Aj , Bj ) com j = 1, . . . , N representado pelo seguinte modelo ARX Aj (q −1 )yj (k) = Bj (q −1 )u(k − 1) + ēj (k) onde se assumiu atraso unitário (m = n − 1), (4.4) tal como se verica no modelo do bloqueio neuromuscular, ver secção 3.3. Assim n P Aj (q −1 ) = 1 + aj,i q −i i=1 m P −1 Bj (q ) = bj,i q −i i=0 são os polinómios no operador atraso de 42 n e m, q −1 , respectivamente para todos o em que Aj j = 1, . . . , N . é mónico e Em (4.4) Bj ēj (k) com ordens xas é uma sequência 4.5. Multi-Estimadores de variáveis independentes e identicamente distribuidas de média nula, representando perturbações não modeladas. Considere-se agora o problema de concepção dos preditores, através da inserção em (4.4) do polinómio observador n X A0 (q ) = 1 + a0,i q −i −1 i=0 Adicione-se Ap0 (q −1 )yj (k) − Aj (q −1 )yj (k) em ambos os membros de (4.4) resultando em Ap0 yj (k) = (Ap0 − Aj )yj (k) + Bj u(k − 1) + ēj (k) 1 (4.5) A equação (4.5) motiva a denição do seguinte estimador ŷj (k) = (Ap0 − Aj ) 1 1 p y(k) + Bj p u(k − 1) A0 A0 (4.6) A ideia por detrás da equação (4.6) é de que se o modelo do processo coincidir com o modelo Mj , y deve coincidir com yj , o que implica y(k) − yj (k) = yj (k) − ŷj (k) = e dado que Ap0 1 ēj (k) Ap0 (4.7) é escolhido de modo a ser estável, a parte deterministica da estimativa ŷj deve ser assimptóticamente exacta. Como se pode constatar em (4.7) o erro de predição é uma ltragem passa-baixo das perturbações. Se for escolhido um observador rápido, i.e., com todas as raízes do p polinómio A0 na origem, não existe ltragem. De modo a conferir propriedades de robustez com respeito à dinâmica não modelada, uma escolha adequada das raízes do observador é feita escolhendo as raízes no segmento real entre 0 e 1 (observador mais lento). Implementação Apresentam-se agora os passos para a o cálculo da estimativa 1. Realizar as actualizações de yf (k) e uf (k) ŷj (k) através de n P yf (k) = y(k) − a0,i yf (k − i) i=0 n P uf (k) = u(k) − a0,i uf (k − i) (4.8) i=0 1 deixou-se cair o argumento indicativo da variável independente nos polinómios de modo a simplicar a escrita. 43 Capítulo 4. Controlo Comutado com Múltiplos Modelos 2. Calcular a estimativa através de ŷj (k) = θjT xE (k) com θj (4.9) denido como a0,1 − aj,1 . . . a0,n − aj,n θj := bj,0 . . . bj,m e a estimativa de estado partilhada dada por xE (k) := yf (k − 1) . . . yf (k − n) uf (k − 1) . . . uf (k − m − 1) Índice de Desempenho Como referido na secção 4.2, após a obtenção do erro de predição índice de desempenho πp ep , é produzido um calculado através da seguinte ltragem passa-baixo πp (k) = λp πp (k − 1) + (1 − λp )e2p (k) A constante do ltro 0 ≤ λp ≤ 1 Em [16, 17, 18] é utilizado um (4.10) pode ser interpretada como um factor de esquecimento. λp constante, neste trabalho usa-se um factor de esqueci- mento variável, que foi um factor determinante no sucesso do trabalho realizado em [21]. A ideia por detrás de um λp variável é que a adaptação deverá ser maior ou menor consoante a excitação na entrada. Mas a escolha do seu valor envolve um um λp elevado a adaptação é muito lenta, enquanto para um λp tradeo. Para baixo a adaptação é demasiado agressiva resultando na perda de informação relevante e adaptação excessiva. A heurística é a de quando existe pouca excitação na entrada o esquecimento de dados passados deve ser suspensa, através da escolha λp deve ser igualada a uma constante especicada pode ser realizada segundo duas métricas: 44 λ = 1. λ0 . Caso exista excitação suciente, A medida de excitação na entrada 4.5. Multi-Estimadores 1. erro de predição ep = yp − y 2. erro de controlo ec = rc − y Assim durante um período em que a métrica escolhida exceda um certo colocado em λ0 < 1. dados passados. Caso contrário, A escolha do sistema em questão. λ limiar limiar, λp é é colocado a 1 e não existe esquecimento dos é diferente para cada métrica e dependente do Neste trabalho, optou-se ainda por colocar λp = 0.975 metade do limiar é excedido. Assim, caso o erro esteja acima do limiar λp = λ0 = 0.85, quando o erro começar a diminuir até apenas exceder metade do limiar nalmente quando estiver abaixo de metado do limiar quando o λp = 0.975 e λp = 1. Desvios em Relação à Linearização Dado que o modelo do paciente é não linear e sendo necessária a descrição dos modelos do banco segundo modelos de entrada/saída secção 2.2). Existe assim um desvio de pode ser resolvido derivando ( y e y e (Aj , Bj ), u foi realizada uma linearização (ver na entrada do supervisor. Este problema u usupervisor (k) = u(k) − u(k − 1) (4.11) ysupervisor (k) = y(k) − y(k − 1) Esta derivada resolve o problema referido, mas tem o inconveniente de uma derivada aumentar o ruído de alta frequência. Com o intuito de resolver o problema dos desvios, sem aumentar, o ruído é apresentado outro multi-estimador na secção 4.5.2. 4.5.2 Estimador por minimização do erro quadrático médio Apresenta-se agora uma abordagem diferente para a estimação da resposta dos modelos ŷi , em que se resolve um problema da minimização do erro de predição calculando o desvio para cada modelo. Este assunto é abordado com maior detalhe em [20]. O texto que a seguir se apresenta, tem como base notas cedidas pelo Professor João Hespanha, sobre Least Mean Squares ) em o problema dos desvios. O estimador será referido como LMS ( algumas partes de forma a tornar o texto mais compacto. Considere-se a seguinte situação em que o modelo do processo é dado por ( As = Bu y =s+b (4.12) 45 Capítulo 4. Controlo Comutado com Múltiplos Modelos e onde os polinómios AeB são desconhecidos (modelo do paciente), b pois podem ser medidos, enquanto valor correcto s. y e u são conhecidos (desconhecido) representa o desvio em relação ao O seguinte preditor é assimptóticamente correcto para o modelo de (4.12) A B ŝ = 1 − s+ u ω ω onde ω (4.13) é um polinómio estável, que realiza uma ltragem no erro de predição. A partir de (4.12) e (4.13) obtém-se A B ŷ = ŝ + b = 1 − s+ u+b ω ω (4.14) O mesmo raciocínio pode ser aplicado para os múltiplos modelos ( Ai si = Bi u (4.15) yi = si + bi usando para estes o seguinte preditor Bi Ai s + u + bi ŷi = 1 − ω ω Dado que y. (4.16) s não está disponível, é necessário expressar os preditores em função da medida Para tal, substitui-se s por y − bi o que é correcto para o modelo em causa: Ai Bi Ai Bi Ai ŷi = 1 − (y − bi ) + u + bi = 1 − y + u + bi ω ω ω ω ω (4.17) O erro de predição é assim dado por ŷi − y = − Ai Bi (y − bi ) + u ω ω Este preditor possui assim a propriedade fundamental de que se existir (na medida em que Ai = A, Bi = B ŷi − y = − e bi = b) (4.18) model matching tém-se Bi A B A B Ai (y − bi ) + u = − (y − b) + u = − s + u → 0 ω ω ω ω ω ω e, como foi referido anteriormente, o preditor (4.13) é assimptóticamentel exacto. Obtida uma expressão para o preditor, formula-se agora o problema de optimização. Num instante Kf pretende-se escolher o modelo que minimiza o erro de predição arg min i∈M 46 Kf X k=0 (yi (k) − y(k))2 (4.19) 4.5. Multi-Estimadores Para a geração do erro de predição pode ser usada a linearidade nos desvios bi da seguinte forma: y i − y = α i + bi β i (4.20) Comparando (4.18) e (4.20) tem-se αi := − onde Ai Bi y+ u ω ω βi := − 1 representa um escalão unitário na entrada. Ai 1 ω (4.21) Isto permite expressar a selecção do modelo (4.19) como Kf X arg min (αi (k) + bi βi (k))2 i∈M (4.22) k=0 Desenvolvendo o quadrado obtém-se Kf Kf Kf X X X 2 2 arg min αi (k) + 2bi αi (k)βi (k) + bi βi2 (k) i∈M k=0 k=0 É possível obter uma solução de bi ∈ R (4.23) k=0 em forma fechada, derivando (4.23) e igualando a zero, obtendo-se: Kf P bopt i = αi (k)βi (k) k=0 − K Pf βi (k)2 k=0 (4.24) Substituindo a solução óptima (4.24) na equação de selecção do modelo (4.23), resulta em P Kf Kf arg min i∈M X αi2 (k) − k=0 2 αi (k)βi (k) k=0 Kf P (4.25) βi (k)2 k=0 Como se pode constatar esta estratégia de multi-estimador não segue exactamente o esquema da Figura 4.2, na medida em que não se calcula directamente quência ep . ŷ nem por conse- Assim, de forma a seguir o esquema conceptual da Figura 4.2, o problema de optimização é equivalente a considerar-se a seguinte denição para os índices de desempenho P Kf Kf πpi (k) = X k=0 αi2 (k) − 2 αi (k)βi (k) k=0 Kf P (4.26) βi (k)2 k=0 47 Capítulo 4. Controlo Comutado com Múltiplos Modelos Pode colocar-se a questão de mostrar que P Kf Kf X αi2 (k) − k=0 2 αi (k)βi (k) k=0 Kf P ≥0 (4.27) βi (k)2 k=0 para qualquer αi , βi . Desenvolvendo (4.27) obtém-se Kf Kf Kf X 2 X X 2 αi (k)βi (k) ≤ αi (k) βi (k)2 k=0 k=0 sendo esta equação validada pela (4.28) k=0 Desigualdade de Cauchy-Schwarz dada por |< α, β >|2 ≤k α k . k β k Factor de Esquecimento O problema de optimização (4.19) também pode ser formulado adicionando um factor de esquecimento 0 < λl ≤ 1 Kf X Kf −k arg min λlms (yi (k) − y(k))2 i∈M (4.29) k=0 o que implica a redenição do índice de desempenho para P Kf Kf πpi (k) = X λK−k αi2 (k) − l k=0 4.6 Kf −k λl k=0 Kf P αi (k)βi (k) 2 (4.30) K −k λl f βi (k)2 k=0 Estudo Comparativo Nesta secção pretende-se efectuar uma comparação entre as diversas soluções propostas para blocos do supervisor do controlador comutado. De forma a que as comparações sejam efectuadas nas mesmas condições, escolheu-se como banco de controladores o presente na Tabela C.1, sendo este um dos bancos de controladores construídos recorrendo aos métodos descritos no capítulo 5. 48 4.6. Estudo Comparativo 4.6.1 Exemplo 1: lógica de decisão Escolheu-se arbitrariamente o estimador do tipo PEPI (denido em 4.5.1) com um ltro de predição variável, para efectuar a comparação entre as lógicas de decisão: tempo de permanência e histerese com escala independente. simulação efectuda para o modelo M56 Na Figura 4.7 está representada a com um tempo de permanência τD = 5 instantes de amostragem. Figura 4.7: Simulação para o modelo M56 com τD = 5. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ e índice de classe φ. Na Figura 4.8 pode ser observada a simulação para o mesmo modelo, mas com uma constante de histerese h = 1. Analisando as Figuras 4.7a) e 4.8a), conclui-se que com ambas as lógicas o desempenho do sistema de controlo foi bom. Neste exemplo, é mais interessante analisar os grácos (c) em que se representam os sinais de comutação (traço sólido), de agregação (tracejado), modelo nal do sinal de comutação (*, à direita), modelo do centróide nal do sinal de agregação (*,ao centro) e modelo do centróide do qual pertence o modelo do paciente (*, à esquerda). Assim, comparando os grácos de (c) constata-se que, apesar de em ambas 49 Capítulo 4. Controlo Comutado com Múltiplos Modelos Figura 4.8: Simulação para o modelo M56 com h = 1. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ e índice de classe φ. as situações o sinal índice de classe ter convergido para o centróide pretendido, no caso em que se utilizou o tempo de permanência, existiu um excesso de comutação em relação à situação com histerese, e o sinal de comutação parece ainda não ter convergido para o seu valor nal. Não se pode armar categoricamente a supremacia de uma lógica de decisão sobre a outra, ambos os casos dão bons resultados, sendo que na maioria das vezes acontece algo semelhante ao caso exemplicado. Considerando ainda a ideia por detrás de cada lógica, a histerese é uma lógica pensada com o intuito não só de evitar o excesso de comutação, mas também com o objectivo que a convergência esteja dentro de um dado limiar. Assim, pode-se considerar a histerese com escala independente uma melhor escolha para a lógica de decisão. De referir que estas simulações foram efectuadas com um o intuito de originar uma maior adaptação, i.e., λ = 0.9 (xo), com um possível excesso de comutação, de forma a que se podessem retirar conclusões sobre o desempenho das lógicas de decisão. 50 4.6. Estudo Comparativo 4.6.2 Exemplo 2: ltro de predição Com este exemplo o estimador só poderia ser o do tipo Observador, pois só para este foi denido o ltro de predição. Deseja-se efectuar uma comparação entre um ltro de predição em que o parâmetro do ltro (factor de esquecimento), ltro em que λp λp , é constante e um varia consoante o erro de seguimento ou de predição estar dentro dum certo limiar. Na Figura 4.9 pode ser observada a simulação efectuada para o modelo e para um factor de esquecimento constante com M69 λp = 0.975. Figura 4.9: Simulação para o modelo M69 com λp = 0.975. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ e índice de classe φ. Na Figura 4.10 pode ser visualizada a simulação para o mesmo modelo, mas com ltro de predição variável com e um limiar de erro em λ0 = 0.85, erro de controlo como medida da excitação na entrada 0.1%. A variação do valor do ltro de predição em função do erro de controlo pode ser visualizada em (d) em que se representam o erro de controlo (ec , tracejado) e o factor de esquecimento (λp , traço sólido). Comparando as Figuras 4.9 e 4.10 constata-se que o desempenho do sistema com um 51 Capítulo 4. Controlo Comutado com Múltiplos Modelos Figura 4.10: Simulação para o modelo M69 com λ0 = 0.85 e limiar de ec (t) em 0.1%. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ e índice de classe φ, (d) - variação de λp (t) em função de ec (t). factor de esquecimento variável foi superior, visto que o tempo de estabelecimento foi 64 min mais rápido. Isto deveu-se, neste caso, ao facto da adaptação ter sido demasiado lenta no caso com com o λp λp constante, o que originou que a convergência fosse mais lenta. Já variável, a adaptação foi mais rápida permitindo uma convergência mais rápida e como consequência um melhor desempenho do controlador comutado. Pode-se arguir que o valor usado para o factor de esquecimento constante foi demasiado elevado e caso contrário o resultado poderia ser semelhante ao do λp variável. Este facto é verdade, neste caso, pondendo noutros não se aplicar. Esta é, portanto, a vantagem do esquema com λp variável, que permite uma adaptação consoante o desempenho que o controlador esteja a fornecer. 52 4.6. Estudo Comparativo 4.6.3 Exemplo 3: multi-estimador A comparação entre os estimadores LMS e PEPI é efectuada no capítulo 6, onde se apresentam e discutem os resultados das extensas simulações efectuadas. Como nos exemplos anteriores se usou o estimador PEPI, nesta secção apenas se dá um exemplo do funcionamento típico do estimador LMS. Como se verá no capítulo 6 a taxa de convergência deste estimador é substancialmente inferior ao estimador PEPI, mas consegue produzir um desempenho semelhante. O estimador LMS caracteriza-se ainda por uma rápida convergência para o modelo nal, realizando por isso poucas comutações de controladores. Na Figura 4.11 pode ser observado esse mesmo exemplo, com o modelo M85 e com a constante de histerese unitária. Figura 4.11: Simulação para o modelo M85 e estimador LMS. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ e índice de classe φ. 53 54 Capítulo 5 Métodos de Agregação de Modelos Este capítulo apresenta um método para a construção de um banco de controladores, para ser usado no controlo comutado. A partir de um banco de modelos que se assume disponível realiza-se uma classicação no espaço dos modelos, por exemplo no espaço dos parâmetros. Um importante passo na realização da classicação é a escolha de uma métrica para a distância entre modelos, apresentando-se uma solução na secção 5.2. Em seguida descrevem-se alguns métodos de agregação, com abordagens distintas. Uns utilizam a estrutura do problema a resolver, enquanto os outros são cegos em relação ao problema em questão. No nal, é apresentado um estudo comparativo entre os métodos de agregação. 5.1 Introdução Nesta tese foi colocado o desao de apresentar uma metodologia para a construção de um banco de controladores a partir de um banco de modelos, com um número de controladores substancialmente inferior ao número de modelos. Se não existisse um banco de modelos poderia usar-se a teoria de [22] onde é descrito um método para a determinação de um conjunto de modelos para os quais é projectado um conjunto de controladores, para um esquema de controlo comutado. Considere-se então que se tem à disposição um banco de modelos M = {Mj = M (P), j = 1, . . . , N } onde para o bloqueio neuromuscular se tem P = [a1 a2 λ1 λ2 λ C50 γ τ ] ∈ R8 (5.1) 55 Capítulo 5. Métodos de Agregação de Modelos De forma a obter um número de controladores candidatos a seguinte partição de M em Nc Nc N é necessário realizar subconjuntos M= Nc [ M(k) k=1 de maneira a que os modelos em M(k) sejam bem regulados pelos controlador C(k), em que C(k) = Cj k = 1, . . . , Nc j = 1, . . . , N sendo o banco de controladores então denido por C= Nc [ C(k) k=1 De notar, que nas partes do texto onde o assunto em discussão se centra nos métodos de agregação o termo controlador será substituido pelo termo centróide e C(k) identica a classe e respectivo centróide. Na Figura 5.1 está representado um exemplo simplicado do espaço de modelos (que pode ser caracterizado através do espaço dos parâmetros do modelo do paciente) onde se podem ver os agregados compostos por modelos e por um modelo central que é o modelo do controlador, i.e., o modelo para o qual o controlador desse agregado será projectado. Figura 5.1: Espaço de modelos e a sua agregação. 56 5.2. Métrica de Vinnicombe Denido o problema, coloca-se agora a questão de como a realizar a partição. Esta é realizada através de algoritmos de classicação que recebem como argumento o número de controladores/classes pretendidos(as) e retornam as classes e ainda os centróides (modelos centrais/controladores) de cada classe. 5.2 Métrica de Vinnicombe Um factor importante na classicação dos modelos é a denição de uma métrica adequada. Pretende-se utilizar uma métrica que seja adequada ao problema em questão, ou seja, que se dois modelos estiverem perto nessa métrica, tal implique que se um controlador estabilizar um dos modelos também o faça para o outro. A utilização da norma euclidiana não possui as propriedades desejadas. Com efeito, é possível dar exemplos de sistemas arbitrariamente perto neste sentido para os quais não há um único controlador que estabilize ambos. A distância de Vinnicombe [23], conhecida como propriedades desejadas. por gap fornece uma medida com as Esta métrica tem uma topologia igual à da métrica conhecida [24]. A métrica de Vinnicombe tem a vantagem de não ser tão conservativa em comparação com a métrica ν -gap ν -gap, gap. Isto na medida em que se a proximidade na métrica não for capaz de garantir que um processo perturbado seja estabilizado por um controlador no qual resulta um certo nível de desempenho mínimo para um dado processo original, então existe algum controlador que atinge esse mínimo no processo original, e algum modelo que atinge a condição de proximidade de Vinnicombe. Assim é armado em [22], que a distância de Vinnicombe é uma métrica mais relevante no domínio do controlo. Para dois modelos com iguais dimensões de entrada e saída, a distância de Vinnicombe é denida como δν (M1 , M2 ) = k(I + M2 M2∗ )−1/2 (M2 − M1 )(I + M1∗ M1 )−1/2 k∞ (5.2) e toma valores entre 0 ≤ δν (M1 , M2 ) ≤ 1 Valores baixos relativamente a 1 indicam que um controlador que estabilize estabilizar M2 M1 deve e ainda que os ganhos em malha fechada dos dois sistemas em cadeia fechada serão semelhantes. Um valor de 0 signica que os modelos são iguais, enquanto que um valor de 1 signica que os modelos são bastante diferentes. 57 Capítulo 5. Métodos de Agregação de Modelos 5.3 Métodos de Agregação Existe uma extensa bibliograa sobre métodos de classicação e algoritmos de agregação, tendo-se recorrido nesta secção às seguintes referências [6, 25, 7]. A agregação é a classicação não supervisionada de padrões em grupos (agregados), nos quais os seus elementos devem partilhar atributos comuns. Diz-se não supervisionada quando se assume que não existe o conhecimento de decisões anteriores correctas, ou seja, não está disponível um conjunto de treino classicado. Os métodos propostos pertencem aos métodos não paramétricos, pois não se referem a um modelo explícito para os dados que pretendem classicar. Estes métodos procuram realizar a classicação a partir da estrutura dos padrões de treino [7]. Existem diversos critérios de classicação. Um dos mais populares consiste em identicar grupos compactos de dados concentrados em torno de representantes das classes, designados por centróides. Um segundo critério baseia-se na noção de distância a um conjunto de pontos. Procura-se que o padrão a classicar esteja próximo de um padrão de treino da classe em que for classicado (método do vizinho mais próximo). Na Figura 5.2 pode ser observada a representação da taxonomia das metodologias de agregação. Figura 5.2: Taxonomia das metodologias de agregação [6]. Num nível superior, existe uma diferença nas abordagens hierárquica e particional, em que os métodos hierárquicos produzem uma série de partições aninhadas, enquanto os particionais apenas produzem uma única. Os algoritmos hierárquicos criam agregados sucessivamente a partir de agregados já estabelecidos, podendo estes ser de dois tipos: aglomerativos ou partitivos. Os algoritmos aglomerativos seguem a abordagem baixo-para-cima, começando cada elemento como 58 5.3. Métodos de Agregação um agregado e existindo uma fusão sucessiva de agregados em agregados de maior dimensão. Nos partitivos passa-se o oposto: o algoritmo começa com todos os elementos num único agregado e em cada passo há a divisão dos agregados em agregados menores. A representação mais natural do agregamento hierárquico é através de uma árvore denominada dendograma, que pode ser observado um exemplo na Figura 5.3, representando os elementos agrupados e os níveis de similaridade a que cada grupo pertence. Figura 5.3: Exemplo de um dendograma usando um método aglomerativo [7]. Os algoritmos particionais obtêm uma única partição dos dados em vez de uma estrutura de agregação. Estes métodos têm a desvantagem de para dados de elevada dimensão a construção de dendogramas ser computacionalmente proibitiva. Normalmente, estes al- goritmos criam agregados através da optimização de uma função de custo, sendo o critério mais usado o dos mínimos quadrados. Apresentam-se em seguida três métodos de agregação para o controlo comutado. O primeiro é um método em que se analisa o sistema especíco a controlar, mas que tem a desvantagem de não poder ser usado para outro problema. O segundo é um método particional que pode usar como inicialização do primeiro método. O terceiro é um método hierárquico aglomerativo que é totalmente independente do problema a utilizar, mas que apenas faz a classicação, i.e., cria os agregados não denindo o centróide. Para a obtenção dos centróides utiliza-se uma parte do algoritmo do segundo método. 5.3.1 Algoritmo Intuitivo O primeiro método de agregação apresentado utiliza a estrutura do problema para realizar a classicação. Pretende-se obter uma caracterização em termos de variáveis dos modelos do paciente, mas dado que um modelo é caracterizado por oito parâmetros, ver equação (5.1), tal torna a tarefa bastante complicada. O ideal seria ter duas variáveis em a 59 Capítulo 5. Métodos de Agregação de Modelos que a sua representação no espaço fosse simples de analisar, e ainda que essas variáveis traduzissem grandezas intuitivas. Na secção 2.3 caracterizou-se a resposta do paciente ao de cinco parâmetros: T 80, T 50, T 10, S e P . bolus inicial, através da denição Estes parâmetros têm um signicado intuitivo de perceber, ao contrário dos parâmetros de (5.1). Em [2] são usados os valores de T 10 T 50 e para a anação automática dos controladores PID, sugerindo-se uma caracterização mais profunda em termos da resposta ao bolus inicial. bolus Nesta tese optou-se por simplicar a resposta ao inicial em termos de dois parâmetros que dessem: uma medida da rapidez da descida e outro da rapidez com que a resposta começa a subir. Deniu-se assim o parâmetro do tempo de decaimento da resposta, i.e., T 10 − T 80 que dá uma medida do tempo que o fármaco leva a ser absorvido inicialmente. Para o segundo parâmetro não foi necessária uma nova denição pois o P já tem o signicado pretendido, ou seja, dá uma medida do tempo em que parâmetro o fármaco administrado no bolus inicial é absorvido pelo paciente. Na Figura 5.4 pode ser observada a representação dos 100 modelos no espaço dos parâmetros T 10 − T 80 e P. Tendo em conta a distribuição dos pontos representativos dos modelos realizou-se a partição em classes, podendo ver-se a tracejado a separação das mesmas. Escolheu-se um modelo em cada classe de maneira arbitrária para ser o modelo representativo da classe, i.e., o centróide ao qual é associado um controlador. Após esta escolha, para cada agregado calculou-se a cadeia fechada obtida, acoplando o controlador do centróide a cada modelo do respectivo agregado. Determinou-se assim se existia algum modelo para o qual o controlador originasse pólos da cadeia fechada instáveis. Se tal acontecesse, ou se modicava o controlador, ou se escolhia um outro modelo a associar ao controlador até não existir nenhum modelo em que o seu respectivo controlador originasse um sistema instável em cadeia fechada quando acoplado aos outros modelos da mesma classe. Os * representam os centróides de cada classe, ou seja, modelos aos quais estão associados os controladores. De referir que os modelos sentação, M67 e M71 coincidem nesta repre- i.e., existiu perda de informação na passagem das cinco para as duas variáveis. Tal seria de esperar e constitui uma desvantagem da redução do número de variáveis, mas em que o ganho de desempenho o justica plenamente. Por forma a avaliar qual a inuência do número de controladores (classes) no desempenho do sistema de controlo comutado, obteve-se uma agregação com mais classes, i.e., com mais controladores. Para este efeito, analisando a Figura 5.4 optou-se por realizar partição nas classes com maior densidade de modelos, como são as classes 60 C(3), C(6) e 5.3. Métodos de Agregação Figura 5.4: Agregação em 7 classes com base em T 10 − T 80 e P . C(7). Na Figura 5.5 pode ser observado o resultado da partição e da agregação em 12 classes. 5.3.2 Algoritmo K-médias adaptado ao Controlo Comutado k-médias [26]. Este algortimo faz parte dos algoritmos que usam o critério de mínimos quadrados como função Descreve-se agora um método baseado no algoritmo de agregação de custo a optimizar. Este é o critério mais intuitivo e mais frequentemente usado em técnicas de agregação com partição, funcionado bem com conjuntos de dados compactos k-médias é o mais simples e mais usado dos algoritmos que usam o critério de mínimos quadrados. Os passos do algoritmo k-médias e conjuntos de dados isolados. O algoritmo adaptado ao problema do controlo comutado com múltiplos modelos são: 1. Inicialização dos Centróides. 2. Classicação. M, Inicialização aleatória dos centróides. Consiste na atribuição de cada modelo M ao centróide mais próximo, de acordo com. Mi ∈ M(k) : k = argmin δν (C(k), Mi ) k 61 Capítulo 5. Métodos de Agregação de Modelos Figura 5.5: Agregação em 12 classes com base em T 10 − T 80 e P . em que Mi , 1 ≤ i ≤ Nc designa cada um dos centróides e Nc o número total de classes. 3. Actualização dos Centróides. Consiste na redenição dos centróides tendo em conta a nova denição das classes, passando estes a ocupar o ponto médio dos modelos da sua classe. O algortimo começa com a inicialização dos centróides no passo maior problema no algorimo k-médias 1. Dado que o é a sensibilidade à inicialização dos centróides apresentada-se uma opção alternativa, em que a inicialização já está perto da óptima. Esta hipótese consiste em partir da agregação obtida pelo método intuitivo apresentado na secção 5.3.1, o que implica que não só a inicialização foi efectuada mas também a classicação, começando o algoritmo, neste caso, no passo 3. Esta abordagem tem, no entanto, a desvantagem de implicar o conhecimento do problema em questão. No passo 2 cada modelo é classicado na classe do centróide mais próximo. Por último, em 3 é recalculado o centróide tendo em conta as alterações nas classes, tomando o centróide no ponto médio dos modelos em cada classe. De notar que, no algoritmo k-médias original, o ponto médio ocorreria muito provavalmente fora do conjunto dos modelos, enquanto nesta versão o centróide 62 Mk é obrigado a pertencer ao conjunto dos modelos M(k), da 5.3. Métodos de Agregação classe ao k. Em seguida começa a recursividade no algoritmo, voltando ao passo 2 e depois 3 até não existirem mais alterações na composição das classes e respectivos centróides. 5.3.3 Algoritmo Aglomerativo Os métodos da ligação simples [27] e da ligação completa [28] diferem na maneira em que são caracterizadas as similaridades entre um par de agregados. No método da simples ligação é usada a distância mínima entre todos os pares de modelos retirados de dois agregados (um modelo do primeiro agregado e outro do segundo). Já no método da completa ligação a distância entre dois agregados é o máximo de todas as distância entre pares de modelos em dois agregados. Em qualquer dos casos, dois agregados são aglomerados para formarem um agregado maior baseado no critério da distância mínima. Na Figura 5.6 pode ser observada a diferença dos critérios de distorção entre agregados. Figura 5.6: Critérios de dessimilação entre agregados: distância máxima e distância mínima, [7]. Método da Ligação Simples Este método usa como, critério de dissemelhança entre agregados, a distância mínima, dmin , denida como dmin (Mi , Mj ) = onde k, k̄ = 1, . . . , Nc , k 6= k̄ e min Mi ∈M(k),Mj ∈M(k̄) i, j = 1, . . . , N . δν (Mi , Mj ) (5.3) O algoritmo é iniciado com um número de agregados igual ao número de modelos. A junção de dois agregados, corresponde à ligação dos pares de pontos mais próximos nos agregados M(i) M(i) e e M(j), M(j). 63 Capítulo 5. Métodos de Agregação de Modelos Dado que as ligações entre agregados são sempre entre agregados diferentes, o grafo resultante nunca produz cadeias fechadas ou circuitos, na terminologia da teoria dos grafos, gerando uma árvore. Se for permitido que se continui até todos os subconjuntos estarem ligados em expansão, o resultado é uma árvore de expansão. expansão é um caminho de qualquer nó para outro nó da árvore. Uma árvore de Contudo, pode ser demonstrado que a soma dos comprimentos das ligações da árvore resultante não excede a soma das ligações de qualquer outra árvore de expansão. Como a árvore liga todos os pontos de M, e a soma dos comprimentos dos ramos é mínima, tal implica que qualquer árvore que ligue todos os elementos de M tem comprimento superior. Esta árvore é designada por árvore de expansão mínima [25]. A separação dos pontos em agregados é realizada quando a distância entre as classes mais próximos excede um limiar xo δν (M(k), M(k̄) < limiar k 6= k̄ e k, k̄ = 1, . . . , Nc O algoritmo termina quando se chega ao número de classes especicadas. Este método sofre do chamado efeito de encadeamento, ou seja, tem a tendência para gerar agregados alongados (cadeias de pontos próximos) ou espalhados. De referir que devido a este defeito do algoritmo para o caso do e usando como métrica a se o bloqueio neuromuscular ν -gap, efeito de encadeamento com o banco de modelos disponíveis os resultados não foram os mais adequados. Observou- em que a maioria dos agregados estavam isolados com um só elemento e um ou outro com as restantes cadeias alongadas. o método da ligação completa, Tal não acontece com sendo esse o escolhido para ser o método hierárquico e aglomerativo para aplicação no controlo comutado do bloqueio neuromuscular. Método da Ligação Completa Este método usa, como critério de dissemelhança entre agregados, a distância máxima, dmax , denida como dmax (Mi , Mj ) = onde k, k̄ = 1, . . . , Nc , k 6= k̄ ligação simples, e max Mi ∈M(k),Mj ∈M(k̄) i, j = 1, . . . , N . δν (Mi , Mj ) (5.4) A inicialização é identica ao método da em que cada agregado é um dos modelos. Este algoritmo não permite o crescimento de agregados alongados, produzindo um grafo em que todas as ligações conectam todos os nós no agregado. Na terminologia da teoria dos grafos, cada agregado constitui um subgrafo completo. A distância entre dois agregados é determinada pela maior distância entre dois agregados. 64 5.4. Estudo Comparativo Quando os agregados mais próximos são fundidos, o grafo é alterado através da adição de ramos entre cada par de nós nos dois agregados. Assim, se se denir o diâmetro da partição como o maior diâmetro para os agregados da partição, então cada iteração aumenta o diâmetro da partição o mínimo possível [25]. Para que um ponto pertença a um agregado é necessário que a distância a todos os pontos do agregado seja inferior a um dado limiar. Novamente, o algoritmo termina quando se chega ao número de classes pretendidas. Dado que estes métodos aglomerativos apenas criam os agregados, não denindo os centróides de cada classe, é necessário recorrer ao método descrito em 5.3.2. classicação já ter sido efectuada, apenas é necessário começar no passo 2, Dada a em que se escolhe para centróide o elemento que minimiza a soma das distâncias dos elementos da classe. 5.4 Estudo Comparativo Nesta tese foram construídos 6 bancos de controladores, podendo estes ser observados nas tabelas do apêndice C. A construção de 6 bancos de controladores foi realizada com o intuito de comparar os vários métodos de agregação (intuitivo, k-médias, aglomerativo) e ainda avaliar o efeito do número de controladores (7 ou 12) ser maior ou menor. Assim, a combinação de todos entre métodos de agregação e número de controladores dá os 6 bancos de controladores. No capítulo 6 realiza-se uma comparação entre o desempenho dos vários bancos de controladores no sistema de controlo. Nesta secção, efectua-se uma comparação entre os vários métodos de agregação através da análise das distâncias nos agregados. Os métodos de agregação tiveram como objectivo construir agregados no espaço dos modelos, de maneira a que se conseguissem associar modelos, com propriedades semelhantes, formando classes. E ainda, dentro das classes encontrar um modelo que repre- sentasse a classe, tal que fosse o modelo mais indicado para o projecto do controlador da classe. Como se referiu na secção 5.2, a distância de Vinnicombe dá uma medida indicadora do quão perto estão modelos, no sentido de se um controlador estabilizar um, também estabiliza o outro. Assim, recorre-se a esta métrica como medida da avaliação da agregação efectuada por cada método, na medida em que, se considera como desejável que a média das distâncias de Vinnicombe, entre o centróide e respectivos modelos, seja a menor possível dentro em cada classe, assim como, a distância máxima de um centróide para um 65 Capítulo 5. Métodos de Agregação de Modelos modelo da classe seja a menor possível. Nas Tabelas 5.1 e 5.2 apresentam-se o número de modelos, a média das distâncias entre o centróide e os modelos, e o pior caso em cada centróide, i.e., a maior distância entre um centróide e o respectivo modelo. Os dados apresentados em cada agregado estão em função dos métodos de agregação, para 7 e 12 centróides, respectivamente. Tabela 5.1: Dados sobre δν dos agregados em função do método de agregação, casos com 7 centróides. C C(1) C(2) C(3) C(4) C(5) C(6) C(7) No m's 8 8 18 3 5 34 24 Intuitivo média pior caso 0.1884 0.2956 0.1497 0.2620 0.1021 0.2229 0.0989 0.1051 0.0716 0.1056 0.1407 0.3253 0.2004 0.4166 K-médias m's média pior caso 9 0.1505 0.2850 15 0.0946 0.1905 14 0.0570 0.1703 4 0.0872 0.1520 10 0.0542 0.0766 17 0.0657 0.1074 31 0.1155 0.3119 No Aglomerativo m's média pior caso 22 0.0879 0.1357 19 0.0762 0.2124 27 0.0904 0.1750 21 0.1040 0.2633 5 0.1188 0.1534 3 0.1243 0.1327 3 0.1138 0.1453 No Em primeira instância interessa analisar se com o método k-médias, em que se partiu de uma inicialização e classicação dada pelo método intuitivo, se conseguiu de facto diminuir as distâncias entre os centróides e os seus elementos. Analisando as Tabelas 5.1 e 5.2, nomeadamente as colunas respeitantes aos métodos intuitivo e k-médias, conclui-se que a média das distâncias do centróide para os seus elementos e a distância máxima entre o centróide e um seu elemento é sempre menor com o método k-médias, mesmo quando o número de modelos de um centróide, respeitante ao método k-médias, é maior que um respeitante ao método intuitivo. Existindo apenas duas excepções, a primeira na Tabela 5.1 em C(4) (pior caso superior) e a segunda na Tabela 5.2 no C(11) (média e pior caso superiores). De notar, que existe um certo grau de correspondência entre os centróides C(i) do método intuitivo para o método k-médias, apesar de no método k-médias se realizarem novas classicações. O mesmo não acontece com o método aglomerativo, não tendo lógica compara as distâncias com os outros métodos. De referir, que o método aglomerativo implementado de ligação completa foi sugerido pelo Professor Jorge Marques, sendo ainda cedido pelo mesmo a função MATLAB que implementa do algoritmo. A referida função recebe como argumento uma matriz com as distâncias de todos os modelos para todos e o número de classes, retornando o número de classes pretendidas e os seus elementos, mas como se referiu em 5.3.3, é necessário recorrer a parte do método k-médias para a 66 5.4. Estudo Comparativo obtenção dos respectivos centróides em cada classe. Analisando as colunas respeitantes ao método aglomerativo, nas Tabelas 5.1 e 5.2, constata-se que este método tende a formar classes com muitos modelos e outros com poucos modelos. Isto em conjunto com a análise das Tabelas C.3 e C.6, conclui-se ainda que o método tende a realizar partições nas zonas em que os modelos estão mais afastados, criando classes com um número elevado de elementos em zonas em que os modelos estão mais próximos. Exemplo disso mesmo são os centróides C(10) = C52 e C(12) = C69 que são modelos muito afastados em relação aos restantes. Em relação às diferenças dentro do mesmo método, para um número de centróides diferente, são as esperadas, nomeadamente a média das distâncias e o pior caso diminuiem. Isto deve-se em parte ao facto de o número de modelos em cada classe ser tendencialmente menor, o que se deve ao facto de se terem realizado partições nas zonas mais densas em termos de modelos no método intuitivo, o que também teve consequência no método k-médias. Tabela 5.2: Dados sobre δν dos agregados em função do método de agregação, casos com 12 centróides. C C(1) C(2) C(3) C(4) C(5) C(6) C(7) C(8) C(9) C(10) C(11) C(12) No m's 8 8 7 3 10 5 14 5 15 9 5 10 Intuitivo média pior caso 0.1884 0.2956 0.1497 0.2620 0.0979 0.1950 0.0989 0.1051 0.0665 0.1748 0.0716 0.1056 0.1043 0.1784 0.1051 0.2276 0.1228 0.2263 0.1235 0.2036 0.0808 0.1694 0.1324 0.1846 K-médias m's média pior caso 8 0.1499 0.2850 15 0.0946 0.1905 6 0.0698 0.1261 3 0.0548 0.0551 9 0.0300 0.0513 9 0.0552 0.0766 10 0.0511 0.0939 7 0.0502 0.0563 8 0.0540 0.0815 6 0.0669 0.0742 10 0.1004 0.2372 9 0.0641 0.1566 No Aglomerativo m's média pior caso 24 0.0736 0.1303 4 0.0697 0.0966 16 0.0524 0.0958 11 0.0735 0.0990 5 0.0650 0.0737 15 0.0744 0.1032 5 0.0989 0.1143 8 0.0633 0.1170 9 0.0791 0.1542 1 2 0.1159 0.1159 1 - No 67 68 Capítulo 6 Resultados das Simulações para o NMB Este capítulo tem como objectivo apresentar e discutir os dados obtidos das simulações do bloqueio neuromuscular, com os vários sistemas de controlo implementados. Inicialmente, descrevem-se os parâmetros de desempenho que, normalmente, se consideram para o bloqueio neuromuscular. Em seguida apresentam-se exemplos das vantagens do controlo comutado na presença de sistemas em que existe uma elevada incerteza na dinâmica do processo, em relação a um controlador. A parte principal do capítulo centra-se na discusão dos resultados das simulações efectuadas para os vários bancos de controladores e estimadores, que juntos formam um sistema de controlo. Os dados completos das simulações efectuadas estão presentes no apêndice C. Por último são identicados os problemas que o ruído coloca no controlo comutado, sendo apresentados alguns exemplos. 6.1 Parâmetros de Desempenho Nesta secção descrevem-se parâmetros que permitem avaliar o desempenho do sistema de controlo, tendo em conta os requesitos clínicos e de controlo. Alguns dos parâmetros pretendem dar informação sobre a resposta transitória, enquanto outros avaliam o desempenho da resposta em regime estacionário. Esta descrição tem como base [29], em que se deniram os parâmetros de desempenho para o bloqueio neuromuscular. 69 Capítulo 6. Resultados das Simulações para o NMB 6.1.1 Em Regime Transitório O regime transitório corresponde à resposta inicial do controlador e é denida como o intervalo de tempo entre 30 min. tref e os 75 min, sendo que o valor usado nesta foi de De acordo com [30], o desempenho do sistema de controlo em cadeia fechada é caracterizado por um índice denominado erro de desempenho ( calculado como a diferença ponderada entre a medida actual P Ej = O tref = M DP E rj performance error ), P E , e a desejada rjc rj − rjc × 100 rjc é denido como a mediana do PE (6.1) e dá uma medida do desvio constante que possa existir e reecte se as medidas estão sistematicamente acima ou abaixo do valor da referência. M DP E = M edian{P Ej } (6.2) Uma medida da exactidão do método de controlo é dada pelo M AP E , denido como a mediana do erro absoluto de desempenho, ou seja, M DP E = M edian{|P E|j } O W obble (6.3) mede o comportamente oscilatório do controlador, sendo denido como W obble = M edian{|P Ej − M DP E|} Em que sendo j = tinicial , . . . , tf inal , tf inal 75 min. os O (6.4) onde tinicial é o instante após tref em que Overshoot r(t) passa os 10%, é denido como Overshoot = max(rj ) − rtf inal × 100 max(rj ) (6.5) sendo uma medida da sobrelevação inicial da resposta, desejando-se que esteja seja nulo. A área , A, é cálculada através de X A=( |rj − rjc |) × ∆t onde (6.6) ∆t representa o intervalo de tempo em que a soma é cálculada (que será o respeitante ao regime transitório). O tempo de estabelecimento, ts , também é um parâmetro impor- tante, que apesar de não ter sido incluído em [29], é aqui considerado. Este é denido como o tempo que o sistema leva até que o erro de seguimento esteja em módulo abaixo de um certo limiar. Nesta tese considerou-se o limiar em estar entre 9% tref = 30 min e 11%. 70 ts ou seja, a saída deverá Tendo em conta que a subida gradual da referência começa após e que a subida leva como bom todos os ±1%, inferiores a 40 min a atingir o valor de nal desejado, considera-se 70 min e razoáveis até aproximadamente 100 min. 6.2. Vantagens do Controlo Comutado 6.1.2 Em Regime Estacionário O regime estacionário começa naturalmente após terminar o transitório, ou seja, após os 75 min até ao m da simulação. Para a avaliação do desempenho em regime estacionário foram considerados os parâmetros M DP E , M AP E e W obble anteriormente denidos. Consideraram-se ainda outros parâmetros como a taxa média de infusão, a média do nível do bloqueio neuromuscular e o erro quadrático médio (MSE). 6.2 Vantagens do Controlo Comutado Como se referiu no capítulo 4, o controlo comutado foi concebido com o intuito de resolver os problemas da variabilidade intra e interpacientes. Nesta secção são apresentados exemplos do desempenho superior do controlo comutado em relação ao uso de um único controlador. 6.2.1 Variabilidade Inter-pacientes Na secção 3.4 apresentaram-se uma série de exemplos em que se tinha um controlador projectado especicamente para o modelo do paciente em questão. assumir conhecimento possível saber. a priori Pelo que se está a sobre o modelo do paciente, o que na realidade não é Na prática, antes da cirurgia, são realizados testes pelo anestesista de modo a avaliar se o paciente é mais ou menos resistente ao fármaco, mas daí até saber qual o modelo farmacocinético/farmacodinâmico vai uma grande distância. Na Figura 6.1 está representado um exemplo de uma simulação em que o modelo do paciente é um modelo lento, M69 , e o controlador aplicado é projectado para um modelo intermédio, C4 , ver apêndice A. Como se pode constatar na Figura 6.1a) a resposta é bastante oscilatória e analisando o comportamento da acção de controlo em (b), este está a oscilar em crescendo indicando possivelmente instabilidade, ou pelo menos estabilidade crítrica após atingir a saturação. Em contraponto na Figura 6.2 está representada a simulação para o mesmo modelo do paciente, M69 , mas com um esquema de controlo comutado (ver Tabela C.2). 6.2.2 Variabilidade Intra-pacientes Durante uma cirurgia é possível que a dinâmica do paciente varie durante um certo período de tempo. Na Figura 6.3 apresenta-se uma simulação que ilustra a seguinte situação: inicialmente o modelo do paciente era o M10 , em t = 180 min começou a variar-se linear- 71 Capítulo 6. Resultados das Simulações para o NMB Figura 6.1: Simulação para o modelo M69 com o controlador C4 Am ∈ {0.8, 0.92} e Ac0 ∈ {0.89}. (a) resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ]. mente os parâmetros do modelo farmacocinético/farmacodinâmico para os parâmetros do modelo M69 , até ao instante nal da simulação. Como se pode observar na Figura 6.3, após a variação existe um transitório de até o controlador se adaptar à nova dinâmica. Passados 20 min, começa novamente a adaptação até atingir o controlador da classe do novo modelo de paciente controlador correcto, 6.3 C70 , M69 C76 , 25 min o controlador comutado sendo este o controlador (inicialmente também tinha convergido para o ver Tabela C.2). Discussão dos Resultados Nesta secção apresentam-se e discutem-se os resultados das simulações efectuadas para o conjunto dos 6 bancos de controladores construído, presentes no apêndice C. De notar, que cada banco de controladores foi simulado com dois tipos de estimadores, nomeadamente estimador com Predição do Erro com Índices de Desempenho, PEPI, e estimador com Minimização do Erro Quadrático Médio, LMS. Assim, são apresentados 12 sistemas de controlo a comparar, respeitantes à combinação de 3 métodos de agregação com 2 números possíveis para o número de controladores e 2 estimadores diferentes. Escolheram-se como parâmetros de avaliação do desempenho do sistema de controlo o número de casos em que o sinal de comutação converge para um modelo do mesmo centróide, o Overshoot (sobrelvação), o ts (tempo de estabelecimento) e o M SE (erro quadrático médio em regime estacionário). O número de convergência é parâmetro importante avaliar, pois espera-se que com um número de convergências maior o desempenho seja superior, dado que um controlador garante um bom desempenho para os elementos 72 6.3. Discussão dos Resultados Figura 6.2: Simulação para o modelo M69 com o controlador comutado. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ e índice de classe φ. da sua classe, mas não para elementos de outras classes. Os parâmetros M SE Overshoot, ts e foram escolhidos, em detrimento dos outros parâmetros descritos em 6.1, por terem um signicado mais intuitivo. Sendo que o tempo de estabelecimento e sobrelevação fornecem informação sobre a parte inicial da resposta, enquanto o M SE permite avaliar a resposta em regime estacionário (relembrar que se considera como regime estacionário a resposta para t > 75 min). Na Tabela 6.1 apresentam-se os parâmetros de desempenho do controlador em função do sistema de controlo identicado da seguinte forma: controladores -estimador. método de agregação -número de 73 Capítulo 6. Resultados das Simulações para o NMB Figura 6.3: Simulação com o controlador comutado, em que entre t = 180 min até t = 300 min os parâmetros de M10 variam linearmente de forma a igualarem os parâmetros de M69 . (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ e índice de classe φ. 74 6.3. Discussão dos Resultados Tabela 6.1: Parâmetros de desempenho em função do sistema de controlo. Overshoot [%] Sistema de Controlo intuitivo-7-PEPI intuitivo-7-LMS k-médias-7-PEPI k-médias-7-LMS aglomerativo-7-PEPI aglomerativo-7-LMS intuitivo-12-PEPI intuitivo-12-LMS k-médias-12-PEPI k-médias-12-LMS aglomerativo-12-PEPI aglomerativo-12-LMS convergências 63 27 69 33 26 34 14 14 8 12 20 22 média 2.84 4.62 2.25 4.39 23.41 3.72 7.09 2.88 4.25 3.11 9.51 11.04 ts [min] pior caso 35 39 35 54 99 36 45 40 50 45 64 99 média 65.22 68.24 66.65 67.09 110.82 68.11 112.07 59.96 86.47 61.61 107.7 91.34 pior caso 96 286 298 250 300 197 300 286 300 157 300 300 M SE [%] média 0.0205 0.0523 0.3098 0.2804 11.47 0.1222 0.7415 0.0277 0.6008 0.0707 1.5882 1.4983 pior caso 0.34 1.6 29.3 8.35 114 4.47 8.75 1.4 15.9 4.43 17.6 13.2 Em primeiro lugar interessa identicar o sistema de controlo que teve o melhor desempenho. Observando a Tabela 6.1, dois sistemas de controlo destacam-se dos demais, nomeadamente o intuitivo-7-PEPI e o k-médias-7-PEPI. O sistema intuitivo-7-PEPI foi o único a apresentar bons resultados em todos os parâmetros de desempenho, nomeadamente o único que apresentou como pior caso de ts um valor aceitável. De referir no en- tanto, que o sistema k-médias-7-PEPI apenas apresentou um modelo que não fornecesse o desempenho mínimo (ver Tabela C.2 modelo ts = 108 min e M SE = 0.31%. M68 ), tendo o pior caso seguinte um Estes dois sistemas de controlo destacam-se dos demais, principalmente pelo número de modelos que convergiram para um modelo do mesmo controlador. Estes são os únicos casos em que taxa de convergências é superior a 50% (como o banco utilizado tem 100 modelos, a taxa de convergência é igual ao número de convergências em %). Um aspecto importante a comparar é o desempenho dos estimadores do controlador comutado. Analisando a Tabela 6.1 constata-se que ambos os métodos apresentam bons resultados em termos de parâmetros de desempenho, mas destacam-se duas diferenças fundamentais: na convergência e com um número de controladores superior. Em relação à convergência o LMS tem uma taxa de convergência bastante inferior ao PEPI (nos casos intuitivo-7-PEPI e k-médias-7-PEPI), mas em termos dos restantes parâmetros apresenta valores semelhantes, apesar de ligeiramente superiores. As diferenças das médias de Overshoot não excedem os 2.5%, das médias de ts não passam dos 3.5 min e em re- 75 Capítulo 6. Resultados das Simulações para o NMB lação às médias do M SE consegue ser melhor num caso (k-médias-7-LMS) e no outro a difernça de médias não excede os 0.03%. Pode assim concluir-se que o método LMS não está dependende do sucesso da taxa de convergência para que o sistema tenha um bom desempenho De notar que as conclusões sobre a convergência são relativas, na medida em que se utiliza lógica de decisão (histerese) para evitar excesso de comutação e ainda, em alguns casos, ltro de predição variável, em que se o erro estiver abaixo de um certo limiar suspende a comutação. Isto tem origem na principal preocupação do sistema de controlo, que é o de se ter uma boa resposta do paciente, em detrimento do número de convergências poder ser maior, mas com transitórios indesejáveis ao longo da comutação. De referir que com o método de agregação aglomerativo o estimador LMS teve melhor desempenho em todos os parâmetros do que o PEPI, incluindo a taxa de convergência. Em relação ao número de controladores, o desempenho dos estimadores inverte-se, tendo o LMS melhor desempenho com qualquer método de agregação e com um número de controladores superior (com o aglomerativo apenas tem maior média e pior caso de Overshoot). O descrescimo de desempenho do PEPI deve-se sobretudo ao facto da taxa de convergência ter diminuido. Focando a atenção nos métodos de agregação, interessa saber se a optimização efectuada pelo método k-médias em relação ao método intuitivo tem repercursão no desempenho do sistema de controlo. A partir dos dados da Tabela 6.1 não é possível armar a superioridade de um método em relação a outro. Isto signica que os parâmetros T 80 − 10 e P descrevem sucientemente bem o modelo, de maneira a que uma classicação no espaço dos parâmetros T 80−10 e P seja adequada. Ambos os métodos de agregação têm valores, dos parâmetros de desempenho considerados, similares. Rera-se, novamente, que o sistema de controlo que melhor cumpriu todas as especicações foi um sistema de controlo em que o banco de controladores foi construído através de um método intuitivo. Ainda sobre os métodos de agregação, interessa saber se o método automático de agregação, em que não se assume conhecer a estrutura do problema consegue cumprir as especicações mínimas. A partir dos dados da Tabela 6.1, constata-se que apenas no sistema de controlo aglomerativo-7-LMS tem um bom desempenho, com valores médios de Overshoot, ts e M SE dentro ao nível dos melhores sistemas de controlo já referidos. Por último, analisa-se, se com a utilização de um número superior de controladores o desempenho do sistema de controlo aumenta. Em termos de convergência ao contrário do que seria esperado, a taxa de convergência é menor com um número maior de controladores. Em termos das respostas do paciente no tempo de referir com a excepção dos 76 6.4. O Problema do Ruído no Controlo Comutado casos com o método de agregação aglomerativo, discutido no parágrafo anterior, para o estimador PEPI os resultados são piores, enquando para o estimador LMS os resultados são melhores. 6.4 O Problema do Ruído no Controlo Comutado Um factor importante na validação de um trabalho de simulação é a sua aproximação com a realidade. Num ambiente clínico, os dados são obtidos através de sensores, que corrompem os dados com ruído. Assim, é importante que o controlador mantenha, dentro do possível, o desempenho na presença de ruído. Nesta secção é abordado o problema que o ruído coloca no controlador, em que inicialmente se apresenta um ltro passa-baixo e em seguida se apresentam algumas simulações. 6.4.1 Filtragem do Ruído Para as simulações em que se adicionou o ruído na saída do modelo do paciente, projectouse um ltro passa-baixo com o objectivo de reduzir o ruído de alta frequência. Considerouse um ltro de primeira ordem dado por rf iltrado (k) = λn rf iltrado (k − 1) + (1 − λn )r(k) em que λn (6.7) está entre 0 e 1. Tendo em conta a especicidade do problema do bloqueio neuromuscular, em particular, o facto de inicialmente ser administrado um resposta varia aproximadamente dos a partir dos bolus em que a 100% aos 0% em poucos minutos, o ltro só é ligado 5 min. 6.4.2 Exemplos Na presença de ruído, a resposta do sistema com o controlador comutado degrada-se, principalmente em modelos mais lentos e na fase transitória do controlador proporcional para os controladores do banco C. Isto, porque em regime estacionário o controlador segue a referência com um bom desempenho, mesmo variando a referência à volta dos 10%. As simulações presentes nas Figuras 6.4, 6.5 e 6.6, foram efectuadas com o estimador do tipo PEPI e com o banco de controladores de 7 elementos construído com o método k-médias. A histerese com h = 1, um ltro de predição variável com foi escolhida como lógica de decisão, sendo usado λ0 = 0.85 e um limiar do ec em 0.1%. Os grácos (d) representam a resposta do paciente sem estar ltrada e a resposta ltrada com um λn = 0.85. As simulações foram efectuadas com uma variância unitária para o ruído. 77 Capítulo 6. Resultados das Simulações para o NMB Figura 6.4: Simulação efectuada para o modelo M9 com ruído de variância unitária. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ e índice de classe φ, (d) - . As simulações foram efectuadas com os modelos M9 , M22 cas diferentes em termos dos parâmetros da resposta ao na Tabela A. e bolus M76 que têm característi- inicial, como se pode ver As três respostas dos pacientes têm em comum o facto de apresentarem problemas no regime transitório, mas não acontecendo o mesmo em regime estacionário. Este facto deve-se ao transitório inicial do controlador comutado, e para resolver este problema colocou-se a raíz do polinómio observador de anti-colagem, Aaw , fora da origem, mas mesmo assim o problema persistiu. Dado que em tcc ainda está num nível baixo, aproximadamente tado em tcc = 50 min, = 30 min a resposta do paciente 3%, optou-se por ligar o controlador comu- cando assim o controlador proporcional ligado até aos Como se pode ver nas Figuras 6.4, 6.5 e 6.6 em t = 50 min 50 min. existe uma alteração radical da resposta, acontecendo um de dois casos: se a resposta estiver aos 50 minutos estiver abaixo da referência a acção de controlo satura no valor superior da saturação, tendo como consequência uma descida do nível do bloqueio neuromuscular, caso contrário a acção de controlo satura em 0, o que faz com a resposta apresente uma elevada sobrelevação. 78 6.4. O Problema do Ruído no Controlo Comutado Nestes exemplos variou-se a referência em pequenos incrementos de ±3% em torno do valor nal desejado. Como se pode analisar nos grácos (a), o seguimento em regime estacionário após a mudança de referência, seguiu perfeitamente a mesma, não apresentando qualquer transitório indesejado. Por último, como se pode observar nos três casos em (c), existiu pouca ou nenhuma comutação do controlador comutado. Esta situação vericou-se, mesmo com o outro tipo de estimador ou método de agregação. Figura 6.5: Simulação efectuada para o modelo M23 com ruído de variância unitária. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ e índice de classe φ, (d) - . 79 Capítulo 6. Resultados das Simulações para o NMB Figura 6.6: Simulação efectuada para o modelo M76 com ruído de variância unitária. (a) - resposta do nível de bloqueio neuromuscular r(t) [%], (b) - acção de controlo u(t) [µg kg −1 ], (c) - sinais de comutação σ e índice de classe φ, (d) - . 80 Capítulo 7 Conclusões e Trabalho Futuro Neste capítulo nal, resumem-se as conclusões e contribuições principais da tese, sugerindose ainda alguns aspectos, sobre os temas abordados, que poderiam ser melhorados. 7.1 Conclusões Este tese pretendeu contribuir para o desenvolvimento de métodos de controlo supervisionado com múltiplos modelos, aplicados ao problema do bloqueio neuromuscular. No capítulo 2, através de testes efectuados, comprovou-se que a linearização obtida para os modelos do bloqueio neuromuscular constituiam boas aproximações à volta do ponto de interesse. Sugeriu-se o uso de parâmetros da resposta ao bolus inicial, de forma a se conseguir ganhar intuição para a especicação da dinâmica dos controladores locais, o que depois foi exemplicado no capítulo 3. O capítulo 3 apresentou o método de projecto por colocação de pólos, com técnicas polinomiais, sendo aplicado, pela primeira vez, ao bloqueio neuromuscular com sucesso. Destacam-se a importância de alguns aspectos como o termo Rd (acção integral), adi- cionado ao controlador, permitiu rejeitar erro estático em regime estacionário, o termo Sd permitiu que o controlador funcionasse na presença de ruído, o que em conjunto com a acção integral não era possível, sendo este um factor determinante no sucesso do projecto. O termo Sd conferiu ainda robustez, na medida em que aumenta a margem de estabili- dade, permitindo assim uma maior gama de valores para a colocação de pólos. Ainda em relação ao controlador polinomial, observou-se que os modelos mais lentos necessitavam de uma especicação dinâmica, pólos de Am , mais lenta do que nos modelos rápidos na presença de ruído. Este facto, também acontecia sem ruído e sem o termo Sd (que como já foi referido confere robustez ao sistema). Por último, demonstrou-se o efeito do polinómio 81 Capítulo 7. Conclusões e Trabalho Futuro observador na presença de ruído, em que retirando os pólos da origem o desempenho do controlador melhorou signicativamente. No capítulo 4 apresentaram-se soluções para diversos blocos do supervisor. Em particular, a inovadora utilização do estimador LMS aplicado ao bloqueio neuromuscular. Através de simulações demonstra-se que a histerese com escala independente é uma solução mais dwell- adequada para o bloco lógica de decisão, em detrimento do tempo de permanência ( time ), pois evita o excesso de comutação e ainda produz melhores resultados em termos de convergência para o controlador correcto. Demonstrou-se ainda o desempenho superior do ltro de predição variável (em oposição ao constante), em que se realizou uma ligeira alteração ao esquema original apresentado em [21]. Propôs-se ainda um esquema de colagem anti- com integrador comum adaptado aos controladores com colocação de pólos, que foi um aspecto importante no funcionamento do controlo comutado. Na discussão sobre os resultados das simulações efectuadas com os diversos estimadores e bancos de controladores conclui-se que em relação aos estimadores ambos apresentam bons resultados com os diversos bancos de controladores. Com o estimador PEPI obtiveram-se os melhores resultados observados, destanco neste estimador a sua taxa de convergência acima dos 60%, nos dois melhores sistemas de controlo apresentados. Apesar dos melhores resultados terem sido com o estimador PEPI, vericou-se uma dependência da taxa de convergência para o sucesso do sistema de controlo, tal não se vericou com o estimador LMS. O estimador LMS, mesmo com taxas de convergência bastante inferiores conseguiu cumprir perfeitamente as especicações e com um número superior de controladores teve um desempenho melhor do que o PEPI. O capítulo 5, apresenta o maior contributo desta tese, que passa pelo desenvolvimento de métodos (de agregação) para a construção de um banco de controladores, em que o número de controladores é substancialmente inferior ao número de modelos (do banco de modelos). Apresentaram-se 3 métodos diferentes tendo todos tido sucesso, na medida em que os sistemas de controlo com estes bancos obtiveram bons resultados. Um passo bastante importante para ecácia dos métodos de agregação, nomeadamente os métodos k-médias e aglomerativo, foi a denição de uma métrica adequada para as distâncias entre modelos. A métrica escolhida foi a distância de Vinnicombe e dada o sucesso dos métodos de agregação conclui-se que esta foi uma escolha acertada. Um dos métodos apresentados é um método intuitivo, na medida em que utiliza a intuição do problema para efectuar a classicação. Outro método proposto, parte do método intuitivo como primeira iteração de inicialização mais classicação, o que signica que é inicializado numa zona óptima, para depois realizar uma optimização das distâncias 82 7.2. Trabalho Futuro nas classes (método k-médias). Os resultados demonstrados no capítulo 6, não registaram diferenças signicativas entre o desempenho dos dois métodos de agregação referidos. Isto permitiu concluir que os parâmetros denidos com base na resposta ao bolus inicial consegue descrever sucientemente bem o comportamento dos modelos. Estes métodos obtiveram melhores resultados do que o terceiro método apresentado, mas têm a desvantagem de utilizarem informação sobre o problema para obterem as soluções. Na resolução do problema do bloqueio neuromuscular não se vericou este problema porque se conseguiu obter uma descrição dos modelos em termos de 2 variáveis, que como cou demonstrado pelos resultados, são capazes de descrever o comportamento dos modelos. Noutros problemas, a elevada dimensionalidade do problema e a consequente falta de intuição pode impossibilitar que algo semelhante se possa fazer. Deste modo, propôs-se um terceiro método, com o objectivo de ser independente do problema e totalmente automático. Este é um método aglomerativo de ligação completa, que como seria de esperar teve um desempenho inferior em relação ao intuitivo e kmédias. Mesmo assim, os sistemas de controlo com os bancos de controladores criados com o método aglomerativo cumpriram minimamente as especicações pedidas, tendo sido apresentado um caso em que os resultados estavam ao nível dos melhores obtidos. Um problema deste método é facto do método de agregação tender a criar centróides com poucos elementos, nas zonas em que os modelos estão muito afastados, e centróides com muitos elementos nas zonas de maior densidade de modelos. O que em termos de aplicação do controlo comutado, obriga a que um controlador de uma classe com muitos modelos tenha de ser mais robusto, perdendo assim desempenho em alguns modelos da classe de forma a estabilizar todos os elementos. Esta foi a razão principal encontrada para os piores resultados deste método. Em relação ao número de controladores ser maior ou menor, conclui-se que com mais controladores a taxa de convergência é inferior, que o estimador PEPI funcionou melhor com menos controladores e o estimador LMS com mais controladores. Assim, a questão do número de controladores ca de certo modo em aberto, já que os resultados demonstraram uma dependência em relação ao estimador em utilização. 7.2 Trabalho Futuro O desempenho evidenciado pelos algoritmos de controlo em conjunto com o desenvolvimento recente de soluções validadas clinicamente para o problema do bloqueio neuromuscular, sugere o uso dos algorimtos de controlo em pacientes submetidos a cirurgia. 83 Capítulo 7. Conclusões e Trabalho Futuro Em relação ao algoritmo de colocação de pólos através de técnicas polinomiais que é usado no projecto dos controladores locais, seria interessante ter um método de projecto automático e robusto para os controladores (pólos de ser o uso da mixed sensitivity Am e Ac0 ). Uma possibilidade poderia aplicada a um controlador com dois graus de liberdade. O perl da referência poderia ser melhorado, tornando-o parametrizável, em função da identicação inicial do modelo ao longo da descida. saber o valor de parâmetros como T 80, T 50 e T 10. Após o bolus inicial é possível Com este conhecimento, seria possível escolher mais adequadamente, parâmetros da referência, como tref . Outra hipótese seria usar o método híbrido [14] que estima o modelo farmacocinético/farmacodinâmico nos instantes iniciais. Um questão em aberto, é como se poderia melhorar o desempenho do controlo comutado, com o conhecimento da identicação (através do método híbrido referido no parágrafo anterior) do modelo do paciente ao longo do tempo. O maior problema que surgiu neste trabalho deveu-se ao ruído com o esquema de controlo comutado, nomeadamente na fase inicial do controlador, pois em regime estacionário e com mudanças de referência este funcionava adequadamente. Assim, uma solução para este problema seria bastante benéca em termos de experimentação em pacientes. Em relação ao banco de controladores, um aspecto que poderia ser melhorado reside na concepção de um método de projecto dos controladores associados aos centróides das classes de forma a que cada controlador estabilizasse todos os modelos e não só os da classe (pelo menos). Um problema desta solução seria provalvemente uma perda de desempenho em relação aos modelos das classes de cada controlador. 84 Apêndice A Parâmetros da Resposta ao Inicial Este apêndice contém os valores dos parâmetros acordo com a secção 2.3, para o banco de modelos Bolus T 80, T 50, T 10, S e P, calculados de M = {Mj = 1, . . . , 100} do atracúrio. Tabela A.1: Parâmetros da resposta ao bolus inicial. Modelo/Parâmetro T 80 [min] T 50 [min T 10 [min] S P [min] M1 2.33 2.67 4.33 -52.94 20.33 M2 3.00 3.67 5.67 -44.03 28.33 M3 1.67 2.33 3.33 -67.99 27.33 M4 1.67 2.33 3.33 -70.12 32.33 M5 1.33 1.67 2.33 -116.26 33.33 M6 1.33 1.33 2.00 -149.62 29.67 M7 2.33 3.00 4.00 -60.63 33.00 M8 2.33 2.67 4.00 -64.84 29.33 M9 1.67 2.00 3.33 -72.27 24.33 M10 1.33 1.33 2.00 -128.02 31.33 M11 1.67 2.00 2.67 -89.00 32.33 M12 1.67 2.00 3.00 -76.83 24.33 M13 1.67 2.00 3.33 -68.79 29.00 M14 3.00 4.33 8.00 -28.80 11.67 M15 1.33 1.33 2.00 -149.11 42.00 M16 2.33 2.67 4.67 -54.44 15.33 M17 1.67 2.00 2.67 -91.03 26.00 M18 1.67 2.00 4.00 -60.03 20.00 M19 2.33 2.67 4.00 -62.77 27.67 M20 1.33 1.33 2.00 -137.65 29.67 M21 2.33 3.00 4.33 -60.82 19.33 85 Apêndice A. Parâmetros da Resposta ao Bolus Inicial 86 Modelo/Parâmetro T 80 [min] T 50 [min T 10 [min] S P [min] M22 1.67 2.00 2.67 -100.96 43.67 M23 1.67 2.00 2.67 -91.79 30.33 M24 2.33 3.00 4.67 -52.77 21.00 M25 2.33 2.67 3.67 -69.85 31.33 M26 1.67 2.00 2.67 -112.23 42.00 M27 1.33 1.67 2.67 -97.25 27.33 M28 2.67 3.67 5.67 -41.94 20.33 M29 2.00 2.33 3.67 -71.84 30.00 M30 2.67 3.00 4.33 -63.83 34.67 M31 2.33 3.00 3.67 -84.04 37.00 M32 1.33 1.67 2.33 -100.53 31.00 M33 1.67 2.00 3.00 -95.88 37.33 M34 2.33 3.00 4.00 -64.03 26.33 M35 1.33 1.33 1.67 -155.83 34.33 M36 3.00 3.67 4.67 -56.68 36.00 M37 3.67 5.00 8.67 -28.46 0.00 M38 1.67 2.00 2.33 -133.80 31.67 M39 5.33 6.67 11.33 -21.64 13.33 M40 1.33 1.67 2.33 -116.68 35.33 M41 2.33 2.67 3.33 -79.01 31.00 M42 1.67 2.00 2.67 -91.27 23.33 M43 1.67 2.00 3.00 -78.87 26.33 M44 3.00 3.67 5.00 -49.63 31.00 M45 2.00 2.33 3.33 -86.97 39.00 M46 1.67 1.67 2.33 -117.27 35.00 M47 1.67 2.00 3.00 -87.30 25.67 M48 1.00 1.33 1.67 -131.97 37.00 M49 2.00 2.33 3.33 -84.12 29.33 M50 1.33 2.00 2.67 -86.39 27.00 M51 1.33 1.67 2.33 -106.92 30.67 M52 1.00 1.00 1.33 -184.96 39.67 M53 2.33 3.00 4.33 -57.36 32.00 M54 2.33 3.00 4.00 -63.44 29.00 M55 2.00 2.33 3.00 -94.92 27.33 M56 1.67 2.00 2.67 -97.48 31.00 M57 2.00 2.33 3.33 -89.45 36.00 M58 1.67 2.00 3.00 -76.57 23.00 M59 1.33 1.67 2.00 -138.08 33.33 M60 2.00 2.33 3.33 -80.31 22.67 M61 1.33 1.67 2.67 -95.73 32.67 M62 3.67 4.67 6.67 -37.08 22.00 Modelo/Parâmetro T 80 [min] T 50 [min T 10 [min] S P [min] M63 1.33 1.67 3.00 -79.74 14.33 M64 1.67 2.00 2.67 -95.63 30.67 M65 1.33 1.67 2.00 -143.48 42.33 M66 1.33 1.67 2.33 -98.07 28.67 M67 1.67 2.00 2.67 -94.10 38.33 M68 1.67 2.00 2.67 -94.71 30.33 M69 5.33 6.67 10.00 -23.81 37.00 M70 1.67 2.00 2.33 -122.10 37.33 M71 1.33 1.67 2.33 -117.50 38.33 M72 1.67 2.00 2.33 -128.59 37.33 M73 2.00 2.67 3.33 -76.47 29.33 M74 2.00 2.33 3.33 -78.29 24.67 M75 2.33 2.67 3.67 -64.17 37.33 M76 3.00 4.00 6.67 -34.46 20.67 M77 2.33 3.00 4.33 -58.38 31.00 M78 2.33 3.00 4.67 -49.45 31.00 M79 1.67 2.00 3.00 -87.26 20.67 M80 1.67 2.00 2.67 -93.31 34.33 M81 3.33 4.33 7.67 -29.29 21.00 M82 1.67 2.00 3.00 -76.65 28.33 M83 1.33 1.67 2.33 -106.30 26.00 M84 1.67 2.00 3.00 -74.91 20.67 M85 1.67 2.00 3.00 -80.21 29.33 M86 1.67 2.00 2.67 -102.24 27.33 M87 1.67 2.00 3.00 -86.47 31.00 M88 2.33 3.00 4.33 -58.09 29.67 M89 1.67 2.00 2.67 -99.12 36.00 M90 1.33 1.67 2.33 -108.56 45.67 M91 1.67 2.00 2.67 -94.98 31.33 M92 1.67 2.00 4.00 -58.50 11.67 M93 1.33 1.67 2.33 -119.26 41.33 M94 1.00 1.33 1.67 -140.21 34.33 M95 1.67 2.33 4.00 -58.63 26.67 M96 2.33 3.00 4.33 -54.51 23.00 M97 1.33 1.33 2.00 -149.27 40.33 M98 2.00 2.33 3.67 -68.88 35.33 M99 1.67 2.00 3.00 -87.70 31.33 M100 2.33 2.67 4.00 -63.00 30.67 87 88 Apêndice B Método de Resposta ao Escalão de Ziegler-Nichols Esta técnica consiste na extracção de dois parâmetros da resposta do sistema em malha aberta a um escalão unitário [31, 32]. Estes são o valor do declive no ponto de inexão, R, e o atraso no tempo, L. A resposta de um sistema genérico a um escalão e a extracção desses mesmos parâmetros pode ser observada na Figura B.1. Em [11] é fornecido um Figura B.1: Determinação dos parâmetros R e L a partir da resposta ao escalão, do método de resposta ao escalão de Ziegler-Nichols [1]. 89 Apêndice B. Método de Resposta ao Escalão de Ziegler-Nichols algoritmo para o anamento dos ganhos de um controlador PID, a partir do método da resposta ao escalão de Ziegler-Nichols, aplicado apenas à parte linear do modelo. A expressão usada para o ganho proporcional é dada por kp = 1.2 1 RL rd (req ) (B.1) Mas tendo em conta que se pretende implementar apenas um controlador proporcional, o ganho será reajustado de acordo com sugerido no método de Ziegler-Nichols, ou seja, com uma diminuição de 20% no valor do ganho em relação a (B.1). kp = 1 1 RL rd (req ) (B.2) Um problema que surge com este método é o de se assumir conhecimento a priori, ou seja, é necessário conhecer a resposta ao escalão do paciente, o que não é desejável. Mas sendo este um elemento secundário no esquema de controlo global, considerou-se que os ganhos cálculados através de (B.2) constituem boas aproximações. De referir no entanto, que existem métodos para o cálculo dos parâmetros na resposta ao 90 bolus inicial, nomeadamente T 50 e R T 10, e L [2]. através da informação obtida Apêndice C Tabelas dos Agregados Este apêndice contém 6 tabelas, para os 6 bancos de controladores construídos. As 3 primeiras tabelas, C.1, C.2 e C.3 referem-se aos bancos de controladores construídos com 7 controladores e para os métodos de agregação intuitivo, k-médias e aglomerativo, respectivamente. Em seguida apresentam-se 3 tabelas, C.4, C.5 e C.6 com os mesmos métodos, mas com 12 controladores. Para cada banco de controladores foram realizadas simulações com os dois tipos de estimadores considerados: PEPI e LMS. As simulações foram efectuadas com histerese (h = 1) (λ0 como lógica de decisão e, no caso PEPI, com um ltro de predição variável = 0.85 λp = 0.975 e limiar de ec = 0.1%, excepção para a Tabela C.3 em que se utilizou um xo). As tabelas estão organizadas por classes, começa-se por identicar a classe com e k = 1, . . . , Nc , à sua direita identica-se o modelo controlador da classe é o modelo que na coluna das distâncias, valor nulo. Á direita de Am e Ac0 , Ci δν , Ci , C(k) em que i do controlador aos elementos da classe tem apresentam-se as especicações para os pólos do controlador, e para os pólos do observador da predição Ap0 . Os valores apresentados da simulação representam os parâmetros de desempenho do sistema de controlo considerados: convergência, Overshoot, ts e M SE . Sendo que a coluna da convergência é preenchida da seguinte forma: se o sinal índice de classe convergiu para o centróide (controlador) da classe não se preenche, caso contrário é colocado um *. 91 Apêndice C. Tabelas dos Agregados Tabela C.1: Algoritmo Intuitivo com 7 centróides. 92 Modelo δν C(1) C14 M14 0 M28 M37 convergência Overshoot [%] PEPI PEPI LMS Am ∈ {0.8, 0.92} LMS ts [min] PEPI M SE [%] LMS Ap0 ∈ {0.5} PEPI LMS Ac0 ∈ {0.89} 0 0 74 57 0.01 0 0.2387 1 5 35 35 0 0 0.1012 35 0 55 52 0 0 M39 0.1512 9 0 78 49 0.04 0 M62 0.2956 35 30 55 59 0 0 M69 0.2912 5 8 58 57 0.02 0.02 M76 0.1502 1 0 67 38 0 0 0 75 42 0.01 0 M81 0.0905 C(2) C21 0 M1 0.1071 M16 0.1062 M18 0.2216 * M21 0 * M24 0.0677 M63 0.2013 M92 0.2620 Am ∈ {0.83, 0.95} Ap0 ∈ {0.5} * Ac0 ∈ {0.85} * 0 2 64 41 0 0 * 0 0 74 63 0.01 0 * 0 0 69 61 0 0 0 1 59 59 0 0.01 0 9 64 52 0 0 0 1 71 286 0 0.34 * 0 0 70 59 0.01 0 0 0 61 38 0 0 * M96 0.0817 * C(3) C34 Am ∈ {0.83, 0.95} Ap0 ∈ {0.5} M2 0.2059 * 7 0 66 42 0 0 M3 0.0487 * 7 0 37 67 0 0.01 M4 0.0381 0 19 66 61 0.01 0 M7 0.0522 0 6 68 51 0 0 M8 0.0164 3 0 62 75 0 0.02 M9 0.1718 0 0 68 61 0 0 M13 0.1748 0 0 69 71 0 0.01 M19 0.0205 4 0 56 72 0 0.01 M29 0.0550 * 0 0 66 72 0.01 0.01 M34 0 * * 13 2 44 65 0 0 M44 0.1582 * 2 0 70 56 0.01 0 M53 0.1068 0 0 86 79 0.08 0.05 M54 0.0357 2 0 60 74 0 0.01 M77 0.1058 0 0 67 86 0.01 0.34 M78 0.1832 0 0 72 58 0 0 M88 0.0873 0 3 64 84 0.01 0.49 M95 0.2229 1 0 68 44 0 0 M100 0.0520 0 28 92 74 0.15 0.01 Am ∈ {0.8, 0.92} Ap0 ∈ {0.85} * * * * * * Ac0 ∈ {0.86} Ac0 C(4) C98 M30 0.0928 * * 6 0 89 80 0.34 ∈ {0.9} 0.1 M36 0.1051 * * 13 31 93 91 0.07 0.19 Modelo convergência Overshoot [%] δν PEPI PEPI * LMS 0 ts [min] M SE [%] LMS PEPI LMS PEPI LMS 26 69 103 0 0.57 M98 0 C(5) C60 Am ∈ {0.8, 0.92} M42 0.0860 * 0 0 60 69 0 0 M58 0.0400 * 0 0 58 57 0 0 M60 0 * 0 0 59 57 0 0 M79 0.1056 * 0 0 62 67 0 0 0 0 60 70 0 0.01 Ap0 ∈ {0.8} M84 0.0548 * C(6) C66 Am ∈ {0.83, 0.95} Ap0 ∈ {0} M5 0.1460 * Ac0 ∈ {0.85} Ac0 ∈ {0.85} * 0 0 68 74 0.01 0.02 M6 0.2270 * 0 9 40 81 0 0.31 M10 0.1785 * 0 2 58 85 0 0.5 M11 0.1170 * 0 4 67 50 0.01 0 M12 0.1140 * 24 30 59 60 0 0 M17 0.0515 * 0 0 65 44 0.01 0 M20 0.1626 * * 0 0 58 72 0 0.01 M23 0.0741 * * 0 0 68 70 0.01 0.01 M25 0.1445 * 0 0 67 72 0.01 0.01 M27 0.1313 * 0 0 68 64 0 0 M32 0.1145 * * 0 0 62 62 0.01 0 M38 0.2197 * * 0 39 62 74 0 0.02 M41 0.1234 * 0 0 66 74 0.01 0.01 M43 0.0939 * 2 0 36 58 0 0 M47 0.1486 * * 14 25 51 62 0 0 M49 0.1422 * * 3 8 38 78 0 0.04 M50 0.1703 * 0 0 68 67 0 0 M51 0.1846 * 0 0 38 67 0 0 M55 0.1971 * 28 22 96 69 0.32 0.01 M56 0.1205 * 0 0 62 74 0 0.02 M59 0.3253 * 0 0 64 67 0 0.01 M61 0.1383 * 0 0 70 71 0.01 0.01 M64 0.0570 * * 0 0 65 68 0.01 0 M66 0 * * 0 6 38 51 0 0 M68 0.2263 * * 4 0 51 68 0.03 0 M73 0.1745 * 0 0 54 74 0 0.02 M74 0.1014 * 0 2 38 37 0 0 M82 0.0784 * 0 0 65 68 0 0 M83 0.1959 * * 9 37 34 74 0 0.02 M85 0.1450 * * 0 0 69 75 0 0.02 M86 0.0792 * * 0 0 61 44 0 0 M87 0.0851 * 0 0 66 74 0 0.01 M91 0.0326 * 0 0 67 75 0.01 0.01 * * * 93 Apêndice C. Tabelas dos Agregados 94 Modelo δν convergência Overshoot [%] PEPI LMS PEPI 0 M99 0.1438 * C(7) C66 Am ∈ {0.83, 0.95} M15 0.1087 * M22 0.2397 M26 0.2522 M31 ts [min] M SE [%] LMS PEPI LMS PEPI LMS 0 70 72 0.01 0.01 Ap0 ∈ {0.5} Ac0 ∈ {0.85} 0 0 71 57 0.01 0 * 0 0 85 56 0.16 0.01 * 13 0 89 65 0.1 0 0.3136 * 8 0 72 81 0.07 0.07 M33 0.2457 * 0 0 67 74 0.04 0.02 M35 0 0 0 68 68 0.01 0 M40 0.1483 * 0 0 71 62 0.01 0 M45 0.3067 * 6 0 71 77 0.02 0.04 M46 0.1639 * 0 21 69 69 0.01 0.01 M48 0.1398 * 0 0 70 71 0.01 0.01 M52 0.1846 * 0 39 71 159 0.01 1.6 M57 0.2879 * 3 0 87 73 0.14 0.02 M65 0.0850 * 0 14 72 73 0.01 0.02 M67 0.2429 * 0 0 74 73 0.03 0.02 M70 0.1402 * * 0 1 71 50 0.01 0 M71 0.1230 * * 0 0 72 55 0.01 0 M72 0.1479 * * 0 0 72 50 0.01 0 M75 0.4166 * * 2 0 72 79 0 0.05 M80 0.3061 * 0 0 70 73 0.01 0.01 M89 0.1833 * 0 0 70 70 0.01 0.01 M90 0.1882 * 24 0 80 78 0.09 0.04 M93 0.1628 * 0 0 70 58 0.02 0 M94 0.0737 0 32 67 75 0 0.02 M97 0.1478 0 0 72 69 0.01 0.01 * * * * Tabela C.2: Algoritmo K-médias adaptado ao Controlo Comutado com 7 centróides. convergência Overshoot [%] PEPI PEPI LMS ts [min] Modelo δν C(1) C76 M14 0.1502 0 0 72 58 0 0 M28 0.1106 1 6 35 35 0 0 M37 0.0765 0 0 67 58 0 0 M39 0.1652 9 0 77 44 0.03 0 M62 0.1534 35 30 56 58 0 0 M69 0.2850 7 10 58 65 0.02 0.02 M76 0 2 0 65 38 0 0 M78 0.1543 0 0 69 58 0 0 M81 0.1085 0 0 73 42 0 0 Am ∈ {0.8, 0.92} Am ∈ {0.83, 0.95} LMS PEPI M SE [%] LMS Ap0 ∈ {0.5} Ap0 PEPI LMS Ac0 ∈ {0.89} Ac0 C(2) C16 M1 0.0723 * 0 0 61 56 0 0 M9 0.0536 * 0 0 67 57 0.01 0 M13 0.0751 * 0 0 67 58 0.01 0 * 0 0 75 62 0.01 0 * 0 0 68 60 0 0 * 0 0 62 59 0 0 ∈ {0.85} M16 0 M18 0.1186 M24 0.0950 M27 0.0784 * 0 0 67 66 0.01 0 M50 0.0777 * 0 8 68 58 0.01 0.04 M61 0.0848 * 0 25 69 104 0.01 0.73 M63 0.1245 * 0 0 69 158 0 0.36 M85 0.0710 * 0 0 67 52 0.01 0 M92 0.1905 * 0 0 69 59 0 0 M95 0.0961 * * 0 0 66 42 0 0 M96 0.0921 * * 0 0 57 39 0 0 * 0 0 69 59 0.01 0 M99 0.0941 C(3) C4 M2 0.1703 M3 0.0427 M4 0 M7 * ∈ {0.5} * Am ∈ {0.75 ± 0.2i, 0.92} * Ap0 ∈ {0.5} Ac0 ∈ {0.85} * 8 0 63 42 0 0 * 5 2 53 37 0 0 0 0 64 59 0 0 0.0400 0 0 66 58 0 0 M8 0.0278 3 0 56 55 0.01 0 M19 0.0261 2 0 54 38 0.01 0 M34 0.0381 * 12 4 42 56 0 0 M44 0.1235 * 1 0 66 58 0 0 M53 0.0691 * 0 0 66 57 0 0 M54 0.0262 1 0 56 54 0.01 0 M77 0.0705 1 0 63 53 0 0 M88 0.0494 0 0 61 59 0 0 M98 0.0289 0 0 67 61 0 0 * * 95 Apêndice C. Tabelas dos Agregados 96 convergência Overshoot [%] PEPI PEPI Modelo δν M100 0.0283 C(4) C30 M30 0 * * 0 0 67 61 M36 0.0545 * * 3 0 69 M45 0.1520 * * 0 0 70 M75 0.0551 * * 0 3 69 63 C(5) C58 M17 0.0430 M21 0.0643 M23 0.0535 M42 0.0744 M58 0 M60 0.0400 M74 0.0460 M79 0.0766 M82 0.0574 M84 0.0323 LMS ts [min] 7 Am ∈ {0.8, 0.92} M SE [%] LMS PEPI LMS 0 62 57 Ap0 ∈ {0.85} PEPI LMS 0.01 0 Ac0 ∈ {0.9} 0 0 62 0 0 63 0.02 0 0 0.01 Am ∈ {0.8, 0.92} Ap0 * 0 0 63 56 0 0 0 0 59 68 0 0 * 0 0 67 57 0.01 0 * 0 0 59 67 0 0.01 * 0 0 58 61 0 0 * 0 0 59 52 0 0 * 0 0 38 37 0 0 * 0 0 62 68 0 0.01 * 0 0 63 55 0 0 * 0 0 60 61 0 0 * * * * Am ∈ {0.83, 0.95} Ac0 ∈ {0.8} Ap0 Ac0 ∈ {0} ∈ {0.85} C(6) C87 ∈ {0.85} M11 0.0464 * * 0 0 68 73 0 0.01 M12 0.0528 * * 25 27 61 57 0 0 M25 0.0637 * * 0 0 63 57 0 0 M29 0.0646 * * 0 0 64 56 0 0 M32 0.1028 * * 0 0 62 60 0 0 M41 0.0511 * * 0 0 67 56 0.01 0 M43 0.0395 * * 0 6 36 74 0 0.01 M47 0.1074 * * 14 42 52 85 0.01 0.16 M49 0.0645 * 5 22 51 86 0.01 0.53 M56 0.0637 * * 0 0 64 54 0 0 M64 0.0326 * * 0 0 64 66 0.01 0 M66 0.0851 * * 0 0 38 60 0 0 M73 0.0913 * * 0 0 52 62 0 0 M80 0.0269 * * 0 0 69 59 0.01 0 M86 0.0922 * * 0 0 58 57 0 0 M87 0 * * 0 0 65 56 0 0 M91 0.0672 * * 0 0 66 58 0.01 0 C(7) C70 Am ∈ {0.83, 0.95} Ap0 M5 0.0925 0 54 66 120 0 8.35 M6 0.1275 1 0 43 74 0 0.01 M10 0.1441 0 0 59 79 0.01 0.05 M15 0.0539 0 0 68 86 0.01 0.43 M20 0.1368 0 0 56 70 0 0.01 * ∈ {0.5} Ac0 ∈ {0.85} convergência Overshoot [%] PEPI LMS PEPI Modelo δν M22 0.1042 * M26 0.1600 * M31 0.1812 M33 M35 M38 0.0986 M40 0.0623 M46 0.0273 M48 0.1643 M51 0.0824 M52 0.3119 M55 0.1283 M57 0.1526 M59 0.1515 M65 ts [min] M SE [%] LMS PEPI LMS PEPI 1 1 84 66 0.16 0 9 13 87 80 0.05 0.05 * 0 0 108 85 0.37 0.51 0.1103 * 7 0 67 76 0.03 0.02 0.1402 * 0 0 65 66 0 0 0 0 64 74 0 0.01 * 0 2 71 49 0.02 0 * 0 0 90 72 0.34 0.01 0 2 69 114 0.01 2.08 7 0 50 59 0.01 0 0 2 70 104 0.01 0.62 30 24 54 63 0 0 * 0 0 64 63 0.04 0 * 0 0 76 64 0.03 0 0.0675 * 0 0 71 92 0.01 2.64 M67 0.1048 * 9 0 67 56 0.05 0 M68 0.0981 * 6 0 298 65 29.30 0 M70 0 0 13 87 99 0.14 0.13 M71 0.0251 0 17 69 119 0.02 7.93 M72 0.0551 0 34 81 106 0.07 1.35 M83 0.0734 12 15 73 50 0.03 0 M89 0.0908 0 0 69 250 0 0.12 M90 0.0852 * 0 26 61 87 0 0.28 M93 0.1048 * 2 7 67 58 0 0.01 M94 0.1815 0 0 64 70 0 0.01 M97 0.1487 0 44 72 97 0.01 1.53 * * LMS 97 Apêndice C. Tabelas dos Agregados Tabela C.3: Algoritmo Aglomerativo com 7 centróides. 98 convergência Overshoot [%] PEPI PEPI Modelo δν C(1) C85 LMS M1 0.0846 * * Am ∈ {0.8, 0.92} LMS ts [min] PEPI LMS Ap0 ∈ {0.75} 0 0 M SE [%] PEPI LMS Ac0 ∈ {0.9} 64 50 0 0 M9 0.0421 * * 0 0 66 64 0 0 M13 0.0418 * * 61 0 133 67 11.82 0 M16 0.0710 * * 1 0 59 64 0 0 M17 0.1328 * * 0 0 64 62 0 0 M23 0.0915 * 62 0 117 66 16.11 0 M24 0.0909 * * 0 0 64 45 0 0 M27 0.0590 * * 0 0 66 68 0 0 M29 0.1152 * * 1 0 115 64 4.17 0 M42 0.1009 * 3 0 236 62 66.74 0 M50 0.0694 * * 0 0 66 66 0 0 M58 0.1126 * * 11 0 67 61 0.33 0 M60 0.1357 * * 2 0 62 56 0 0 M61 0.0314 * 4 0 103 69 2.15 0 M74 0.1266 * 18 0 127 37 3.71 0 M79 0.1082 * 0 1 68 63 0.05 0.01 M82 0.0927 * 46 0 103 64 3.06 0 M84 0.1339 9 0 80 62 0.39 0 63 0 123 68 17.73 0 1 0 80 56 0.09 0 * 3 0 149 61 7.84 0 9 17 121 106 6.74 0.2 * M85 0 M21 0.0638 * * M96 0.0851 * M99 0.0562 * C(2) C4 Am ∈ {0.83, 0.95} Ap0 ∈ {0.5} M2 0.1703 * 0 0 56 42 0 M3 0.0427 15 24 124 64 3.21 0 M4 0 1 2 115 76 2.49 0.02 M7 0.0400 46 0 125 70 4.35 0.01 * Ac0 ∈ {0.85} 0 M8 0.0278 52 0 118 65 7.7 0 M19 0.0261 53 5 124 38 8.83 0 M30 0.0947 47 0 123 82 4.7 0.2 M34 0.0381 54 4 120 36 7.83 0 M36 0.1024 37 16 129 90 1.78 0.12 M44 0.1235 0 0 67 134 0.05 0.45 M53 0.0691 34 0 143 68 1.36 0 M54 0.0262 13 0 121 65 3.59 0 M62 0.2124 28 33 62 66 0 0 M75 0.0623 2 0 125 88 2.62 0.1 M77 0.0705 41 24 131 81 2.47 0.06 M78 0.1582 0 0 67 62 0.01 0 * * * convergência Overshoot [%] PEPI PEPI LMS PEPI LMS PEPI LMS ts [min] M SE [%] Modelo δν M88 0.0494 5 16 126 68 2.63 0 M98 0.0289 1 0 126 72 3.48 0.02 M100 0.0283 45 0 124 76 4.01 0.02 Am ∈ {0.7 ± 0.2i, 0.92} Ap0 Ac0 C(3) C56 M11 0.0257 * * 56 0 110 74 10.27 0.01 M12 0.0929 * * 79 30 135 58 114.17 0 M22 0.1378 * * 0 0 109 83 7.89 0.12 M25 0.0814 * * 47 0 114 62 5.83 0 M31 0.1750 * * 0 0 110 65 6.54 0.01 M32 0.0696 * * 2 0 103 47 5.02 0 M33 0.0941 * * 0 0 111 74 7.78 0.02 M41 0.0390 * * 7 0 109 67 6.24 0 M43 0.0767 * 69 0 124 36 33.39 0 M45 0.1418 * * 0 0 111 83 7.11 0.16 M47 0.0474 * * 27 19 166 53 8.08 0 M49 0.0453 * 14 9 126 42 6.2 0 M51 0.0882 * 1 0 135 68 7.78 0 M55 0.0834 * 73 34 136 58 53.22 0 M56 0 * * 68 0 117 43 29.55 0 M57 0.1293 * * 51 0 109 75 6.66 0.02 M64 0.0832 * * 68 0 111 67 22.58 0 M66 0.1205 * 26 0 108 59 4.66 0 M67 0.1186 * * 0 0 111 72 7.71 0.01 M68 0.1217 * * 0 0 120 50 7.06 0 M73 0.0695 * * 11 20 118 62 4.95 0 M80 0.0890 * * 6 0 113 64 6.97 0 M86 0.0815 * * 0 0 61 63 0 0 M87 0.0637 * * 11 0 108 58 5.56 0 M89 0.0846 * * 2 0 111 64 9.03 0 M90 0.0831 * * 59 0 114 88 11.64 0.69 * * 66 0 104 67 9.97 0 * M91 0.1069 C(4) C65 M5 0.0781 * M6 0.0731 * M10 0.0933 * M15 0.0720 * M20 0.1029 * * M26 0.2092 * M35 0.0850 * M38 0.0321 * M40 0.0640 * Am ∈ {0.8, 0.92} * ∈ {0.5} LMS Ap0 ∈ {0.85} ∈ {0.85} Ac0 ∈ {0.9} 0 0 89 64 2.27 0 78 29 125 69 47.43 0 80 0 264 59 96.53 0 68 21 195 115 63.17 4.47 61 0 105 58 8.16 0 * 50 0 103 74 4.63 0.02 * 62 0 99 61 0.2 0 6 3 103 75 7.35 0.01 14 0 120 65 7.18 0 * * 99 Apêndice C. Tabelas dos Agregados 100 convergência Overshoot [%] ts [min] M SE [%] Modelo δν PEPI LMS PEPI LMS PEPI LMS PEPI LMS M46 0.0935 * * 66 0 116 73 13.79 0.01 M48 0.1195 * * 1 0 101 65 5.53 0 M52 0.2633 * 73 5 284 110 63.09 2.11 M59 0.1181 * 74 0 229 197 37.37 0.64 M65 0 * * 99 0 300 74 105.97 0.01 M70 0.0675 * * 3 0 111 71 6.89 0.01 M71 0.0550 * * 2 0 107 75 5.38 0.02 M72 0.0935 * * 5 0 113 75 7.57 0.02 M83 0.0743 * 6 36 34 74 0 0.01 M93 0.1354 * * 9 0 130 69 10.5 0.01 M94 0.1468 * * 4 0 63 60 0.01 0 M97 0.1036 * * 68 14 236 73 46.16 0.01 C(5) C37 Am ∈ {0.8, 0.92} Ap0 M14 0.1012 * * 0 0 67 63 0.01 0 M28 0.1440 * * 0 8 60 35 0 0 M37 0 * 0 0 66 58 0 0 M76 0.0765 * * 0 2 40 38 0 0 M95 0.1534 * * 0 0 61 68 0.04 0 Ac0 ∈ {0.8} ∈ {0.85} C(6) C63 Am ∈ {0.83, 0.95} Ap0 M18 0.1327 * * 0 0 63 63 0 0 M63 0 * * 1 0 67 188 0 2.61 * * 0 0 67 59 0 0 Ac0 ∈ {0} ∈ {0.85} M92 0.1159 C(7) C39 M39 0 0 0 65 45 0.01 0 M69 0.1453 0 0 73 70 0.01 0.01 M81 0.0824 0 0 63 42 0 0 Am ∈ {0.83, 0.95} Ap0 ∈ {0.7} Ac0 ∈ {0.85} Tabela C.4: Algoritmo Intuitivo com 12 centróides. Modelo δν C(1) C14 M14 convergência Overshoot [%] PEPI PEPI LMS LMS ts [min] PEPI M SE [%] LMS PEPI LMS Am ∈ {0.8, 0.92} Ap0 ∈ {0.5} 0 * 22 0 294 57 0.95 0 M28 0.2387 * 6 5 121 35 0.42 0 M37 0.1012 * 0 0 57 56 0 0 M39 0.1512 * 33 0 300 44 8.75 0 M62 0.2956 * 44 29 300 59 6.82 0 M69 0.2912 * 41 8 300 57 4.88 0.02 M76 0.1502 * 8 0 300 38 7.30 0 * 0 0 55 42 0 0 M81 0.0905 C(2) C21 M1 0.1071 M16 0.1062 M18 0.2216 * M21 0 * M24 0.0677 * M63 0.2013 * M92 0.2620 * * M96 0.0817 C(3) C88 Am ∈ {0.83, 0.95} Ap0 ∈ {0.5} * Ac0 ∈ {0.89} Ac0 ∈ {0.85} * 0 0 55 48 0 0 * 0 0 69 56 0 0 * 0 0 57 60 0 0 0 2 68 54 0 0 0 0 54 48 0 0 5 1 57 286 0 0.34 * 0 0 57 59 0 0 * 6 0 57 39 0.02 0 * Am ∈ {0.75, 0.85} Ap0 ∈ {0.89} Ac0 ∈ {0.91} M2 0.1238 * * 30 0 299 42 6.26 0 M44 0.0790 * * 34 0 300 53 4.12 0 M53 0.0203 * 39 3 300 51 2.95 0 M77 0.0401 * 37 0 300 75 3.9 0.01 M78 0.1294 * 16 0 120 58 0.27 0 M88 0 * 4 0 300 67 2.86 0 0 61 44 0.02 0 * * M95 0.1950 C(4) C98 * 7 M30 0.0928 * * 18 0 298 M36 0.1051 * * 45 11 M98 0 * 3 27 Am ∈ {0.75, 0.88} Ap0 Am ∈ {0.83, 0.95} Ap0 ∈ {0.85} Ac0 ∈ {0.85} 53 3.28 0 300 70 3.87 0.01 59 108 0.02 0.75 Ac0 C(5) C34 ∈ {0.9} ∈ {0.85} M3 0.0487 * * 8 0 74 37 0.07 0 M4 0.0381 * * 17 7 126 48 0.34 0 M7 0.0522 * * 12 0 106 51 0.22 0 M8 0.0164 * * 2 0 55 59 0 0 M9 0.1718 * * 0 0 57 54 0 0 M13 0.1748 * * 2 0 59 52 0 0 M19 0.0205 * * 9 0 74 39 0.09 0 M29 0.0550 * * 4 0 57 56 0.01 0 M34 0 * * 5 2 56 70 0.02 0.01 101 Apêndice C. Tabelas dos Agregados Overshoot [%] PEPI LMS Modelo δν PEPI LMS M54 0.0357 * * 5 M100 0.0520 * * 20 Am ∈ {0.8, 0.9} ts [min] M SE [%] PEPI LMS PEPI LMS 0 67 58 0.02 0 8 298 48 2.43 0 Ap0 ∈ {0.75} Ac0 C(6) C60 M42 0.0860 * * 0 0 55 60 0 0 M58 0.0400 * * 0 0 55 55 0 0 M60 0 * * 0 0 56 56 0 0 M79 0.1056 * * 0 0 61 67 0 0 M84 0.0548 * * 0 0 71 62 0.01 0 Am ∈ {0.8, 0.88} Ap0 ∈ {0.75} Ac0 ∈ {0.85} C(7) C82 M12 0.0827 * * 15 27 40 58 0 0 M25 0.0993 * * 7 0 71 58 0.03 0 M27 0.0974 * * 0 0 57 69 0 0.01 M43 0.0693 * * 1 5 54 36 0 0 M47 0.1784 * * 2 16 49 50 0 0 M49 0.1419 * * 0 12 51 75 0 0.03 M50 0.1303 * * 0 0 57 58 0 0.03 M61 0.0902 * * 0 1 60 56 0 0 M73 0.1562 * * 0 0 71 56 0.01 0 M74 0.0375 * * 1 1 54 37 0 0 M82 0 * * 0 0 57 53 0 0 M85 0.0927 * * 1 0 59 51 0 0 M87 0.0811 * * 0 0 71 75 0.01 0.02 M99 0.0985 * 0 0 57 54 0 0 Am ∈ {0.8, 0.88} Ap0 ∈ {0.52} C(8) 102 convergência C70 Ac0 ∈ {0.85} ∈ {0.85} M31 0 * * 24 0 299 55 2.94 0 M33 0.0945 * * 0 0 60 53 0 0 M45 0.0463 * * 24 0 300 56 1.72 0 M57 0.0519 * * 34 0 300 53 1.72 0 M75 0.2276 * * 15 0 65 60 0.34 0 C(9) C66 Am ∈ {0.8, 0.88} Ap0 Ac0 ∈ {0.7} ∈ {0.85} M5 0.1460 * 0 0 56 59 0 0.03 M11 0.1170 * 4 0 56 53 0.01 0 M17 0.0515 * 0 0 56 55 0 0 M23 0.0741 * 0 0 57 60 0 0 M32 0.1145 * 0 0 55 71 0 0.01 M41 0.1234 * 4 0 68 58 0.01 0 M51 0.1846 * 2 0 64 58 0 0 M55 0.1971 * 19 23 61 57 0.01 0 M56 0.1205 * 3 0 67 58 0.01 0 M64 0.0570 * 0 0 71 73 0.01 0.01 M66 0 * 0 0 57 59 0 0 * * convergência Overshoot [%] PEPI LMS PEPI Modelo δν M68 0.2263 * M83 0.1959 * M86 0.0792 M SE [%] LMS PEPI LMS PEPI LMS 6 0 300 71 1.62 0.01 0 11 47 42 0 0 * 0 0 54 45 0 0 * 0 0 71 58 0.01 0 M91 0.0326 C(10) C67 M22 0.0407 * * 18 7 297 56 1.01 M26 0.1497 * * 13 0 299 61 1.92 0 M40 0.1212 * * 0 0 57 70 0 0.01 M67 0 * * 0 0 62 55 0.16 0 M71 0.1235 * * 0 8 59 50 0 0 M80 0.2036 * * 0 0 57 60 0 0 M89 0.1061 * * 0 0 55 59 0 0 M90 0.0945 * * 1 5 65 58 0 0 M93 0.1489 * * 9 0 298 58 0.92 0 Am ∈ {0.8, 0.94} Ap0 ∈ {0.52} C(11) C10 * ts [min] Am ∈ {0.75, 0.82} Ap0 ∈ {0.75} Ac0 ∈ {0.85} Ac0 0 ∈ {0.85} M6 0.0537 * * 0 0 56 55 0 0 M10 0 * * 0 0 57 55 0 0 M20 0.0299 * * 0 0 56 53 0 0 M38 0.0703 * * 0 0 58 56 0 0 M59 0.1694 * * 1 0 59 56 0 0 Am ∈ {0.83, 0.95} Ap0 0.1087 * * 0 0 60 70 0 0.01 0 * * 0 0 59 60 0 0 M46 0.1639 * * 4 17 64 69 0.02 0.01 M48 0.1398 * * 0 0 57 58 0 0 M52 0.1846 * * 19 40 300 186 1.77 1.4 M65 0.0850 * * 0 6 60 54 0 0 M70 0.1402 * * 0 0 59 53 0 0 M72 0.1479 * * 0 0 59 55 0 0 M94 0.0737 * * 0 6 58 56 0 0.05 M97 0.1478 * * 0 0 59 62 0 0 C(12) C35 M15 M35 Ac0 ∈ {0.5} ∈ {0.85} 103 Apêndice C. Tabelas dos Agregados Tabela C.5: Algoritmo K-médias adaptado ao Controlo Comutado com 12 centróides. 104 convergência Overshoot [%] PEPI PEPI Modelo δν C(1) C76 M14 0.1502 * M28 0.1106 * M37 0.0765 M39 0.1652 * M62 0.1534 M69 0.2850 M76 0 M81 0.1085 C(2) C16 M1 LMS Am ∈ {0.8, 0.92} * LMS ts [min] PEPI M SE [%] LMS Ap0 ∈ {0.98} PEPI LMS Ac0 ∈ {0.89} 33 2 300 61 3.24 0 9 6 59 35 0.1 0 0 0 59 56 0 0 5 0 300 44 8.57 0 * 7 30 300 58 4.66 0 * 20 10 300 65 15.94 0.02 * 23 0 298 38 4.13 0 * 50 0 300 42 6.95 0 Am ∈ {0.83, 0.95} Ap0 ∈ {0.5} 0.0723 * * 0 0 55 51 0 0 Ac0 ∈ {0.85} M9 0.0536 * * 0 0 58 55 0 0 M13 0.0751 * * 2 0 59 53 0 0 M16 0 * 0 0 67 62 0.01 0 M18 0.1186 * * 0 0 62 59 0 0 M24 0.0950 * * 0 0 54 59 0 0 M27 0.0784 * * 0 0 59 71 0 0.01 M50 0.0777 * * 0 0 58 57 0 0 M61 0.0848 * * 0 23 59 106 0 0.63 M63 0.1245 * 5 9 57 157 0 0.09 M85 0.0710 * * 0 0 58 52 0 0 M92 0.1905 * * 0 0 57 59 0 0 M95 0.0961 * * 7 0 60 42 0.02 0 M96 0.0921 * * 3 0 56 38 0 0 M99 0.0941 * * 1 0 74 55 0.01 0 Am ∈ {0.75, 85} Ap0 ∈ {0.89} Ac0 C(3) C53 M2 0.1066 * * 11 0 300 41 3.33 0 M44 0.0627 * * 15 0 132 58 0.37 0 M53 0 * * 13 0 85 57 0.14 0 M77 0.0335 * * 14 0 77 53 0.1 0 M78 0.1261 * * 14 0 81 58 0.08 0 0 75 58 0.05 0 * 12 ∈ {0.91} M88 0.0203 C(4) C30 M30 0 * * 9 0 73 61 0.06 M36 0.0545 * * 2 0 58 62 0.03 0 M75 0.0551 * * 0 4 59 63 0 0.01 C(5) C8 M3 M4 M7 Am ∈ {0.83, 0.95} Ap0 ∈ {0.85} Ac0 ∈ {0.85} 0 Am ∈ {0.75, 0.88} Ap0 ∈ {0.9} 0.0513 * * 2 2 56 37 0 0 0.0278 * * 11 0 73 60 0.01 0 0.0426 * * 6 0 58 58 0.01 0 Ac0 ∈ {0.85} Modelo convergência Overshoot [%] δν PEPI LMS PEPI LMS PEPI LMS PEPI LMS ts [min] M SE [%] M8 0 * * 0 0 56 52 0 0 M19 0.0267 * * 2 0 56 38 0 0 M34 0.0164 * * 0 5 56 64 0 0 M54 0.0205 * * 0 0 55 51 0 0 M98 0.0178 * * 1 0 57 61 0 0 M100 0.0366 * * 11 0 72 56 0.02 0 ∈ {0.75} Ac0 C(6) C58 M17 0.0430 * * 0 0 56 55 0 0 M21 0.0643 * * 0 13 56 108 0 0.11 M23 0.0535 * * 0 0 57 54 0 0 M42 0.0744 * * 26 0 300 68 2.26 0.01 M58 0 * * 21 0 300 67 0.59 0 M60 0.0400 * * 17 0 300 56 1.43 0 M79 0.0766 * * 1 0 80 68 0.07 0.01 M82 0.0574 * * 0 0 57 47 0 0 * * 0 2 63 60 0 0 M84 0.0323 C(7) C43 M12 Am ∈ {0.8, 0.9} Ap0 ∈ {0.85} Am ∈ {0.8, 0.88} Ap0 ∈ {0.75} 0.0275 * * 15 27 41 59 0 0 M25 0.0528 * * 0 0 56 55 0 0 M29 0.0578 * * 0 0 56 53 0 0 M43 0 * * 0 0 55 70 0 0.01 M64 0.0389 * * 0 0 56 71 0 0.01 M66 0.0939 * * 0 0 58 58 0 0 M74 0.0372 * * 0 0 55 37 0 0 M80 0.0372 * * 0 0 57 58 0 0 M87 0.0395 * * 0 0 73 53 0.01 0 M91 0.0747 * * 0 0 74 55 0.01 0 Am ∈ {0.8, 0.88} Ap0 ∈ {0.52} Ac0 ∈ {0.85} Ac0 C(8) C57 M22 0.0532 * * 0 0 62 71 ∈ {0.85} 0 0.01 M31 0.0519 * * 1 0 57 90 0 0.6 M33 0.0491 * * 0 0 59 73 0 0.02 M45 0.0398 * * 0 0 61 88 0 0.3 M55 0.0563 * 15 24 41 49 0 0 M57 0 * * 1 0 63 65 0 0 M67 0.0509 * * 0 3 61 56 0 0 C(9) C56 Am ∈ {0.8, 0.88} Ap0 M11 0.0257 * 0 0 56 67 0 0.01 M32 0.0696 * 0 0 57 75 0 0.02 M41 0.0390 * 0 0 57 53 0 0 M47 0.0474 * 0 15 34 49 0 0 M49 0.0453 0 29 54 62 0 0 * Ac0 ∈ {0.7} ∈ {0.85} 105 Apêndice C. Tabelas dos Agregados Modelo 106 δν M56 0 M73 0.0695 M86 0.0815 convergência Overshoot [%] PEPI LMS PEPI LMS PEPI LMS PEPI * 0 0 56 49 0 0 * 0 0 53 69 0 0.01 * 0 0 56 63 0 0.01 Am ∈ {0.75, 0.82} Ap0 ∈ {0.75} * ts [min] M SE [%] Ac0 LMS C(10) C51 M5 0.0742 * * 0 9 58 57 ∈ {0.85} 0 0.02 M51 0 * * 0 0 55 65 0 0 M68 0.0710 * * 0 0 53 70 0 0.01 M83 0.0649 * * 0 8 54 34 0 0 M89 0.0542 * * 0 0 57 58 0 0.01 * * 0 23 55 89 0 0.28 M90 0.0703 C(11) C6 M6 0 * * 0 0 57 48 0 0 M10 0.0537 * * 0 0 58 59 0 0 M20 0.0686 * * 0 0 57 58 0 0 M35 0.0650 * * 0 0 58 71 0 0.01 M38 0.0526 * * 0 0 58 79 0 0.05 M48 0.0796 * * 0 45 57 109 0 4.43 M52 0.2372 * 36 0 300 87 7.87 0.23 M59 0.1184 * * 0 0 58 69 0 0.01 M94 0.1374 * * 0 0 58 59 0 0 M97 0.0912 * * 0 0 58 64 0 0 Am ∈ {0.8, 0.84} Ap0 ∈ {0.52} Ac0 ∈ {0.85} C(12) C71 Am ∈ {0.83, 0.95} Ap0 M15 0.0353 * * 0 0 60 69 0 0 M26 0.1566 * * 4 8 60 61 0.01 0.02 M40 0.0623 * * 0 1 58 51 0 0 M46 0.0442 * * 0 0 59 73 0 0.02 M65 0.0550 * * 0 0 58 71 0 0 M70 0.0251 * * 0 8 59 61 0 0.03 M71 0 * * 0 3 59 64 0 0 M72 0.0415 * * 0 0 59 80 0 0.06 M93 0.0924 * * 0 2 59 61 0 0 Ac0 ∈ {0.5} ∈ {0.85} Tabela C.6: Algoritmo Aglomerativo com 12 centróides. convergência Overshoot [%] PEPI PEPI LMS δν C(1) C82 M9 0.0989 * * 47 17 300 102 7.97 0.2 M12 0.0827 * * 19 26 48 68 0 0 M17 0.0483 * * 0 0 60 58 0 0 M21 0.0607 * 45 0 300 60 5.96 0 M23 0.0410 * * 0 0 63 59 0 0 M27 0.0974 * * 0 0 62 61 0 0 M29 0.0579 * * 0 0 62 89 0 0.14 M42 0.0750 * 56 0 300 60 14.91 0 M43 0.0693 * * 0 3 59 37 0 0 M50 0.1303 * * 38 12 300 108 10.76 2.01 M58 0.0574 * * 48 0 300 58 8.89 0 M60 0.0449 * * 64 0 300 59 16.09 0 M61 0.0902 * * 0 14 66 111 0 2.65 M64 0.0610 * * 0 0 63 44 0 0 M66 0.0784 * * 0 0 63 58 0 0 M74 0.0375 * * 0 0 59 56 0 0 M79 0.1086 * 1 0 87 61 0.08 0 M80 0.0559 * * 0 13 64 90 0 0.1 M82 0 * * 0 0 63 63 0 0 M84 0.0824 * * 57 46 300 300 11.55 6.95 M87 0.0811 * * 44 0 300 68 12.15 0 M91 0.0609 * * 55 0 300 56 17.61 0 M99 0.0985 * * 58 14 300 101 13.24 1.45 C(2) C2 Am ∈ {0.78, 0.85} PEPI M SE [%] Modelo Am ∈ {0.83, 0.95} LMS ts [min] LMS Ap0 ∈ {0.75} PEPI LMS Ac0 ∈ {0.85} Ap0 ∈ {0.75} Ac0 ∈ {0.85} M2 0 * 26 6 231 45 1.07 0.03 M44 0.0519 * 14 0 95 74 0.23 0.01 M62 0.0606 * * 32 20 297 48 2.11 0.02 * * 0 0 66 55 0.04 0 M78 0.0966 C(3) C54 M3 0.0526 * * 1 0 60 38 0 0 M4 0.0262 * * 7 0 63 57 0.01 0 M7 0.0430 * * 5 0 64 62 0.01 0 M8 0.0205 * 0 0 62 67 0.01 0.01 M19 0.0370 * 0 26 61 300 0.01 2.07 M25 0.0772 * 0 2 62 93 0.01 0.11 M30 0.0786 * 8 4 63 59 0.01 0.03 M34 0.0357 * 8 1 60 37 0 0 M36 0.0958 * * 6 0 65 75 0.03 0.02 M53 0.0833 * * 12 0 90 67 0.11 0 Am ∈ {0.75 ± 0.2i, 0.92} * Ap0 ∈ {0.5} Ac0 ∈ {0.85} 107 Apêndice C. Tabelas dos Agregados convergência Overshoot [%] δν PEPI PEPI LMS PEPI LMS PEPI LMS M54 0 * 1 1 61 51 0.01 0.04 M75 0.0545 * 1 2 65 62 0.01 0.02 M77 0.0787 * * 10 0 72 73 0.03 0.01 M88 0.0653 * * 8 0 63 68 0.02 0 M98 0.0200 * 1 2 64 57 0.01 0.04 M100 0.0176 * 6 3 62 52 0.01 0 Modelo * Am ∈ {0.75 ± 0.2i, 0.85} Ap0 ∈ {0.5} M SE [%] Ac0 C(4) C5 M5 0 * * 0 37 63 97 0 1.88 M10 0.0854 * * 0 0 62 60 0 0 M20 0.0755 * * 0 59 61 99 0 1.21 M32 0.0613 * * 0 45 62 300 0 10.18 M48 0.0990 * * 0 11 62 64 0 0 M65 0.0781 * * 0 11 64 115 0 7.84 M83 0.0567 * * 2 5 34 69 0 0 M86 0.0896 * * 0 0 60 58 0 0 M89 0.0524 * * 0 54 62 90 0 1.63 M90 0.0582 * * 0 2 57 108 0 1.6 M97 0.0788 * * 0 11 64 97 0 1.72 Am ∈ {0.8, 0.92} Ap0 Ac0 ∈ {0.7} ∈ {0.86} C(5) C35 M6 0.0650 * * 0 6 59 66 0 0.01 M35 0 * * 0 0 63 72 0 0 M38 0.0665 * * 0 30 62 69 0 0 M59 0.0550 * 0 0 62 73 0 0 M94 0.0737 * 0 4 62 79 0 0.2 ∈ {0.85} Am ∈ {0.8, 0.92} Ap0 ∈ {0.7} 0 20 62 154 0 13.26 Ac0 C(6) C55 M11 0.0976 M22 0.0692 * 0 39 66 281 0 12.15 M31 0.1032 * 0 0 62 151 0 12.81 M33 0.0405 * 0 8 63 56 0 0 M41 0.0970 * 0 0 62 73 0 0.01 M45 0.0840 * 0 0 64 82 0 0.17 M47 0.0676 6 9 34 70 0 0 M49 0.0906 * 0 0 60 67 0 0 M51 0.0619 * 0 42 59 300 0 12.57 M55 0 23 52 49 67 0 0 M56 0.0834 0 12 61 131 0 8.05 M57 0.0563 * 0 36 61 85 0 0.25 M67 0.0517 * 0 15 62 71 0 0 M68 0.0583 * 0 23 59 300 0 6.85 M73 0.0806 * 0 28 59 300 0 3.83 Am ∈ {0.8, 0.92} Ap0 C(7) 108 LMS ts [min] C81 ∈ {0.5} Ac0 ∈ {0.85} ∈ {0.7} convergência Overshoot [%] ts [min] M SE [%] Modelo δν PEPI LMS PEPI LMS PEPI LMS PEPI LMS M14 0.0905 * * 4 0 68 59 0.03 0 M37 0.1143 * 0 0 67 60 0 0 M39 0.0824 * * 8 0 300 59 2.51 0 M76 0.1085 * * 25 0 300 39 1.02 0 M81 0 * * 33 0 300 56 1.92 0 Ac0 C(8) C72 M15 0.0519 * * 0 0 64 75 0 0.01 M26 0.1170 * * 0 27 63 88 0 0.48 M40 0.0891 * * 0 66 63 90 0 2.9 M46 0.0337 * * 0 41 62 151 0 2.89 M70 0.0551 * 0 14 63 114 0 8.02 M71 0.0415 * 0 4 64 120 0 1.6 M72 0 * 0 15 63 117 0 9.96 M93 0.0549 * 0 99 64 300 0 9.16 Am ∈ {0.8, 0.92} Ap0 C(9) C1 Am ∈ {0.8, 0.92} Ap0 ∈ {0.5} Ac0 ∈ {0.5} ∈ {0.85} ∈ {0.85} M1 0 * * 41 0 300 58 4.56 0 M13 0.0617 * * 0 0 66 93 0 0.08 M16 0.0723 * * 12 34 68 78 0 0.03 M18 0.1542 * 54 24 300 71 8.41 0 M24 0.0542 * * 30 0 300 55 6.53 0 M28 0.1022 * * 5 1 62 35 0.01 0 M85 0.0846 * * 0 1 66 55 0 0 M95 0.0652 * * 0 0 66 55 0 0 M96 0.0385 * * 0 0 61 52 0 0 C(10) C52 M52 0 Am ∈ {0.8, 0.92} Ap0 * 6 * 0 Ac0 ∈ {0.5} 63 88 ∈ {0.85} 0 2.47 C(11) C92 Am ∈ {0.8, 0.92} Ap0 M63 0.1159 * 0 1 63 80 0 0.1 M92 0 * 0 0 64 57 0 0 Am ∈ {0.8, 0.92} Ap0 ∈ {0.92} 0 300 C(12) C69 M69 0 * 30 Ac0 ∈ {0.5} Ac0 58 ∈ {0.85} ∈ {0.85} 10.88 0 109 110 Bibliograa [1] H. Magalhães, Contributions to neuromuscular blockade control. PhD thesis, Univer- sidade do Porto, 2006. [2] Lago, P., T.Mendonça e L. Gonçalves, On-line autocalibration of a pid controller of Proceedings of the 1998 IEEE International Conference on Control Applications. Triste, Itália. neuromuscular blockade, pp. 363367, IEEE, 1998. Métodos e algoritmos para o controlo de sistemas biológicos: aplicação ao controlo do bloqueio neuromuscular. PhD thesis, Universidade do Porto, 1993. [3] T. Mendonça, [4] J. Hespanha, Tutorial on Supervisory Control. Dep. Electrical and Computer Engi- neering, Univ. of California, 2002. [5] K. Åström and B. Wittenmark, Computer-Controlled Systems: Theory and Design. New Jersey, USA: Prentice Hall, 1997. [6] A.K. Jain, M. N. Murty and P. J. Flynn, Data clustering: A review, 1999. [7] J. S. Marques, Reconhecimento de Padrões: Métodos Estatísticos e Neuronais. Lisbon, Portugal: IST Press, 2005. [8] J. M. Lemos, N. Roma, T. Mendonça, L.Sousa, B. Costa, C. S. Nunes, S. Esteves, P. Amorim, L. Antunes, Development of an integrated control system for anaesthesia automation, Portuguese Conference on Automatic Control, 2008. [9] Cass, N. , D. Lampard, W. Brown and J. Coles, Computer controlled muscle relaxation: a comparison of four muscle relaxants in the sheep, Care, vol. 4, pp. 1622, 1976. Anaesthesia Intensive [10] Asbury, A. and D. Linkens, Clinical automatic control of neuromuscular blockade, Anaesthesia, vol. 41, pp. 316320, 1986. [11] Mendonça, T. and P.Lago, PID control strategies for the automatic control of neuromuscular blockade, Control Engineering Practice, vol. 6, no. 10, pp. 12251231, 1998. 111 Bibliograa [12] Schwilden, H. and K. Olkkola, Use of a pharmacokinetic-dynamic model for the automatic feedback control of atracurium, European Journal of Clinical Pharmacology, vol. 40, pp. 293296, 1991. [13] Kansanaho, M. and K. Olkkola, Performance assessment of and adaptive modelbased feedback controller: Comparisson between atracurium, mivacurium, rocuronium and vecuronium, Journal of Clinical Monitoring and Computing, vol. 13, pp. 217224, 1996. [14] Hugo Alonso, Teresa Mendonça, Paula Rocha, A hybrid method for parameter estimation and its application to biomedical systems, in Biomedecine, vol. 89, pp. 112122, 2008. Computer Methods and Programs [15] P. Oliveira, Controlo do bloqueio neuromuscular: Uma abordagem polinomial, Tech. Rep. 43, Inesc-id, 2008. [16] A. S. Morse, Supervisory control of families of linear set-point controllers - part 1: exact matching, IEEE Trans. on Automat. Contr., vol. 41, pp. 14131431, 1996. [17] Narendra, K. and J. Balakrishnan, Adaptive control using multiple models, Transactions on Automatic Control, vol. 42, no. 2, pp. 171187, 1997. IEEE [18] Mendonça, T., P. Lago, H. Magalhães, A. Neves and P. Rocha, On-line multiple model switching control implementation: a case study, (Lisbon, Portugal), Proceedings of the 10th Mediterranean Conference on Control and Automation (MED'02), 2002. [19] J. Hespanha, Logic-Based Switching Algorithms in Control. PhD thesis, Yale Univer- sity, 1998. [20] J.P. Hespanha, D. Liberzon and A.S. Morse, Overcoming the limitations of adaptive control by means of logic-based switching, Systems and Control Letters, vol. 49, no. 1. [21] Böling, J.M., et al, Multi-model adaptive control of a simulated ph neutralization process, Control Engineering Practice, 2007. doi:10.1016/j.conengprac.2006.11.008. [22] B. D. O. Anderson, T.S. Brinsmead, F. De Bruyne, J. Hespanha, D. Liberzon, A. S. Morse, Multiple model adaptive control. part 1: Finite controller coverings, International Journal of Robust Nonlinear Control, vol. 10, pp. 909929, 2000. [23] G. Vinnicombe, Frequency domain uncertainty and the graph topology, Transactions on Automatic Control, vol. 38, no. 9, pp. 13711383, 1993. IEEE [24] A. El-Sakkatry, The gap metric: robustness of stabilization of feedback systems, IEEE Transactions on Automatic Control, vol. 38, no. 3, pp. 240247, 1985. 112 Bibliograa [25] R. Duda, P. Hart and D. Stork, [26] Univ. California Press, ed., Pattern Classication. John Wiley, 2000. Some Methods for Classication and Analysis of Multi- variate Observations, vol. 1, Proc. 5th Berkeley Symp. Math. Stat. and Prob., 1967. [27] Sneath, P. H. A. and Sokal, R. R., Numerical Taxonomy. London, UK: Freeman, 1973. [28] B. King, Step-wise clustering procedures, sociation, vol. 69, pp. 86101, 1967. Journal of the American Statistical As- [29] Margarida M. Silveira, T. Mendonça, S. Esteves, Personalized neuromuscular blockade through control: Clinical and technical evaluation, (Vancouver, Canada), 30th Annual International IEEE EMBS Conference, 2008. [30] J. Varvel, D. Donoho, S. Shafe, Measuring the predictive performance of computercontrolled infusion pumps, J. Pharmacokinetic Biopharm, vol. 20, pp. 6394, 1992. [31] J. Zigler and N.Nichols, Optimum settings for automatic controllers, Transactions of American Society of Mechanical Engineers, vol. 64, pp. 759768, 1942. [32] J. Zigler and N.Nichols, Process lags in automatic control circuits, Transactions of American Society of Mechanical Engineers, vol. 65, pp. 433444, 1943. 113