Martin J.Pomar Garcia
Transcrição
Martin J.Pomar Garcia
UNIVERSIDADE FEDERAL DE SANTA CATARINA Programa de Pós-Graduação em Engenharia de Automação e Sistemas (PG-EAS) Projeto Integrado de Controle e Conversores de Potência com aplicação a Industria do Petróleo. Exame de qualificação submetido à Universidade Federal de Santa Catarina como parte dos requisitos para a obtenção do grau de Doutor em Engenharia de Automação e Sistemas. Martín J. Pomar García Florianópolis, Agosto de 2007 Agradecimento Agradeço o apoio financeiro da Agência Nacional do Petróleo, Gás Natural e Biocombustíveis (ANP) e da Financiadora de Estudos e Projetos (FINEP), por meio do Programa de Recursos Humanos da ANP para o Setor do Petróleo e Gás PRH-34 ANP/MCT. Universidade Federal de Santa Catarina Programa de Pós-Graduação em Engenharia de Automação e Sistemas (PG-EAS) Projeto Integrado de Controle e Conversores de Potência com aplicação a Industria do Petróleo. Exame de qualificação submetido à Universidade Federal de Santa Catarina como parte dos requisitos para a obtenção do grau de Doutor em Engenharia de Automação e Sistemas. Martı́n J. Pomar Garcı́a Florianópolis, Agosto de 2007. Projeto Integrado de Controle e Conversores de Potência com aplicação a Industria do Petróleo. Martı́n J. Pomar Garcı́a Este Exame de Qualificação foi julgado adequado, servindo como requisito parcial para o obtenção do tı́tulo de Doutor em Engenharia de Automação e Sistemas, e aprovada em sua forma final pelo Programa de Pós-Graduação em Engenharia de Automação e Sistemas da Universidade Federal de Santa Catarina. Prof. Julio Elias Normey-Rico, Dr. Prof. Cesar de Prada Moraga, Dr. Orientadores Prof. Eugênio de Bona Castelan, Dr. Coordenador do curso de PG-EAS, UFSC. Banca Examinadora Prof. João Gomes da Silva Jr., Dr. - UFRGS. Prof. Eduardo Camponogara, Dr. - UFSC Prof. Alexandre Trofino Neto, Dr. - UFSC Prof. Max Hering de Queiroz, Dr. - UFSC Resumo do Exame de Qualificação apresentado à UFSC como parte dos requisitos necessários para obtenção do grau de Doutor em Engenharia de Automação e Sistemas. Projeto Integrado de Controle e Conversores de Potência com aplicação a Industria do Petróleo. Martı́n J. Pomar Garcı́a Agosto/2007 Orientadores : Prof. Julio E. Normey-Rico, Dr. Prof. Cesar de Prada Moraga, Dr. Palavras-chave : Conversores de Potência, Conversor Buck-Boost, HVDC Projeto Integrado, Sı́nteses de Processos Sistema Hı́bridos, PWA, MLD CPMI Número de Páginas : 163 Este trabalho apresenta um introdução a duas áreas temáticas dentro da teoria de Controle e Sistemas: (i) Projeto Integrado e Sı́nteses de Processos e Controle, e (ii) Sistemas Hı́bridos. Projeto Integrado e Sı́nteses, são áreas de concentração que tem sido investigadas e desenvolvidas para a industria de processos. Pouca, e em alguns casos quasi nula extensão a outras áreas, como a Eletrônica de Potência, aparecem na literatura. Por outro lado, os Sistemas Hı́bridos são uma nova área de investigação surgida como necessidade do presente contexto tecnológico. Os Sistemas Hı́bridos podem capturar o comportamento discreto, como por exemplo um programa de computador, e o comportamento contı́nuo de processos fı́sicos. Os dispositivos que estuda a Eletrônica de Potência em geral são Sistemas Hı́bridos, e alguns deles são muito importantes na industria do petróleo e gás, como é o caso do conversor HVDC que introduziremos neste trabalho. O presente trabalho assim como a tese de doutorado, pretende extender conceitos das duas áreas temáticas mencionadas acima, para poder serem aplicados a conversores de potência com aplicação a industria do petróleo e gás. Sumário Lista de Abreviaturas 1 1 Introdução 2 1.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.3 Organização do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2 Projeto Integrado e Sı́ntese 8 2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Algumas Medidas de Controlabilidade 2.3 2.4 2.5 8 . . . . . . . . . . . . . . . . . . . . 13 2.2.1 Indices de Controlabilidade para sistemas SISO . . . . . . . . . . . 14 2.2.2 Indices de Controlabilidade para sistemas MIMO . . . . . . . . . . 16 Projeto Integrado de Processos e Controle . . . . . . . . . . . . . . . . . . 32 2.3.1 Procedimento Geral de Projeto Integrado . . . . . . . . . . . . . . . 33 2.3.2 Exemplo: Projeto Integrado de un CBB e um controlador PID. . . 35 2.3.3 Exemplo: Projeto Integrado de un CBB e um CMD. . . . . . . . . 44 Sı́ntese de Processos e Controle . . . . . . . . . . . . . . . . . . . . . . . . 52 2.4.1 Sı́ntese de Processos . . . . . . . . . . . . . . . . . . . . . . . . . . 53 2.4.2 Sı́ntese de Processos e Controle . . . . . . . . . . . . . . . . . . . . 56 2.4.3 Exemplo: Sintese de processos. . . . . . . . . . . . . . . . . . . . . 61 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 3 Modelado de Sistemas Hı́bridos 65 3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3.2 Sistemas Afins a Troços 3.2.1 3.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 Sistemas Mistos Lógicos Dinâmicos . . . . . . . . . . . . . . . . . . . . . . 74 3.3.1 Calculo Proposicional e Programação Linear Inteira . . . . . . . . . 74 iv 3.3.1.1 Proposições Lógicas . . . . . . . . . . . . . . . . . . . . . 74 3.3.1.2 Proposições Mistas Lógicas-Continuas . . . . . . . . . . . 77 3.3.2 Estrutura de Sistemas MLD . . . . . . . . . . . . . . . . . . . . . . 79 3.3.3 Sistema MLD bem posto e a tolerância ² . . . . . . . . . . . . . . . 82 3.3.4 Estado estacionário para sistemas MLD . . . . . . . . . . . . . . . . 84 3.3.5 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 3.4 Equivalência entre sistemas MLD e PWA . . . . . . . . . . . . . . . . . . . 92 3.5 Conversão de modelos MLD-PWA . . . . . . . . . . . . . . . . . . . . . . . 93 3.6 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 4 Controle Preditivo de Sistemas Hı́bridos 95 4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 4.2 Controle Preditivo de Sistemas MLD . . . . . . . . . . . . . . . . . . . . . 96 4.3 4.2.1 Problema de seguimento . . . . . . . . . . . . . . . . . . . . . . . . 104 4.2.2 Algoritmos MIQP . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 4.2.3 Controle Preditivo Misto Inteiro do CBB . . . . . . . . . . . . . . . 105 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 5 Conclusões e Cronograma 113 5.1 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 5.2 Cronograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 A Indices de Controlabilidade para sistemas SISO 117 A.1 Indices de performance no domı́nio do tempo . . . . . . . . . . . . . . . . . 117 A.2 Indices de performance no domı́nio da freqüência . . . . . . . . . . . . . . 118 B Escalamento 123 C Modelado Eficiente de Sistemas MLD 127 C.1 Lógica Proposicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 C.2 Proposições Mistas Lógicas-Continuas . . . . . . . . . . . . . . . . . . . . . 138 C.3 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 C.4 The HYbrid Systems DEscription Language HYSDEL . . . . . . . . . . . . 148 Lista de Abreviaturas CP Conversor de Potência HVDC High Voltage Direct Current SH Sistemas Hı́bridos DC Direct Current ISE Integral Squared Error RGA Relative Gain Array CBB Conversor Buck-Boost HA Hybrid Automata PWA Piece Wise Affine PWL Piece Wise Linear MLD Mixed Logical Dynamical LC Linear Complementarity ELC Extended Linear Complementarity MMPS Max-Min-Plus-Scaling LMI Linear Matrix Inequalities FNC Forma Normal Conjuntiva FBG Formula Booleana Generalizada FNCG Forma Normal Conjuntiva Generalizada HYSDEL Hybrid Systems Description Language SDP Semi-Definite Programming LP Linear Programming QP Quadratic Programming MILP Mixed Integer Linear Programming MIQP Mixed Integer Quadratic Programming SOS Sum-of-Square Capı́tulo 1 Introdução 1.1 Motivação A Eletrônica de Potência é a área da eletrônica que se ocupa do condicionamento da energia elétrica por meio de circuitos eletrônicos especializado chamados de Conversores de Potência (CP). Além disso a Eletrônica de Potência lida com o acionamento de máquinas elétricas e cargas de grande potência, em corrente direta ou alternada, através do uso de dispositivos semi condutores de alta capacidade. Esta área da engenharia tem alcançado um lugar muito importante na tecnologia moderna nos últimos anos. Ela está presente em uma grande variedade de produtos de nosso cotidiano. É difı́cil traçar os limites das aplicações da eletrônica de potência em especial com a tendência atual no desenvolvimento de novos dispositivos semi-condutores e microprocessadores; o limite superior ainda é indefinido. A Tabela 1.1 mostra algumas das aplicações da Eletrônica de Potência (Rashid 1995). Na area da industria petroquı́mica são inúmeras as aplicações onde está presente a eletrônica de potência. À mais evidente seja talvez o controle da potência para alimentação de grandes motores elétricos usados em bombas ou em grande compressores; substituindo os rústicos sistemas de variação de velocidades mecânicos, tais como polias e variadores hidráulicos, bem como os custosos motores de corrente contı́nua pelo conjunto motor assı́ncrono e inversor, mais barato, de manutenção mais simples e reposição profusa. Aplicações novas e de muito interesse vem sendo desenvolvidas recentemente é o caso por exemplo dos High Voltage Direct Current, (HVDC), (Bahrman e Johnson 2007), Introdução 3 Acondicionamento de Ar Amplificadores de Audio Iluminação Calefação Computadores Corrente direta de alta voltage (HVDC) Elevadores Gravações magnéticas Ferramentas elétricas Ignição eletrônica Moinhos Veı́culos elétricos Controle de Motores Compensação de potência reativa Bombas e Compressores Soldadura Trens Regulação de tensão Alarmes Sistemas de partida para turbinas de Gás Calderas Cargador de Bateria Controles lineares de motores de indução Eletrodomésticos Fonte de alimentação par aeronaves Gruas e tornos Fornos de cimento Locomotivas Processos Quı́micos Minerı́a Fontes de alimentação Perfuração de poços de petróleo Fontes de alimentação de energia solar Produção de papel Sistemas de partida para maquinas sı́ncronas Acelerador de partı́culas Tabela 1.1: Aplicações da Eletrônica de Potência utilizados na alimentação energética de plataformas em alto mar. A tecnologia HVDC e uma alternativa ambiental amigável, mais eficiente, e mais segura, para à alimentação energética de plataformas marı́timas do que a geração tradicional usando turbinas de gás. Consegue-se uma eficiência de transmissão de ∼ 90 − 94% e redução na emissão de CO2 , por exemplo no projeto Troll A, (plataforma de extração de gás em alto mar na Noruega), conseguiu-se reduzir a emissão de CO2 em até 230.000tons/ano. Este tipo de soluções demanda muito menos mantimento e pode ser controlado desde o continente o que faz necessário muito menos pessoal capacitado na plataforma. A vida útil das instalações também e maior (30 anos). Os riscos de acidente de trabalho e o nı́vel de ruı́do na plataforma são menores. Em muitos casos é possı́vel mostrar os benefı́cios econômicos de fornecer energia desde o continente que usando o gás produzido na plataforma (Hyttinen e Bentzen 2006), (Jones e Stendius 2006). A Figura 1.1, mostra o esquema do conversor HVDC do Projeto Troll A. Todos os CP são dispositivos chaveados o que significa que pelo menos um dos seus elementos constitutivos e um semi-condutor que vai operar como um interruptor através de un sinal de controle que vai indicar quando ele deverá estar em estado de condução ou em estado de corte, ou não condução. A saı́da requerida vai se obter variando o tempo de condução e o tempo de corte da chave. Esta peculiaridade faz dos CP sistemas conhecidos na literatura como sistemas hı́bridos (SH), sistemas em cujo modelo coexistem variáveis Introdução 4 Figura 1.1: Esquema do conversor HVDC do Projeto Troll A reais ou continuas (ex., tensão e corrente) e variáveis discretas (sinal de controle do tipo ON-OFF). O conceito de modelo de um sistema é associado tradicionalmente com as equações diferenciais ou a diferença, derivadas das leis fı́sicas que governam a dinâmica do sistema considerado. Conseqüentemente, a maioria das principais teorias de controle e ferramentas foram desenvolvidas para tais sistemas. Por outro lado, em muitas aplicações o sistema a ser controlado é constituı́do também por regras lógicas, interruptores ou válvulas tipo ON-OFF, seletores de velocidade, evoluções dependentes de regras tipo if-then else. Freqüentemente na prática, o controle destes sistemas é realizado utilizando esquemas baseados em regras heurı́sticas deduzidas da operação prática da planta (Bemporad e Morari 1999). Nos últimos anos o estudo de SH ou sistemas hierárquicos, constituı́dos por componentes dinâmicos no nı́vel inferior e por componentes lógicos/discretos no nı́vel superior, tem recebido muita atenção e torno-se uma das principais areas de investigação no meio acadêmico (Grossmann et al. 1993) e (Branicky et al. 1998). Desde o começo e durante muito tempo a teoria clássica de controle preocupou-se principalmente com os sistemas contı́nuos e a ciência da computação com os sistemas com dinâmica discreta, Figura 1.2. Hoje em dia os sistemas a controlar estão tornando-se mais complexos e a interação da dinâmica contı́nua e discreta está aumentando, o que requer portanto a necessidade de desenvolver ferramentas novas par analisar e projetar controladores para este tipo de sistemas (Kerrigan 2000). Não obstante, em todos os casos encontrados na literatura, ambos os problemas, o desenho do CP e o projeto do controle, é considerado independentemente. O circuito é Introdução 5 Figura 1.2: Sistemas Hı́bridos projetado primeiramente e então logo após o engenheiro de controle escolhe a estratégia do controle e ajusta o controlador. Isto limita o desempenho atingı́vel do sistema porque nenhum aspecto dinâmico do comportamento do dispositivo é feito durante a fase de projeto do sistema (Pomar et al. 2007). Este método de projeto tradicional ignora a idéia que as mudanças no projeto do processo podem fazer o sistema mais controlável ou fornecem mais graus de liberdade para aumentar o desempenho (Luyben 1993). Geralmente falando, o projeto do processo tradicionalmente é centrado em determinar a estrutura, o tamanho e as condições de operação dos componentes em um ponto de operação estacionário de acordo com especificações dadas da produção ou da operação. Geralmente, nos estágios de projeto, embora a otimização seja usada freqüentemente para dimensionar o sistema, não há nenhuma consideração explı́cita do comportamento dinâmico do processo e a função de custo a otimizar inclui somente os termos associados aos componentes ou aos custos de operação. Uma vez que a planta foi construı́da, os engenheiros de controle tentam projetar um sistema automático de controle que assegure a operação correta da planta, mesmo na presença de incertezas e de perturbações. Esta tarefa é freqüentemente difı́cil ou mesmo impossı́vel dado que no projeto original não se teve em conta os requerimentos de controle. O Funcionamento adequado do processo, junto com seu sistema automático de controle, não depende exclusivamente do tipo de controlador e dos seus parâmetros, mas também do processo em si próprio (Luyben 1993). O projeto integrado do processo e do controle é uma técnica em que as caracterı́sticas do controle são consideradas nos estágios do projeto, permitindo assim considerar especi- Introdução 6 ficações dinâmicas para que o sistema assegure uma flexibilidade e facilidade de operação. Pode-se considerar o projeto integrado em malha aberta ou em malha fechada. A solução obtida ao resolver o problema de projeto em malha aberta são os parâmetros fı́sicos da planta associada aos valores mı́nimos da função de custo que verifica as restrições de projeto do processo e que fornece um comportamento dinâmico desejado do sistema em malha aberta. Neste caso o objetivo é facilitar a tarefa subseqüente: o projeto do controle. Por outro lado, a solução do problema em malha fechada, além de fornecer os parâmetros fı́sicos ótimos da planta, fornece também os parâmetros do controlador. Isto é, a sı́ntese do controlador é incluı́da também no problema do projeto de planta com o objetivo de fornecer a solução de menor custo além de garantir determinadas especificações dinâmicas em malha fechada. As primeiras idéias para integrar o controle com o projeto de processos foram propostas por Nishida e Ichikawa (1975) e Nishida et al. (1976). Morari (1992) e Perkins (1989) recolheram alguns dos resultados importantes e dos esforços precedentes relativos à interação entre o projeto e o controle. Morari (1983), Skogestad e Morari (1987), Morari e Zafiriou (1989), Skogestad e Wolf (1990), Skogestad et al. (1991) fizeram contribuições significativas na análise de controladores e no estudo da adaptabilidade dinâmica dos sistemas, introduzindo e analisando magnitudes de controle para a interação das variáveis e a rejeição das perturbações. Não obstante, na área dos dispositivos eletrônicos de potência, as contribuições na literatura sao muito escassas. Este trabalho propõe soluções para o projeto de SH utilizando técnicas de projeto integrado, controle preditivo e controle não linear aplicadas a CP e a sua utilização em processos da industria do petróleo e gás natural. 1.2 Objetivos Os objetivos de este trabalho podem agrupar-se em três diferentes areas temáticas: Sistemas Hı́bridos Definir SH. Estudar as diferentes classes de SH e sua modelagem. Extender os conceitos de controlabilidade e observabilidade a SH. Aprofundar no conhecimento de soluções de controle avançado para SH tendo em conta o problema da estabilidade e da robustez das diferentes estratégias de controle. Estabelecer resultados comparativos entre as diferentes controladores, tomando como estudo de caso um CP de corrente direta em corrente direta, (DC-DC), o conversor Buck-Boost Introdução 7 (CBB). Projeto Integrado Estudar as técnicas de projeto integrado na industria de processos. Estender estas técnicas a SH, utilizando como estudo de caso o projeto integrado de um CBB. Mostrar os benefı́cios de realizar o projeto integrado realizando uma comparação de desempenho das prestações do CBB obtido no projeto integrado e o da primeira parte. Conversores de Potência Definir CP. Estudar as diferentes classes de CP e sua modelagem. Definir HVDC e suas aplicações na area de industria do petróleo e gás natural. Aplicar as diferentes técnicas de controle mencionadas no começo a um HVDC já construı́do, e finalmente aplicar as técnicas de projeto integrado para poder comparar com o HVDC construı́do com as técnicas tradicionais. 1.3 Organização do trabalho Este trabalho está organizado da seguinte forma: No Capı́tulo 2 desenvolve-se aspectos teóricos sobre projeto integrados e sı́ntese de processos e controle. Mostram-se alguns indices de controlabilidade usados na literatura, e exemplifica-se a metodologia com alguns estudos de caso que também mostram os benefı́cios desta abordagem. No Capı́tulo 3 é definido e caracterizado os SH. Apresentam-se duas estratégias de modelado para SH, a relação entre ambas e os benefı́cios de cada contexto de modelagem apresentado. No Capı́tulo 4 apresentam-se o controle preditivo de SH num dos marcos de modelagem apresentado no capı́tulo 3, o contexto MLD. Mostra-se através de um estudo de caso uma serie de desafios e questões em aberto, que apresenta esta forma de controle. No Capı́tulo 5 apresentam-se as conclusões do trabalho e o cronograma de atividades durante a duração do curso de doutorado. Capı́tulo 2 Projeto Integrado e Sı́ntese 2.1 Introdução Historicamente, o projeto de um processo e seu controle tem sido realizados de forma seqüencial pelos engenheiros de processo e de controle respectivamente. É bem sabido que a primeira etapa, o projeto do processo, determina a controlabilidade inerente do próprio processo e, por conseguinte, as propriedades de interação entre as variáveis, a capacidade de rejeitar perturbações e a qualidade no seguimento a referências, tudo isso com independência ao regulador colocado na etapa de controle. Assim freqüentemente o engenheiro de controle se enfrenta a plantas pouco controláveis e o projeto e a sintonia do sistema de controle torna-se uma tarefa difı́cil (Luyben 1993, Luyben e Floudas 1994a, Luyben e Floudas 1994b, Gutierrez 2000). No projeto de uma planta são involucradas duas áreas fundamentalmente: a sı́ntese do processo e o projeto do processo. Na sı́ntese do processo se determina a interconexão ótima entre as unidades do processo como também o tipo de desenho das unidades dentro do sistema, para assim alcançar objetivos de produção especı́ficados. O projeto do processo é focado na determinação das condições de operação de cada uma das unidades do processo e do dimensionamento que são requeridos para a produção de um produto especı́fico. Finalmente o controle de processos estabelece pautas de operação que asseguram Projeto Integrado e Sı́ntese 9 um comportamento estável do processo satisfazendo un conjunto de especificações transitórias e de regime permanente mesmo considerando a ação de perturbações e incertezas nos modelos usados no projeto do sistema de controle. A sı́ntese de processos tem sido levada a cabo tradicionalmente de maneira manual e intuitiva, uma vez que se propõem diferentes esquemas de diagramas de fluxos, os engenheiros se centram em escolher o esquema da planta economicamente ótima do ponto de vista de custos de construção, mas sem ter em conta a seqüencia e interconexão ótima entre as unidades que a compõem, e sem considerar as caracterı́sticas de controlabilidade em malha aberta ou em malha fechada que teria a planta uma vez projetada. O modo tradicional de abordar o projeto de processos mostra-se na Figura 2.1. Inicialmente o engenheiro de processos determina a estrutura do diagrama de fluxo, as condições de operação em estado estacionário que se requerem para alcançar os objetivos de produção e o cálculo dos parâmetros fı́sicos da planta (tamanho das unidades do processo). O objetivo principal procurado nesta tarefa tem sido a de otimizar um ı́ndice econômico (minimizar o custo anual de manutenção, maximizar os benefı́cios, minimizar o custo de construção, etc.), considerando unicamente a operação da planta em estado estacionário, avaliando um grande número de estruturas alternativas, de condições de projeto e parâmetros que satisfaçam os requerimentos de operação estabelecidos, selecionando finalmente a mais econômica tanto em custos de manutenção como de construção das mesmas. Nesta etapa se dá pouca atenção à controlabilidade dinâmica do processo. Uma vez projetada a planta, o engenheiro de controle se encarrega de estabelecer uma estratégia de controle que assegure um comportamento dinâmico estável e que satisfaça às exigências de qualidade do produto. Estes objetivos devem alcançar-se mesmo na presença de grandes perturbações, de falhas nos equipamentos, variações de carga, etc. Freqüentemente esta é uma tarefa difı́cil dado que a controlabilidade do processo, que deveria ser uma parte integral nas etapas do projeto, não é tida em conta previamente. Nas últimas três décadas a pressão exercida pelos avanços tecnológicos e a competitividade, tem feito que a segurança, os custos de energia e as regulações governamentais em geral, incrementem a complexidade e sensibilidade do processo em aras de conseguir maior produtividade e qualidade dos produtos. As plantas tem passado a ser mais complexas em relação ao fluxo de materiais (configurações complexas, re-circulação de fluxos, etc.) e ao fluxo de energia (integração do calor). Estas novas condições do processo, fazem que a tarefa de controle seja freqüentemente muito difı́cil e que se aposte pelo uso de técnicas de controle avançado, como por exemplo o controle preditivo. Projeto Integrado e Sı́ntese 10 Figura 2.1: Projeto tradicional de processos. A interação entre estas duas disciplinas (engenharia de processos e controle) surge devido a que o projeto de processos determina de um modo inerente sua controlabilidade, o que qualitativamente significa o bem que um processo é capaz de rejeitar perturbações, quão severamente interagem as múltiplas variáveis e quão facilmente o sistema move-se de um ponto de operação a outro. Um procedimento mais ótimo consistiria em integrar na tarefa do projeto de processos restrições sobre a controlabilidade do sistema. Existem duas razões fundamentais que tem condicionado o uso majoritário das técnicas de projeto de processos tradicionais, uma é a falta de ferramentas de projeto assistidas por computador que permitem o estudo dinâmico das plantas (somente nos últimos anos Projeto Integrado e Sı́ntese 11 tem-se evidenciado um desenvolvimento pronunciado nesta área) e a segunda razão são as barreiras históricas e tecnológicas, existente entre o engenheiro de processos e o engenheiro de controle, (Gutierrez 2000). Atualmente, a situação do ponto de vista tecnológico permite realizar o projeto simultâneo do processo e do sistema de controle, levando em conta restrições de operação, restrições do tipo fı́sico e considerando a controlabilidade do conjunto. A definição de controlabilidade não é única, como demonstram as diversas definições dadas por Ziegler e Nichols (1943), Kalman et al. (1962), etc. Mais especificamente, Skogestad et al. (1991) definiu o conceito de controlabilidade como “a melhor qualidade de resposta que possa se obter através de um controlador feedback ”, esta definição geral proporciona um marco de trabalho conceitual com o qual pode tratar-se o problema de projeto integrado. Alguns investigadores tem apontado a essa idéia como fundamental, no que refere a incorporar a controlabilidade como uma magnitude nas etapas de projeto do processo. Conceitualmente podem distinguir-se quatro tipo de requerimentos: Flexibilidade, habilidade que possui um sistema para trabalhar em diferentes pontos de estado estacionário não consideradas no projeto. Permutabilidade, habilidade que possui um sistema para se mover de um ponto de estado estacionário a outro. Controlabilidade, capacidade que possui o processo para alcançar e manter um valor de equilı́brio desejado. Controlabilidade em malha fechada, se define como o “melhor”comportamento dinâmico do sistema (seguimento de referencias e rejeição de perturbações), que pode alcançar o sistema em malha fechada. Por definição esta caracterı́stica não depende só do controlador, mas também da própria planta, já que a controlabilidade depende em grande medida da flexibilidade e permutabilidade que são proporcionados pelo próprio projeto do processo. Projeto Integrado seria a técnica de projeto através da qual obtém-se os parâmetros fı́sicos da planta que minimizem os custos de operação e construção, ao mesmo tempo que satisfaçam caracterı́sticas de controlabilidade impostas ao processo, como mostra a Figura 2.2. Este problema se traduz matematicamente num problema de otimização não linear Projeto Integrado e Sı́ntese 12 multi-objetivo com restrições, onde os objetivos que se consideram são do tipo econômico e de controle, e as restrições são os requerimentos fı́sico e de controlabilidade do processo, que podem incluir: segurança, flexibilidade, operabilidade, etc. Figura 2.2: Projeto tradicional de processos. A integração da sı́ntese do processo e do controle, seria a técnica que permitiria selecionar automaticamente a estrutura ótima da planta junto com a estrutura do controlador, isto é, obter uma planta cujas unidades estejam conectadas de uma maneira ótima, seu dimensionamento represente o custo mı́nimo de construção e permita satisfazer os requerimentos para um funcionamento adequado do processo, paralelamente a isto se obtém os parâmetros ótimos do regulador que proporcionem um comportamento dinâmico do sistema fixado na etapa de projeto. Na seqüencia descrevem-se alguns indices de controlabilidade utilizados na literatura relacionados ao projeto e sı́ntese de processos, seguidamente apresenta-se a metodologia de projeto integrado e a de sı́ntese de processos exemplificando cada método com estudos de caso. Projeto Integrado e Sı́ntese 2.2 13 Algumas Medidas de Controlabilidade O desenvolvimento teórico deste capı́tulo é realizado sobre modelos lineares, invariantes no tempo. No caso mono-variável considera-se: y(s) = G(s)u(s) + Gd (s)d(s) (2.1) onde y é a saı́da do sistema, u é a entrada manipulada e d são as perturbações. G é a função de transferência entrada-saı́da da planta e Gd a função de transferência perturbações-saı́da. Para sistemas multi-variáveis, G(s) é uma matriz de funções de transferência. Comentario 2.1 Vamos adotar a seguinte notação neste trabalho: quando a letra que representa a função de transferência estiver em negrito então trata-se de um sistema multi-variável e por tanto estaremos representando uma matriz de transferência, no caso contrario tratara-se de um sistema mono-variável e estaremos representando uma função de transferência. A função de transferência G(s) serão funções racionais da forma: G= bnz snz + . . . + b1 s + b0 sn + an−1 sn−1 + . . . + a1 s + a0 (2.2) onde n é a ordem do denominador e é chamado de ordem do sistema; nz e a ordem do numerador. n − nz é chamado de ordem relativo do sistema. Definição 2.1 • O sistema G(s) é estritamente próprio se lim G(s) = 0. s→∞ • O sistema G(s) é semi-próprio se lim G(s) = D 6= 0. s→∞ • O sistema G(s) que é estritamente próprio ou semi-próprio é próprio. • O sistema G(s) é impróprio se lim G(s) = ∞. s→∞ Para os sistemas próprios, com n ≥ nz , podemos fazer uma descrição no espaço de estados, ẋ = Ax + Bu, y = Cx + Du, do sistema (2.2) da seguinte forma: G(s) = C(sI − A)−1 B + D (2.3) Projeto Integrado e Sı́ntese 14 Comentario 2.2 Todo sistema real tem ganho zero a uma freqüência suficientemente grande, e por tanto é estritamente próprio. A equação (2.1) é um modelo incremental do sistema, onde os sinais: u(s), d(s) e y(s), geralmente são variáveis que representam o desvio do sinais verdadeiros respeito de um ponto de equilı́brio ou referência, pois geralmente o modelo (2.1) é obtido a partir de uma linearização de um modelo não-linear do sistema. A seguir mostram-se os principais ı́ndices de controlabilidade para sistemas uma entrada uma saı́da (SISO), e logo após para sistemas de múltiplas entradas e múltiplas saı́das (MIMO). 2.2.1 Indices de Controlabilidade para sistemas SISO Performance no domı́nio do tempo Uma forma tradicional de avaliar a performance de um sistema SISO é simular sua resposta a um degrau unitário na entrada de referência e avaliar indices como: • Tempo de subida (tr ). • Tempo de 5% ou tempo de assentamento (ts ). • Sobre-sinal (Mp ). • Fator de redução (quociente entre o segundo e o primeiro pico do sinal de saı́da). • Erro em estado estacionário (es→∞ ). Os dois primeiros indices medem a velocidade de resposta, no entanto os últimos três medem a qualidade da resposta. Para o leitor que não estiver familiarizado com estes indices, sua definição encontram-se no apêndice A. Comentario 2.3 Estes indices são válidos quando usamos um modelo incremental do processo onde y(0) = 0 Projeto Integrado e Sı́ntese 15 Outra forma de quantificar a performance no domı́nio do tempo é em termos de alguma norma do sinal de erro: e(t) = y(t) − r(t). Por exemplo podemos usar a integral do quadrado do erro (Integral Squared qR Error - ISE), ou a raiz quadrada, que é a norma∞ 2 do sinal de erro, ke(t)k2 = |e(τ )|2 dτ . Observe que neste caso vários objetivos 0 relacionados com ambas, a velocidade e a qualidade da resposta, são combinados em um único número. Outra vantagem da norma-2 é que o problema resultante de otimização é numericamente fácil de resolver. Além do mais qR podemos tomar em conta as magnitude ∞ de entrada considerando, por exemplo, J = (Q|e(t)|2 + R|u(t)|2 dt, onde Q e R são 0 constantes positivas. Isto é similar ao control quadrático ótimo (LQ), mas no controle LQ normalmente consideramos o impulso em lugar do degrau em r(t). Performance no domı́nio da freqüência Substituindo s por jw na função de transferência G(s) de um sistema estável, obtemos a chamada descrição da resposta em freqüência. A resposta em freqüência pode ser usada para descrever: (i) a resposta de um sistema estável a uma sinusoide de freqüência variável, (ii) o conteúdo harmônico de um sinal determinı́stico via Transformada de Fourier, (iii) a Distribuição Harmônica de um sinal estocátsico via a Função de Densidade Espectral de Potência. A grande vantagem da analise no domı́nio da freqüência comparado com a analise da resposta ao degrau, e justamente que ela considera uma ampla classe de sinais (sinusoides de qualquer freqüência). Isto facilita a caracterização das propriedades de realimentação, e em particular o comportamento do sistema na região próximas a freqüência de corte (largura de banda). Alguns dos principais indices no domı́nio da freqüência, para sistemas SISO, são: • Margem de Fase (PM) e Margem de Ganho (GM). • Máximo Pico. • Largura de Banda e Freqüência de Corte. O leitor que não estiver familiarizado com estes indices no domı́nio da freqüência, pode achar a definição assim como um desenvolvimento mais detalhado dos mesmos no apêndice A. Projeto Integrado e Sı́ntese 2.2.2 16 Indices de Controlabilidade para sistemas MIMO Considere-se uma planta MIMO com m entradas e l saı́das. Assim o modelo básico de função de transferência é y(s) = G(s)u(s), onde y é um vetor l × 1, u é um vetor m × 1 e G(s) e uma matriz de funções de transferências l × m. A principal diferença entre os sistemas SISO e MIMO e a aparição de direções. Direções são relevantes para vetores e matrices mas não para escalares. No entanto, apesar da complicação do fator da direção muitas das idéias apresentadas na seção anterior para sistemas SISO podem ser estendidas para sistemas MIMO. A decomposição em valores singulares (SVD) é uma forma útil de quantificar a direcionalidade, e vamos ver que muitos dos resultados envolvendo valores absolutos (magnitude) para sistemas monovariáveis podem ser generalizados para sistemas multi-variáveis considerando o máximo valor singular. Analise da resposta em freqüência multi-variável O domı́nio da freqüência é ideal para o estudo das direções em sistemas multi-variáveis. Considere o sistema G(s) mostrado na Figura 2.3 com entrada d(s) e saı́da y(s). Figura 2.3: Sistema G(s) com entrada d e saı́da y. y(s) = G(s)d(s) (2.4) (Vamos chamar aqui a entrada de d em lugar de u para evitar confusões com a matriz U usada mais adiante na decomposição de valores singulares). Na Seção 2.2.1 foi mencionado que a resposta em freqüência de um sistema SISO estável pode ser interpretada fisicamente como a resposta do sistema a uma entrada sinusoidal de freqüência w. Esta interpretação da resposta em freqüência pode ser generalizada a sistemas MIMO considerando os elementos gij (jw) da matriz G como a resposta do sistema na saı́da i a uma entrada sinusoidal na entrada j. Mais especificamente isto quer dicer que, aplicando no canal de entrada j um sinal escalar Projeto Integrado e Sı́ntese 17 sinusoidal persistente (ou seja ele é aplicado desde t = −∞): dj = dj0 sin(wt + αj ) (2.5) obtemos no canal de saı́da i o sinal persistente: yi = yi0 sin(wt + βi ) (2.6) onde a amplificação (ganho) e o corrimento de fase, podem ser obtidos a partir do número complexo gij (jw) como segue: yi0 = |gij (jw)|, dj0 βi − αj = ∠gij (jw) (2.7) A resposta total do sistema a entradas simultâneas nos canais de entrada é, pelo principio de superposição de sistemas lineares, igual a soma das respostas individuais, ou seja: yi (w) = gi1 (jw)d1 (w) + gi2 (jw)d2 (w) + . . . = X gij (jw)dj (w) (2.8) j Para sistemas SISO, y = Gd, o ganho a uma dada freqüência é simplesmente: |y(w)| |G(jw)d(w)| = = |G(jw)| |d(w)| |d(w)| O ganho depende da freqüência w, mas como o sistema é linear não depende da magnitude de entrada |d(w)|. Para aplicar este conceitos em sistemas MIMO, onde os sinais de entrada e saı́da são ambos vetores, é necessário usar normas especı́ficas. Por exemplo, se escolhemos a norma-2, então a uma freqüência dada w a magnitude do vetor de entrada é: kd(w)k2 = sX q d210 + d220 + · · · (2.9) 2 2 y10 + y20 + ··· (2.10) |dj (w)|2 = j e a magnitude do vetor de saı́da é: s ky(w)k2 = X i q |yi (w)|2 = Projeto Integrado e Sı́ntese 18 O ganho do sistema G(s) para uma sinal de entrada particular d(w) é dado por: p 2 y 2 + y20 + ··· ky(w)k2 kG(jw)d(w)k2 = = p 10 2 2 kd(w)k2 kd(w)k2 d10 + d20 + · · · (2.11) Novamente o ganho depende da freqüência w e é independente da magnitude de entrada kd(w)k2 . No entanto par sistemas MIMO existem graus de liberdade adicionais e o ganho depende da direção da entrada d. " Exemplo 2.1 Para um sistema com duas entradas, d = d10 d20 # , o ganho é em geral diferente para as seguintes 5 entradas: " 1 d1 = # " , d2 = 0 0 # " , d3 = 1 # 0.707 " , d4 = 0.707 # 0.707 −0.707 " , d5 = # 0.6 −0.8 (observe que todas as entradas tem a mesma magnitude kdk2 = 1, mas tem diferentes direções). Por exemplo, para o sistema 2 × 2: " G1 = 5 4 # (2.12) 3 2 (matriz constante) podemos calcular para as 5 entradas dj os seguintes vetores de saı́da: " y1 = 5 # 3 " , y2 = 4 # 2 " , y3 = 6.36 3.54 # " , y4 = 0.707 0.707 # " , y5 = −0.2 # 0.2 e a norma-2 destas 5 saı́das é: ky1 k2 = 5.83, ky2 k2 = 4.47, ky3 k2 = 7.30, ky4 k2 = 1.00, ky5 k2 = 0.28 Esta dependência do ganho em relação a direção de entrada é mostrada na Figura 2.4 onde usamos d20 d10 como variável independente para representar a direção de entrada. Vemos que, dependendo de d20 , d10 o ganho varia entre 0.27 e 7.34. O máximo valor do ganho em 2.11 é o máximo valor singular de G max d6=0 kGdk2 = max kGdk2 = σ(G) kdk2 =1 kdk2 (2.13) Projeto Integrado e Sı́ntese 19 8 σ(G1 ) = 7.34 7 6 kyk2 kdk2 5 4 3 2 1 0 −5 σ(G1 ) = 0.27 −4 −3 Figura 2.4: Ganho −2 −1 0 d20 d10 1 kG1 dk2 kdk2 como função de 2 d20 d10 3 4 5 para G1 em 2.12. e o ganho mı́nimo é o mı́nimo valor singular de G, min d6=0 kGdk2 = min kGdk2 = σ(G) kdk2 =1 kdk2 (2.14) A primeira igualdade em (2.13) e (2.14) são válidas porque o ganho é independente da magnitude de entrada para sistemas lineares. Para achar uma generalização útil de |G| para o caso em que G é uma matriz, necessitamos do conceito de norma de um matriz: kGk. Decomposição em Valores Singulares Definição 2.2 Matriz Unitária. A matriz (complexa) U é untaria se U H = U −1 (2.15) onde U H é a matriz conjugada transposta (Hermı́tica) de U e U −1 é a inversa de U . Todos os autovalores da matriz unitária tem valor absoluto igual a 1, e todos seus valores singulares são iguais a 1. Projeto Integrado e Sı́ntese 20 Definição 2.3 Decomposição em Valores Singulares (SVD). Qualquer matriz complexa A, l × m, pode ser fatorizada na decomposição em valor singular: A = U ΣV H (2.16) onde a matriz U , l × l, e a matriz V , m × m, são unitárias, e a matriz Σ, l × m, contem a matriz diagonal Σ1 com os valores singulares reais não negativos, σi , arrumados em ordem descendente como em: " Σ= ou Σ1 # 0 h ; l≥m (2.17) i Σ= Σ1 0 ; l≤m (2.18) onde Σ1 = diag{σ1 , σ2 , . . . , σk }; k = min(l, m) (2.19) σ ≡ σ1 ≥ σ2 ≥ . . . ≥ σk ≡ σ (2.20) e Os valores singulares são as raı́zes quadradas positivas dos k = min(l, m) maiores autovalores de ambas matrices AAH e AH A. Ou seja: σi (A) = p λi (AH A) = p λi (AAH ) (2.21) Definida a SVD, vejamos como usar este conceito na resposta em freqüência de um sistema MIMO G(s) com m entradas e l saı́das. Considere uma freqüência fixa w onde G(jw) e uma matriz complexa constante l × m, por simplicidade anotemos G(jw) por G. Qualquer matriz G pode ser decomposta em uma SVD, ou seja podemos fazer: G = U ΣV H (2.22) Direções de entrada e saı́da Os vetores colunas de U , (ui ), representam as direções de saı́da da planta. Estes vetores são ortogonais e de tamanho igual a 1 (ortonormais), isto é: kui k2 = p |ui1 |2 + |ui2 |2 + . . . |uil |2 = 1 H uH i ui = 1, ui uj = 0, i 6= j (2.23) (2.24) Projeto Integrado e Sı́ntese 21 Assim mesmo, os vetores colunas de V , (vi ), representam as direções de entrada da planta, também estes vetores são ortogonais e de tamanho igual a 1 (ortonormais). Estas entradas e saı́das estão relacionadas através dos valores singulares. Para ver isto note que como V é unitária temos que V H V = I, por tanto (2.22) pode ser escrita como GV = U Σ para a qual a coluna i torna-se: Gvi = σi ui (2.25) onde vi e ui são vetores e σi um escalar. Isto é, se consideramos uma entrada na direção vi , então a saı́da é na direção ui . Além disso, como kvi k2 = 1 e kui k2 = 1 vemos que o i-ésimo valor singular σi da diretamente o ganho da matriz G nessa direção. Em outras palavras: σi (G) = kGvi k2 = kGvi k2 kvi k2 (2.26) Algumas vantagens da decomposição SVD em relação aos autovalores para analisar ganhos e direções de plantas multi-variáveis são: 1. Os valores singulares dão melhor informação sobre o ganho da planta. 2. As direções da planta obtidas do SVD são ortogonais 3. SVD pode ser aplicado diretamente a plantas não quadradas. Valores singulares máximo e mı́nimo Como já determinado, é possı́vel mostrar que o maior ganho para qualquer direção de entrada é igual ao valor singular máximo, σ(G) ≡ σ1 (G) = max d6=0 kGdk2 kGv1 k2 = kdk2 kv1 k2 (2.27) e que o menor ganho para qualquer direção de entrada é igual ao valor singular mı́nimo, σ(G) ≡ σk (G) = min d6=0 kGvk k2 kGdk2 = kdk2 kvk k2 (2.28) onde k = min{l, m}. Assim, para qualquer vetor d temos que: σ(G) ≤ kGdk2 ≤ σ(G) kdk2 (2.29) Projeto Integrado e Sı́ntese 22 Exemplo 2.2 Considere novamente o sistema (2.12) do exemplo (2.1) " G1 = 5 4 # (2.30) 3 2 A decomposição em valores singulares SVD de G1 é: " G1 = | 0.872 0.490 #" 0.490 −0.872 {z }| 7.343 0 U 0 #" 0.794 −0.608 0.272 0.608 0.794 {z }| {z Σ #H } VH " 0.794 # O maior ganho 7.343 é para uma entrada na direção v = , e o menor ganho 0.608 " # −0.608 . Isto confirma o achado no 0.272 é para uma entrada na direção v = 0.794 exemplo (2.1). Como em (2.30) ambas entradas afetam ambas saı́das, diremos que o sistema é interativo. Além disso o sistema é mal condicionado, isto é, algumas combinações das entradas tem um forte efeito nas saı́das, no entanto outras combinações tem um efeito fraco. Isto pode ser quantificado pelo numero de condição, o quociente entre os ganhos na direção forte e fraca: σ(G) σ(G) (2.31) 7.343 σ(G) = = 27.0 σ(G) 0.272 (2.32) γ(G) = Para o sistema (2.30) é: γ(G) = Exemplo 2.3 Considere o sistema mostrado na Figura 2.5, o qual consiste numa coluna de destilação da qual devemos extrair 2 produtos com distinta composição. O produto no topo da coluna deve ter uma composição yD = 0.99 (saı́da y1 ), no entanto que o produto da parte inferior de coluna deve ter uma composição xB = 0.01 (saı́da y2 ), para isso contamos com 2 magnitude a manipular: o refluxo L (entrada u1 ) e o vapor no intercambiador de calor V (entrada u2 ) Projeto Integrado e Sı́ntese 23 Figura 2.5: Sistema columna de destilação. O modelo em estado estacionário do sistema é, " G= 87.8 −86.4 # (2.33) 108.2 −109.6 As variáveis foram escaladas como discutido no apêndice B. (O conceito, a justificativa e a metodologia de escalamento de um sistema, encontra-se no apêndice B). A decomposição em valores singulares SVD de G é: " G= | 0.625 −0.781 0.781 #" 0.625 {z }| U 197.2 0 0 1.39 {z #" }| 0.707 −0.708 −0.708 −0.707 {z Σ Do primeiro vetor singular de entrada, υ = [0.707 #H } VH − 0.708]T , vemos que o ganho é 197.2 quando incrementamos uma entrada e decrementamos a outra entrada na mesma quantidade. Por outro lado, do segundo vetor singular de entrada, υ = [−0.708 − 0.707]T , vemos que se incrementamos ambas entradas na mesma proporção então o ganho é somente 1.39. A motivo disto é que a planta é tal que as duas entradas se contra-restam entre elas. Isto porque o processo de destilação é mal condicionado ao menos em estado estacionário, e o numero de condição é Projeto Integrado e Sı́ntese γ(G) = 197.2 1.39 24 = 141.7 Para sistemas dinâmicos os valores singulares e suas direções associadas variam com a freqüência. Para propósito de controle é a variação dos valores singulares no intervalo de freqüência correspondente a largura de banda em malha fechada que é de interesse principal. Para o sistema da coluna de destilação cuja matriz de transferência é: 1 G(s) = 75s + 1 " 87.8 −86.4 # 108.2 −109.6 os valores singulares do sistema em função da freqüência são mostrados na Figura 2.6 Singular Values 50 40 σ*(G(0)) σ*(G(jw)) Singular Values (dB) 30 20 10 0 σ*(G(0)) σ*(G(jw)) −10 −20 −30 MATLAB: sys=tf([87.8],[−86.4];[108.8],[−109.6],[75.1,1],[75.1,1];[75.1,1],[75.1,1]) sigma(sys) −40 −4 10 −3 10 −2 10 Frequency (rad/sec) −1 10 0 10 Figura 2.6: Valores singulares columna de destilação. Plantas não-quadradas O SVD é também util para plantas não quadradas. Por exemplo, considere uma planta com 2 entradas e 3 saı́das. Neste caso o terceiro vetor singular de saı́da, u3 , nos diz em qual direção de saı́da a planta não pode ser controlada. Similarmente, para plantas com mais entradas que saı́das, os vetores singulares de entrada adicionais nos dizem em que direções as entradas não tem efeito. Projeto Integrado e Sı́ntese 25 Uso do valor singular mı́nimo da planta O valor singular mı́nimo da planta, σ(G(jw)), avaliado como função da freqüência, é uma medida útil para avaliar a factibilidade de alcançar um controle aceitável. Se as entradas e saı́das foram escaladas como mostrado no apêndice B, então com uma entrada manipulada de magnitude unitária (medida através da norma-2), podemos alcançar uma magnitude de saı́da de pelo menos σ(G) em qualquer direção de saı́da. Geralmente desejamos que σ(G) seja o maior possı́vel. Valores Singulares para performance O valor singular máximo da planta é muito útil para analisar a performance e a robustez do sistema no domı́nio da freqüência. Considere um sistema cuja estrutura mostra-se na Figura 2.7, o qual apresenta um laço de realimentação negativa e tem um grau de liberdade (K). Figura 2.7: Diagrama de blocos de um sistema em malha fechada. A entrada ao controlador K(s) é r − ym onde ym = y + n é a medida da saı́da e n é o ruido de medida. Por tanto a entrada à planta é: u = K(s)(r − y − n) (2.34) O objetivo do controle é manipular u (projetar (K)) tal que o erro e se mantenha Projeto Integrado e Sı́ntese 26 dentro das especificações a pesar da perturbação d. O sinal erro e definido como: e=y−r (2.35) onde r denota o valor de referência para a saı́da. O modelo matemático da planta pode ser escrito como: y = G(s)u + Gd (s)d (2.36) e para um controlador de um grau de liberdade a substituição de 2.34 em 2.36 da como resultado: y = GK(r − y − n) + Gd d ou (I + GK)y = GKr + Gd d − GKn (2.37) por tanto a resposta em malha fechada é: y = (I + GK)−1 GK r + (I + GK)−1 Gd d − (I + GK)−1 GK n {z } {z } {z } | | | T S (2.38) T O erro é: e = y − r = −Sr + SGd d − T n (2.39) onde é usado o fato que I − T = S. O correspondente sinal de entrada a planta é: u = KSr − KSGd d − KSn (2.40) A seguinte notação e terminologia será usada: L = GK Funç~ ao de Laço S = (I + GK)−1 = (I + L)−1 Funç~ ao de Sensibilidade T = (I + GK)−1 GK = (I + L)−1 L Funç~ ao de Sensibilidade Complementaria S é a função de transferência em malha fechada da saı́da respeito a perturbação, no entanto T é a função de transferência em malha fechada da saı́da respeito a referência. S+T =I (2.41) Projeto Integrado e Sı́ntese 27 Para os sistemas SISO |S(jw)| avaliada como função da freqüência da informação útil sobre a efetividade do controle por realimentação. Por exemplo, é o ganho entre uma entrada sinusoidal de referência e o erro de controle, |e(w)|/|r(w)| = |S(jw)| Para sistemas MIMO uma generalização muito útil pode ser feita se considerarmos o quociente ke(w)k2 /kr(w)k2 , onde r é o vetor de referência na entrada, e é o vetor do erro de controle, e k · k é a norma-2 de um vetor. Como vamos explicar a seguir este ganho depende da direção de r(w) e sabemos por (2.29) que dito ganho esta delimitado pelos valores singulares máximo e mı́nimo de S. σ(S(jw)) ≤ ke(w)k2 ≤ σ(S(jw)) kr(w)k2 (2.42) Em termos da performance, é razoável requerer que o ganho ke(w)k2 /kr(w)k2 se mantenha pequeno para qualquer direção de r(w), incluindo a direção do pior caso cujo ganho é σ(S(jw)). Seja 1/|wP (jw)| (inversa da função peso de desempenho) o valor que representa a máxima magnitude permitida de kek2 /krk2 a cada freqüência. Isto resulta no seguinte requerimento de performance: σ(S(jw)) < 1/|wP (jw)| ⇔ σ(wP S) < 1, ∀w ⇔ kwP Sk∞ < 1 (2.43) onde a norma H∞ é definida como o pico do valor singular máximo da resposta em freqüência. kM (s)k∞ , max σ(M (jw)) w (2.44) Tipicamente a função peso de desempenho wP pode ser da forma: wP (s) = ∗ s/M + wB ∗ s + wB A (2.45) 1/|wP (jw)| representa a cota superior de |S(jw)|. Os valores singulares de S(jw) podem ser traçados em função da freqüência. Tipicamente, o gráfico será pequeno em baixas freqüências onde a realimentação é efetiva e aproximam-se a 1 em altas freqüências dado que qualquer sistema real e estritamente próprio: w → ∞ : L(jw) → 0 ⇒ S(jw) → I (2.46) Projeto Integrado e Sı́ntese 28 M 0 Magnitude 10 ∗ wB −1 10 A −2 10 −2 10 −1 10 0 10 Freqüência[rad/s] Figura 2.8: Inversa da função peso de desempenho. |1/wP (jw)| . 1 10 2 10 Gráfico exato e assintótico de O valor singular máximo, σ(S(jw)), usualmente possui um pico maior que 1 entorno da freqüência de corte. Este pico é indesejado mas inevitável para sistemas reais. Como para sistemas SISO definimos a largura de banda como a freqüência até onde a realimentação é efetiva (veja apêndice A). Para sistemas MIMO a largura de banda depende das direções, vamos ter uma região de largura de banda entre a menor freqüência onde o valor singular máximo, σ(S), alcança 0.7 (o menor ganho ou a direção do pior caso), e a maior freqüência onde o valor singular mı́nimo, σ(S), alcança 0.7 (o maior ganho ou a melhor direção). Se desejamos associar uma única freqüência de largura de banda a o sistema multi-variável, então consideramos a direção do pior caso (menor ganho), e definimos • Largura de banda, wB : a freqüência onde σ(S) cruza √1 2 = 0.7 por baixo. Então é entendido que a largura de banda é ao menos wB para qualquer direção do sinal de entrada (referência ou perturbação). Projeto Integrado e Sı́ntese 29 Número de condição e RGA Dois medidas usadas para quantificar o grau de direcionalidade e o nı́vel de interação entre as variáveis em um sistema MIMO, são o numero de condição e a matriz de ganhos relativos (RGA), respectivamente. Número de condição Definimos o numero de condição de uma matriz como u quociente entre o máximo e o mı́nimo valor singular, γ(G) , σ(G) σ(G) (2.47) A matriz com um numero de condição grande é dita mal condicionada. Para uma matriz não singular (quadrada) σ(G) = 1/σ(G−1 ), então γ(G) = σ(G)σ(G−1 ). Por tanto o número de condição será grande sé ambas G e G−1 possuem elementos grandes. O numero de condição depende fortemente do escalamentos, (o conceito, justificativa e a metodologia de escalamento de um sistema encontra-se no apêndice B), das entradas e saı́das. Sendo mais especifico, se D1 e D2 são matrices diagonais escaladas, então o número de condição das matrices G e D1 GD2 podem ser arbitrariamente longe entre si. Em geral, a matriz G deverá ser escalada em base a magnitudes fı́sicas, por exemplo, dividindo cada entrada e saı́da pelo maior valor esperado ou desejado como discutido no apêndice B. Más também podemos considerar minimizar o número de condição sobre todos os possı́veis escalamentos. Para achar o número de condição ótimo devemos resolver o seguinte problema de minimização, γ ∗ (G) = min γ(D1 GD2 ) D1 ,D2 (2.48) O número de condição pode ser usado como uma medida da controlabilidade entradasaı́da, e em particular pode ser postulado que um número de condição grande indica sensibilidade as incertezas. Isto não é verdade em geral, mas o contrário sim; se o número de condição é pequeno, então o efeito multi-variável das incerteza não são severas. Projeto Integrado e Sı́ntese 30 Matriz de ganho relativos (RGA) A matriz de ganhos relativos (RGA) de uma matriz quadrada não-singular é uma matriz quadrada definida como, RGA(G) = Λ(G) , G × (G−1 )T (2.49) onde × indica o produto elemento a elemento (produto de Schur ou Hadamard). Bristol (1966) originalmente introduz a matriz RGA como uma medida em estado estacionário da interação para um controle descentralizado. Infelizmente, por causa da definição original, muitas pessoas descartaram a RGA pois só era útil para w = 0. Mas, em muitos casos o valor da RGA a freqüências perto da freqüência de corte é muito importante. A RGA possui numerosas propriedades algébricas interessantes, as quais as mais importantes são: 1. É independente do escalamento das entradas e saı́das. 2. A soma das colunas e filas e igual a 1. P 3. A norma-soma (kAksoma = |aij |) da matriz RGA, kΛksoma , é muito próxima ao número de condição γ ∗ (equação 2.48). Isto significa que uma planta com grandes elementos na RGA é sempre mal condicionada (com um valor grande de γ(G)), mas a inversa não é valida (isto é uma planta com um grande γ(G) pode ter uma RGA com elementos pequenos) 4. Uma mudança relativa num elemento de G semelhante ao inverso negativo de seu correspondente elementos-RGA produz uma singularidade. 5. A RGA é a matriz identidade se G é triangular superior ou inferior. Da última propriedade segue que a RGA (o mais precisamente Λ(G) − I) da uma medida da interação entrada-saı́da. A definição da RGA pode ser generalizada a matrices não quadradas usando a pseudoinversa, (a pseudo-inversa de G é (GT G)−1 ). Além das propriedades algébricas mencionadas anteriormente, a matriz RGA possui numerosas propriedades de controle úteis: Projeto Integrado e Sı́ntese 31 1. RGA é um bom indicador da sensibilidade as incertezas: (a) Incertezas no canal de entrada. Plantas com elementos grandes na RGA ao redor da freqüência de corte são fundamentalmente difı́ceis de controlar pela sensibilidade as incertezas de entrada (por exemplo causada pelas incertezas ou omissão da dinâmica do atuador) (b) Elementos incertos. Como implicado pela propriedade algébrica 4 acima, um elemento grande na RGA implica sensibilidade a incerteza elemento a elemento. Entretanto, este tipo da incerteza não pode ocorrer na prática devido aos acoplamentos fı́sicos entre os elementos da função de transferência. Conseqüentemente, a incerteza diagonal da entrada (que está sempre presente) é geralmente de mais interesse para plantas com elementos-RGA grandes. 2. RGA e zeros no semi-plano direito. Se o signo de um elemento-RGA muda de s = 0 a s = ∞, então existe um zero no semi-plano direito em G ou em algum sub-sistema de G. 3. Plantas não-quadradas. Entradas extras: se a soma dos elementos na coluna da RGA é pequeno (<< 1), então se pode considerar suprimir a entrada correspondente. Saı́das extras: se todos os elementos de um fila de uma RGA são pequenos (<< 1), então a correspondente saı́da não pode ser controlada. 4. Dominância diagonal. A RGA pode ser usada para medir a dominância diagonal pela simples quantidade: RGA − number = kΛ(G) − Iksum (2.50) Para um controle descentralizado prefere-se emparelhamentos para a qual o numero RGA na freqüência de corte seja próximo a 1. 5. RGA e controle descentralizado. (a) Integridade: para plantas estáveis evitar emparelhamentos entrada-saı́da com elementos-RGA de estado estacionário negativos. Se não, se os subcontroladores são projetados independentemente cada um com ação integral, então as interações causarão instabilidade ainda quando toda as malhas sejam fechadas, ou quando a malha correspondente ao ganho relativo negativo tornase inativo (por exemplo por causa da saturação). Interessante, este é o único uso da RGA relacionado diretamente à definição original de Bristol. Projeto Integrado e Sı́ntese 32 (b) Estabilidade: Preferir os emparelhamentos que correspondam a um númeroRGA perto de 0 nas freqüências de corte. Exemplo 2.4 Considere a planta diagonal G, calcule a RGA e o número de condição, " G= 100 0 0 1 # , Λ(G) = I, γ(G) = σ(G) 100 = = 100, γ ∗ (G) = 1 σ(G) 1 (2.51) Aqui o número de condição e grande o que significa que o ganho da planta depende fortemente das direções de entrada. No entanto, dado que planta é diagonal não a interação por tanto Λ(G) = I é γ ∗ (G) = 1, e normalmente não é esperado sensibilidade as incertezas. Exemplo 2.5 Considere novamente o processo de destilação mostrado no exemplo 2.3, para a qual temos a matriz de ganhos em estado estacionário, " G= 87.8 −86.4 # (2.52) 108.2 −109.6 " G−1 = # (2.53) 0.394 −0.320 " Λ(G) = 0.399 −0.315 35.1 −34.1 −34.1 35.1 # (2.54) Neste caso γ(G) = 197.2/1.391 = 141.7 é somente ligeiramente maior que γ ∗ (G) = 138.268. A magnitude da soma dos elementos da matriz RGA é kΛksum = 138.275. O número de condição é grande, mas como o valor singular mı́nimo σ(G) = 1.391 é maior que 1 isto por si não implica um problema de controle. Entretanto, os elementos-RGA grandes indicam problemas no controle, e problemas fundamentais do controle esperamse se a análise mostrar que G(jw) tem elementos-RGA também na região de freqüência perto da freqüência de corte. 2.3 Projeto Integrado de Processos e Controle Na tarefa de Projeto Integrado se consideram simultaneamente objetivos de controle e objetivos econômicos, que podem traduzir-se em encontrar os parâmetros fı́sicos da Projeto Integrado e Sı́ntese 33 planta e um ponto em estado estacionário que minimize o custo de construção e operação ao mesmo tempo que satisfaça certas caracterı́sticas de controlabilidade. O problema pode formular-se da seguinte maneira, (Luyben 1993): “Dada varias configurações da planta concebida para a realização de um conjunto de tarefas (reações, separação, aquecimento, etc) e dado um conjunto de variáveis controladas, manipuladas e de perturbação, que estão relacionas através de um modelo matemático, o objetivo fundamental é determinar a configuração ótima ou de melhor compromisso do processo entre os objetivos econômicos e de controle.” Esta formulação não especifica qual é o objetivo particular do controle ou como pode obter-se a melhor solução de compromisso, o problema de projeto integrado pode formularse como um problema de otimização multi objetivo que facilita a liberdade de estabelecer um certo número o tipo de objetivos, este não só tem que ter em conta a controlabilidade, podem envolver objetivos de segurança ou meio ambientais por exemplo. A determinação da melhor solução de compromisso recai no usuário, quem deve escolher em dependência as suas prioridades qual é a que ele considera a melhor solução. Se as caracterı́sticas de controlabilidade que se estabelecem na etapa de projeto consideram o comportamento do sistema em malha aberta, o problema é dirigido a encontrar a configuração ótima, tendo em conta aquela estrutura que resulte mais econômica. Se o que se persegue fixar é o comportamento do sistema em malha fechada, o problema conduz a determinar a estrutura de menor custo e os parâmetros ótimos do regulador que cumpram com os requerimentos estabelecidos. 2.3.1 Procedimento Geral de Projeto Integrado O procedimento de Projeto Integrado e executado seguindo os passos que se apresentam a continuação: 1. Proposta de diferentes estruturas alternativas Se propõem diferentes estruturas do processo e se determinam os objetivos econômicos e de controle que sejam de interesse. 2. Modelado das estruturas Formula-se um modelo matemático de conhecimento de todas as estruturas pro- Projeto Integrado e Sı́ntese 34 postas e expressam-se as magnitudes de controlabilidade (em malha aberta ou malha fechada) em função das variáveis de projeto desconhecidas a partir dos modelos linearizados de cada planta. 3. Obtenção dos parâmetros fı́sicos da planta A solução do problema que se apresenta conduz a solução de um problema de otimização multi objetivo não linear com restrições que formula-se da seguinte maneira: min x sujeito a : U [f1 (x), f2 (x), . . .] h(x) = 0 g(x) ≤ 0 x∈X Onde: U : representa o ı́ndice a minimizar e que relaciona os diferentes objetivos. f1 (x), f2 (x), . . .: representam os objetivos de controle, econômicos e outros. h(x): representa as equações de balanços e equilibrios do processo. g(x): representa as restrições do processo, fı́sicas e de controle. x: representa os parâmetros de dimensionamento e fı́sicos das unidades, a composição, temperaturas, etc. 4. Obtenção da melhor solução de compromisso A melhor solução a um problema com múltiplos objetivos, consiste de aquelas soluções onde um objetivo pode ser melhorado unicamente a expensas dos outros objetivos. Existem algoritmos de otimização multi objetivos (MOP), que acham de maneira automática a melhor solução de compromisso. No caso de projeto integrado em malha aberta, os objetivos de controle e econômicos que podem impor-se podem ser por exemplo: • minimizar o custo de operação e construção, • minimizar o número de condição de perturbação, • minimizar a distancia a 1 dos elementos positivos da RGA • incluir dentro das restrições outras magnitudes de interesse relacionadas com a operabilidade e flexibilidade das plantas. Projeto Integrado e Sı́ntese 35 No caso de projeto integrado onde considera-se o sistema em malha fechada, os objetivos que podem impor-se, podem ser por exemplo: • minimizar o custo de construção da planta, • minimizar o número de condição da perturbação, • minimizar o ganho da matriz de transferência em malha fechada respeito a matriz de transferência em malha aberta, • incluir nas restrições localização dos pólos da matriz de transferência em malha fechada. A seguir mostram-se dois exemplos de projeto integrado que permitem ilustrar as vantagens que podem obter-se com esta metodologia. Os dois exemplo são uma contribuição deste trabalho preliminar, trata-se do projeto integrado de um conversor de potência, o CBB. 2.3.2 Exemplo: Projeto Integrado de un CBB e um controlador PID. A Figura 2.9 mostra o circuito de um CBB ideal. S D - V CC L C R Vo + Figura 2.9: Diagrama do CBB. O CBB é um conversor DC-DC tı́pico, normalmente usado como fonte de alimentação. A principal propriedade deste conversor é que sua tensão de saı́da (V0 ) é ajustável podendo ser maior ou menor que a tensão continua primaria (Vcc ). Do ponto de vista do controle o objetivo deste sistema é fornecer uma tensão de saı́da que possa seguir uma referência desejada de tensão e rejeitar as perturbações causadas pelas variações de carga representadas na Figura 2.9 pela resistência R. Para fazê-lo, uma adequada estratégia de controle deve ser definida para atuar no interruptor S. Projeto Integrado e Sı́ntese 36 O CBB pode operar em dois modos diferentes. Se a corrente no inductor L não é zero o CBB opera no modo de condução contı́nuo. Se não o modo descontı́nuo de operação é considerado. Tipicamente, dois modelos de CBB são usados na literatura. O modelo instantâneo que considera todos os fenômenos dinâmicos relacionado à operação de interruptor. E o modelo médio que não considera as dinâmicas de interruptor mas só o comportamento dominante causado pelos outros elementos do circuito, (Middlebrook e Cúk 1976, Vorpérian 1990, Kassakian et al. 1991). Modelo Instantâneo. Para obter o modelo instantâneo do CBB, é definido q como um sinal que caracteriza o comportamento dinâmico do interruptor: ( S: q = 0, se a chave esta aberta q = 1, se a chave esta fechada Assim, dois conjuntos de equações diferenciais descrevem o comportamento do CBB. Se q = 0: diL 1 = vC dt L dvC 1 vC = (−iL − ) dt C R V0 = −vC (2.55) (2.56) (2.57) e se q = 1: 1 diL = Vi dt L 1 vC dvC = − dt C R V0 = −vC (2.58) (2.59) (2.60) Projeto Integrado e Sı́ntese 37 Combinando estes dois sub-sistemas o modelo instantâneo do CBB é obtido: diL 1 = (qVi + (1 − q)vC ) dt L dvC 1 vC = − ( + (1 − q)iL ) dt C R V0 = −vC (2.61) (2.62) (2.63) que é um modelo com variáveis reais (iL , vC ) e inteiras (q). Modelo Médio. O modelo médio é obtido usando o modelo instantâneo e algumas hipóteses de simplificação. Assumindo que a freqüência de comutação do interruptor é muito maior que as freqüências associadas à transferência de energia dos elementos passivos do circuito (R, L, e C) é possı́vel substituir o sinal instantâneo de controle q(t) pelo sinal d(t) que dá, em cada instante de tempo t, o valor médio de q(t) num perı́odo de comutação. Usando esta aproximação, o modelo pode ser representado pelo seguinte conjunto de equações (Borges 2002): dibL 1 = (dVi + (1 − d)c vC ) dt L dc vC 1 vc C = − ( + (1 − d)ibL ) dt C R V0 = −c vC (2.64) (2.65) (2.66) Projeto Inicial. O projeto tradicional de um CBB como o da Figura 2.9, começa com um conjunto dado de especificações tal como: • Fonte de tensão Vcc = Vi • Intervalo da tensão de saı́da em que deve operar o CBB, V0 ∈ [V0min , V0max ], e • Intervalo de carga a qual será submetido o CBB, R ∈ [Rmin , Rmax ]. e finaliza na determinação dos valores dos componentes do circuito, isto é: indutância L, capacitância C e o perı́odo T do modulator de largura de pulso (PWM) conectado entre Projeto Integrado e Sı́ntese 38 o controle e o interruptor (S), tal que os seguintes requisitos de estado estacionário sejam totalmente cumpridos: • O CBB deve trabalhar em modo contı́nuo de condução, isto é, iL (t) ≥ 0, ∀t. Então, idealmente, igualando a energia entregada pela fonte primaria à energia consumida pelo carga R: E(f onte) = E(carga) V02 Vi ibS = R 2 Vi d T V02 Vi ≥ 2L R Portanto V02 1 Vi2 R 2 − Td ≥ 0 2 L (2.67) Onde ibS é a corrente média pelo interruptor no limite de modo de condução contı́nua e pode ser calculada como: Vi d2 T ibS = 2L sendo d a fração de T que corresponde a posição fechada do interruptor S. • A ondulação da corrente pelo inductor deve ser menos que 5%, isto é, 4iL ≤ 5%, então: Porque, 4iL = Vi T d ≤ 0.05ibL L Vi T d, L (2.68) pode ser obtida integrando a equação (2.58). • A ondulação de tensão no capacitor deve ser menos que 5%, 4vC ≤ 5%, então: (1 − d)T b Vi [iL − ] ≤ 0.05c vC C R (2.69) Para calcular (2.69) supusemos que se q = 0, então a corrente do capacitor é a diferença entre a corrente pelo inductor L e a corrente na carga R, iL − IR C Sendo esta corrente responsável pelas ondulação de tensão. Uma aproximação de primeira ordem leva a: 4vC = (1 − d)T b Vi [iL − ] C R Projeto Integrado e Sı́ntese 39 portanto a (2.69) Todos estes requisitos devem ser cumpridos ∀V0 ∈ [V0min , V0max ] e ∀R ∈ [Rmin , Rmax ]. Um estudo do pior caso permite escolher um conjunto de valores que satisfazem as especificações acima citadas. Um exemplo de tal conjunto é dado na Tabela 2.1. Opcionalmente, um procedimento de otimização sob o modelo e restrições de especificação podem ser usados para escolher tal conjunto com um critério econômico. Elemento Valor Tensão da fonte (Vi ) 48V Resistência (valor min) (Rmin ) 40Ω Resistência (valor max) (Rmax ) 120Ω Tensão de saı́da (valor min) (VoM in ) 12V Tensão de saı́da (valor max) (VoM ax ) 100V Indutância (H) 5.2 ∗ 10−3 Hy Capacitância (C) 2.6355 ∗ 10−6 F Freqüência de chaveamento (T ) 3.3823 ∗ 10−6 s Tabela 2.1: Parâmetros do CBB. Uma vez o CBB foi projetado, um controlador de baixo de custo, como por exemplo um PID com uma lei de controle da forma: d = KP + KI + s KD +1 1 s N (2.70) pode ser sintonizado para manter a tensão de saı́da num valor desejado apesar das mudanças na carga. Mas isto não é fácil dado que o CBB é um dispositivo não-linear com um vasto leque de condições operativas e que pode ser submetido a mudanças significativas na carga. Então o procedimento de sintonização do controlador PID realizado foi o seguinte: linearizou-se o modelo do CBB no meio do intervalo de operação e para com este modelo sintonizou-se o PID. Em seguida comprovou-se o desempenho do CBB operando em malha fechada para todo o intervalo de operação desejado. O conjunto de parâmetros do PID obtido para o ponto de operação V0 = 56V e R = 80Ω, correspondente ao CBB de tabela 2.1, é dado na tabela 2.2. Onde N é a constante de tempo do filtro da ação derivativa. Projeto Integrado e Sı́ntese 40 Element Value KP −6.8688 ∗ 10−4 KI 0.7004 KD 1.3188 ∗ 10−6 N 446.0379 Tabela 2.2: Parâmetros do PID. Projeto Integrado. No projeto da planta analisada na seção anterior, a dinâmica e as caracterı́sticas de controle não são levadas em conta. Só uma vez a planta foi projetada, a tarefa de achar os melhores parâmetros para o controlador é que começa, restritos pelos limites imposto pelo projeto do CBB. Um alternativa é integrar ambas fases calculando simultaneamente o valor dos componentes do CBB e a sintonia do controlador PID satisfazendo as restrições operacionais e de controle. Além do mais, para garantir um desempenho adequado em todo o intervalo de operação, uma metodologia de projeto chamada: projeto multi-ponto, será introduzida. Os elementos chave da metodologia proposta de projeto integrado são: 1. Uma estrutura do processo do sistema a ser projetado primeiramente é proposto. Pode ser uma já fixada, tal como a estrutura mostrada na Figura 2.9, ou a mesma sujeita a modificações. Por simplicidade, não consideraremos a última possibilidade. 2. Um modelo matemático do processo é formulado. Em nosso caso corresponde ao conjunto de equações ( 2.64,2.65,2.66). 3. A estrutura de controle é definida e o modelo matemático é aumentado com as equações do controlador, em nosso caso (2.70). O resultante modelo de malha fechada é uma função dos ainda desconhecidos parâmetros do processo e do controle. 4. As especificações e restrições de operabilidade, concernentes ambas ao estado estacionário do processo e a resposta dinâmica do sistema, são adicionadas e formuladas como um conjunto de pontos de operação a ser escolhidos cobrindo o intervalo de funcionamento desejado. Exemplos das restrições em estado estacionário são (2.67,2.68,2.69). Se necessário, algumas caracterı́sticas dinâmicas podem ser impostas sob as magnitudes obtidas dos modelos linearizados calculados em cada um dos pontos de operação. Projeto Integrado e Sı́ntese 41 5. A seleção dos parâmetros do processo e controle é feito por otimização de um função custo F (x) que reflete objetivos econômico e de desempenho, em relação à variável de decisão x, que inclui os parâmetros desconhecidos de projeto, sob as restrições do modelo e as especificações descritas anteriormente, tanto em forma de igualdade ou forma de desigualdade: P : Minimize F (x) x Subject to: g(x) ≤ 0 h(x) = 0 x∈R Em nosso caso, por simplicidade, a função custo F (x) inclui somente termos de desempenho que correspondem aos erros quadráticos acumulados em quatro experimentos representativas cobrindo as piores situações extremas de operação: Z F (x) = Z e21 dt + Z e22 dt Z e23 dt e24 dt (2.71) Os erros ei são definidos como as diferenças entre o set-point (tensão de saı́da desejada) e a real calculada através do modelo em malha fechada. Desta forma F (x) inclui uma medida de respostas dinâmicas relevantes. Como a caracterı́stica principal de um conversor de potência é dada por sua capacidade de rejeitar perturbações, isto é, mudanças na carga, e em nosso caso tem que operar entre 12V e 100V , os quatro experimentos selecionadas foram: • com uma tensão de referência de 12V , o carga R foi mudada de 40Ω a 120Ω. • com uma tensão de referência de 12V , o carga R foi mudada de 120Ω a 40Ω. • com uma tensão de referência de 100V , o carga R foi mudada de 40Ω a 120Ω. • com uma tensão de referência de 100V , o carga R foi mudada de 120Ω a 40Ω. O F (x) foi calculado simulando quatro vezes o sistema em malha fechada. Cada simulação corresponde a um valor dado da variável de decisão x = [L C T KP KI KD N ]T . As restrições (2.67, 2.68, 2.69) também são avaliadas em cada um dos quatro estados estacionários dado na tabela 2.3 correspondente com as quatro experiências. Projeto Integrado e Sı́ntese 42 i 1 2 3 4 V0 12 12 100 100 R 120 40 120 40 Tabela 2.3: Pontos de Operação. Finalmente, um conjunto de restrições dinâmicas adicionais são impostas para garantir estabilidade e o tipo de resposta em malha fechada. Estas restrições correspondem aos pólos em malha fechada do sistema, os quais deveram estar contidos na região mostrada na Figura 2.10. O calculo dos pólos é feito através do modelo linearizado em malha fechada Figura 2.10: Região permitida para os autovalores em malha fechada. em cada um dos quatro pontos de operação selecionados. Note que, neste caso, o ponto de operação será escolhido pelo operador dentro do intervalo especificado, por tanto, a tensão de saı́da não é dada pelo projeto. Em outros casos de projeto integrado, o objetivo pode ser especificado em termos de custos dos componentes e especificações tal como consumo de energia. Então o melhor ponto de operação pode ser selecionado pela otimização, cumprindo as restrições. Projeto Integrado e Sı́ntese 43 Resultado. O projeto integrado então é formulado como a solução do problema não linear de programação: Minimize F (x) x Subject to: [2.61][2.62][2.63] ∀t [2.64][2.65][2.66] ∀t [2.67] i = 1, 2, 3, 4 [2.68] i = 1, 2, 3, 4 [2.69] i = 1, 2, 3, 4 poles(Ai , Bi , Ci ) ∈ C i = 1, 2, 3, 4 x ∈ Rn Onde: x = [L C T KP KI KD N ]T F (x) = R e21 dt + R e22 dt R e23 dt R e24 dt n=7 Ai (x), Bi (x), Ci (x), corresponde aos modelos linearizados em cada um dos quatro pontos selecionados. O algoritmo de programação quadrática seqüencial (SQP) implementado em Matlabr foi usado para resolver o problema. Os parâmetros ótimos de projeto são dados na tabela 2.4. Respostas comparativas das soluções com e sem projeto integrado são mostrados na Figuras 2.11 e 2.12 para as quatro experiências. Como podemos ver, o CBB projetado levando em conta a dinâmica em malha fechada, mostra desempenho superior que o CBB projetado pelo método tradicional. Projeto Integrado e Sı́ntese 44 Parâmetros L C T KP KI KD N Valor 5.2 ∗ 10−3 H 3.2220 ∗ 10−4 F 3.3334 ∗ 10−6 4.7158 ∗ 10−4 1.0158 1.8806 ∗ 10−5 824.7588 Tabela 2.4: Solução Os problemas de projeto integrado, incorporando caracterı́sticas de controle tanto em malha aberta como fechada, são complexos. Isto á devido, fundamentalmente, ao tamanho do problema em si e as não-linearidades das equações que devem-se resolver. As técnicas matemáticas de programação não sempre garantem uma solução global ao problema. Além do mais, o tempo de cálculo pode ser significativo. Mas neste sentido, devemos salientar que o projeto é feito fora de linha, por tanto o tempo de cálculo não é um fator importante na hora de aplicar esta metodologia de projeto. Outro ponto a mencionar é que técnicas de programação estocásticas podem ser usadas na procura do ótimo global como uma alternativa. 2.3.3 Exemplo: Projeto Integrado de un CBB e um CMD. Seja o mesmo conversor elevador-redutor do exemplo anterior, onde foi considerado, fazendo certas suposições, o seu correspondente modelo médio para realizar o projeto. A seguir, vamos a realizar o projeto do CBB mas agora considerando o mesmo como um sistema hı́brido, ou seja um sistema que mistura variáveis continuas (tensão e corrente) e variáveis discretas (sinal de controle sobre a chave {0, 1}), e por tanto vamos realizar o projeto em base a seu modelo instantâneo. Para isso primeiro vamos ter que definir uma nova estrutura para o controlador que permita levar em conta a caracterı́stica hı́brida do sistema, e por tanto atue diretamente sobre a chave e não mais sobre o PWM que facia as vezes de “conversor de sinal contı́nuodiscreto”. Projeto Integrado e Sı́ntese 45 Vref = 12V 120 100 R(Ω) 80 60 40 20 0 0.15 0.16 0.17 0.18 Time(s) 0.19 0.2 0.21 1 Initial Design Integrated design e(V) 0.5 0 −0.5 −1 0.15 0.16 0.17 0.18 Time(s) 0.19 0.2 0.21 Figura 2.11: Resposta comparativa nas experiências 1 e 2. Controle por Modos Deslizantes (CMD) O controle por modos deslizantes (CMD) é uma técnica de controle não-linear ampliamente estudada na literatura e tem sido aplicada com bons resultados nos sistema de estrutura variável, (Borges 2002), sistemas que apresenta descontinuidades nas equações que o modelam. Devido a essas descontinuidades a maioria das ferramentas matemáticas desenvolvidas para equações diferenciais e sistemas dinâmicos não são aplicáveis pois pressupõem a continuidade das equações, (Itkis 1976) (Utkin 1974 (English Translation 1978)). Essencialmente a lei de controle para sistemas de estrutura variável atua direcionando as trajetórias do sistema a una variedade do plano de fase chamada superfı́cie de deslizamento ou de comutação e uma vez nela se mantém confinada a essa variedade dando origem a que se conhece como modo deslizante. A trajetória de um modo deslizante não verifica a equação diferencial ordinaria (EDO) Projeto Integrado e Sı́ntese 46 Vref = 100V 120 100 R(Ω) 80 60 40 20 0 0.15 0.16 0.17 0.18 Time(s) 0.19 10 0.2 0.21 Initial Design Integrated Design e(V) 5 0 −5 −10 0.15 0.16 0.17 0.18 Time(s) 0.19 0.2 0.21 Figura 2.12: Resposta comparativa nas experiências 3 e 4. de nenhuma das estruturas, mas ela existe como solução global do problema. As superficies de comutação são projetadas de tal maneira que o movimento dos estados do sistema confinados à mesma exibam o comportamento desejado de regulação o tracking. Consideremos o seguinte sistema ao qual devemos projetar un controlador por modos deslizantes, (Mattavelli et al. 1993): ẋ = f (x, t, u) onde: x ∈ D ⊆ Rn é o vetor de estados. f : D × Rn → Rn é uma função vectorial. u é a entrada de controle. (2.72) Projeto Integrado e Sı́ntese 47 Seja σ(x, t) : D × R → R uma função continua com gradiente não nulo em D, a partir da qual definimos a seguinte superfı́cie: S = {(x, t) ∈ D × R, σ(x, t) = 0} (2.73) que chamamos de superfı́cie de comutação e será projetada de forma tal que a lei de controle: ( u(x, t) = u+ (x, t) se σ(x, t) > 0 u− (x, t) se σ(x, t) < 0 (2.74) direcione as trajetórias do sistema em direção à mesma e que contenha o ponto de equilı́brio que desejamos alcançar em estado estacionário. A função f vai apresentar então, uma descontinuidade em S devido a essa ação de controle: ( f (x, t, u) = f + (x, t, u+ ) se σ(x, t) → 0+ f − (x, t, u− ) se σ(x, t) → 0− (2.75) Para que um modo deslizante exista as trajetórias do sistema das duas sub-estruturas, correspondentes aos dois diferentes valores do vetor função f , devem estar direcionados à superfı́cie de deslizamento o de comutação. Então: lim fi+ < 0 ⇒ σ→0+ lim ∇σ.f + < 0 σ→0+ (2.76) lim fi− > 0 ⇒ σ→0− lim ∇σ.f − > 0 σ→0− i representa os componentes do vetor ẋ, e ∇σ é o gradiente de função σ. Como: n dσ X ∂σ dxi = = ∇σ.f dt ∂xi dt i=1 (2.77) então a condição de existência dos modos deslizantes pode formular-se nos seguintes termos: lim+ σ→0 dσ dt <0 ⇒ lim σ dσ <0 dt σ→0 lim dσ σ→0− dt >0 (2.78) Projeto Integrado e Sı́ntese 48 A região do espaço de estados: Ω = {(x, t) ∈ D × R, σ(x, t)σ̇(x, t) < 0} (2.79) define a região de existência dos modos deslizantes. Por tanto o domı́nio dos modos deslizantes queda definido em: ψ =S∩Ω (2.80) Modos deslizantes puros aparecem apenas quando x ∈ S, ∀t > 0 na região Ω, o que demanda uma freqüência de comutação infinitamente alta, não alcançável em sistemas reais. A limitação em freqüência resulta em um movimento dentro da vizinhança da superfı́cie de comutação, chamada de fenômeno de chattering. Em sistemas reais o controle apresenta um comportamento de histérese. Na figura 2.13 mostra-se o esquema básico de controle por modos deslizantes. Figura 2.13: Esquema básico de controle. A curva de comutação é uma combinação linear das variáveis de estado, isto resulta numa implementação muito simples do controle real: S = (x, t) ∈ D × R, σ(x, t) = k(iL − iLe ) + (vC − vCe ) = 0 onde: (2.81) Projeto Integrado e Sı́ntese 49 (iLe , vCe ), é o ponto de equilı́brio que desejamos alcançar em estado estacionário. k, é um parâmetro de projeto. A lei de controle comutado é: ( q(t) = 0 si σ(x, t) > +β 1 si σ(x, t) < −β (2.82) Em uma implementação real o erro da corrente no inductor, (iL − iLe ), calcula-se através de um filtro passa alto (HPF), o que faz que necessariamente o valor médio em estado estacionário deste erro seja 0. Se a função de comutação S devido à histerese no controle não tem valor médio nulo, então aparecerá um erro em estado estacionário na tensão de saı́da. Este problema resolve-se colocando un controle PI na função de deslizamento S. A ação integral só atua quando o sistema está sobre a superfı́cie de deslizamento e desta forma não afeta o comportamento do sistema durante o transitório. Outros refinamentos aplicados no controle em um esquema real são: limitar a corrente maxima pelo inductor e eliminar a dependência da freqüência de chaveamento com o ponto de operação. A figura 2.14 mostra o esquema real de controle por modos deslizantes para o CBB. Neste trabalho por simplicidade o esquema de controle a ser usado em simulação é o que mostra-se na Figura 2.15 Onde: K τ −4.1025 1e − 3 O ganho K determinou-se a partir de imposição das condições de existência dos modos deslizantes e a constante de tempo do filtro se determinou usando a regra prática que indica que esse tempo deve ter um valor próximo à constante de tempo natural do sistema. Projeto Integrado tomando em conta requisitos de controle. Na seção anterior, o projeto do circuito do CBB e do sistema de controle foram executados em dois passo independentes. Só depois que o circuito do CBB foi projetado a tarefa de achar os melhores parâmetros para o controlador foi começada, restringido pelos Projeto Integrado e Sı́ntese 50 Figura 2.14: Esquema real de controle. limites imposto do projeto do CBB. Uma alternativa é integrar ambas tarefas calculando simultaneamente os valores dos componentes do CBB e os parâmetros do controlador, satisfazendo ambos, restrições operacionais e de controle. A seguir mostra-se o desenvolvimento desta alternativa. Os elementos chave da metodologia proposta de projeto integrado são as mesmas que apontadas no exemplo anterior. Uma estrutura do processo do sistema a ser projetado primeiramente é proposto, (Figura 2.9). Um modelo matemático do processo é formulado. Em nosso caso corresponde ao conjunto de equações (2.61, 2.62, 2.63). A estrutura de controle é definida. As especificações e restrições de operabilidade, concernentes ambas ao estado estacionário do processo e a resposta dinâmica do sistema, são adicionados e formuladas como um conjunto de pontos de operação a serem escolhidos cobrindo o intervalo de funcionamento desejado. A seleção dos parâmetros do processo e controle é feito por otimização de um função custo F (x) que reflete objetivos econômico e de desempenho, em relação à variável de decisão x, que inclui os parâmetros desconhecidos de projeto, sob as restrições do mod- Projeto Integrado e Sı́ntese 51 Figura 2.15: Esquema simulado. elo e as especificações descritas anteriormente, tanto em forma de igualdade ou forma de desigualdade: P : Minimize F (x) x Sujeito a: g(x) ≤ 0 h(x) = 0 x∈R Neste exemplo será usada a mesma função de custo do exemplo anterior, para o caso do PID, a qual inclui somente termos de desempenho que correspondem aos erros quadráticos acumulados em quatro experimentos representativos, (os mesmos do exemplo anterior), cobrindo as situações extremas de operação: F (x) = e21 dt + Z Z Z Z e22 dt e23 dt e24 dt (2.83) Os erros ei são definidos como as diferenças entre a referência (tensão de saı́da desejada) e a real calculada através do modelo em malha fechada. O F (x) foi calculado simulando quatro vezes o sistema em malha fechada. Cada simulação coincide a um valor dado da variável de decisão x = [L C K τ ]T . As restrições Projeto Integrado e Sı́ntese 52 (2.67, 2.68, 2.69) também são avaliadas em cada um dos quatro estados estacionários dados na tabela 2.3 correspondentes com as quatro experiências. Note que, como o ponto de operação será escolhido pelo operador dentro de um intervalo especificado, a tensão de saı́da não é dada pelo projeto. Em vez disso, um projeto global “multiponto”foi escolhido para tratar com a variabilidade do ponto de operação e da perturbação (carga), fornecendo um desempenho robusto ao conjunto CBB-controlador. Resultado. Os parâmetros ótimos de projeto obtidos são mostrados na tabela 2.5. Parâmetro L C K τ Valor 1.47 ∗ 10−3 H 2.94 ∗ 10−4 F −4 1 ∗ 10−4 Tabela 2.5: Solução obtida com o projeto integrado Respostas comparativas da solução inicial e do projeto integrado são mostrados nas Figuras 2.16 e 2.19 para as quatro experiências. Como podemos ver novamente, o CBB projetado levando em conta a dinâmica em malha fechada, mostra desempenho superior que o CBB projetado pelo método tradicional. 2.4 Sı́ntese de Processos e Controle Anteriormente, partindo de uma estrutura da planta já dada, obtém-se o custo mı́nimo da mesma, satisfazendo certas caracterı́sticas de controlabilidade impostas. O problema abordado nesta seção, difere do anterior, em que trata-se de obter a estrutura ótima da planta, junto com os parâmetros fı́sicos que minimizem seu custo, e os parâmetros ótimos do controlador que verifiquem com as condições de controlabilidade fixadas previamente de forma simultânea, este problema se resolve no contexto da Otimização Não-Linear Mista-Inteira. Projeto Integrado e Sı́ntese 53 14 Vref V com Proj. Integrado O 13.5 VO sem Proj. Integrado 13 VO(V) Detalhe A Detalhe B 12.5 12 11.5 11 10.5 0.05 0.06 0.07 0.08 0.09 0.1 0.11 tempo(s) 0.12 0.13 0.14 0.15 Figura 2.16: Resposta comparativa nas experiências 1 e 2. Detalhe A Detalhe B 12.2 Vref Vref V com Proj. Integrado O 12.3 V com Proj. Integrado O 12.1 V sem Proj. Integrado V sem Proj. Integrado O O 12 VO(V) VO(V) 12.2 12.1 11.9 11.8 12 11.7 11.9 11.6 11.8 0.0495 0.05 0.0505 0.051 tempo(s) 0.0515 0.052 Figura 2.17: Detalhe A. 2.4.1 11.5 0.099 0.0995 0.1 0.1005 tempo(s) 0.101 0.1015 Figura 2.18: Detalhe B. Sı́ntese de Processos Nishida et al. (1974), definiu: “a sı́ntese de processos é um ato de determinar a interconexão ótima entre as unidades do processo como também o tipo, o número e o desenho das unidades dentro do sistema de processos, isto implica selecionar um sistema particular dentro de um sistema geral que contenha o comportamento especificado”. O problema de sı́ntese de processos pode estabelecer-se como segue: dada as especificações de entrada e as especificações de saı́da, obter um diagrama de fluxos do processo que transforme as entradas dadas a um produto desejado, levando em conta os custes de construção e exploração, a qualidade do produto, requerimentos meio ambientais, se- Projeto Integrado e Sı́ntese 54 130 Vref V com Proj. Integrado O 120 VO sem Proj. Integrado Detalhe A VO(V) 110 Detalhe B 100 90 80 70 0.05 0.06 0.07 0.08 0.09 0.1 0.11 tempo(s) 0.12 0.13 0.14 0.15 Figura 2.19: Resposta comparativa nas experiências 3 e 4. Detalhe A Detalhe B 108 104 Vref 107 Vref VO com Proj. Integrado VO com Proj. Integrado 102 VO sem Proj. Integrado 106 VO sem Proj. Integrado 105 100 103 VO(V) VO(V) 104 102 101 98 96 100 99 94 98 0.0495 0.05 0.0505 0.051 0.0515 0.052 tempo(s) 0.0525 0.053 0.0535 Figura 2.20: Detalhe A. 92 0.0995 0.1 0.1005 0.101 0.1015 0.102 0.1025 0.103 0.1035 0.104 0.1045 tempo(s) Figura 2.21: Detalhe B. gurança e operabilidade. Isto conduz a solução de três problemas fundamentalmente, (Floudas 1995): 1. ¿Quais são as unidades do processo que devem ser incluı́das no processo? 2. ¿Como devem ser interligadas as unidades do processo? 3. ¿Que condição de operação e dimensões devem ter as unidades do processo? O uso da otimização na sı́ntese de processos tem-se desenvolvido e focado na solução destes problemas. A mesma involucra três passos: Projeto Integrado e Sı́ntese 55 1. A representação das estruturas alternativas do processo a traves de uma superestrutura do processo. 2. O modelo matemático da super-estrutura. 3. O desenvolvimento e utilização de um algoritmo para a solução do modelo matemático. Cada uma das três etapas é crucial para a determinação da estrutura ótima do diagrama de fluxos do processo. A super-estrutura é, um super-conjunto de todos os projetos de interesse alternativos ao processo. A representação dos processos alternativos baseia-se conceitualmente na idéia da teoria dos grafos. Os nodos utilizam-se para representar as entradas, as saı́das e cada unidade da super-estrutura. As flechas em uma direção representam as conexões desde as entradas das unidades do processo, e as conexões da saı́da, as flechas de dupla direção representam as interconexões de realimentação entre as unidades do processo, (Floudas 1995), veja um exemplo na figura 2.22. Figura 2.22: Representação da super-estrutura. Uma vez definida a árvore é necessário construir um modelo matemático da mesma utilizando variáveis contı́nuas e binárias, as variáveis binárias são utilizadas para indicar a existência ou não dos nodos dentro da rede e as variáveis contı́nuas representam os nı́veis Projeto Integrado e Sı́ntese 56 dos valores a traves das flechas. A formulação resultante é um Problema de Programação Não Linear Mista Inteira (MINLP), que se mostra a continuação: min x,y sujeito a : f (x, y) h(x, y) = 0 g(x, y) ≤ 0 (2.84) x ∈ X ⊆ Rn y ∈ Y ⊆ {0, 1}m onde: x: é um vetor de n variáveis contı́nuas que representam os fluxos, as composições, temperaturas, pressões, e tamanhos das unidades do processo. y: é um vetor de m variáveis binárias que representam as alternativas do processo. f (x, y): é uma função de um objetivo que representa o critério de projeto. h(x, y) = 0: são q restrições de igualdade que representam os balanços de massa e energia, e as expressões de equilı́brio do processo. g(x, y) ≤ 0: são as p restrições de desigualdade que representam as especificações de projeto e as restrições lógicas. O passo final da otimização é o desenvolvimento e aplicação de um algoritmo de otimização que dê solução ao modelo matemático. 2.4.2 Sı́ntese de Processos e Controle Para resolver os problemas de sı́ntese de processos, as técnicas tradicionais concentraram-se em determinar a configuração econômicamente ótima do processo dentro de um conjunto de alternativas possı́veis que satisfazem os requerimentos de operação. As magnitudes de controlabilidade geralmente não são consideradas. As técnicas tradicionais de controle de processos uma vez dada a configuração do mesmo analisam o modo de achar a melhor seleção de pares de variáveis manipuladas e controladas assim como os parâmetros do regulador que permitem o melhor comportamento do sistema em malha fechada. Projeto Integrado e Sı́ntese 57 Nas últimas décadas, tem se apreciado um auge na evolução do desenvolvimento de ferramentas matemáticas que permitem resolver o problema de sı́ntese de processos incorporando a controlabilidade como um dos objetivos dentro do projeto. O problema de interação entre o projeto e a controlabilidade no marco da sı́ntese de processos requer de, (Schweiger e Floudas 1997): • Uma super-estrutura do processo que englobe todas as alternativas possı́veis. • Um modelo matemático que descreva a super-estrutura do processo. • Os conjuntos de variáveis manipuladas e controladas • Valores desejados da saı́da do processo. • Conjunto de estruturas de controle alternativas. • Conjunto de variáveis de perturbação. • Restrições. • Custos. • Horizonte finito de tempo. O objetivo é determinar a estrutura do processo, a condições de operação, a estrutura do controlador e seus parâmetros de ajuste que otimizem tanto a controlabilidade do processo como os custes e que garantam uma operação factı́vel da planta. No problema de sı́ntese do processo, é muito complexo e numericamente caro a utilização de modelos lineares, devido que requer-se apresentar e formular o modelo linear na forma MINLP, ao mesmo tempo que se incluam de igual maneira as magnitudes de controlabilidade expostas neste trabalho, isto nos obriga a trabalhar com modelos não lineares. É evidente a deficiência de magnitudes de controlabilidade para sistemas não lineares. Uma possı́vel magnitude usada tradicionalmente é a integral do quadrado do erro (ISE): Z J= (yref − y)2 dt (2.85) onde: erro = yref − y Esta magnitude apresenta vários inconvenientes, primeiro que somente reflete a dinâmica das variáveis medidas e omite a dinâmica das variáveis de estado não medidas. Projeto Integrado e Sı́ntese 58 este inconveniente pode se solucionar incorporando restrições de trajetória na formulação do problema. Outro problema referente ao uso da ISE como magnitude de controlabilidade e seleção da estrutura de controle tem a ver com a seleção dos parâmetros do controlador, já que busca dos parâmetros ótimos do controlador baseado na ISE, traiz consigo múltiplos ótimos locais, além do que não existe uma correspondência um a um entre a estrutura de controle e a ISE. A pesar dos problemas associados a esta magnitude, seu uso tem alguns aspectos positivos, primeiro é fácil de calcular e pode-se determinar diretamente com uma parte do modelo do processo, segundo reflete o comportamento dinâmico do processo em termos da variável de saı́da. Os projetos que apresentam caracterı́sticas dinâmicas “pobres”, tem um valor muito grande da ISE, no entanto os melhores projetos terão um valor mais pequeno de esta magnitude. Finalmente podemos acrescentar que a ISE é uma função diferenciável e facilita seu uso em métodos baseados em gradiente. A formulação matemática deste problema caracteriza-se por diferentes tipos de variáveis e restrições. Igual que no problema anterior, as variáveis se dividem em duas categorias: contı́nuas e inteiras. A diferença vem dada pela introdução de dinâmica no projeto, (Schweiger e Floudas 1997), que faz que as variáveis contı́nuas possam ser: v : variáveis de projeto ou variáveis de decisão invariantes no tempo, z(t) variáveis dinâmicas, u(t) variáveis de controle ou variáveis de decisão variantes no tempo. A formulação do problema de interação entre o projeto e o controle no marco da sı́ntese de processos consta primeiramente do indice a minimizar (maximizar) U , este ı́ndice por sua vez se compõe dos objetivos de controle e os objetivos econômicos, J1 e J2 , que dependeram das variáveis dinâmicas (z), as variáveis de controle (u) e as variáveis inteiras (y). ou seja, dependeram de: min U (J1 (ż1 (ti ), z1 (ti ), z2 (ti ), u(ti ), v, y), J2 (ż1 (ti ), z1 (ti ), z2 (ti ), u(ti ), v, y)) (2.86) onde z1 (t) é um vetor de n variáveis dinâmicas cujas derivadas no tempo ż1 (t) aparecem Projeto Integrado e Sı́ntese 59 explicitamente, e z2 (t) é um vetor de m variáveis dinâmicas cujas derivadas não aparecem explicitamente. Note-se que ti é o instante de tempo. Sujeito a um conjunto de restrições que podem classificar-se e descrever da seguinte maneira: 1. O modelo dinâmico que representa a estrutura do processo e modela-se utilizando um sistema de equações algébricas e diferenciais (DAE): f1 (ż1 (t), z1 (t), z2 (t), u(t), v, y, t) = 0 f2 (z1 (t), z2 (t), u(t), v, y, t) = 0 (2.87) Onde f1 representa n equações diferenciais, e f2 , m equações algébricas dinâmicas. As variáveis v e y, são parâmetros para o sistema DAE e variáveis para a otimização, v é um vetor de p variáveis contı́nuas invariantes no tempo, e y é um vetor de q variáveis binárias. As variáveis de controle representadas por u(t) é um vetor de r variáveis. O tempo t é uma variável independente para o sistema dinâmico e t0 é o tempo inicial. 2. As condições iniciais para o sistema dinâmico também constituem restrições ao problema z1 (t0 ) = z10 z2 (t0 ) = z20 (2.88) 3. Restrições pontuais que involucram as variáveis dinâmicas num instante de tempo especı́fico: h0 (ż1 (ti ), z1 (ti ), z2 (ti ), u(ti ), v, y) = 0 g 0 (ż1 (ti ), z1 (ti ), z2 (ti ), u(ti ), v, y) ≤ 0 (2.89) Onde ti é o instante de tempo onde deve verificar-se a restrição, o ı́ndice i pode tomar valores desde 0 até N , onde N é o número de instantes de tempo que é necessário no problema e tN é o tempo final. 4. Restrições que involucram unicamente as variáveis invariantes no tempo: h00 (v, y) = 0 g 00 (v, y) ≤ 0 (2.90) 5. Seleção da estrutura de controle. A lei de controle pode ser por exemplo um PI, cuja lei de controle é fácil de implementar. Por tanto ao problema também adiciona-se Projeto Integrado e Sı́ntese 60 a seleção da estrutura do regulador, que significa determinar os pares de variáveis manipuladas e controladas, correspondentes à estrutura ótima da planta obtida, assim como os valores de ajuste dos parâmetros do regulador, para qual utilizam-se também variáveis binárias. Este problema se adiciona como restrição e se formula da seguinte maneira: uf (t)−u0,f − X ½ · ¸¾ Z t 1 s ∈ S krs (zmed,s (t) − zset,s ) + (zmed,s (t) − zset,s ) = 0, ∀r ∈ R τrs 0 (2.91) Onde uf (t) é o conjunto de variáveis manipuladas, zmed,s é o conjunto de variáveis medidas, zset,s representa o conjunto de consignas das variáveis controladas, krs , τrs são os parâmetros do regulador (o ganho e o tempo integral respectivamente), R e S, representam o conjunto de variáveis manipuladas e controladas respectivamente. 6. Restrições adicionais: L U Krs y rs ≤ Krs ≤ Krs y rs ∀r ∈ R, ∀s ∈ S U L y rs ≤ τrs ≤ τrs y rs τrs P s ∈ Sy rs ≤ 1 P r ∈ Ry rs ≤ 1 ∀r ∈ R, ∀s ∈ S ∀r ∈ R (2.92) ∀s ∈ S Onde y rs são as variáveis binárias que indicam a existência dos pares entre as variáveis manipuladas r e as controladas s. As dois primeiras desigualdades fixam o intervalo em que encontram-se os parâmetros do regulador em caso de existência (limites inferior e superior), no entanto que as últimas desigualdades lógicas, garantem que pelo menos exista uma malha de controle (um par para cada variável manipulada e controlada). Tudo isso sujeito as restrições de pertença: v ∈ ν ⊆ Rp y ∈ {0, 1}q ti ∈ [t0 , tN ] (2.93) i = 0...N O problema que obtém-se é um problema de Otimização Multi-Objetivo Mista Inteira de Controle Ótimo. O problema de controle ótimo resolve-se parametrizando o problema de programação de dimensão infinita a um problema de programação de dimensão finita, para o qual aplica-se uma lei de controle como por exemplo PI. Projeto Integrado e Sı́ntese 61 O problema multi-objetivo, pode-se resolver se convertemos J2 (o J1 ) em uma restrição de contorno o pontual, e se inclui no conjunto das restrições h0 , com a qual o problema que se obtém é um problema de programação com um só objetivo. A notação matemática desta formulação pode se simplificar se combinamos no conjunto das variáveis x, todas as variáveis invariantes no tempo (os parâmetros do regulador, os volumes, áreas, etc.). A parametrização do controle obtém-se da conversão das variáveis de controle em variáveis de estado, daı́ que o conjunto de variáveis dinâmicas se acrescentem as variáveis de controle: z2 = {z2 (t), u(t)}. As equações de parametrização do controle, ψ(w, z(t)), são equações algébricas que se acrescentam ao sistema DAE e podem ser incluı́das no conjunto de equações f2 . As variáveis binárias y, que são usadas para selecionar a estrutura de controle se agrupam no conjunto original das variáveis binárias. Já que as restrições de seleção da estrutura de controle envolvem os parâmetros do controlador e as variáveis binárias, podem ser incluı́das nas restrições do tipo g 00 (x, y). Aplicando esta notação obtém-se o seguinte problema MINLP/DAE min x,y J(ż1 (ti ), z1 (ti ), z2 (ti ), x, y) sujeito a : f1 (ż1 (t), z1 (t), z2 (t), x, y, t) = 0 f2 (z1 (t), z2 (t), x, y, t) = 0 z1 (t0 ) = z10 z2 (t0 ) = z20 h0 (ż1 (ti ), z1 (ti ), z2 (ti ), x, y) = 0 g 0 (ż1 (ti ), z1 (ti ), z2 (ti ), x, y) ≤ 0 (2.94) h00 (x, y) = 0 g 00 (v, y) ≤ 0 x∈X ti ∈ [t0 , tN ] i = 0...N 2.4.3 Exemplo: Sintese de processos. Desejamos produzir o produto C a partir dos produtos A e B, através dos processos I, II e III. O produto C pode ser produzido somente através do processo I, os processos I e Projeto Integrado e Sı́ntese 62 Processo I II III Relação C = 0.9B B = ln(1 + A) B = 1.2 ln(1 + A) Tabela 2.6: Conversões Processo I II III Capacidade máx. 2ton/h de C 5ton/h de B 4ton/h de B Tabela 2.7: Capacidades máximas III e os processos I e II. Os processos II e III não podem realizar-se simultaneamente. Figura 2.23: Diagrama de fluxo do problema. Os dados do problema são os mostrados nas tabelas 2.6, 2.7, 2.8 e 2.9. A demanda do produto C é de 1ton/h máximo. Projeto Integrado e Sı́ntese 63 Produto Preço A 1.800$/ton B 7.000$/ton C 13.000$/ton Tabela 2.8: Preços Processo Custo Fixo Custo Variável I 3.5 ∗ 103 $/ton 2.0 ∗ 103 $/ton II 1.0 ∗ 103 $/ton 1.0 ∗ 103 $/ton III 1.5 ∗ 103 $/ton 1.2 ∗ 103 $/ton Tabela 2.9: Custe da Inversão A formulação do problema é a seguinte: max P R = 13C − 1.8A2 − 1.8A3 − 7B1 − 3.5y1 − 2C − 1.0y2 − 1B2 − 1.5y3 − 1.2B3 Sujeito a P I C − 0.9(B1 + B2 + B3 ) = 0 P II B2 − ln(1 + A2 ) = 0 P III B3 − 1.2 ln(1 + A3 ) = 0 B1 = B2 + B3 C≤1 C ≤ 2y1 B2 ≤ 4y1 B3 ≤ 5y3 y1 + y2 + y3 = 0, 1 n~ ao negatividade 2.5 Conclusões Neste capı́tulo foram desenvolvido aspectos teóricos relacionados com o Projeto Integrado de Processos e Controle assim como de Sı́nteses de Processos. Foi exemplificada a metodologia de Projeto Integrado através de dois estudos de caso. No primeiro projetou-se un conversor de potência, o CBB, com um controle tipo PID. No segundo exemplo considerou-se o modelo hı́brido do CBB e projetou-se o conversor com um controlador por modos deslizantes. A aplicação da metodologia de projeto integrado a sistemas de potência são uma contribuição deste trabalho preliminar. Projeto Integrado e Sı́ntese 64 Será objetivo da tese extender o leque de aplicação dos indices de controlabilidade vistos neste capı́tulo a SH, assim como procurar novos indices que permitam caracterizar aspectos relacionados a controlabilidade de esta classe de sistemas. Também foi mostrado a forma de apresentar um problema de sı́ntese de processo através de um exemplo simples mas que exemplifica a metodologia. Os conceitos de projeto integrado e sı́ntese aparecerão e desenvolverão no âmbito de processos. A extensão da metodologia a área da Eletrônica de Potência pretende ser uma contribuição da tese de doutorado. Capı́tulo 3 Modelado de Sistemas Hı́bridos 3.1 Introdução Um modelo é uma representação simplificada do mundo real, que tem um grau suficiente de complexidade para permitir a descrição do comportamento que interessa ser estudado. Ao mesmo tempo um modelo deve excluir todas as caracterı́sticas que não são relevantes para a pesquisa e possam obstaculizar uma solução eficiente de tarefas especificadas. Cada área da ciência e da engenharia desenvolveram seus próprios formalismos para obter modelos que permitissem resolver os problemas de interesse nas áreas correspondentes. Na teoria de controle e sistemas a atenção esta voltada para a manipulação das variáveis do sistema que permitam alcançar metas como estabilização, rejeição a perturbações e robustez. A idéia chave é o uso de estruturas realimentadas, onde a evolução de algumas variáveis monitoradas determina a ação atual e futura sobre o sistema. Conseqüentemente o conceito de modelo de um sistema, é tradicionalmente associado com as equações diferenciais ou a diferenças que descrevem a evolução do sistema. Um modelo é derivado tipicamente das leis fı́sicas que governam a dinâmica do sistema, ou pela estimação de seqüências experimentais de dados coletados com a finalidade de modelar a planta (Mignone 2002). O computador e programas lógicos, estão cada vez mais envolvidos em aplicações de controle numa extensa classe de sistemas por causa de sua confiabilidade e pelo baixo custo de fabricação de dispositivos eletrônicos. Isto trouxe duas conseqüências; primeiro, Modelado de Sistemas Hı́bridos 66 aumento-se as capacidades funcionais avançadas de muitos dispositivos de uso comum, como por exemplo os “sistemas eletrônicos embutidos”nos carros modernos para melhorar a habilidade do condutor de dirigir o carro sob circunstâncias adversas (Balluchi et al. 2000); em segundo, apareceram novos desafios nas areas das pesquisas teóricas de controle e ciências da computação. Com o fim de abordar estes desafios, novas classes de modelos foram definidos, os sistemas hı́bridos (SH). Os SH podem capturar o comportamento discreto de programas de computador e o comportamento contı́nuo de processos fı́sicos (Torrisi 2003). Desde uma perspectiva histórica, o termo hı́brido foi introduzido dado que nenhum único modelo conhecido era capaz de capturar a dinâmica discreta e contı́nua ao mesmo tempo. Era então necessário combinar as potencialidades de diferentes estruturas de modelagem para descrever o comportamento de fenômenos hı́bridos. Muitos fenômenos fı́sicos admitem uma descrição hı́brida, por exemplo, circuitos que integram relês ou diodos (Pomar et al. 2007), redes biomoleculares (Alur et al. 1999), e redes TCP/IP (Hespanha et al. 2001). Os modelos hı́bridos são necessários para poder atacar numerosos problemas em diversos processos, como o calculo das trajetórias do sistema, análise de estabilidade e de alcanzabilidade, controle, estimação de estados, etc. (Torrisi 2003). Como ainda não estão disponı́veis métodos tratáveis para analisar sistemas hı́bridos em geral, diversos autores tem focalizado sua atenção em subclasses especiais de sistemas dinâmicos hı́bridos para os quais técnicas de analise e/ou projeto estão sendo atualmente desenvolvidas. Alguns exemplos de tais subclasses são: os Autômatos Hı́bridos (Hybrid Automata (HA)) (Schaft e Schumacher 1999), Sistemas Afins a Troços (Piece Wise Affine (PWA) systems) (Sontag 1981), Sistemas Mixtos Lógicos Dinâmicos (Mixed Logical Dynamical (MLD) systems) (Bemporad e Morari 1999), Sistemas Lineares Complementarios (Linear Complementarity (LC) systems) (Heemels et al. 2000), Sistemas Lineares Complementarios Extendidos (Extended Linear Complementarity (ELC) systems (Schutter e Moor 1999)), e os Max-Min-Plus-Scaling (MMPS) systems (Schutter e Boom 2001). Em Heemels et al. (2001) a equivalência entre subclasses de sistema é abordada. É mostrado que sob algumas condições técnicas, as últimas cinco subclasses de modelos mencionadas são equivalentes. Modelado de Sistemas Hı́bridos Tarefa Controle Estabilidade Verificação Identificação Detecção de Faltas Estimação 67 Modelo MLD, PWA, MMPS PWA PWA PWA MLD MLD Tabela 3.1: Modelo sugerido para cada tarefa Cada sub-classe tem suas vantagens. A equivalência entre as diferentes subclasses permite facilmente transferir as propriedades teóricas (por exemplo: estabilidade, controlabilidade, observabilidade, etc.) e ferramentas de uma sub-classe a outra. A tabela 3.1 sugere o modelo recomendado para algumas das tarefas mais tı́picas da engenharia de controle. Por causa de sua generalidade não implica que alguns problemas especı́ficos não possam ser resolvidos de uma maneira mais eficiente usando um contexto de modelado diferente (Torrisi 2003). Nas seguintes seções desenvolvera-se as duas subclasses de SH mais estudadas na literatura, os sistemas PWA e MLD, exemplificando cada uma delas com o Conversor de Potência Buck-Boost (CBB). 3.2 Sistemas Afins a Troços Entre as várias estruturas usadas para modelar sistemas hı́bridos em tempo discreto a mais estudada no meio acadêmico é a estrutura Afim a Troços (Piece Wise Affine systems, (PWA)) (Sontag 1981). Os sistemas PWA são capazes de modelar um grande número de processos fı́sicos, tais como sistemas com não-linearidades estáticas (por exemplo: saturação do acionador), aproximar dinâmicas não-lineares com exatidão arbitrária via múltiplas linearizações em diferentes pontos de operação (Torrisi 2003), sistemas chaveados onde o comportamento dinâmico é descrito por um número finito de modelos lineares junto com um conjunto de regras lógica para trocar entre estes modelos (Borrelli 2002), etc. Os sistemas PWA são definidos particionando o espaço de estado e de entrada em regiões poliédricas, e associando a cada região uma equação afim de atualização de estados diferente, isto é: Modelado de Sistemas Hı́bridos 68 · x(t + 1) = Ai x(t) + Bi u(t) + fi y(t) = Ci x(t) + gi para x(t) u(t) ¸ ∈ Ci (3.1) onde: • x são os estados contı́nuos e binários: # " xc x= , xc ∈ Rnc , xl ∈ {0, 1}nl , n , nc + nl xl • y são as saı́das contı́nuas e binárias: " y= yc yl # , yc ∈ Rpc , yl ∈ {0, 1}pl , p , pc + pl • u são as entradas contı́nuas e binárias: " # uc u= , uc ∈ Rmc , ul ∈ {0, 1}ml , m , mc + ml ul • {Ci }s−1 i=0 é uma partição poliédrica do espaço dos conjuntos de estados e entradas, Ci ⊆ Rn+m , n , nc + nl , m , mc + ml • as matrizes Ai , Bi , Ci , fi , gi são constantes e tem dimensões adequadas. Comentario 3.1 Os sub-indices c e l nas equações anteriores denotam os componentes contı́nuos e lógicos (ou binários) de cada vetor respectivamente. Assim nc e a quantidade de elementos contı́nuos e nl a quantidade de elementos binários que possui o vetor de estados. O mesmo para os demais vetores. Cada subsistema definido pelo conjunto (Ai , Bi , Ci , fi , gi ), é denominado de componente do sistema PWA (3.1). Se fi e gi são nulos, o sistema (3.1) é chamados de linear a troços (Piece Wise Linear (PWL) system). 3.2.1 Exemplo Exemplo 3.1 Modelo PWA do Conversor Buck-Boost (CBB) Modelado de Sistemas Hı́bridos 69 Como foi visto no capı́tulo 2, o CBB pode operar em dois modos diferentes. Se a corrente pelo inductor L não é zero o CBB opera no modo de condução contı́nua (MCC). Se não o modo de operação descontı́nua (MCD) é considerado. O sinal de controle do sistema é q ∈ {0, 1}, (sinal sobre o interruptor S), e os estados do sistema são a corrente pelo inductor iL ∈ R e a tensão sobre o capacitor vC ∈ R, como observa-se o sistema mistura sinais contı́nuos e discretos (binários) por tanto é claramente um sistema hı́brido. Se o interruptor estiver fechado (q = 1) então o conjunto de equações que descreve o comportamento do sistema é: 1 Vcc L 1 vC = − C R = −vC i˙L = (3.2) v˙C (3.3) V0 (3.4) onde L C e R são a indutância, capacitância e resistência respectivamente, VO é a tensão de saı́da. Se o interruptor estiver aberto (q = 0) então o conjunto de equações que descrevem o comportamento do sistema depende da corrente pelo inductor L. Se iL > 0, (MCC), então: 1 vC L 1 vC = (−iL − ) C R = −vC i˙L = (3.5) v˙C (3.6) V0 (3.7) más se iL = 0, (MCD), o conjunto de equações que descreve o comportamento do sistema será: i˙L = 0 1 vC C R = −vC v˙C = − V0 (3.8) (3.9) (3.10) Discretizando a dinâmica contı́nua com um tempo de amostragem igual a Ts , temos Modelado de Sistemas Hı́bridos 70 então: ( iL (t + 1) = iL (t) + TLs Vcc ¡ ¢ Ts vC (t + 1) = 1 − RC vC (t) Ts iL (t + 1) = iL (t) + L vC (t) (q = 0) ⇒ (iL > 0) ⇒ vC (t + 1) = − TCs iL (t)+ ¢ ¡ Ts vC (t) 1 − RC ( iL (t + 1) = iL (t) ¡ ¢ (iL = 0) ⇒ Ts vC (t + 1) = 1 − RC vC (t) (q = 1) ⇒ (3.11) (3.12) (3.13) O conjunto de equações (3.11, 3.12 e 3.13) representam a descrição PWA do CBB. Apesar do fato que modelos PWA são uma composição de sistemas dinâmicos lineares invariantes no tempo (componentes), suas propriedades estruturais tais como estabilidade, controlabilidade e observabilidade, são complexas e articuladas como tı́picas de sistemas não-lineares (Borrelli 2002). No que diz respeito a estabilidade, além dos resultados simples mas muito conservadores, tais como achar uma função quadrática comum de Lyapunov para todos os componentes, pesquisadores começaram a desenvolver ferramentas de análise e sı́ntese para sistemas PWA só recentemente (Johannson e Rantzer 1998, Mignone et al. 2000, FerrariTrecate et al. 2002b). Adotando funções de Lyapunov quadráticas a troços, um enfoque computacional baseados em Desigualdades Matriciais Lineares (Linear Matrix Inequalities (LMI)) foi proposto em Hassibi e Boyd (1998) e Johannson e Rantzer (1998) para análise de estabilidade e sı́ntese do controlador. A construção de funções de Lyapunov para sistemas chaveados também foi abordado em Wicks e Peleties (1994). Para a classe mais geral de sistemas chaveados da forma ẋ = fi (x), i = 1, ..., s, Branicky (1994) e Branicky (1998) fizeram uma extensão do critério de Lyapunov baseado em múltiplas funções de Lyapunov. Em seu recente artigo, Blondel e Tsitsiklis (1999) mostraram que a verificação da estabilidade de sistemas autônomos PWA é N P-hard (isto é, em geral a estabilidade de sistemas PWA não pode ser avaliada por um algoritmo em tempo polinomial, a menos que P = N P), até mesmo para sistemas PWA simples com só dois componentes. Várias propriedades globais (tais como convergência global e estabilidade assintótica) de sistemas PWA foram mostradas recentemente undecidable em Blondel et al. (1999). A pesquisa sobre critérios de estabilidade para sistemas PWA foi motivada pelo fato que a estabilidade de cada sub-sistema componente não é suficiente para garantir a esta- Modelado de Sistemas Hı́bridos 71 bilidade do sistema PWA (e vice versa). Em Branicky (1998), se dá um exemplo onde subsistemas estáveis, más convenientemente combinados, geram um sistema PWA instável. Sistemas estáveis construı́do de subsistemas instáveis são mostrados em Utkin (1977). Estes exemplos salientam sobre as restrições que devem ser impostas no chaveamento para garantir que uma composição de componentes estáveis se mantenha estável. Exemplo 3.2 Considere o sistema autônomo: " ẋ1 # ẋ2 " = Ap(t) x1 # x2 onde as matrices componentes do sistema são: " A1 = −1 −100 10 −1 # " A2 = −1 10 # −100 −1 √ Ambas dinâmicas são estáveis e com os mesmos autovalores: −1 ± j 1000 A lei de comutação é: ( + p(t ) = 1 se p(t) = 2 e se x2 (t) = −x1 (t) k 2 se p(t) = 1 e se x2 (t) = kx1 (t) Esta lei de comutação conduz a um sistema instável para k = −0.2 como mostra a Figura 3.1 Figura 3.1: Trajetória do sistema no espaço de estados Modelado de Sistemas Hı́bridos 72 Exemplo 3.3 Considere o sistema autônomo: " ẋ1 # " = Ap(t) ẋ2 x1 # x2 onde as matrices componentes do sistema são: " A1 = 0 10 0 0 # " A2 = 1.5 # 2 −2 −0.5 √ Ambas dinâmicas são instáveis e com os mesmos autovalores: 0.5 ± j 3 A lei de comutação é: ( p(t+ ) = 1 se p(t) = 2 e se x2 (t) = −kx1 (t) 2 2 se p(t) = 1 e se x2 (t) = kx1 (t) Esta lei de comutação conduz a um sistema estável para k = 0.5 como mostra a Figura 3.2 Figura 3.2: Trajetória do sistema no espaço de estados Muito pouca pesquisa tem focalizado a atenção nas propriedades de observabilidade e controlabilidade de sistemas hı́bridos além de contribuições limitadas no campo dos Timed Automatas (Alur et al. 1993, T.A. Henzinger e Varaiya 1995, Kesten et al. 1993) e o trabalho precursor de Sontag (1981) para sistemas PWA. Desnecessário dizer, que estes conceitos são fundamentais para entender se um observador de estado e um controlador para um sistema hı́brido, podem ser projetados e quão bom será sua performance. Por exemplo, em Ferrari-Trecate et al. (2000), propriedades de observabilidade foram di- Modelado de Sistemas Hı́bridos 73 retamente exploradas para projetar estimadores de estados convergentes para sistemas hı́bridos . As propriedades de controlabilidade e observabilidade foram investigadas em Ezzine e Haddad (1989) e Goshen-Meskin e Bar-Itzhack (1992) para sistemas lineares variantes no tempo, e em particular para a classe de sistemas assim chamado de constantes a troços (onde as matrizes na representação de espaço de estados são funções do tempo constantes a troços). Embora em princı́pio aplicável, estes resultados não permitem capturar as peculiaridades dos sistemas PWA. Questões gerais de N P-hardness sobre a avaliação de controlabilidade de sistemas não-linear foram abordadas por Sontag (1988). Seguindo seus resultados anteriores (Sontag 1981, Sontag 1985), Sontag (1996) analisa a complexidade computacional da observabilidade e controlabilidade de sistemas PWA através de argumentos baseado na linguagem de álgebra linear a troços. O autor prova que a observabilidade/controlabilidade é N P-Completa sobre o tempo finito, e é undecidable sobre o tempo infinito (isto é, em geral não pode ser resolvido em tempo finito por meio de qualquer algoritmo). Usando um raciocı́nio diferente, o mesmo resultado foi derivado em Blondel e Tsitsiklis (1999). Em Bemporad, Ferrari-Trecate e Morari (2000) os autores fornecem duas importantes contribuições à análise da controlabilidade e observabilidade de sistemas hı́brido e PWA: (i) mostram ao leitor que a observabilidade e a controlabilidade podem ser muito complexas; apresentam numerosos contra-exemplos que descartam conjeturas óbvias sobre herdar propriedades de observabilidade/controlabilidade dos subsistemas lineares componentes do sistema; (ii) fornecem testes de observabilidade e controlabilidade baseadas em Programação Linear (LP) e Mista Inteira Linear (MILP). A motivação principal para concentrar-nos em modelos em tempo-discreto vem da necessidade de analisar estes sistemas e resolver problemas de otimização, tal como o controle ótimo ou problemas de seqüenciamento, para a qual a contra parte em tempo contı́nuo não é fácil o cálculo. Por esta razão necessitamos um meio para descrever sistemas PWA em tempo-discreto numa forma conveniente para transformar problemas de análise-sı́ntese em problema mais compacto de otimização. A estrutura MLD descrita na seguinte seção foi desenvolvida para tal propósito. Em particular, será provado que modelos MLD são bem sucedido para transformar problemas de otimização com dinâmica hı́brida em programas misto inteiro lineares e quadráticos, solucionáveis via técnicas Branch and Bound por exemplo (Nemhauser e Wolsey 1988), (Borrelli 2002). Modelado de Sistemas Hı́bridos 3.3 74 Sistemas Mistos Lógicos Dinâmicos Os Sistemas Mistos Lógicos Dinâmicos (Mixed Logical Dynamical systems, (MLD)) são um marco para modelar e controlar aqueles sistemas descritos por leis fı́sicas, regras lógicas, e restrições de operação, interdependentes. Sua caracterı́stica fundamental é permitir uma formulação e resolução sistemática de vários problemas de análise e sı́ntese usando técnicas matemáticas de otimização. De acordo com as técnicas descritas por exemplo em Williams (1993), Cavalier et al. (1990) e Raman e Grossmann (1992), a lógica proposicional é transformada em desigualdades lineares que envolvem variáveis inteiras e variáveis contı́nuas, o que permite chegar no sistema MLD, sistemas descritos por equações dinâmicas lineares sujeitas a inequações lineares, mistas inteiras, isto é equações e inequações envolvendo variáveis contı́nuas e binárias (ou lógicas, ou {0, 1}). Os sistemas MLD generalizam um amplo conjunto de modelos entre os quais estão os sistemas hı́bridos lineares, a maquina de estado finita, alguma classe de sistemas a eventos discretos, sistemas lineares com restrições, e sistemas não lineares cujas não linearidades podem ser expressas por funções lineares a troços. 3.3.1 Calculo Proposicional e Programação Linear Inteira 3.3.1.1 Proposições Lógicas Seguindo a notação padrão (Williams 1977, Cavalier et al. 1990, Williams 1993), vamos adotar as letras maiúsculas Xi para representar proposições, por exemplo “x ≥ 0”ou “a temperatura está quente”. O literal Xi pode ser verdadeiro (V) ou falso (F). A Algebra Booleana permite-nos combinar proposições simples em proposições compostas por meios de operadores. Estes são: ∧ operador AN D ∨ operador OR · operador N OT (complemento) → implicancia ↔ se e somente se ⊕ OR exclusivo Modelado de Sistemas Hı́bridos 75 Um tratamento mais detalhado da algebra booleana pode ser encontrada em textos de projeto de circuitos digitais, como por exemplo Christiansen (1997) e Hayes (1993). Para uma exposição rigorosa veja por exemplo Mendelson (1964). Os operadores lógicos satisfazem diversas propriedades (Christiansen 1997) que podem ser usadas para transformar proposições compostas em proposições compostas equivalentes envolvendo operadores diferentes, simplificando proposições complexas. É sabido que todos os operadores lógicos podem ser definidos nos termos de um subconjunto deles o qual é dito ser um conjunto completo dos operadores. Exemplo 3.4 O conjunto de operadores {∨, ·} e um conjunto completo de operadores, pois os outros operadores podem ser expressos em termos de estes aplicando equivalências lógicas, por exemplo: X1 → X2 equivalente a X 1 ∨ X2 (3.14) X1 → X2 equivalente a X 2 → X1 (3.15) X1 ↔ X2 equivalente a (X1 → X2 ) ∧ (X2 → X1 ) (3.16) X1 ∧ X2 equivalente a X 1 ∨ X 2 (3.17) A uma proposição Xi pode associar-se uma variável lógica δi ∈ {0, 1} a qual terá um valor igual a um 1 se Xi = V , ou 0 se Xi = F . Um problema de lógica proposicional onde a proposição X1 deve ser provada verdadeira dado un conjunto de proposições (compostas) envolvendo proposições X2 , ..., Xn , podem de fato ser resolvidos apropriadamente por meio de programação linear inteira traduzindo as proposições compostas originais em desigualdades lineares que envolvem as variáveis binárias δi . Estes desigualdades são denominados desigualdades lineares inteiras. De fato, é fácil ver que as proposições e restrições lineares mostradas na tabela 3.2 são equivalentes. Existem métodos e formulações alternativos para transformar problemas de lógica proposicional em problemas de programação matemática inteira equivalentes, e nenhum método é uniformemente melhor do que o outro. Em Cavalier et al. (1990) conclui-se que a eleição de uma abordagem de modelado eficiente depende da forma das proposições lógicas. Está claro que um pre-processo procurando uma redução no problema de lógica proposicional trás grandes benefı́cios na solução numérica quando resolvermos o problema Modelado de Sistemas Hı́bridos relação AN D (∧) X1 ∧ X2 76 proposição lógica [δ1 = 1] ∧ [δ2 = 1] (des)igualdade mista inteira δ1 = 1 δ2 = 1 −δ1 + δ3 ≤ 0 −δ2 + δ3 ≤ 0 δ1 + δ2 − δ3 ≤ 1 X3 ↔ (X1 ∧ X2 ) [δ3 = 1] ↔ [δ1 = 1] ∧ [δ2 = 1] OR (∨) X1 ∨ X2 [δ1 = 1] ∨ [δ2 = 1] δ1 + δ2 ≥ 1 [δ3 = 1] ↔ [δ1 = 1] ∨ [δ2 = 1] δ1 − δ3 ≤ 0 δ2 − δ3 ≤ 0 −δ1 − δ2 + δ3 ≤ 0 [δ1 = 1] δ1 = 0 [δ1 = 1] ⊕ [δ2 = 1] δ1 + δ2 = 1 X3 ↔ (X1 ∨ X2 ) N OT (.) X1 XOR (⊕) X1 ⊕ X2 X3 ↔ (X1 ⊕ X2 ) [δ3 = 1] ↔ [δ1 = 1] ⊕ [δ2 = 1] IM P LY (→) X1 → X2 IF F (↔) X1 ↔ X2 −δ1 − δ2 + δ3 ≤ 0 −δ1 + δ2 − δ3 ≤ 0 δ1 − δ2 − δ3 ≤ 0 δ1 + δ2 + δ3 ≤ 2 [δ1 = 1] → [δ2 = 1] δ1 − δ2 ≤ 1 [δ1 = 1] ↔ [δ2 = 1] δ1 − δ2 = 0 Tabela 3.2: Conversão de relações lógicas básicas em desigualdades inteiras Modelado de Sistemas Hı́bridos 77 de programação mista inteira. O problema de encontrar a forma mı́nima, é bem conhecido no âmbito de projeto de redes digitais. Existe uma variedade de métodos para executar esta tarefa. Para uma exposição detalhada o leitor pode consultar Hayes (1993). 3.3.1.2 Proposições Mistas Lógicas-Continuas Com a técnica de dedução computacional, mostrada na seção anterior, podemos então modelar a parte lógica do processo (chaves ON/OFF, mecanismos discretos, redes combinatórias e seqüenciais) e o conhecimento heurı́stico de operação da planta através de desigualdades lineares inteiras. Mas como estamos interessados em sistemas que não só tenham parte lógica mas também dinâmica, devemos estabelecer um laço entre estes dois mundos. Em particular necessitamos estabelecer uma metodologia de como construir proposições de eventos operacionais respeito à dinâmica continua. A idéia chave é usar desigualdades lineares mistas inteiras, isto é desigualdades envolvendo variáveis continuas, x ∈ Rn , e variáveis lógicas, δ ∈ {0, 1}. Em Raman e Grossmann (1991) e Raman e Grossmann (1992) a idéia de introduzir o conhecimento qualitativo na sı́nteses do processo usando lógica proposicional é apresentada. Uma aplicação mais recente de alocação de recursos e seqüenciamento é descrito em Glover (1975). Na tabela 3.3 mostra-se uma lista de equivalências, que permite realizar a tradução de algumas proposições mistas lógicascontinuas num conjunto de desigualdades a ser usado como restrições nos problemas de otimização matemática. Uma lista extensiva de tais transformações é dada em Mignone (2001). Notar que as relações que envolvem a forma [δ = 0] em vez de [δ = 1] nas tabelas 3.2 e 3.3 podem ser obtidos substituindo δ por (1 − δ) nas desigualdades correspondentes. Exemplo 3.5 Como mostra-se na tabela 3.3, consideremos por exemplo a proposição X , [f (x) ≤ 0] (3.18) onde f : R 7→ R e linear, supõe-se que x ∈ X , onde X é um conjunto delimitado dado, e define-se: M , max f (x) (3.19) m , min f (x) (3.20) x∈X x∈X Modelado de Sistemas Hı́bridos relação IM P LY (→) [f (x) ≤ 0] → X X → [f (x) ≤ 0] IF F (↔) [f (x) ≤ 0] ↔ X 78 proposição lógica (des)igualdade mista inteira [f (x) ≤ 0] → [δ = 1] f (x) ≥ ² + (m − ²)δ [δ = 1] → [f (x) ≤ 0] f (x) ≥ M − M δ f (x) ≤ M (1 − δ) f (x) ≥ ² + (m − ²)δ z ≤ Mδ −z ≤ −mδ z ≤ f (x) − m(1 − δ) −z ≤ −f (x) + M (1 − δ) [f (x) ≤ 0] ↔ [δ = 1] P roduct IF X T HEN z = f (x) ELSE z = 0 z = δ.f (x) Tabela 3.3: Conversão de relações mistas lógicas continuas básicas em desigualdades mistas inteiras. M , m em R são as cotas superior e inferior da função linear f (x) para x ∈ X , ² > 0 é uma tolerância pequena, geralmente a precisão da maquina Teoricamente, uma sobre-estimação (sub-estimação) de M (m) é suficiente para nosso propósito. Entretanto, estimativas mais realı́sticas fornecem benefı́cios computacionais (Williams 1993). Associando a variável binária δ com a proposição X, é possı́vel transformar 3.18 nas seguintes desigualdades mistas inteiras: f (x) ≤ M − M δ (3.21) f (x) ≥ ² + (m − ²)δ (3.22) onde ² é uma pequena tolerância (tipicamente a precisão da maquina) além da qual a restrição é considerado como violada. Para verificar a equivalências entre a proposição lógica e o conjunto de desigualdades (3.21, 3.22), pode verificar-se que 3.21 e 3.22 se reduzem as quatro restrições da coluna “implicação resultante”da Tabela C.1, contanto que as suposições adicionais correspondentes da coluna “quantidade fixa”sejam feitas. quantidade fixa δ=0 δ=1 f (x) ≤ 0 f (x) ≥ ² desigualdade 3.21 f (x) ≤ M (inativa) f (x) ≤ 0 δ ∈ {0, 1} (inativa) δ=0 desigualdade 3.22 f (x) ≥ ² f (x) ≥ m (inativa) δ=1 δ ∈ {0, 1} (inativa) implicação resultante f (x) ≥ ² f (x) ≤ 0 δ=1 δ=0 Tabela 3.4: Implicações de 3.21 e 3.22 Observar que de acordo como a coluna “quantidade fixa”da tabela C.1, uma das desigualdade de 3.21 e 3.22 torna-se inativa no sentido que sempre se cumpre, supondo 3.19, Modelado de Sistemas Hı́bridos 79 3.20 e δ ∈ {0, 1}. De um ponto de vista semântico, notar que o intervalo de δ na coluna direita da tabela 3.3 é entendida como um subconjunto dos números reais. Mesmo que estejamos falando sobre δ como uma variável lógica ou discreta, quando fazemos a transformação para as desigualdades, a suposição inerente é que: δ ∈ {0, 1} ⊂ R (3.23) A tradução de proposições lógicas ou declarações mistas lógicas-continuas em desigualdades, vistas na seção 3.3.1, é um passo que determina criticamente o tamanho do modelo MLD resultante em termos do número de variáveis. É importante achar modelos que tenham um número pequeno de variáveis binárias, pois isto permite melhorar a velocidade de resolução dos problemas matemáticos de otimização, necessários para análise, sı́ntese e supervisão de sistemas hı́bridos. No apêndice C propõe-se métodos eficientemente para a tradução de proposições lógicas em desigualdades diminuindo o número de variáveis auxiliares necessárias. Os métodos são aplicáveis quando as proposições lógicas são mais complexas que as mostradas na Tabela 3.2, envolvendo combinações arbitrárias de operadores. 3.3.2 Estrutura de Sistemas MLD Os modelos MLD para sistemas hı́bridos se baseiam na combinação de três idéias e observações apresentadas isoladamente na literatura (Mignone 2002). Estas idéias são: 1. Representação de proposições lógicas como desigualdades lineares que envolvem variáveis binárias. 2. Representação de proposições que acoplam relações lógicas às variáveis contı́nuas como desigualdades lineares que envolvem variáveis contı́nuas e binárias. 3. A inclusão de variáveis binárias e restrições lineares na descrição de sistemas estimados contı́nuos. Os primeiros dois pontos foram considerados na seção 3.3.1. O último ponto combina todas as desigualdades que são construı́das a partir dos métodos da seção 3.3.1 num Modelado de Sistemas Hı́bridos 80 conjunto de restrições. Para permitir uma formulação computacionalmente tratável dos problemas de análise e sı́ntese do sistema, um modelo linear em tempo discreto é escolhido para descrever a evolução dos estados. Como os componentes lógicos influenciam na dinâmica contı́nua, é necessário introduzir variáveis binárias na descrição do sistema. Um dos primeiros trabalhos usando esta idéia, é publicado em Witsenhausen (1966), onde um modelo linear é escolhido, permitindo-se haver estados e entradas tanto contı́nuas como discretas. A forma geral de um sistema MLD é dado pelas seguintes expressões: x(k + 1) = Ax(k) + B1 u(k) + B2 δ(k) + B3 z(k) (3.24) y(k) = Cx(k) + D1 u(k) + D2 δ(k) + D3 z(k) (3.25) E2 δ(k) + E3 z(k) ≤ E1 u(k) + E4 x(k) + E5 (3.26) A equação (3.24) é a função de atualização dos estados. (3.25) é a função de saı́da e o conjunto de desigualdades em (3.26) coleta as restrições inerentes do sistema assim como as traduções das proposições lógicas como indicado nas tabelas 3.2 e 3.3. O significado das variáveis é o seguinte: • x são os estados contı́nuos e binários: " # xc x= , xc ∈ Rnc , xl ∈ {0, 1}nl , n , nc + nl xl • y são as saı́das contı́nuas e binárias: " y= yc yl # , yc ∈ Rpc , yl ∈ {0, 1}pl , p , pc + pl • u são as entradas contı́nuas e binárias: # " uc , uc ∈ Rmc , ul ∈ {0, 1}ml , m , mc + ml u= ul • δ ∈ {0, 1}rl são as variáveis auxiliares binárias • z ∈ Rrc são as variáveis auxiliares contı́nuas Modelado de Sistemas Hı́bridos 81 Observe que removendo a equação (3.26) e fazendo δ e z iguais a 0, as equações (3.24) e (3.25) reduzem-se a um sistema linear sem restrições em tempo discreto no espaço de estados. As varáveis δ e z são introduzidas quando traduzimos as proposições lógicas em desigualdades lineares. Todas as restrições estão contidas na desigualdade (3.26). A descrição (3.24, 3.25, 3.26) só aparenta ser linear dado que as variáveis δ, xl , yl e ul são binárias. Veremos o procedimento de modelado na forma MLD na seção 3.3.5. O sistema (3.24, 3.25, 3.26) é suposto ser “completamente bem posto”(Bemporad e Morari 1999). Isto significa que dado o estado x(k) e a entrada u(k) a desigualdade (3.26) tem uma única solução para δ(k) e z(k). Em outras palavras, em cada instante de tempo, o mapeamento (x(k), u(k)) 7→ δ(k) e (x(k), u(k)) 7→ z(k) resultam em um único valor. Conseqüentemente, x(k + 1) é unicamente definido, permitindo encontrar uma trajetória única do estado x(.) dado um estado inicial x(0) e uma seqüência de entrada u(0)...u(N ). É condição para realizar uma correta simulação de um sistema MLD que este seja “bem posto”. Algoritmo 3.1 Simulação de um sistema MLD: 1. Faça k = k0 e escolha x(k). 2. Dado x(k) e u(k), obtenha δ(k) e z(k) que verifique (3.26). 3. Determine x(k + 1) de (3.24) 4. Faça k = k + 1 e vá ao passo 2. É possı́vel determinar δ(k) e z(k) no passo 2 através de um Teste de Factibilidade Misto Inteiro (Mixed Integer Feasibility Test (MIFT)), (Mignone 2002). A assunção que o sistema seja bem posto é usualmente não restritiva na prática. Mesmo que seja fácil definir sistemas MLD que não sejam bem postos, estes casos são freqüentemente de interesse somente no âmbito acadêmico, e surgem se o sistema não for precisamente modelado. Para a simulação de grandes sistemas, algoritmos computacionais mais eficientes do que o algoritmo 3.1 podem ser realizados (Torrisi 2003). As matrices A, B1 , B2 , B3 , C, D1 , D2 , D3 , E1 , ..., E5 são reais e de dimensões apropriadas. Se bem as matrizes A, B1 , B3 são matrices genéricas, algumas entradas têm que ser excluı́das, se estados binários estão presentes em x. Mais precisamente, o componente lógico xl do estado não pode depender diretamente das variáveis continuas xc , uc , Modelado de Sistemas Hı́bridos 82 z através de 3.24. As correspondentes entradas em A, B1 , B3 devem ser zero para um modelo MLD válido (Torrisi 2003, Ferrari-Trecate et al. 2002a). Por exemplo, a matriz A deverá ter a forma: " A= 3.3.3 Acc Acd # 0nl xnc Add Sistema MLD bem posto e a tolerância ² Para a tradução de algumas proposições lógicas em desigualdades, é necessário introduzir pequenas tolerâncias (² > 0), como pode ser visto na Tabela 3.3. A justificação principal para estas variáveis é a capacidade de expressar as desigualdades como nãoestritas, antes que como desigualdades estritas. Isto permite sua inclusão como restrições em problemas de otimização. Esta seção descreve um par de conseqüências desta aproximação para as restrições assim obtidas e mostra, como depende da escolha de ² que o sistema seja bem posto. Exemplo 3.6 Considere por exemplo a proposição: [δ = 1] ↔ [f (x) ≤ 0] (3.27) e sua tradução f (x) ≤ M − M δ (3.28) f (x) ≥ ² + (m − ²)δ (3.29) É fácil de verificar que as desigualdades (3.28) e (3.29) definem as relações: [δ = 1] ↔ [m ≤ f (x) ≤ 0] (3.30) [δ = 0] ↔ [² ≤ f (x) ≤ M ] (3.31) 0 < f (x) < ² (3.32) Se f (x) toma valores entre A variável δ permanece indefinida e as desigualdades (3.28) e (3.29) são infactı́veis para qualquer par (δ, f (x)) ∈ {0, 1} × (0, ²). De fato, se por exemplo f (x) = 2² , então (3.28) e Modelado de Sistemas Hı́bridos 83 (3.29) tornam-se ² ≤ M − Mδ 2 ² − ≥ (m − ²)δ 2 (3.33) (3.34) Aqui, (3.33) é factı́vel para δ = 0 somente, no entanto que (3.34) só pode ser satisfeita com δ = 1. Note que se (3.32) nunca ocorrer, nenhum problema de factibilidade é esperado. Neste caso ² pode ser escolhido como a precisão representavel da máquina. Com uma interpretação geométrica podemos visualizar, se há alternativas para representar (3.27), além de (3.28) e (3.29). Graficando o conjunto de pontos válidos no plano (δ, y), onde y = f (x), como se mostra na Figura 3.3. Figura 3.3: Conjunto de pontos válidos de 3.27 no plano (δ, y) representado como as linhas marcadas Da Figura 3.3, vemos que o ponto (δ, y) = (0, 0) é um elemento do fecho convexo de pontos válidos, mesmo que ele mesmo é inválido. Note que estendendo o espaço com variáveis binárias adicionais não ajuda neste caso, já que o conjunto de pontos válidos é um conjunto aberto. Isto não satisfaz a suposição de conjunto compacto no Teorema C.5. Para qualquer extensão do domı́nio do espaço (δ, y) com variáveis auxiliares, o conjunto de pontos válidos é um conjunto não-convexo. Um meio de representar esta relação como desigualdades é sacrificar a propriedade que o modelo seja bem posto. A solução (3.28) e (3.29) modifica o conjunto de pontos válidos, tal que há uma lacuna, em que δ é indefinido, como se mostra em Figura 3.4. Isto significa que estritamente falando o sistema não é completamente bem posto, já que para y ∈ (0, ²) nenhum δ é definido. Se estamos dispostos a sacrificar que o modelo deja bem posto, podemos propor uma tradução alternativa, como se mostra na Figura 3.5. Modelado de Sistemas Hı́bridos 84 Figura 3.4: Conjunto de pontos válidos de 3.27 no plano (δ, y) usando a abordagem ². Os pontos válidos são representado como as linhas marcadas Figura 3.5: Conjunto de pontos válidos de 3.27 no plano (δ, y) sem ser o sistema bem posto. Os pontos válidos são representado como as linhas marcadas Aqui nós não temos zonas da variável contı́nua y, onde a variável binária δ é indefinida, mas temos ambos possı́veis valores de δ, se y = 0. As desigualdades neste caso são obtidas colocando ² ≤ 0 em (3.28) e (3.29). 3.3.4 Estado estacionário para sistemas MLD Os sistemas MLD podem exibir várias propriedades que são tı́picas de sistemas nãolineares, como múltiplos pontos de equilı́brios isolados ou ciclos limites. Propriedades como deadlocks ou livelocks, tipicamente encontradas em sistemas a eventos discretos, podem ser achados também em modelos MLD. O valor de estado estacionário xf de um sistema MLD pode ser determinado resolvendo o seguinte problema de programação mista inteira min xf ,uf ,δf ,zf (kyf − rkρy + kxf kρ4 + kuf kρ1 + kzf kρ3 + kδf kρ2 (3.35) Modelado de Sistemas Hı́bridos 85 Sujeito a: xf = Axf + B1 uf + B2 δf + B3 zf (3.36) yf = Cxf + D1 uf + D2 δf + D3 zf (3.37) E2 δf + E3 zf ≤ E1 uf + E4 xf + E5 (3.38) Aqui k · k é uma norma arbitrária, o vetor r é a referência constante, ρi = ρTi é uma matriz de ponderação não-negativa. Em general, o conjunto completo de todos os estados estacionários é definido pelos pontos factı́veis que satisfazem (3.36-3.38). No entanto, como a solução xf , uf , δf , zf tipicamente é usada para propósitos de controle, estamos interessados numa solução de (3.35-3.38), onde ρy À ρj , (j = 1...4) isto é um estado estacionário que produz uma saı́da perto da referência. Devido a grande variedade de comportamentos que podem apresentar sistemas MLD, o resultado (xf , uf , δf , zf ) de (3.35-3.38) devem ser melhor analisados antes de seu uso num esquema de controle. Algumas dificuldades que podem surgir são listadas a seguir: Estado estacionário inalcansável O estado constante obtido com (3.35-3.38) pode ser inalcansável. Chamamos um estado xe inalcansável, se existe um estado inicial x0 , para o qual nenhuma entrada factı́vel [u(0), u(1), ..., u(N )] de tamanho N (N ≥ 1) existe, tal que x(N ) = xe para todo N . Multiplicidade de estados estacionários Mesmo que todas as ponderações ρi em (3.35) são escolhidos diferentes de zero, os estados estacionários obtidos com (3.35 -3.38) podem ser não-únicos por causa da presença das variáveis binárias. Um exemplo simples deste fenômeno é um sistema PWA, onde o estado estacionário correspondente a dinâmica afim da região Xi permanece em Xi para todo i. Sistemas podem ser achados, com estados estacionários que dão o mesmo valor de (3.35) para todos os estados estacionários dos subsistemas. Ciclos Limites Considere o problema de estabilizar um sistema MLD a uma referência constante r. Ao procurar por um estado que forneça uma saı́da y que permaneça perto de r, (3.35-3.38) pôde dar uma solução única e alcançável. No entanto, em alguns casos o equilı́brio assim obtido é distante da referência. Deve-se observar que o erro acumulado sobre um horizonte finito de comprimento M M X k=1 kyf (k) − rk Modelado de Sistemas Hı́bridos 86 pode ser menor, por exemplo, quando y segue um ciclo de estados em vez de se manter num valor constante. O tal ciclo é gerado pelo chaveamento periódico dos componentes discretos do sistema. Em outras palavras, o sistema vai por meio de um ciclo de estados permanecer perto da referência, em vez de convergir a um estado constante. Para sistemas que exibam ciclos limite, em vez de achar um único estado estacionario, podem-se procurar por seqüências inteiras de estados. A otimização então é dada por: min xf ,uf ,δ f ,z f (ky f − rkρy + kxf kρ4 + kuf kρ1 + kz f kρ3 + kδ f kρ2 (3.39) Sujeito a: xf (1) = Axf (0) + B1 uf (0) + B2 δf (0) + B3 zf (0) xf (2) = Axf (1) + B1 uf (1) + B2 δf (1) + B3 zf (1) .. . xf (N ) = Axf (N − 1) + B1 uf (N − 1) + B2 δf (N − 1) + B3 zf (N − 1) xf (0) = Axf (N ) + B1 uf (N ) + B2 δf (N ) + B3 zf (N ) E2 δf (0) + E3 zf (0) ≤ E1 uf (0) + E4 xf (0) + E5 .. . E2 δf (N ) + E3 zf (N ) ≤ E1 uf (N ) + E4 xf (N ) + E5 As variáveis xf , uf , δ f , z f em (3.39) são seqüencias das variáveis correspondentes xf , uf , δf , zf de comprimento N , isto é xf (0) uf (0) . .. uf = .. xf = . xf (N ) uf (N ) δf (0) zf (0) . .. δf = zf = .. . δf (N ) zf (N ) r r = ... r r é o vetor constante de referência. Em general o comprimento N da seqüência não é sabido previamente e deve ser achado iterativamente. Se um ciclo curto é requerido, resolvemos o problema de otimização min{ min N ∈N yf (0),...,yf (N ) ky f − rkρe + γ(N )} Modelado de Sistemas Hı́bridos 87 + Onde γ(·) : R+ 0 → R0 é uma função monótona crescente estrita, não-negativa que penaliza o uso de ciclos longos de comprimento N . 3.3.5 Exemplos Exemplo 3.7 Conversor Buck-Boost (CBB) Para um melhor entendimento da metodologia de transformação das equações diferenciais que descrevem a dinâmica do sistema a um modelo no contexto MLD, vamos supor que o CBB somente trabalha no MCC. Para obter o modelo MLD (3.24-3.26) a partir das equações dinâmicas do CBB ((3.2-3.4) e (3.5-3.7)), em primeiro lugar é necessário associar a proposição “chave fechada”uma variável auxiliar, por tanto: [q = 1] ↔ [chave f echada] Então temos que: 1 1 Vcc q + vC L L 1 1 = − vC − iL (1 − q) RC C = −vC i˙L = (3.40) v˙C (3.41) V0 (3.42) onde L C e R são a indutância, capacitância e resistência respectivamente, VO é a tensão de saı́da. Discretizando as equações anteriores com um perı́odo de amostragem Ts : Ts Vcc Ts Vcc q(k) + vC (k)(1 − q(k)) + iL (k) L L Ts Ts vC (k) − iL (k)(1 − q(k)) + vC (k) vC (k + 1) = − RC C V0 = −vC iL (k + 1) = (3.43) (3.44) (3.45) onde k denota o tempo discreto o qual fazendo abuso da notação vamos omitir daqui para frente. Como se observa nas equações anteriores a corrente pelo inductor iL e a tensão sobre o capacitor aparecem multiplicadas por a variável binária auxiliar q. É necessário introduzir Modelado de Sistemas Hı́bridos 88 por tanto duas variáveis auxiliares como indica a tabela 3.3: z1 z1 z1 z1 z1 = ≤ ≥ ≤ ≥ iL q MI q mI q iL − mI (1 − q) iL − MI (1 − q) z2 z2 z2 z2 z2 onde: = ≤ ≥ ≤ ≥ vC q MV q mV q vC − mV (1 − q) vC − MV (1 − q) onde: MI , max iL mI , min iL MV mV , max vC , min vC As transformações acima podem resumir-se na seguinte representação MLD do CBB: " i+ L # vC+ " = −MI − TCs 1 − −mI MI q + −MV mV −mV MV mI #" Ts L 1 1 Ts RC 0 iL vC # " + Ts VCC L # q+ 0 0 " 0 0 0 0 1 0 1 0 # " −1 0 z1 ≤ −1 0 0 0 1 z2 0 0 0 −1 0 0 1 1 0 0 −1 0 −1 −1 0 − TLs Ts C 0 #" z1 # (3.46) z2 0 0 −m I " # x1 MI + x 0 2 0 −m V MV (3.47) + onde: i+ L = iL (k + 1) e vC = vC (k + 1). Exemplo 3.8 Sistema de Controle de Temperatura O exemplo que vamos desenvolver nesta seção é reportado em Bemporad, FerrariTrecate e Morari (2000). A temperatura xc de uma sala é controlada por um termostato, que liga ou desliga um aquecedor de acordo com a temperatura medida. Quando o aquecedor está desligado, xc diminui de acordo com a dinâmica de primeiro-ordem ẋc = −Kxc ; quando o aquecedor está ligado, ẋc = −K(u − xc ), onde u é proporcional a potência do aquecedor, mu ≤ u ≤ Mu . O autômato hı́brido que modela o sistema de controle de temperatura é mostrado na Figura 3.6. Modelado de Sistemas Hı́bridos 89 Figura 3.6: Sistema de controle de temperatura Para traduzir o autômato na forma MLD (3.24-3.26), vamos discretizar a dinâmica contı́nua com tempo de amostragem igual a Ts , temos então ( xc (t + 1) = λxc (t), se aquecedor desligado λxc (t) + (1 − λ)u(t), se aquecedor ligado (3.48) onde λ , e−KTs . Então, introduzimos as variáveis binárias auxiliares [δ1 (t) = 1] ↔ [xc (t) ≥ M ] (3.49) [δ2 (t) = 1] ↔ [xc (t) ≥ m] (3.50) Que toma em conta o cruzamento das linhas de guarda (obviamente, m < M ). As equações (3.49,3.50) podem ser transformadas em desigualdades lineares mistas inteiras usando a tabela 3.2, (vamos supor que os limites inferior mx e superior Mx sobre xc são conhecidos). O estado lógico xl (t + 1) é necessitado para armazenar o estado do aquecedor, e evoluciona de acordo com a equação xl (t + 1) = δ3 (t) (3.51) [δ1 (t) = 1] → [δ3 (t) = 0] (3.52) [δ2 (t) = 1] → [δ3 (t) = 1] (3.53) onde [δ1 (t) = 0] ∧ [δ2 (t) = 0] → [δ3 (t) = δ4 (t)] (3.54) Modelado de Sistemas Hı́bridos 90 e δ4 (t) = xl (t) (3.55) Como δ1 e δ2 não podem ser 1 ao mesmo tempo, incluı́mos a restrição δ1 (t) + δ2 (t) ≤ 1 (3.56) As equações (3.52) e (3.53) são traduzidas em desigualdades de acordo com a tabela 3.2. A equação (3.54) é equivalente a δ1 (t) + δ2 (t) ≤ δ3 (t) − δ4 (t) ≤ δ1 (t) + δ2 (t) (3.57) Embora (3.57) pode ser imediatamente verificada por inspeção, ela foi obtida aplicando a técnica da FNC. A dinâmica (3.48) pode ser reescrita equivalentemente como xc(t + 1) = λxc (t) + xl (t)(1 − λ)u(t) (3.58) Por causa do produto envolvendo xl e u(t), introduzimos a variável contı́nua auxiliar z(t) = xl u(t) = δ4 (t)u(t), que pode ser transformada em desigualdades lineares mistas inteiras, de acordo com a Tabela 3.3. As transformações acima podem resumir-se na seguinte representação MLD do sistema de controle de temperatura: " x(t + 1) = λ 0 0 0 # " x(t) + 0 0 0 0 0 0 1 0 # " δ(t) + 1−λ 0 # z(t) (3.59) Modelado de Sistemas Hı́bridos 91 0 Mx − m 0 0 0 m − m − ² 0 0 x M − m 0 0 0 x M − Mx − ² 0 0 0 1 1 0 0 0 1 −1 0 1 0 1 0 δ(t) + −1 −1 1 −1 −1 −1 −1 1 0 0 0 −1 0 0 0 1 0 0 0 −M u 0 0 0 mu 0 0 0 −m u 0 0 0 Mu −1 1 1 −1 0 0 0 + 0 0 0 0 0 0 0 0 h onde δ , δ1 δ2 δ3 δ4 iT h ex, xc xl iT . 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 u(t) z(t) ≤ 0 0 0 0 0 0 0 0 1 0 −1 1 1 −1 −1 Mx 0 −m − ² 0 0 −mx M −² 0 1 0 0 0 1 0 (3.60) 0 0 x(t) + 0 0 0 −1 0 1 0 0 0 0 −m 0 u Mu 0 Modelado de Sistemas Hı́bridos 3.4 92 Equivalência entre sistemas MLD e PWA Definição 3.1 (Bemporad 2004) Sejam P e P sistemas hı́bridos no espaço de estados, P P com iguais dimensões nos estados, entradas, e saı́das. 1 e 2 são ditos equivalentes se 1 2 para todo x1 (k) = x2 (k) e u1 (k) = u2 (k), então o estado sucessor x1 (k+1) = x2 (k+1) e as saı́das y1 (k) = y2 (k), onde k ∈ Z≥0 e Z≥0 é o conjunto de números inteiros não-negativos. Note que se as trajetórias são persistentes, isto é, definidas para todo k ∈ Z≥0 então a Definição 3.1 implica que começando do mesmo estado inicial e aplicando a mesma seqüência de entrada, o estado e trajetórias de saı́da dos dois sistemas equivalentes são idênticos. O seguinte resultado é proposto em Bemporad, Ferrari-Trecate e Morari (2000) e é uma extensão fácil do resultado correspondente proposto em Bemporad e Morari (1999) para sistemas lineares a troços (PWL) (isto é, sistemas PWA com fi = gi = 0). Proposição 3.1 (Bemporad 2004) Considere o sistema bem posto PWA (3.1) e seja o conjunto Ω de estados e entradas factı́veis acotado. Então, existe um sistema MLD (3.243.26) tal que (3.1) e (3.24-3.26) são equivalentes. Comentario 3.2 Como os modelos MLD só permitem que desigualdades não-estritas sejam incluı́das em (3.26), ao reescrever um sistema PWA descontı́nuo como um modelo MLD desigualdades estritas como x(k) < 0 devem ser aproximadas por x(k) ≤ −² para algum ² > 0 (tipicamente a precisão de máquina), com o suposição que −² < x(k) < 0 não pode ocorrer devido ao número finito de bits usado para representar números reais (nenhum problema existe quando o PWA é contı́nuo, onde a desigualdade estrita pode ser reescrita equivalentemente como não-estrita, ou ² = 0); veja (Heemels et al. 2001) e (Bemporad e Morari 1999) para mais detalhes. De um ponto de vista estritamente teórico, a proposição feita na proposição 3.1 é, portanto, não exata para sistemas PWA descontı́nuos. Como discutido previamente, um meio de iludir tal inexatidão é permitir que parte das desigualdades em (3.26) sejam estritas, ou evitar desigualdades estritas na definição das dinâmicas PWA. Por outro lado, de um ponto de vista numérico esta questão não é relevante. A proposição inversa de 3.1 foi estabelecida em Bemporad, Ferrari-Trecate e Morari (2000) sob a condição que o sistema MLD seja completamente bem posto. Uma prova mais geral e levemente diferente é mostrada a seguir. Modelado de Sistemas Hı́bridos 93 Definição 3.2 (Bemporad 2004) O conjunto de estado+entradas factı́veis Ω ⊆ Rnc × {0, 1}nl × Rmc × {0, 1}ml é o conjunto de pares estados+entradas (x(k), u(k)) para a qual (3.26) tem uma solução para algum δ(k) ∈ Rrl , z(k) ∈ Rrc . Proposição 3.2 (Bemporad 2004) Para cada sistema completamente bem posto MLD (3.24-3.26) existe um sistema bem posto PWA (3.1), isto é, o conjunto factı́vel de estados+entradas de (3.24-3.26) Ω podem ser particionados numa coleção de poliedros S convexos {Ωi }si=1 , Ω = si=1 Ωi , e existem 5 tuplas (Ai , Bi , Ci , fi , gi ), i = 1, ..., s, tal que todas as trajetórias x(k), u(k), y(k) do sistema MLD (3.24-3.26) também satisfazem (3.1). Prova (Bemporad 2004) 3.5 Conversão de modelos MLD-PWA Os sistemas PWA podem ser representados na forma MLD (3.24−3.26). A tradução " # consiste em definir variáveis lógicas δi [δi = 1] ↔ [ x ∈ Ci ] e impondo a condição de u Ls OR-exclusivo i=1 [δi = 1]. Para mais detalhes, o leitor pode consultar (Bemporad e Morari 1999). Embora técnicas de controle e estimação de estados baseadas em otimização mista inteira online ou programação mista inteira multiparamétrica offline foram propostas para modelos MLD (Bemporad e Morari 1999, Bemporad, Ferrari-Trecate e Morari 2000), a maioria das outras técnicas hı́bridas exigem uma formulação PWA, tal como: criterios de estabilidade (DeCarlo et al. 2000, Johannson e Rantzer 1998, Ferrari-Trecate et al. 2002b), sı́ntese do controlador ótimo afim a troços (Bemporad et al. 2002, Kerrigan e Mayne 2002, Mayne e Rakovic 2002), e verificação de propriedades de segurança via análise de alcanzabilidade (Asarin et al. 2000, Chutinan e Krogh 1999, Bemporad, Ferrari-Trecate e Morari 2000). Além do mais, as simulações de sistemas hı́bridos são muito mais fáceis para sistemas PWA (avaliação de um função PWA por cada passo de tempo), que para sistema MLD (um teste de factibilidade mista inteira por cada passo de tempo (Bemporad e Morari 1999)). A transformação inversa de MLD a PWA descrita em Bemporad, Ferrari-Trecate e Morari (2000) exige a enumeração de todas as possı́veis combinações das variáveis binárias contida no modelo MLD. Em Bemporad (2004) se fornece um algoritmo eficiente que evita Modelado de Sistemas Hı́bridos 94 tal enumeração e calcula muito eficientemente a forma equivalente PWA de um sistema dado MLD. A tradução eficiente de um modelo MLD a PWA permite estender o uso de ferramentas desenvolvidas para sistemas PWA, a muitos problemas hı́bridos não-triviais da vida real, como os que podem ser descritos na linguagem de modelado HYSDEL por exemplo, (Bemporad 2004). Uma implementação de Matlab deste algoritmo está disponı́vel em http://www.dii.unisi.it/~bemporad/tools.html e são incluı́dos em Hybrid Toolbox for Matlab (Bemporad 2003). Para mais detalhes, o leitor pode consultar (Bemporad 2004). 3.6 Conclusões Neste capı́tulo foi introduzido o conceito de Sistema Hı́brido, o qual surge desde uma perspectiva histórica dado que nenhum único modelo conhecido era capaz de capturar a dinâmica discreta e contı́nua ao mesmo tempo. Ainda não existem métodos para analisar sistemas hı́bridos em geral, por tanto diversos autores tem focalizado sua atenção em subclasses especiais de sistemas dinâmicos hı́bridos. Muitas de estas subclasses são equivalentes fazendo certas hipóteses e por tanto, propriedades e ferramentas de um contexto podem ser trasladados a outro contexto. Neste capı́tulo foram desenvolvido aspectos teóricos relacionados com duas destas subclasses ou contextos de modelagem. A primeira subclasse vista foi a PWA. Este contexto de modelagem tem recebido muita atenção no meio acadêmico devido a que é nesse contexto, onde é possı́vel analisar propriedades importantes tais como controlabilidade, observabilidade e estabilidade mais facilmente. Foi mostrado um exemplo de esta subclasse: o CBB. A segundo contexto visto foi o MLD. Esta subclasse permite o modelado de forma sistemática de uma quantidade grande de diferentes tipos de SH, dai sua importância. A metodologia de modelagem neste contexto foi mostrada através de dois estudos de caso: (i) o CBB, (ii) Sistema de controle de temperatura. Capı́tulo 4 Controle Preditivo de Sistemas Hı́bridos 4.1 Introdução O enfoque tradicional para projetar controladores embutidos é baseado no desenvolvimento de regras apoiadas na heurı́stica, ou no conhecimento da planta pelos operários. Tais regras freqüentemente são baseadas no “sentido comum”e tomam em conta cenários especı́ficos da planta. Contudo a análise da planta controlada total para todos os possı́veis cenários é normalmente uma tarefa dura, que tipicamente é resolvida na indústria executando um grande número de simulações ou experimentos sobre o próprio controlador. Esforços recentes de pesquisa tem produzido técnicas que permitem a sı́ntese direta de controladores para sistemas hı́bridos. O objetivo deste capı́tulo é expor alguma de estas técnicas de controle. Os principais métodos ou técnicas de controle disponı́veis hoje em dia são: • Controle preditivo de sistemas MLD usando otimização mista inteira on-line (Bemporad e Morari 1999). • Realimentação de estados linear a troços, para o sistema equivalente PWA (Mignone et al. 2000, Mayne e Rakovic 2003, Peña et al. 2005). • Obter a forma explı́cita do controlador preditivo através de técnicas de otimização multiparamétrica (Bemporad, Borrelli e Morari 2000). Controle Preditivo de Sistemas Hı́bridos 96 • Controle preditivo não linear obtido a partir de uma parametrização das variáveis inteiras em variáveis reais e usando otimização não linear on-line (Sarabia et al. 2007). O primeiro método é aplicado diretamente a sistemas hı́bridos no contexto MLD e será objeto de estudo na seguinte seção. O segundo e o terceiro método é aplicado ao modelo equivalente PWA, no segundo método a lei de controle é achada on-line no entanto que no terceiro método a lei explicita de controle e achada off-line. A quarta técnica pode ser aplicada a sistemas a troços mas gerais como os Sistemas Não-Lineares a Troços (Piece Wise Non Linear (PWNL) Systems), a ação de controle em cada passo de tempo é achada on-line. 4.2 Controle Preditivo de Sistemas MLD Como já foi dito no capı́tulo 3, uma grande quantidade de processos hı́bridos podem ser modelados pela estrutura MLD. Então, é interessante do ponto de vista prático e teórico saber se um sistema MLD pode ser estabilizado em um estado de equilı́brio ou pode seguir uma trajetória desejada de referência, via controle por realimentação. A seguir veremos como o Controle Preditivo Baseado no Modelo (CPBM), fornece ferramentas bem sucedidas para executar estas tarefas. O CPBM é uma forma de controle por realimentação, onde o valor atual das variáveis manipuladas é determinado on-line como a solução de um problema de controle ótimo sobre um horizonte de comprimento dado. O comportamento do sistema sobre o horizonte é predito com um modelo onde o estado atual da planta é o estado inicial para esta predição. Mesmo que um conjunto talvez grande de ações de controle é calculado, só o primeiro é implementado. Quando uma informação atualizada sobre o estado da planta está disponı́vel no seguinte instante de amostragem, a otimização é repetida sobre o horizonte deslocado. A capacidade de incluir sistematicamente restrições e a possibilidade de manipular plantas com múltiplas entradas e saı́das fizeram do CPBM uma técnica atraente na indústria de processo (Lee e Cooley 1997, Mayne 1997, Qin e Badgewell 1997, Mayne et al. 2000). Para uma apresentação ampla de CPBM clássico o leitor pode consultar: Maciejowski (2002) e Camacho e Bordons (2005). No presente contexto, devido à presença de variáveis inteiras, o procedimento de otimização é um problema de Programação Mista Inteira. Uma primeira tentativa em Controle Preditivo de Sistemas Hı́bridos 97 usar Programação Mista Inteira on-line para controlar sistemas dinâmicos submetidos a restrições lógicas apareceu em Tyler e Morari (1995). Outros trabalhos apontando em combinar CPBM a controle hı́brido apareceram em Slupphaug e Foss (1997) e Slupphaugand et al. (1997). A aplicação dos conceitos de CPBM a sistemas MLD foi proposta em Bemporad e Morari (1999). Supondo uma função de custo quadrática e dado o estado inicial x0 , a otimização no tempo t = 0, para um sistema MLD, tem a seguinte forma: min J(v0T −1 , x0 ) v0T −1 , T −1 X kv(k) − ue k2Q1 + kδ(k|t) − δe k2Q2 k=0 +kz(k|t) − ze k2Q3 + kx(k|t) − xe k2Q4 +ky(k|t) − ye k2Q5 (4.1) sujeito a : x(T |t) = xe x(k + 1|t) = Ax(k|t) + B1 v(k) + B2 δ(k|t) + B3 z(k|t) y(k|t) = Cx(k|t) + D1 v(k) + D2 δ(k|t) + D3 z(k|t) E2 δ(k|t) + E3 z(k|t) ≤ E1 v(k) + E4 x(k|t) + E5 (4.2) onde k ¦ kQ = ¦T Q¦; Q1 = QT1 > 0 e Qi = QTi ≥ 0, i = 2, . . . , 5, são matrices de ponderação dadas; xe , ue , δe , ze e ye são um ponto de equilı́brio dado que satisfazem as equações (3.25, 3.26), para a qual lembramos podem aparecer as possı́veis dificuldades mostradas na seção 3.3.4. v0T −1 = [v(0|0), v(1|0), . . . , v(T − 1|0)] ∈ Rnv ×T é a seqüência de variáveis manipuladas sobre um horizonte de T passos de tempo calculada no tempo t = 0; v0k−1 é a seqüência v0T −1 truncada nos primeiros k valores. x(k|t) é o estado do sistema no tempo t + k calculado a partir do estado inicial x0 com a seqüência de entrada v0k−1 ou seja x(k|t) , x(t + k, x0 , v0k−1 ); δ(k), z(k), y(k) são similarmente definidas. As matrizes de ponderação nas variáveis auxiliares δ e z permitem formular o problema de otimização com uma função de custo definida positiva. Para uma aplicação prática no entanto, os pesos Q1 , Q2 , Q5 são mais importante, dado que determinam a compensação entre o esforço da ação de controle e a exatidão do seguimento a referência. Assumamos por momento que a solução ótima {vt∗ (k)}k=0,...,T −1 existe. De acordo com a filosofia de horizonte deslizante mencionada acima, estabelecemos que a ação de controle sobre a planta será: u(t) = vt∗ (0) (4.3) Controle Preditivo de Sistemas Hı́bridos 98 e descartamos as subseqüentes entradas ótimas vt∗ (1), . . . , vt∗ (T − 1), enseguida repete-se todo o procedimento de otimização no tempo t + 1. A lei de controle (4.1,4.2) é chamada na literatura como lei de Controle Preditivo Mista Inteira (CPMI). Várias formulações de controladores preditivos para sistemas MLD poderiam ser propostos. Por exemplo, o número de graus de liberdade do controle pode ser reduzido a Nu < T impondo que u(k) ≡ u(Nu − 1), ∀k = Nu , . . . , T . No entanto, enquanto em outros contextos isto reduz enormemente o tamanho do problema de otimização ao custo geralmente de uma menor performance, aqui o ganho computacional é somente parcial dado que durante todo T as variáveis δ(k) e z(k) permanecem na otimização. Formulações de horizonte infinito são impróprias por razões tanto práticas e teóricas. De fato, aproximar o horizonte infinito com um T grande é computacionalmente proibitivo, dado que o número de variáveis {0, 1} envolvidas no problema de programação mista inteira quadrática (MIQP) depende linearmente de T . Um resultado importante do ponto de vista teórico no que tem a ver com a estabilidade do sistema resultante em malha fechada (sistema MLD + lei de controle CPBM) se mostra no seguinte teorema: Teorema 4.1 Seja (xe , ue , δe , ze ) um ponto de equilı́brio. Suponha que o estado inicial x(0) é tal que existe uma solução factı́vel do problema (4.1, 4.2) em t = 0. Então ∀Q1 = QT1 > 0, Q2 = QT2 ≥ 0, Q3 = QT3 ≥ 0, Q4 = QT4 ≥ 0, e , Q5 = QT5 ≥ 0, a lei MIPC (4.1, 4.2) estabiliza o sistema, que equivale a: lim x(t) = xe t→∞ lim u(t) = ue t→∞ lim kδ(t) − δe kQ2 = 0 t→∞ lim kz(t) − ze kQ3 = 0 t→∞ lim ky(t) − ye kQ5 = 0 t→∞ Verificando as restrições (3.26). Prova (Bemporad e Morari 1999) Comentario 4.1 O teorema anterior tem pouca aplicação prática, pois ele se baseia sobre Controle Preditivo de Sistemas Hı́bridos 99 a hipótese da existência da solução, coisa que é impossı́vel conhecer a priori. A restrição imposta ao problema de otimização: x(T |t) = xe , pode fazer o problema infactı́vel e por tanto sem solução. Definamos o vetor ν(k) como: v(k) ν(k|t) = δ(k|t) z(k|t) (4.4) Usando a definição (4.4), a função custo (4.1) pode ser expressa como: min J(ν0T −1 , x0 ) , ν0T −1 T −1 X kν(k|t) − νe k2Qν + kx(k|t) − xe k2Q4 + ky(k|t) − ye k2Q5 (4.5) k=0 onde: Q1 0 Qν = 0 Q2 0 0 0 0 Q3 (4.6) Expressando a equação (4.5) na forma matricial, temos que: min J(V ) , kV − Ve k2Qν + kX − Xe k2Q4 + kY − Ye k2Q5 V onde: V = ν(0) .. . (4.7) , é o vetor a ser calculado pelo algoritmo do otimização. ν(T − 1) x(1) . X = .. , é o vetor composto pelos vetores de estado preditos nos instantes de x(T ) tempo: k = 1 . . . T − 1. y(1) . Y = .. , é o vetor composto pelos vetores saı́da preditos nos instantes de tempo: y(T ) k = 1 . . . T − 1. Controle Preditivo de Sistemas Hı́bridos 100 Ve , Xe e Ye , são similarmente definidos a partir de: νe = [ve , δe , ze ]T , xe e ye respectivamente. A relação entre V e X pode obter-se desenvolvendo a equação (3.24) tendo em conta a definição (4.4): x(k + 1) = Ax(k) + Bν(k) onde: B1 0 B= 0 B2 0 0 (4.8) 0 0 B3 (4.9) por tanto: x(1) = Ax(0) + Bν(0) x(2) = Ax(1) + Bν(1) = A2 x(0) + ABν(0) + Bν(1) .. . . = .. x(T ) = AT x(0) + AT −1 Bν(0) + . . . + Bν(T − 1) Em forma matricial: x(1) x(2) . = . . x(T ) Definindo: A B 0 AB B x(0) + . .. . . . AT AT −1 · · · A2 .. . Λ= A 0 0 0 .. . 0 .. . AB B B 0 AB B e Φ= . .. . . . T −1 T A ··· A A2 .. . ν(0) ν(1) .. . (4.10) ν(T − 1) 0 0 0 .. . 0 .. . (4.11) AB B temos então que: X = Λx(0) + ΦV (4.12) Fazendo o mesmo para achar a relação entre V e Y : y(k) = Cx(k) (4.13) Controle Preditivo de Sistemas Hı́bridos 101 por tanto: y(1) = Cx(1) = C(Ax(0) + Bν(0)) = CAx(0) + CBν(0) y(2) = CA2 x(0) + CABν(0) + CBν(1) .. . . = .. y(T ) = CAT x(0) + CAT −1 Bν(0) + . . . + CBν(T − 1) Em forma matricial: CA y(1) y(2) CA2 . = . . . . . x(0) + CAT y(T ) CB 0 0 0 CAB .. . CB .. . 0 ... 0 .. . CAT −1 B ··· CAB CB ν(0) ν(1) .. . (4.14) ν(T − 1) Definindo: CA CB 0 0 0 CA2 CAB CB 0 0 Ω= e Ψ = .. .. .. ... .. . . . . T T −1 CA CA B · · · CAB CB (4.15) temos então que: Y = Ωx(0) + ΨV (4.16) Desenvolvendo a equação (4.7) tendo em conta as equações (4.12) e (4.16), chegamos a seguinte expressão: 1 min J(V ) , V T HV + cT V + f V 2 (4.17) que é a forma clássica como se apresenta a função custo em problemas quadráticos mistos inteiros (Mixed Integer Quadratic Program - MIQP), onde: ¤ £ H = 2 ΨT Q5 Ψ + ΦT Q4 Φ + Qν ¤ £ cT = 2 (Ωx(0) − Ye )T Q5 Ψ + (Λx(0) − Xe )T Q4 Φ − VeT Qν f = (Ωx(0) − Ye )T Q5 (Ωx(0) − Ye ) + (Λx(0) − Xe )T Q4 (Λx(0) − Xe ) +VeT Qν Ve (4.18) (4.19) (4.20) (4.21) Controle Preditivo de Sistemas Hı́bridos 102 O mesmo desenvolvimento podemos fazer com as restrições do problema MIQP (4.1, 4.2). Como já foi dito, por questões práticas a primeira restrição de (4.2): x(T |t) = xe será suprimida pois pode fazer o problema infactı́vel, a segunda e terceira restrições são de igualdade, e já foram tidas em conta na solução do problema através do desenvolvimento anterior, onde são introduzidas na função custo (4.1). Por tanto fica só o desenvolvimento da desigualdade: E2 δ(k|t) + E3 z(k|t) ≤ E1 v(k) + E4 x(k|t) + E5 (4.22) a qual podemos por na seguinte forma: − E4 x(k|t) + Eν ν(k) ≤ E5 onde: Eν = −E1 0 0 E2 0 0 0 (4.23) 0 E3 (4.24) −E4 x(0) + Eν ν(0) ≤ E5 −E4 x(1) + Eν ν(1) = −E4 Ax(0) − E4 Bν(0) + Eν ν(1) ≤ E5 .. . . ≤ .. −E4 AT −1 x(0) − E4 AT −2 Bν(0) − . . . − E4 Bν(T − 2) + Eν ν(T − 1) ≤ E5 Em forma matricial: E4 Eν 0 E4 A −E4 B Eν x(0) + − . . .. .. .. . E4 AT −1 −E4 AT −2 B · · · 0 0 0 .. . 0 .. . −E4 B Eν ν(0) ν(1) .. . (4.25) ν(T − 1) Definindo: Ξ = − E4 E4 A .. . E4 AT −1 e Γ= Eν 0 0 0 −E4 B .. . Eν .. . 0 .. . 0 .. . −E4 AT −2 B · · · −E4 B Eν (4.26) Controle Preditivo de Sistemas Hı́bridos 103 temos então que: Ξx(0) + ΓV ≤ U (4.27) onde: U é uma matriz composta por T matrices E5 na forma: U = [E5 . . . E5 ]T Com todo o desenvolvimento anterior obtemos a seguinte expressão do problema MIQP (4.1-4.2): min J(V ) , V 1 T V HV + cT V + f 2 (4.28) Ξx(0) + ΓV ≤ U (4.29) sujeito a : Passando as matrices e vetores: H, cT , f , Ξ, Γ e U a algum algoritmo de otimização MIQP, se existir a solução o algoritmo resolverá o problema dando como resultado um certo V ∗ , do qual tomaremos somente o primeiro elemento para aplicar na planta de acordo com a filosofia do CPBM. Comentario 4.2 Apesar do fato que existem métodos muito eficientes para calcular a solução ótima (global) do problema MIQP (4.28-4.29), no pior caso o tempo de solução depende exponencialmente do número de variáveis inteiras. Em princı́pio, isto talvez limite o alcance de aplicação deste método somente a sistemas muito lentos, desde que para a implementação em tempo-real o perı́odo de amostragem deve ser suficientemente grande para permitir o cálculo do pior caso. No entanto, a prova do teorema anterior não ∗ exige que a seqüências de controle avaliada {Ut∗ }∞ t=0 , ({Ut } denota a seqüência ótima de controle ou seja: {vt∗ (0), . . . , vt∗ (T − 1)), seja o ótimo global. De fato, somente se requer que: ∗ J(Ut+1 , x(t + 1)) ≤ J(U1∗ , x(t + 1)) (4.30) A seqüência U1 está disponı́vel do cálculo prévio (realizado no tempo t), e pode ser usada para iniciar o algoritmo MIQP em t+1. A otimização então pode ser interrompida em ∗ que satisfaz (4.30). Por qualquer passo intermediário para obter a solução suboptima Ut+1 exemplo, quando é usado o método Branch and Bound para resolver o problema MIQP, a nova seqüência de controle Ut∗ pode ser selecionada como a solução do subproblema QP que é factı́vel inteiro e tem o valor mais baixo. Obviamente neste caso o desempenho de seguimento se vê deteriorado, pois não estamos aplicando na planta a solução ótima do problema MIQP. Controle Preditivo de Sistemas Hı́bridos 4.2.1 104 Problema de seguimento Para problemas de seguimento, o objetivo é que a saı́da y(t) siga uma trajetória de referência r(t). Para cada passo de tempo t, os valores de ye , xe , ue , δe , e ze , da equação (4.1) correspondendo a r(t) podem ser calculados resolvendo o seguinte problema MIQP: min xe ,ue ,δe ,ze kye − r(t)k2Q5 + ρ(kxe k2 + kue k2 + kδe k2 + kze k2 ) (4.31) s.a. xe = Axe + B1 ue + B2 δe + B3 ze E2 δe + E3 ze ≤ E1 ue + E4 xe + E5 (4.32) onde ye = Cxe + D1 ue + D2 δe + D3 ze . O parámetro ρ > 0 é qualquer número positivo (pequeno) e é necessário para assegurar a convexidade estrita do valor da função (4.31). Este procedimento permite definir un ponto estacionário ye o mais próximo possı́vel a r(t) compatı́vel com as restrições. 4.2.2 Algoritmos MIQP Nesta seção mencionaremos alguns dos algoritmos existentes para resolver problemas de Programação Matemática Mista Inteira. Não é o objetivo deste trabalho realizar um aprofundamento teórico de cada algoritmo em particular, somente quer-se mostrar as ferramentas existentes, quando melhor sua aplicação, e suas vantagens frente as outras. Com a exceção de estruturas particulares, problemas de programação mista inteira envolvendo variáveis {0, 1} são classificados como N P−completos, o que significa que no pior caso, o tempo de solução cresce exponencialmente com o tamanho do problema (Raman e Grossmann 1991). Apesar desta natureza combinatória, vários enfoques algoritmicos foram propostos e foram aplicadas com êxito a problemas de meio e grande tamanho (Floudas 1995), os quatro mais importantes são: Método dos Planos de Corte , onde uma nova restrição (ou “corte”) são gerados é adicionadas para reduzir o domı́nio factı́vel até que uma solução {0, 1} ótima seja achada. Método de Decomposição , onde a estrutura matemática dos modelos é explorado via Controle Preditivo de Sistemas Hı́bridos 105 partição de variáveis, dualidade, e métodos de relaxação. Métodos Lógicos , onde restrições disjuntivas ou técnicas simbólicas de inferência são utilizadas as quais podem ser expressadas em termos de variáveis binárias. Método de Ramificação e Corte (Branch and Bound ) , onde as combinações {0, 1} são exploradas a traves de uma árvore binária, a região factı́vel é particionada em sub-domı́nios sistematicamente, e limites inferiores e superiores válidos são gerados em diferentes nı́veis da árvore binária. Vários autores concordam no fato que os métodos de Branch and Bound são os melhor sucedidos para resolver problems de programação mista inteira. Fletcher e Leyffer (1995) mostra um estudo numérico que compara diferentes enfoques, e o método Branch and Bound mostrou ser superior em ordem de magnitude. O algoritmo Branch and Bound consiste em resolver e gerar novos problemas QP a traves de uma árvore de procura, onde os nós da árvore correspondem a sub-problemas QP. A ramificação é obtida gerando nós-filhos de nós-pais de acordo com regras de ramificação, que podem ser baseadas, por exemplo, em prioridades especificadas previamente sobre as variáveis inteiras, ou na quantia que as restrições de integralidade são transgredidas. Os nós são marcados como pendente, se o problema correspondente QP não foi resolvido, se o nó já foi plenamente explorado é marcado como explorado. O algoritmo para quando todos os nós foram explorados. O êxito do algoritmo Branch and Bound baseia-se no fato que sub-arvores inteiras podem ser excluı́das da exploração. Isto acontece se o subproblema correspondente QP é infactivel ou uma solução inteira é achada. No segundo caso, o valor correspondente da função de custo serve como limite superior na solução ideal do problema MIQP, e é usado para explorar outros nós tendo valor ótimo maior ou limite inferior. 4.2.3 Controle Preditivo Misto Inteiro do CBB Esta seção apresenta o estudo do CPMI para o CBB analisado nos capı́tulos anteriores. O objetivo deste exemplo é apresentar diversos problemas relacionados com a definição da estratégia, o projeto do controlador, a otimização, a estabilidade e as limitações relacionadas com a própria estrutura do problema. Mostraremos que, a pesar de que o CBB é um sistema de baixa ordem, o projeto do CPMI apresenta vários desafios, vários destes Controle Preditivo de Sistemas Hı́bridos 106 considerados temas abertos na pesquisa de controle preditivo hı́brido. Assim, o exemplo é um elemento motivador dos estudos que serão realizados nesta tese. O primeiro passo para projetar um CPMI é formular um modelo do processo para poder realizar o cálculo das predições. Neste estudo de caso este primeiro passo já foi dado no capı́tulo 3 onde o modelo MLD do CBB foi obtido: " i+ L # vC+ " = −MI − TCs 1 − −mI MI q + −MV mV −mV MV mI #" Ts L 1 1 Ts RC 0 iL vC # " + Ts VCC L # q+ 0 0 " 0 0 0 0 1 0 1 0 # " −1 0 z1 ≤ −1 0 0 0 1 0 z2 0 0 −1 0 0 1 1 0 0 −1 0 −1 −1 0 − TLs Ts C 0 #" z1 # (4.33) z2 0 0 −m I " # x1 MI + x 0 2 0 −m V MV (4.34) O segundo passo no projeto do CPMI é a escolha da função custo a ser minimizada. Como o objetivo de controle é que o CBB siga referências de tensão constantes num intervalo entre [12V, 100V ], poderı́amos considerar, em principio, a seguinte função de custo: J(ν0T −1 , x0 ) , T −1 X ky(k|t) − ye k2Q5 (4.35) k=0 onde foi excluı́do o termo kν(k|t) − νe k2Qν pois como o sinal de controle é do tipo binário {0, 1}, não tem sentido falar sobre a ponderação do sinal de controle. Em sistemas contı́nuos o parâmetro Qν é escolhido de foram tal de evitar a saturação do atuador ou ações de controle muito fortes, mas para sistema hı́brido onde o sinal de controle é somente binário não tem sentido falar sobre saturação ou ações de controle fortes, o controle é 1 ou 0. Definida a função custo, surge o primeiro problema de aplicação direta da metodologia tradicional de CPMI visto nas seções anteriores. ¿Como definir ye quando o sistema possui sinal de control puramente binário?. Si escolhemos ye em cada perı́odo de amostragem como mostrado na seção 4.2.1, então em estado estacionário o sinal de controle poderia tomar o valor 0, e por tanto a corrente no inductor assim como a tensão no capacitor Controle Preditivo de Sistemas Hı́bridos 107 iriam para 0, ou o valor 1 e então a corrente pelo inductor iria para infinito (caso ideal) e a tensão no capacitor para 0. Em regime permanente, o valor do sinal de controle achado se repetiria indefinidamente de acordo com a filosofia do CPBM. Ou seja qualquer que seja o valor de referência que colocarmos no problema (4.31) a tensão de saı́da do CBB em estado estacionário iria para 0. A solução achada foi colocar diretamente o valor da referência que deseja-se alcançar em vez de ye na função custo: J(ν0T −1 , x0 ) , T −1 X ky(k|t) − r(k)k2Q5 (4.36) k=0 onde r(k) é o valor da referência conhecida no instante de tempo t + k. Isto faz, como veremos nos resultados de simulação a seguir, que em estado estacionário se repita uma seqüência de 0 e 1 no sinal de controle e não mais um único valor (0 ou 1). Por tanto o sinal de controle será periódico e de perı́odo desconhecido. Como o sinal de controle é periódico também o sinal de saı́da será um sinal periódico com valor médio o valor da referência, pelo menos isso é o que se esperaria. O termo kx(k|t) − xe k2Q4 também foi omitido, dado que o único objetivo de controle que interessa em principio, é que a saı́da y(t) do CBB siga uma referência constante r(t). Escolhendo um horizonte de predição T = 3, freqüência de amostragem fs = 150kHz e o valor da referência r(t) = 12V , obtemos a resposta em malha fechada mostrada na Figura 4.1. Ampliando a Figura na região do estado estacionário, (Figura 4.2), é possı́vel observar o comportamento periódico do sinal de saı́da causado pela natureza binária do sinal de controle. Se aumentarmos a freqüência de amostragem para fs = 200kHz, podemos observar da Figura 4.3 que o sistema em malha fechada perde a estabilidade. Esta é outra peculiaridade que apresenta o sistema por ter um controle do tipo binário. Em Pomar (2005) foi projetada uma lei de controle preditivo para o mesmo CBB visto neste estudo de caso com a mesma função de custo (equação (4.36)), mas usou-se o modelo médio do CBB, por tanto a lei obtida era contı́nua. O sinal de controle u(t) era um número real pertencente ao intervalo [0, 1]. A pesar do sistema possuir um modo instável (quando a posição da chave estiver fechada, q = 1), a lei de controle contı́nua permitia estabilizar o sistema qualquer que fosse o perı́odo de amostragem escolhido adequadamente. Isto não acontece no caso do CPMI, devido novamente a natureza binária da lei de controle. Controle Preditivo de Sistemas Hı́bridos 108 vO(V) 15 10 vO 5 vref 0 0 0.5 1 1.5 2 tempo(s) 2.5 −3 x 10 iL(A) 0.5 0 0 0.5 1 1.5 2 Controle tempo(s) 2.5 −3 x 10 1 0.5 0 0 0.5 1 1.5 2 tempo(s) 2.5 −3 x 10 Figura 4.1: Resposta do sistema em malha fechada: CBB + CPMI Utilizando a seguinte função de custo, podemos resolver o problema da estabilidade: min J(ν0T −1 , x0 ) ν0T −1 , T −1 X kx(k|t) − rx (k)k2Q4 (4.37) k=0 onde rx (k) é o valor da referência conhecida para os estados do sistema no instante de tempo t + k. A Figura 4.4 mostra a resposta do sistema em malha fechada para uma freqüência de amostragem fs = 200kHz, T = 3 e com a função custo (4.37). Esta nova estratégia considera na otimização tanto a corrente como a tensão e por isso evita que o controle da corrente seja perdido por causa da natureza hı́brida do sinal de controle. Quando fecha-se a chave, q = 1, o inductor armazena energia, e o capacitor descarregase através da carga R, a tensão de saı́da diminui; ao abrir-se a chave, q = 0, então o inductor entrega parte da energia armazenada, carregando o capacitor C, a tensão de saı́da aumenta. Ocorre, se não considerarmos a corrente na estratégia de controle, que dado um certo conjunto de valores dos parâmetros L, C, R e T s, que o inductor pode carregar-se tanto (não á controle de corrente), que o controlador pode preferir manter a Controle Preditivo de Sistemas Hı́bridos 109 12.06 12.04 12.02 vO(V) 12 11.98 11.96 11.94 11.92 11.9 11.88 9 9.2 9.4 9.6 tempo(s) 9.8 10 −3 x 10 Figura 4.2: Resposta do sistema em estado estacionário. chave fechada e que a tensão de saı́da diminua, que abrir a chave e carregar o capacitor com uma tensão muito alta, (a tensão de saı́da aumentaria mais colocando q = 1 do que diminuiria colocando q = 0). Mas isto provoca que o inductor siga carregando-se e assim sucessivamente. O sistema torna-se instável. Se tratarmos de seguir uma referência constante de 100V na saı́da, com um horizonte de predição T = 3, freqüência de amostragem fs = 50kHz, e usando a função custo (4.37), observamos que o sistema no consegue alcançar em regime permanente o valor de referência, (Figura 4.5), aumentando-se o horizonte de predição T o valor do erro em regime permanente diminui, mas como já foi colocado nas seções anteriores isto aumenta significativamente a complexidade computacional do problema. A Figura 4.5 mostra diferentes respostas do sistema em malha fechada para diferentes valores do horizonte de predição. O estudo de caso apresentado nesta seção deixa uma serie de questionamentos e problemas em aberto que serão estudados ao longo da tese. Um sistema hı́brido pode apresentar sinais de controle contı́nuos unicamente, contı́nuos e discretos ou puramente discretos como o caso do CBB. As propriedades de controlabilidade, observabilidade e estabilidade não estão definidas de forma geral para qualquer tipo de sistema hı́brido, e como já vimos Controle Preditivo de Sistemas Hı́bridos 110 vO 15 10 vO 5 vref 0 0 0.5 1 1.5 2 tempo(s) 2.5 1.5 2 tempo(s) 2.5 1.5 2 tempo(s) 2.5 3 3.5 −3 x 10 iL(A) 100 50 controle 0 0 0.5 1 3 3.5 −3 x 10 1 0.5 0 0 0.5 1 3 3.5 −3 x 10 Figura 4.3: Resposta do sistema para fs = 200kHz. no capitulo anterior é uma questão teórica em aberto. Assim surgem questões como: dado um conjunto de possı́veis condições iniciais para o sistema hı́brido, ¿existe alguma lei de controle que permita atingir um valor de referência desejado em regime permanente?. No caso do CPMI, qual é a relação entre o valor do horizonte de predição T e o erro em regime permanente. Que T seria necessário, por exemplo, no caso do CBB para alcançar uma tensão de referência de 100V . Se existir ese valor de horizonte de predição T e ele for um valor muito grande, ¿não haveria uma forma, através de uma penalização terminal ou restrição terminal no CPMI, de alcançar ese valor de referência com um T menor?. Da mesma forma, ¿como poderia-se garantir a estabilidade do sistema em malha fechada com uma lei do tipo CPMI?. 4.3 Conclusões Neste capı́tulo foram desenvolvidos aspectos teóricos e práticos do CPMI, e ficaram explicitadas algumas questões em aberto, que serão objeto de estudo desta tese. A importância fundamental do CPMI reside em que, como o contexto MLD permite Controle Preditivo de Sistemas Hı́bridos 111 vO(V) 15 10 vref 5 vO 0 0 0.5 1 1.5 2 tempo(s) 2.5 1.5 2 tempo(s) 2.5 1.5 2 tempo(s) 2.5 3 3.5 −3 x 10 iL(A) 0.4 0.2 controle 0 0 0.5 1 3 3.5 −3 x 10 1 0.5 0 0 0.5 1 3 3.5 −3 x 10 Figura 4.4: Resposta do sistema para fs = 200kHz, N = 3 e função de custo (4.37). a modelagem de uma grande quantidade de processos hı́bridos é interessante do ponto de vista prático e teórico saber como projetar uma lei de controle preditivo nesse contexto. O CPMI é similar ao já conhecido CPBM classico, mas devido à presença de variáveis inteiras, o procedimento de otimização é um problema de Programação Mista Inteira. Todo modelo MLD tem um equivalente PWA e viceversa. Se bem como já foi dito o contexto MLD permite a modelagem de uma grande quantidade de processos hı́bridos, propriedades como controlabilidade, observabilidade e estabilidade se estudam melhor no contexto PWA. Por tanto o passo a seguir desta tese é o estudo destas propriedades no contexto PWA assim como técnicas de controle preditivo. Controle Preditivo de Sistemas Hı́bridos 112 T=3 vO(V) 100 vO 50 0 vref 0 0.5 1 1.5 2 tempo(s) T=6 2.5 3 3.5 4 −3 x 10 vO(V) 100 vO 50 0 vref 0 0.5 1 1.5 2 tempo(s) T=9 2.5 3 3.5 4 −3 x 10 vO(V) 100 vO 50 0 vref 0 0.5 1 1.5 2 tempo(s) 2.5 3 3.5 4 −3 x 10 Figura 4.5: Resposta do sistema para fs = 50kHz, T = 3, T = 6 e T = 9. Capı́tulo 5 Conclusões e Cronograma 5.1 Conclusões O trabalho final da tese, será orientado principalmente ao projeto integrado de controle e sistemas hı́bridos em particular a conversores de potência com aplicação a Industria do Petróleo. Com este fim nesta etapa previa iniciou-se o estudo teórico da metodologia de projeto integrado para processos, e aplicou-se os conhecimentos adquiridos a un conversor de potência DC-DC, o conversor Buck-Boost. Também estudou-se diferentes formas de modelagem de sistemas hı́bridos, em particular desenvolveu-se o contexto MLD de modelagem por ser este um marco que permite a modelagem de uma grande quantidade de processos hı́bridos. Também mostrou-se neste trabalho prévio como projetar uma lei de controle preditivo no contexto MLD. Para exemplificar a técnica de modelado MLD de um sistema hı́brido forma realizado dois estudos de caso: (i) Sistema de Controle de Temperatura, (ii) Conversor Buck-Boost. Para exemplificar a metodologia do projeto da lei de controle CPMI, projetou-se um controlador CPMI para o CBB. Ficaram uma serie de questões em aberto a ser investigadas na tese. Será também objetivo de investigação desta tese o estudo e a aplicação de diferentes técnicas de projeto de controladores preditivo no contexto de modelagem PWA. Finalmente e como objetivo principal desta tese realizara-se o projeto integrado de um conversor de potência HVDC e a sua lei de controle preditivo. Os conversores HVDC são uma nova alternativa para alimentação energética de plataformas de extração de gas em alto mar, e oferecem uma serie de benefı́cios em comparação aos geradores a turbinas a gás usados tradicionalmente nas plataformas. A tecnologia HVDC e uma alterna- Conclusões e Cronograma 114 tiva ambiental amigável, mais eficiente, e mais segura, este tipo de soluções demanda muito menos mantenimento y pode ser controlado desde o continente o que faz necessário muito menos pessoal capacitado na plataforma, em muitos casos é possı́vel mostrar os benefı́cios econômicos de fornecer energia desde o continente que usando o gás produzido na plataforma. As principais contribuições preliminares são: 1. O projeto integrado do processo e do controle é uma técnica aplicada fundamentalmente no âmbito de processos. Uma contribuição preliminar deste trabalho foi a aplicação desta técnica no âmbito da eletrônica de potência. 2. A aplicação das técnicas de projeto integrado a sistema hı́bridos também e outra contribuição deste trabalho preliminar. 3. Também a aplicação do contexto MLD de modelado a conversores de potência assim como o projeto da lei de controle MIPC e uma contribuição preliminar deste trabalho. 5.2 Cronograma Atividades já realizadas: • (A) Realização dos créditos em disciplinas. • (B) Revisão bibliográfica sobre projeto integrado de processos e controle. • (C) Revisão bibliográfica sobre modelado de sistemas hı́brido e controle preditivo de sistemas no contexto MLD. • (D) Realização de estudo de caso: Conversor Buck-Boost. Atividades a serem realizadas: • (E) Estudo das propriedades de controlabilidade e estabilidade para sistema hı́bridos no contexto PWA. Tratara-se de achar respostas as questões abertas quando projetou-se a lei de controle CPMI ao CBB. Conclusões e Cronograma 115 • (F) Estudo de técnicas de controle preditivo no contexto PWA. • (G) Extensão das técnicas de projeto integrado e controle a sistemas hı́bridos, tendo em conta propriedades de controlabilidade e estabilidade especifica para este tipo de sistemas. • (H) Realização do estudo se caso: Projeto Integrado de um conversor HVDC e uma lei preditiva hı́brida. • (I) Defesa da Tese de Doutorado. Foi realizado um estágio no exterior como parte do curso de Doutorado, no Departamento de Ingenierı́a de Sistemas da Universidad de Valladolid, Espanha. As atividades realizadas no estágio de doutorado realizado no exterior foram: • (B) • (C) • (D) Começou-se o estudo de caso. Atividades a serem realizadas no Brasil: • (A) • (D) Finalização do estudo de caso. • (E) • (F) • (G) • (H) • (I) Defesa da Tese de doutorado. Conclusões e Cronograma 116 Figura 5.1: Cronograma. Apêndice A Indices de Controlabilidade para sistemas SISO A.1 Indices de performance no domı́nio do tempo • tempo de subida (tr ), tempo que leva o sinal de saı́da para alcançar 90% do seu valor final. Usualmente requer-se que este tempo seja pequeno. • tempo de 5% ou tempo de assentamento (ts ), tempo depois da qual o sinal de saı́da mantém-se em ±5% do seu valor final. Usualmente requer-se que este tempo seja pequeno. • Sobre-sinal, valor de pico do sinal de saı́da dividido pelo valor final. Tipicamente este valor deve ser 1, 2 (20%) ou menor. • Fator de redução, o quociente entre o segundo e o primeiro pico do sinal de saı́da. Tipicamente este valor deve ser 0, 3 ou menor. • Erro em estado estacionário, a diferença entre o valor final da saı́da e o valor final desejado. Usualmente requer-se que eta diferença seja pequena ou nula. Os indices que caracterizam a resposta do sistema no domı́nio do tempo podem ver-se na Figura A.1. Indices de Controlabilidade para sistemas SISO 118 Step Response A Sobre−sinal =A Fator de redução = B/A B Amplitude 1.05 1 0.95 0.9 0 tr ts 0 Time (sec) Figura A.1: Caracterı́sticas da resposta em malha fechada a um degrau na referência. A.2 Indices de performance no domı́nio da freqüência Margens de Fase e Ganho A margem de ganho é definida como: GM = 1 |L(jw180 )| (A.1) onde w180 é a freqüência onde a curva L(jw) no plano complexo, corta o eixo real negativo entre −1 e 0, isto é: ∠L(jw180 ) = −180o (A.2) Se a mais de um corte o maior valor de |L(jw180 )| é considerado. O MG é o fator em que |L(jw)| pode aumentar antes de que o sistema em malha fechada se torne instável. O MG é diretamente uma salvaguarda contra a incerteza do ganho em estado estacionário (erro). Tipicamente requer-se que M G > 2. Se o gráfico de (L) corta o eixo real Indices de Controlabilidade para sistemas SISO 119 Nyquist Diagram 1 0.8 0.6 L(jw180 ) Imaginary Axis 0.4 0.2 1− 0 1 GM w = +∞ PM −0.2 −0.4 L(jw) L(jwc ) −0.6 −0.8 −1 −1 −0.8 −0.6 −0.4 −0.2 0 Real Axis 0.2 0.4 0.6 0.8 1 Figura A.2: Gráfico de L(jw) par uma planta estável. negativo entre −1 e −∞ então um margem de redução de ganho pode ser similarmente definido tomando o menor valor do corte de |L(jw180 )| no eixo real. A margem de fase é definida como: P M = ∠L(jwc ) + 180o (A.3) |L(jw)| = 1 (A.4) onde wc é a freqüência onde: A PM nos proporciona o valor da fase negativa que podemos adicionar a L(s) na freqüência wc antes que a fase a essa freqüência seja −180o o que corresponde a um sistema instável em malha fechada. Tipicamente requer-se que o PM seja maior que 30o . A PM é diretamente uma salvaguarda contra a incerteza no tempo de retardo ou tempo morto do sistema. Indices de Controlabilidade para sistemas SISO 120 Máximo Pico O pico máximo da função de sensibilidade e sensibilidade complementaria são definidos como: MS = max |S(jw)|; MT = max |T (jw)| w w (A.5) (Note que MS = kS(jw)k∞ e MT = kT (jw)k∞ em termos da norma H∞ ). Tipicamente requer-se que MS < 2(6dB) e MT < 1, 25(2dB). Um valor grande de MS ou MT (maior que 4) indica uma pobre performance do sistema assim como uma pobre robustez. Dado que S + T = 1 então para qualquer freqüência ||S| − |T || ≤ |S + T | = 1 é por tanto MS e MT diferem como máximo em 1. Um valor grande de MS por tanto ocorre se e somente se MT e grande. O limite superior de MT é uma especificação clássica no projeto de controladores. Vamos dar agora uma justificativa de por que delimitar o valor de MS . Sem controle (u = 0), temos que e = y − r = Gd d − r, e com controle por realimentação e = S(Gd d − r). Por tanto o controle por realimentação melhora a performance reduzindo |e| para toda a freqüência onde |S| < 1. Usualmente, |S| é pequeno a baixas freqüências, por exemplo, |S(0)| = 0 para sistemas com ação integral. Mas como todos os sistemas reais são estritamente próprios, temos que a altas freqüências L → 0 ou equivalentemente S → 1. Nas freqüências intermédias não e possı́vel evitar na prática valores de pico, MS , maiores que 1. Então há uma região de freqüências intermédias onde o controle por realimentação degrada a performance, e o valor de MS é uma medida do pior caso desta degradação. Podemos ver MS como uma medida de robustez. Para manter a estabilidade em malha fechada o número de vezes que L(jw) rodeia o ponto crı́tico −1 não deve mudar, por tanto desejamos que L se mantenha longe deste ponto. A menor distancia entre L(jw) e o ponto −1 é MS−1 , e por tanto para a robustez, um pequeno valor de MS , e melhor. Em resumo tanto como para a estabilidade como para a robustez é desejável que MS esteja perto de 1. O pico máximo e os margens de ganho e fase estão relacionados. Especificamente, para um MS dado, podemos garantir que: GM MS ≥ ; PM ≥ 2 arcsin MS − 1 µ 1 2MS ¶ ≥ 1 [rad] MS (A.6) Indices de Controlabilidade para sistemas SISO 121 Por exemplo, com MS = 2 garantimos que GM ≥ 2 e P M ≥ 29.0o . Similarmente para um valor dado de MT podemos garantir que: GM 1 ≥1+ ; PM ≥ 2 arcsin MT µ 1 2MT ¶ > 1 [rad] MT (A.7) e por tanto com MT = 2 temos que GM ≥ 1.5 e P M ≥ 29.0o Prova (Skogestad e Postlethwaite 1997) Em conclusão vemos que as especificações de máximo pico de |S(jw)| ou |T (jw)| (MS ou MT ), podem facer as especificações nos margens de ganho e fase não necessárias. Por exemplo exigindo que MS < 2 implica na comum regra geral GM > 2 e P M > 30o . Também existe uma correlação entre os picos no domı́nio da freqüência e do tempo, o leitor interessado pode leer sobre este tópico em (Skogestad e Postlethwaite 1997). Largura de Banda e Freqüência de Corte O conceito de largura de banda e muito importante para entender os benefı́cios e o compromisso performance-robustez do controle por realimentação. Acima analisamos os picos da função de transferência em malha fechada, os quais estão relacionados com a qualidade da resposta do sistema. No entanto, para a performance devemos considerar a velocidade da resposta e isto conduz a considerar a largura de banda do sistema. Em geral uma grande largura de banda corresponde a um sistema com tr pequeno, dado que sinais de alta freqüência passam mais facilmente na saı́da. Mas também indicam um sistema mais sensı́vel aos ruı́dos e as variações nos parâmetros. Se o sistema tiver uma largura de banda pequena então ele será em geral mais lento mas mais robusto. Definição A.1 A largura de banda (em malha fechada) wB , e a freqüência onde |S(jw)| cruza para abaixo por primeira vez √1 2 = 0.707(≈ −3dB). Uma definição alternativa, tradicionalmente usada para definir largura de banda m sistemas de controle é a seguinte: A largura de banda em termos de T , wBT , é a maior freqüência onde |T (jw)| cruza para cima √1 2 = 0.707(≈ −3dB). Definição A.2 A freqüência de corte wc , é definida como a freqüência onde |L(jwc )| cruza por cima por 1 pela primeira vês. Indices de Controlabilidade para sistemas SISO 122 Possui a vantagem de ser fácil de calcular, e usualmente da um valor entre wB e wBT Especificamente para sistemas com P M < 90o temos que: wB < wc < wBT (A.8) wB (a qual e definida em termos de |S|) e wc (em termos de |L|) são bons indicadores de performance em malha fechada, no entanto wBT (em termos de |T |) pode ser ora errôneos em alguns casos. O motivo e que desejamos um T ≈ 1 para ter uma boa performance, e não e suficiente que |T | ≈ 1, devemos considerar a fase. Por outro lado, para uma boa performance desejamos que S esteja perto de zero, e este será o caso se |S| ≈ 0 sem ter em conta a fase de S. Apêndice B Escalamento Quando se precisa utilizar técnicas de analise e controle baseadas em indices de otimização que ponderam diversas variáveis do sistema com magnitudes diferentes, o escalamento é muito importante. O escalamento faz as tarefas de analise do modelo e projeto do controlador muito mais fáceis. A tarefa de escalamento requer que o engenheiro crie certos critérios no começo do processo do projeto sobre os requerimentos de performance do sistema. Para fazer isso devem ser tomadas decisões sobre a magnitude esperada das perturbações e mudanças na referência, as magnitudes permitidas para cada sinal de entrada, e as magnitudes permitidas para a desviação dos sinais de saı́da. Seja o modelo linear incremental não escalado: b eb = yb − rb bu + G cd d; yb = Gb (B.1) onde (b) é usado para descrever as variáveis não escaladas. A idéia do escalamento é fazer as variáveis menores que 1 em magnitude. Isto e feito dividindo cada variável por seu maior valor esperado ou mudança permitida. Para as perturbações e as variáveis de entrada, usamos as variáveis escaladas: d= db dbmax , u= u b u bmax (B.2) onde dbmax é a variação esperada máxima na perturbação, e u bmax é a mudança permitida máxima da entrada. As variáveis yb, eb e rb tem as mesmas unidades, por tanto o mesmo fator de escalamento Escalamento 124 pode ser aplicado a cada uma delas. Duas alternativas são possı́veis: • ebmax máximo erro permitido. • rbmax máxima mudança esperada no valor da referência. Como o maior objetivo do controle e minimizar o erro eb, vamos usualmente escolher para o escalamento ebmax , por tanto: y= yb ebmax , r= rb ebmax , e= eb ebmax (B.3) Para formalizar o procedimento de escalamento se introduzem os fatores de escalamento: De = ebmax , Du = u bmax , Dd = dbmax , Dr = rbmax (B.4) Para sistemas de múltiplas entradas e múltiplas saı́das (MIMO) cada variável dos b rb, u vetores d, b e eb tem valores máximos diferentes, en dito caso Dd , Dr , Du e De se transformam em matrices de escalamento diagonal. As variáveis escaladas correspondentes, para usar com o propósito de controle, são por tanto: −1 b u = D−1 u b, e = De−1 eb, r = De−1 rb d = Dd−1 d, u b, y = De y (B.5) Substituindo (B.5) em (B.1) temos que: b uu + G cd Dd d; De e = De y − De r De y = GD (B.6) e introduzindo as funções de transferência escaladas: b u , Gd = D−1 G cd Dd G = De−1 GD e (B.7) chegamos no seguinte modelo em termos das variáveis escaladas: y = Gu + Gd d, e = y − r (B.8) Aqui u e d são menores a 1 em magnitude. E útil também em alguns casos introduzir a referência escalada re, menor que 1 em magnitude. Isto e feito dividindo a referência pelo Escalamento 125 valor da mudança máxima esperada: re = rb rbmax = Dr−1 rb (B.9) temos então que: r = Re r onde R , De−1 Dr = (B.10) rbmax ebmax O diagrama de blocos do sistema com as variáveis escaladas mostra-se na Figura B.1; podemos agora expressar o objetivo de controle, para dito sistema, da seguinte forma: em termos das variáveis escaladas |d(t)| ≤ 1 e re(t) ≤ 1, será nosso objetivo de controle manipular u, com |u(t)| ≤ 1, tal que |e(t)| = |y(t) − r(t)| ≤ 1 durante todo o tempo. Figura B.1: Modelo em termos das variáveis escaladas. Comentario B.1 • Muitas das interpretações dos indices de controlabilidade mostrados a seguir dependem criticamente de um correto escalamento. • Com o escalamento mostrado anteriormente, o pior comportamento do sistema é analisado considerando a perturbação d com magnitude 1, e a referência re com magnitude 1. • O escalamento da saı́da em (B.3) em termos do erro é usado quando se analisa uma planta dada. No entanto se o objetivo é selecionar quais saı́das serão controladas, então podemos escalar a saı́da respeito de sua variação esperada, (usualmente similar a rbmax ). Escalamento 126 • Se a variação esperada ou permitida de uma variável arredor de 0 é não simétrica, então a maior variação deve ser usada para dbmax e a menor variação para u bmax e ebmax Apêndice C Modelado Eficiente de Sistemas MLD A tradução de proposições lógicas ou declarações mistas logicas/continuas em desigualdades, vistas na seção 3.3.1, é um passo que determina criticamente o tamanho do modelo MLD resultante em termos do número de variáveis. É importante achar modelos que tenham um número pequeno de variáveis binárias, pois isto permite melhorar a velocidade de resolução dos problemas matemáticos de otimização, necessários para análise, sı́ntese e supervisão de sistemas hı́bridos. Nesta apêndice propõe-se métodos eficientemente para a tradução de proposições lógicas em desigualdades diminuindo o número de variáveis auxiliares necessárias. Os métodos são aplicáveis quando as proposições lógicas são mais complexas que as mostradas na Tabela 3.2, envolvendo combinações arbitrárias de operadores. C.1 Lógica Proposicional Observações Gerais Suponha que Xi e uma variável booleana. A formula booleana F F (X1 , ..., Xn ) (C.1) Modelado Eficiente de Sistemas MLD 128 é uma combinação arbitraria de vaiáveis Xi por meio de operadores lógicos (., ∨, ∧, ⊕, ← , →, ↔). A formula booleana F é uma Forma Normal Conjuntiva (FNC) ou Produto de Sumas, se é escrita na seguinte forma: F = n ^ ψi (C.2) Xij (C.3) i=1 onde ψi = n _ i=1 A formula booleana ψi e chamada termos do produto ou maxterms, e Xij termos da suma. É bem sabido que qualquer formula booleana pode ser transformada numa FNC, usando as leis distributivas, negação e De Morgan. A FNC é mı́nima si ela possui o mı́nimo número de maxterms e cada maxterms tem o número mı́nimo de termos da suma. Esta definição de minimalidade vem do campo de desenho de circuitos lógicos onde cada operador lógico da FNC e implementado usando uma comporta lógica ou tendo entradas adicionais em comportas com multi-entradas. Toda formula booleana pode ser reescrita como uma FNC mı́nima (Kohavi 1978) A formula booleana f é chamada de função booleana se, após renomear os literais, esta é usada para definir o literal Xn como função de (X1 , ..., Xn−1 ): Xn ↔ f (X1 , ..., Xn−1 ) (C.4) que também pode ser escrita como Xn = f (X1 , ..., Xn−1 ), onde f é uma função booleana arbitraria. De forma mais geral, podemos definir relações entre variáveis booleanas X1 , ..., Xn com uma relação booleana: F (X1 , ..., Xn ) = T (C.5) onde F é uma fórmula booleana. Observar que cada função booleana é também uma relação booleana, mas u oposto não e verdade. O problema de satisfazer uma relação booleana é o problema de determinar se existe uma designação de {F, T } a seus literais tal que a correspondente formula booleana seja avaliada como verdadeira. Uma designação verdadeira de uma formula booleana é chamada de ponto válido. A idéia de resolver estes problemas de inferências lógicas com métodos de otimização conta con ferramentas da área da programação inteira (Chandru e Hooker 1999, Nemhauser e Wolsey 1988, Schrijver 1986). Observar que: Modelado Eficiente de Sistemas MLD 129 • Cada função booleana tem exatamente 2n−1 pontos válidos • A formula booleana com exatamente 2n−1 pontos válidos não precisa ser uma função booleana. Associando variáveis binárias δi ∈ {0, 1} com cada variável booleana Xi ∈ {F, T }, um ponto válido da fórmula booleana pode ser descrito equivalentemente como um elemento do conjunto {0, 1}n ⊂ [0, 1]n . Por tanto o conjunto de todos os pontos válidos de uma fórmula booleana podem ser representados como o conjunto de vértices de um hipercubo [0, 1]n , isto é como os vértices de um politopo em [0, 1]n . Vamos chamar PCH o politopo determinado por todos os pontos válidos da fórmula booleana F : PCH (F ) , {x ∈ [0, 1]n : x ∈ conv(todos os pontos validos de F )} (C.6) Aqui, conv(Y ) denota o fecho convexo do conjunto de pontos Y . Um politopo tem duas respresentações padrões: a representação-V que especifica o politopo por seus vértices e a representação-H que especifica o politopo como a intersecção de semi-espaços dados por desigualdades lineares (Zieger 1995). Um vértice, em que todos os componentes são inteiros, é chamado de vértice integral. Os seguintes métodos são uma generalização das regras mostradas na Tabela 3.2. A meta é achar desigualdades lineares equivalentes para as relações booleanas arbitrárias C.5. Vamos mostrar três métodos com este fim: o método de substituição, o método analı́tico, e o método geométrico. Método de substituição Dado a relação booleana C.5, este método consiste em reconhecer termos elementar listados na tabela 3.2 e substituirlos com variáveis booleanas adicionais. A idéia é facilmente aplicável já que é baseado na aplicação recursiva das regras básicas da tabela 3.2. No entanto, a introdução de variáveis adicionais é uma desvantagem severa e é desnecessária como vamos mostrar com os próximos métodos. Modelado Eficiente de Sistemas MLD 130 Método analı́tico ou método da FNC O método analı́tico consiste primeiro em converter C.4 ou C.5 na FNC, o que pode ser realizado automaticamente usando um de várias técnicas disponı́vel, veja por exemplo Miller (1965) e Sasao (1999). Consideremos a FNC da forma: m ^ j=1 _ i∈Pj Xi ∨ _ Xi (C.7) i∈Nj Onde Pj denota o conjunto de ı́ndices do literal que aparece em forma positiva no j − th maxterm, e Nj denota o conjunto de ı́ndices do literal que aparece em forma negada no j − th maxterm. A FNC indica que todos os maxterms devem ser verdadeiros para que a fórmula booleana seja verdadeira. Quando impomos um conjunto de restrições num problema de otimização exigimos também que os pontos válidos satisfaçam todas as desigualdades simultaneamente. Para cada maxterms podemos portanto deduzir uma desigualdade inteira. Observe ainda mais que um maxterm é verdadeiro, se e somente se ao menos um de seus termos da soma é verdadeiro. Com esta observação, o conjunto de desigualdades lineares inteiras correspondendo a C.7 é: P P 1 ≤ δ + i i∈P i∈N1 (1 − δi ) 1 .. . P 1 ≤ P i∈Pm δi + i∈Nm (1 − δi ) (C.8) As desigualdades C.8 podem ser incluı́dos como restrições no modelo MLD em 3.26. Com estas desigualdades podemos definir o conjunto PF N C para qualquer fórmula booleana F como: PF N C , {x ∈ [0, 1]n : (C.8) e satisf eita com x = [δ1 , ..., δn ] ∈ [0, 1]n } (C.9) PF N C (F ) é o politopo no hipercubo da unidade de dimensão n que inclui todos os pontos inteiros x ∈ {0, 1}n para a qual F (x) = T . É o conjunto de pontos definido por C.8 relaxando a restrição de integrality em δi de δi ∈ {0, 1} a δi ∈ [0, 1]. Nenhuma das variáveis auxiliares necessitam ser introduzidas com esta técnica. Outra Modelado Eficiente de Sistemas MLD 131 vantagem é sua simplicidade uma vez conhecida a FNC da fórmula booleana desejada. Uma desvantagem é o esforço que se deve fazer no calculo simbólico da FNC de uma fórmula booleana arbitrária. Isto pode exigir técnicas como os mapas de Karnaugh, veja por exemplo Kohavi (1978), se a formula booleana é dada implicitamente por seu pontos válido. Outra desvantagem deste método tem a ver com o conjunto PF N C . Como será visto depois, PF N C pode ser um conjunto que é maior do que realmente necessário para definir os pontos factı́veis inteiros. De fato, PF N C pode ter vértices não-integral. Algoritmo C.1 Então, usando as equivalências da Tabela 3.2 é possı́vel converter qualquer expressão lógica em outra expressão envolvendo variáveis inteiras si a expressão lógica inicial se escreve na sua FNC. Q1 ∧ Q2 ∧ · · · ∧ Qn Onde as Q são expressões de P escritas como disjunções. O algoritmo para obtenção da FNC é: 1. Substituir implicações por sua expressão equivalente: P1 → P2 ↔ P 1 ∨ P2 2. Aplicar a lei de De Morgan para deslocar para dentro as negações: (P1 ∧ P2 ) ↔ P 1 ∨ P 2 (P1 ∨ P2 ) ↔ P 1 ∧ P 2 3. Utilizar a propriedade distributiva para chegar na FNC. (P1 ∧ P2 ) ∨ P3 ↔ (P1 ∨ P3 ) ∧ (P2 ∨ P3 ) Exemplo C.1 (P1 ∧ P2 ) ∨ P3 → (P4 ∨ P5 ) 1. Paso 1 [(P1 ∧ P2 ) ∨ P3 ] ∨ (P4 ∨ P5 ) 2. Paso 2 [(P 1 ∨ P 2 ) ∧ P 3 ] ∨ (P4 ∨ P5 ) Modelado Eficiente de Sistemas MLD 132 3. Paso 3 [(P 1 ∨ P 2 ) ∨ (P4 ∨ P5 )] ∧ [P 3 ∨ (P4 ∨ P5 )] £ ¤ £ ¤ P 1 ∨ P 2 ∨ P4 ∨ P5 ∧ P 3 ∨ P4 ∨ P5 Por tanto colocamos [(P1 ∧ P2 ) ∨ P3 → (P4 ∨ P5 )] na FNC: [Q1 ∧ Q2 ], onde: Q1 = P 1 ∨ P 2 ∨ P4 ∨ P5 e Q2 = P 3 ∨ P4 ∨ P5 Associando as variáveis inteiras δ1 , δ2 , δ3 , δ4 e δ5 a P1 , P2 , P3 , P4 e P5 respectivamente obtemos a seguinte representação em desigualdades lineares inteiras: (1 − δ1 ) + (1 − δ2 ) + δ4 + δ5 ≥ 1 (1 − δ3 ) + δ4 + δ5 ≥ 1 Método geométrico, ou método da tabela de verdade O terceiro método é baseado numa interpretação geométrica. Mostraremos que este método supera a desvantagem concernente com PF N C (F ) do método analı́tico descrito previamente. Ele permite uma tradução automática de tabelas de verdade que representam fórmulas booleanas, em desigualdades lineares inteiras. Uma tabela de verdade para a fórmula booleana F (X1 , ...Xn ) é uma lista completa dos pontos válidos de F (.), isto é todos os vetores X = (X1 , ..., Xn ) ∈ {F, T }n para qual F (X) = T . A tabela de verdade pode ser montado para qualquer fórmula booleana, por exemplo por enumeração. As filas da tabela de verdade formam uma lista completa dos pontos válidos, isto é todos esses pontos em {0, 1}n que fazem F (X) verdadeiro, ou satisfazem Xn = f (X1 , ..., Xn−1 ). Quando modelamos sistemas na forma MLD freqüentemente encontramo-nos com os seguintes problemas: P1 Impor que a fórmula booleana F (X1 , ..., Xn ) seja verdadeira, isto é adicionar a restrição dada pela relação booleana F (X1 , ..., Xn ) = T Modelado Eficiente de Sistemas MLD 133 P2 Definir a função booleana Xn = f (X1 , ..., Xn−1 ) Assume-se que ambos f e F são definidos com o operadores básicos ∧, ∨, ., →, ↔, ⊕. O problema P1 especifica uma restrição ou uma caracterı́stica do sistema. Exemplo C.2 Um exemplo de P1 é a proposição que dois entradas binárias u1 e u2 não podam tomar o valor “1”ao mesmo tempo, se um tercer entrada u3 for zero. O correspondente fórmula booleana F1 fica assim: F1 (u1 , u2 , u3 ) = u3 → (u1 ∧ u2 ) Enquanto P1 tem o caráter de uma restrição, P2 define uma quantidade auxiliar a ser adicionada no modelo MLD e tem o caráter de uma equação algébrica. Exemplo C.3 Um caso tı́pico onde aparece P2 é a definição de uma transição de estado num automata finito. X1 , ..., Xn−1 codifica o estado presente e as entradas e Xn é o estado subseqüente. Então, a função f representa a função de transição de estados. Como é imediato transformar relações booleanas em tabelas de verdade, sem perda de generalidade vamos supor que F , f são definidos via uma tabela de verdade. Observe que a tabela de verdade em P2 tem sempre 2n−1 filas e n colunas. Por outro lado a tabela de verdade de P1 pode ter qualquer número de filas de 1 a 2n−1 . Exemplo C.4 Para ilustrar mais a diferença entre P1 e P2, considere o exemplo da fórmula booleana X1 ∧ X2 e da função booleana X3 = X1 ∧ X2 . As tabelas de verdade são dadas na tabela C.1. X1 V X2 V ⇒ δ1 1 δ2 1 X1 V V F F X2 V F V F X3 V F F F δ1 1 ⇒ 1 0 0 δ2 1 0 1 0 δ3 1 0 0 0 Tabela C.1: Tabelas de verdade para a fórmula X1 ∧X2 (esquerda) e para a função booleana X3 = X1 ∧ X2 (direita) Note que no primeiro caso há só um ponto válido e a tabela de verdade consiste portanto de uma só fila. Modelado Eficiente de Sistemas MLD 134 Considere o hipercubo H , [0, 1]n , e permita que H denote o conjunto de seus vértices. Seja conv(S) o fecho convexo do conjunto S ⊆ H, e CH (S) o conjunto complemento de S em H, isto é CH (S) [ S=H \ CH (S) S = ∅ O lema C.1 diz que o subconjunto S de H pode estar “envolvido”dentro de um politopo que não contem qualquer vetor do conjunto complemento CH (S). Lema C.1 Seja S ⊆ H. Então conv(S) ∩ CH (S) = ∅ Para ver a demonstração veja Mignone (2002). Considere agora a tabela de verdade T expressando os pontos válidos associados com os problemas P1 ou P2. Seja m o número de filas em T , e seja T = {R1 , ..., Rm } o conjunto de filas Ri de T considerado como um vetor em Rm , isto é a coleção de todos os pontos válidos. Cada componente da fila Ri é 0 ou 1 e por tanto Ri ∈ H, isto é Ri é um vértice do hipercubo H. Teorema C.1 Seja T a tabela de verdade com T filas, associada a fórmula booleana F nos literais X1 , ...Xn . Então F (X1 , ..., Xn ) é verdadeiro se e somente se o vetor associado δ , [δ1 , ..., δn ] ∈ {0, 1}n satisfaz as desigualdades Aδ ≤ B onde A e B definem o politopo PCH , {δ ∈ [0, 1]n : Aδ ≤ B} = conv(T ) (C.10) Além do mais, cada tradução inteira P = {δ ∈ [0, 1]n : Aδ ≤ B} de F é tal que PCH ⊆ P , isto é PCH é mı́nimo. Para ver a demonstração veja Mignone (2002). O enfoque proposto não introduz qualquer variável booleana adicional. Esta caracterı́stica, e a minimalidade do conjunto relaxado, são particularmente atraentes quando Modelado Eficiente de Sistemas MLD 135 o modelo é usado num problema de otimização. Se bem e verdade que não há nenhuma necessidade em fazer manipulações simbólicas para achar a FNC, este método sofre de pesados requerimentos computacionais para achar o fecho convexo dos pontos válidos e grandes requisitos de armazenamento para armazenar a tabela de verdade. Algumas ferramentas de software para calcular os pontos do fecho convexo são listados no próximo parágrafo. Calculo do fecho convexo Existem vários pacotes para transformar um poliedro P da forma P = {x : x = m X λi xi + p X i=1 µi ri } i=1 onde xi , ri são os pontos extremos e direções extremas de P respectivamente, e 0 ≤ λi ≤ 1, m X λi = 1, mui ≥ 0 i=1 à forma P = {x : Ax ≤ B} Para um exame detalhado destes pacotes, o leitor pode consultar a pagina http://www.geom.umn.edu/software/cglist/ch.html. Exemplo C.5 Considere a função booleana X3 = X1 ∧ X2 , cuja tabela de verdade é dada em Tabela C.1. As filas da tabela de verdade são representadas como pontos em R3 na Figura C.1. Seu fecho convexo, coincide com as desigualdades lineares mencionado na segunda regra da Tabela 3.2. Comparação dos métodos Há casos onde o método de substituição dá um número menor de desigualdades que os outros métodos (Cavalier et al. 1990). No entanto, a complexidade de introduzir variáveis binárias adicionais devem ser evitadas. Os outros dois métodos não exigem a introdução de qualquer variável adicional. No entanto, eles exigem pre-processamento, Modelado Eficiente de Sistemas MLD 136 Figura C.1: Fecho convexo das filas da tabela de verdade de X3 = X1 ∧ X2 tanto seja para construir a tabela de verdade ou para derivar a FNC. Especialmente, construir a tabela de verdade completa e derivar o fecho convexo de suas filas pode ser um tarefa computacionalmente cara, mesmo que programas de computador eficientes estejam disponı́vel para este propósito. Notar, no entanto, que é uma tarefa que pode ser feita offline. Em alguns casos a tabela de verdade talvez contenha só um número pequeno de filas, porque algumas combinações das variáveis independentes podem ser excluı́das a priori. Usando o método de tabela de verdade ou a transformação a FNC para achar as desigualdades que representam uma fórmula de booleana não têm por que dar os mesmos resultados num método como em outro. O Teorema C.1 afirma que PCH ⊆ PCN F . Em outras palavras, todos os vértices inteiros de PCN F são pontos válidos da fórmula booleana correspondente, contudo PCN F pode ter vértices de não-integrais. Existem fórmulas de booleanas, para as quais PCH 6= PCN F , ainda que PCN F seja derivado de uma FNC mı́nima. Exemplo C.6 Considere a fórmula booleana descrita por: (X1 ∨ X2 ) ∧ (X1 ∨ X3 ) ∧ (X2 ∨ X3 ) (C.11) Dado que C.11 está na FNC, podemos usar C.8 para obter as correspondentes desigual- Modelado Eficiente de Sistemas MLD dades como 137 1 1 0 x1 1 PCN F = {x ∈ [0, 1]3 : 1 0 1 x2 ≥ 1 } 0 1 1 x3 1 (C.12) A tabela de verdade de C.11 contem as filas [1, 1, 0], [1, 0, 1], [0, 1, 1], [1, 1, 1]. A fórmula booleana C.11 é caracterizada pelo fato que ao menos duas variáveis booleanas são verdadeiras. Portanto pode ser mostrado que PCH = {x ∈ [0, 1]3 : x1 + x2 + x3 ≥ 2} (C.13) Enquanto em PCH todos vértices são inteiros por construção, PCN F inclui um vértice em (0.5, 0.5, 0.5) que não é inteiro. Este exemplo ilustra que as desigualdades originadas da FNC podem descrever uma representação não minima da relaxação de uma proposição lógica, por causa da presença de vértices não inteiros. Por enumeração direta, pode ser mostrado que além de C.11 há só uma fórmula booleana envolvendo três variáveis booleanas, para qual PCH 6= PCN F , a saber (X1 ∨ X2 ) ∧ (X1 ∨ X3 ) ∧ (X2 ∨ X3 ) ∧ (X 1 ∨ X 2 ∨ X 3 ) (C.14) Para todas as outras fórmulas booleanas em {0, 1}3 é possı́vel assegurar que PCH = PCN F . Figura C.2: Esquerda: PCH das filas da tabela de verdade de (C.11), Direita: PF N C de (C.11), o vértice claro e não inteiro Modelado Eficiente de Sistemas MLD 138 Desigualdades de Clausal O conjunto de desigualdades Ax ≤ b é clausal, se cada elemento de A é 0, 1 ou −1, e cada bi satisfaz bi = 1 − ]{α : α = Aij = −1, j = 1...n} (C.15) Onde Aij é o elemento j − th da fila i em A e ] denota a cardinalidade de conjunto (Chandru e Hooker 1999). O conjunto de desigualdades C.8 associadas com a FNC é clausal por construção. Teorema C.2 Seja F uma fórmula booleana. Se PCH (F ) é dado por desigualdades clausales, então existe uma FNC, tal que PCH (F ) = PCN F (F ). Para ver a demonstração veja Mignone (2002). C.2 Proposições Mistas Lógicas-Continuas Nesta seção os resultados da seção C.1 são estendidos a proposições mistas lógicascontı́nuas. Vamos a considerar os mesmos três enfoques que foram desenvolvidos para as fórmulas booleanas e mostra sua aplicação a proposições envolvendo variáveis tanto contı́nuas como binárias. A Fórmula Booleana Generalizada (FBG) é a extensão da fórmula booleana obtida ei = [fi (x) ≤ 0] sejam agregadas como termos permitindo que desigualdades lineares X adicionais na fórmula booleana. A Forma Normal Conjuntiva Generalizada (FNCG) é definido assim, como a expressão: p ^ à mj _ j=1 i=1 [fij (x) ≤ 0] ∨ nj _ ! [δkj = 1] (C.16) k=1 Cada FBG admite uma representação FNCG equivalente. Vamos mostrar que cada FNCG pode ser traduzida em desigualdades mistas inteiras, contanto que um número suficiente de variáveis auxiliares seja introduzido. Vamos a desenvolver um meio sistemático para traduzir proposições lógicas complexas em desigualdades mistas inteiras. Uma designação (x, δ) ∈ Rn1 × {0, 1}n2 que faz C.16 verdadeira, é chamada de ponto válido. Modelado Eficiente de Sistemas MLD 139 Motivação No que segue, vamos supor que as cotas inferior e superior da função real afim fi (x) = a0i x − bi , fi : Rn 7→ R são conhecidos. Considere a disjunção lógica m _ [fi (x) ≤ 0] (C.17) i=1 que em general define um conjunto não-convexo em Rn , por exemplo o conjunto da Figura C.3 correspondente a disjunção [x1 ≤ 0] ∨ [x2 ≤ 0] (C.18) onde m1 ≤ x1 ≤ M1 , m2 ≤ x2 ≤ M2 . O conjunto na Figura C.3 é não-convexo, e portanto não pode ser escrito como um sistema linear de restrições {x ∈ Rn : Cx ≤ d}. De fato, o conjunto convexo mais pequeno contido na região factı́vel de C.18 contem pontos no primeiro quadrante excluı́dos por C.18. Figura C.3: Conjunto factı́vel definido por C.18 No entanto, introduzindo variáveis binárias adicionais δ ∈ {0, 1}, torna-se possı́vel representar a disjunção como um conjunto de restrições mistas inteiras. Usando as Tabelas 3.2 e 3.3, podemos introduzir δ1 , δ2 ∈ {0, 1} como δ1 , [x1 ≤ 0] (C.19) δ2 , [x2 ≤ 0] (C.20) Modelado Eficiente de Sistemas MLD 140 A proposição na Equação C.18 torna-se δ1 ∨ δ2 (C.21) Cada uma das três proposições C.19, C.20, C.21 podem ser traduzidas em desigualdades usando as Tabelas 3.2 e 3.3. Isto mostra que no espaço (x1 , x2 , δ1 , δ2 ), isto é num subconjunto de R4 , o conjunto factı́vel de C.18 podem ser representados como {x ∈ R2 × {0, 1}2 : Cx ≤ d}. Isto implica que depois da relaxação das restrições de integralidade a 0 ≤ δi ≤ 1, o conjunto factı́vel de C.18 torna-se um conjunto convexo poliédrico em {x ∈ R4 : Cx ≤ d}. Aumentar a dimensão do espaço através de variáveis binárias permite uma representação convexa do conjunto que nas coordenadas originais de interesse não é convexo. Método de substituição Semelhante ao caso das relações lógicas, o método de substituição consiste em aplicar iterativamente as regras de Tabelas 3.2 e 3.3 substituindo proposições lógicas elementares com variáveis auxiliares binárias adicionais. Com as Equações C.19, C.20, C.21 ilustramos o método. Ao contrário à substituição para função puramente lógica na Seção C.1, mostramos através da proposição lógica C.18, que a introdução de variáveis auxiliares pode ser necessária para traduções mistas lógica-contı́nuas. O método de substituição contudo pode introduzir mais variáveis que necessário, como será mostrado logo. Forma Normal Conjuntiva Generalizada Nesta seção vamos a fornecer um procedimento geral para traduzir FBG num conjunto de desigualdades lineares mistas inteiras. A prova do Teorema C.4 contem algumas sugestões construtivas para esta tradução. Teorema C.3 O FNCG com funções reais afins fij (x) p ^ à mj _ j=1 i=1 [fij (x) ≤ 0] ∨ nj _ ! [δkj = 1] (C.22) k=1 pode ser traduzida num conjunto de desigualdades mistas inteiras adicionando Modelado Eficiente de Sistemas MLD Pp 0 j=1 dlog2 (mj 141 + 1)e variáveis binárias, onde m0j ≤ mj é o número de restrições não- redundante no conjunto {x : fij (x) > 0, i = 1, ..., mj } A restrição [fj (x) ≤ 0] é redundante para a proposição C.17, se ( x: m _ ) [fi (x) ≤ 0] ( = m _ x: i=1 ) [fi (x) ≤ 0] (C.23) i=1,i6=j Teorema C.4 A proposição lógica com m funções afins fi (x) m _ [fi (x) ≤ 0] (C.24) i=1 pode ser traduzido num conjunto de desigualdades mistas inteiras adicionando l = dlog2 (m0 )e variáveis binárias, onde m0 ≤ m é o número de restrições não-redundante Prova. A prova é construtiva e envolve os seguintes passos: 1. Defina o fechamento do conjunto não factı́vel B como B = {x : m ^ [fi (x) ≥ 0]} (C.25) i=1 Como todos os fi são afins, B é convexo. 2. Elimine as restrições redundantes. Isto pode ser feito resolvendo para cada i = 1, ..., m um programa linear da forma Jc (i) = s.a. minx fi (x) Vm j=1,j6=i [fi (x) (C.26) ≥ 0] Se Jc ≥ 0, a i − th restrição é redundante. Isto dá o número de m0 restrições nãoredundante. Note que a disjunção C.24 pode ser escrita equivalentemente só usando as restrições não-redundantes. Este passo aponta em ter uma representação mı́nima de C.24. Além do mais, m0 é o número de facetas do politopo B. Modelado Eficiente de Sistemas MLD 142 3. De acordo com Bemporad et al. (1999), o conjunto X\B pode ser particionado em m0 conjuntos disjuntos convexos Cj . Cada conjunto pode ser descrito pelas desigualdades Cj = {x : Aj x ≤ bj } Onde através de uma numeração apropriada, nós temos Aj ∈ Rj×s e bj ∈ Rj (j = 1, ..., m0 ). 4. Temporariamente introduza m0 variáveis binárias δj com a propriedade que [δj = 1] ↔ [x ∈ Cj ] De acordo com as regras da Seção 3.3.1, as últimas relações podem ser traduzidas em desigualdades mistas inteiras como: Aj x − bj ≤ Mj (1 − δj ) m0 X (j = 1, ..., m0 ) δi = 1 (C.27) (C.28) i=1 5. Codifique as regiões Ci como segue: Introduza l = dlog2(m0 )e variáveis binárias µ1 , ..., µl tal que [δj = 1] ↔ [j = 1 + l−1 X 2i µi+1 ] (C.29) i=0 Use-as em C.27 para obter: A1 x − b1 ≤ M1 (l − (1 − µ1 ) − ... − (1 − µl )) A2 x − b2 ≤ M2 (l − µ1 − ... − (1 − µl )) .. . . ≤ .. Am0 x − bm0 ≤ Mm0 (l − µ1 − ... − µl ) Se m0 < 20 , adicionar restrições para excluir as combinações de µ1 , ..., µl que não são usados para codificar qualquer região. Para a representação com δj , C.28 expressa o fato que exatamente um δj é um para cada ponto de dados x. Isto não é exigido quando trabalhamos com µ1 , ..., µl , desde que cada código µ1 , ..., µl que for identifique uma região, ou a exclua. Modelado Eficiente de Sistemas MLD 143 ¤ O número de desigualdades resultantes do algoritmo descrito acima é dado por • (i) os limites em x ou em cada função fi (x) P 0 m0 (m0 +1) • (ii) m restrições definindo µ1 , ..., µl , e i=1 i = 2 • (iii) as restrições excluindo as combinações não utilizadas de µ1 , ..., µl Observe que negligenciando o passo 2 do procedimento de remoção de redundância aumentamos o número de variáveis auxiliares binárias a dlog2 (m)e, mas não se muda o algoritmo. Corolário C.1 A proposição lógica com m funções afins fi (x) m _ [fi (x) ≤ 0] ∨ i=1 n _ [δk = 1] (C.30) k=1 pode ser traduzida num conjunto de desigualdades mistas inteiras adicionando l0 = dlog2 (m0 + 1)e variáveis binárias, onde m0 ≤ m é o número de restriç4oes não-redundante W no disjunção m i=1 [fi (x) ≤ 0]. Finalmente, o último passo consiste em traduzir qualquer FBG a desigualdades sobre variáveis binárias e contı́nuas. Isto pode ser feito considerando as desigualdades [fi (x) ≤ 0] como variáveis booleanas simbólicas e manipulando todas as funções de acordo com a Seção C.1. 1. Substitua cada desigualdade [fi (x) ≤ 0] sobre variáveis contı́nuas com variáveis booleanas yi . 2. Ache a FNC da expressão usando os métodos descritos na Seção C.1. 3. Faça a substituição inversa, substitua as variáveis booleanas yi com [fi (x) ≤ 0]. 4. Aplique o teorema acima. Note que a eficiência do enfoque apresentado aqui pode crescer, se o esquema da a possibilidade de reconhecer partes comuns nas relações lógicas, como a múltipla ocorrência de uma desigualdade [f ij(x) ≤ 0] em C.22. Modelado Eficiente de Sistemas MLD 144 Exemplo C.7 Considere a seguinte FBG 4 _ [fi (x) ≤ 0] (C.31) i=1 onde x = [x1 , x2 ]T ∈ [−10, 10]2 ⊂ R2 , fi : R2 7→ R e f1 (x) = x1 + x2 (C.32) f2 (x) = 2x1 + x2 + 2 (C.33) f3 (x) = x2 − 1 (C.34) f4 (x) = 1.5x1 + x2 + 4.5 (C.35) (C.36) O conjunto de pontos factı́veis é não-convexo, (área pintada na Figura C.4). Figura C.4: Conjunto factı́vel definido por C.31 Vamos aplicar o procedimento descrito na demonstração do Teorema C.4 para achar às desigualdades que descrevem C.31, seguindo os mesmos passos e a terminologia introduzida no teorema. 1. O conjunto B é dado por não sombreada. V4 i=1 [fi (x) ≥ 0] e é mostrada na Figura ?? como a área Modelado Eficiente de Sistemas MLD 145 i 1 2 3 JC (i) -0.5 -7.33 -11 4 3.5 Tabela C.2: Solução de C.26 para o exemplo C.31 2. Resolvendo C.26 chegamos no resulta mostrado na Tabela C.2. Portanto i = 4 denota uma restrição redundante e m0 = 3. 3. O conjunto Cj é: C1 = {x ∈ R2 : [1 1]x ≤ 0} " # " # −1 −1 0 2 C2 = {x ∈ R : x≤ } 2 1 −2 −1 −1 0 2 C3 = {x ∈ R : −2 −1 x ≤ 2 } 0 1 (C.37) (C.38) (C.39) 1 4. Usando as cotas de x, as expressões C.27 tornam-se: h i 1 1 x ≤ 20(1 − δ1 ) " # " # −1 −1 0 20 x− ≤ (1 − δ2 ) 2 1 −2 32 −1 −1 0 20 −2 −1 x − 2 ≤ 28 (1 − δ3 ) " # 0 1 1 (C.40) (C.41) (C.42) 9 5. Aqui se mantiene que l = 2 e codificamos as regiões como: [δ1 ] ⇔ [µ1 µ2 ] = [0 0] (C.43) [δ2 ] ⇔ [µ1 µ2 ] = [1 0] (C.44) [δ3 ] ⇔ [µ1 µ2 ] = [0 1] (C.45) Finalmente, definindo X = [x1 x2 µ1 µ2 ]T e usando as expressões acima, obtemos as Modelado Eficiente de Sistemas MLD 146 desigualdades desejadas como 1 1 −20 −20 0 20 −20 30 2 1 30 −30 X ≤ 20 −1 −1 −20 20 30 −2 −1 −30 30 10 0 1 −10 10 −1 −1 20 (C.46) Método geométrico Estamos motivados a creer que a interpretação geométrica de introduzir variáveis binárias adicionais é uma ampliação a dimensão do espaço considerado. No espaço dimensional mais alto, a região especificada é um conjunto convexo. A projeção sobre o espaço de variáveis originais é ainda não-convexo. Enquanto isto é uma interpretação atraente, não é imediatas generalizá-lo ao procedimento para achar as desigualdades, além do espaço de dimensões baixas. De fato, não está claro a priori, como aumentar o espaço com variáveis binárias adicionais. Para o FBG C.18 esboçamos na Figurar C.5 o efeito de aplicar a idéia do seguinte algoritmo: 1. Introduza naux = 1 variável binária auxiliar. 2. Divida o conjunto não-convexo em conjuntos disjuntos convexos, a união deles deverá ser o conjunto original. 3. Designe a cada subconjunto obtido uma combinação diferente das variáveis binárias auxiliares. 4. Calcule no espaço dimensional mais alto o fecho convexo dos vértices. 5. Se o fecho convexo contem pontos excluı́dos pela proposição lógica, • aumente o número naux de variáveis binárias auxiliares em 1. Ou • escolha uma divisão diferente em 2. Ou • Escolha um código diferente em 3. Em general, não recomendamos confiar com estas interpretações geometrical para traduzir FBG em desigualdades, devido às ações pouco metódicas a serem tomadas no ponto 5. Modelado Eficiente de Sistemas MLD 147 Figura C.5: Conjunto factı́vel definido por C.31 C.3 Resumo Nas Seções C.1 e C.2 vimos uma diferença fundamental entre a tradução de relações puramente lógicas e relações mistas lógica-contı́nuas em desigualdades: a primeira pode ser traduzida sem adicionar variáveis, enquanto a segunda pode exigir a introdução de variáveis de booleanas. Teorema C.5 Seja P uma proposição lógica envolvendo nc variáveis contı́nuas e nb variáveis binárias. Seja V ⊂ XV = Rnc × {0, 1}nb o conjunto de pontos válidos de P e suponha que V é um conjunto compacto. Então, introduzindo na variáveis binárias, e = Rnc × {0, 1}na +nb de diV pode sempre ser delimitada por desigualdades no espaço X mensão na + nb + nc tal que no espaço dimensional mais alto o fecho convexo de pontos válidos não contem qualquer ponto inválido. Além do mais, se nc = 0 então na = 0 Para ver a demonstração veja Mignone (2002). Modelado Eficiente de Sistemas MLD C.4 148 The HYbrid Systems DEscription Language HYSDEL A derivação de modelos MLD “a mão” é uma tarefa tediosa e envolve a aplicação repetida das regras apresentado nas seções prévias. Este procedimento ainda é mais complicado se o objetivo é achar o modelo com o menor número de variáveis ou desigualdades envolvidas. Com o fim de simplificar o modelado para o usuário, um compilador foi desenvolvido para realizar a tradução automatizada de uma descrição do modelo de alto nı́vel na forma MLD. O objetivo do compilador é gerar as matrizes Ai , Bi , C, Di e Ei em (3.24, 3.25, 3.26). Estas matrizes são geradas na sintaxe do Matlab (.mat). A linguagem de especificação do problema ao compilador é HYSDEL (HYbrid System DEscription Language), (Torrisi et al. 2000). HYSDEL é confeccionado para modelar sistemas MLD e PWA, mas é de modo algum a única linguagem de modelado para sistemas hı́bridos. Outras linguagens e ferramentas são descritas por exemplo em (Benveniste et al. 1993, Fabian 1999). A ferramenta LPL é descrita em (Huerlimann 2001). Permite o modelado de sistemas contendo componentes lógicos e traduz o modelo no formato MPS (Murtagh 1981), um formalismo comum para a especificação de problemas matemáticos de otimização. Referências Bibliográficas Alur, R., Belta, C., Ivancic, F., Kumar, V., Mintz, M., Pappas, G. J., Rubin, H. e Schug, J. (1999). Hybrid modeling and simulation of biomolecular networks, In: M. D. Benedetto e A. S. Vincentelli (ed.), Hybrid Systems: Computation and Control, V. 2034 In: Lecture Notes in Computer Science, Springer-Verlag, p. 19–33. Alur, R., Courcoubetis, C., Henzinger, T. e Ho., P.-H. (1993). Hybrid automata: An algorithmic approach to the specification and verification of hybrid systems, In: A. Ravn, R. Grossman, A. Nerode e H. Rischel (ed.), Hybrid Systems, V. 736 In: Lecture Notes in Computer Science, Springer-Verlag, p. 209–229. Asarin, E., Bournez, O., Dang, T. e O.Maler (2000). Reachability analysis of piecewiselinear dynamical systems, In: B. Krogh e N. Lynch (ed.), Hybrid Systems: Computation and Control, V. 1790 In: Lecture Notes in Computer Science, Springer-Verlag, New York, p. 20–31. Bahrman, M. P. e Johnson, B. K. (2007). The abcs of hvdc transmission technologies, Power and Energy Magazine, IEEE 5(2): 32–44. Balluchi, A., Benvenuti, L., Benedetto, M. D., Pinello, C. e Vincentelli, A. S. (2000). Automotive engine control and hybrid systems: Challenges and opportunities, Proceedings IEEE 88(7): 888–912. Bemporad, A. (2003). Hybrid Toolbox-User’s Guide,. Bemporad, A. (2004). Efficient conversion of mixed logical dynamical systems into an equivalent piecewise affine form, IEEE Transactions on Automatic Control 49(5): 832–838. Bemporad, A., Borrelli, F. e Morari, M. (2000). Piecewise linear optimal controllers for hybrid systems, Proceedings of the American Control Conference . Referências Bibliográficas 150 Bemporad, A., Borrelli, F. e Morari, M. (2002). On the optimal control law for linear discrete time hybrid systems, In: M. Greenstreet e C. Tomlin (ed.), Hybrid Systems: Computation and Control, V. 2289 In: Lecture Notes in Computer Science, SpringerVerlag, New York, p. 105–119. Bemporad, A., Ferrari-Trecate, G. e Morari, M. (2000). Observability and controllability of piecewise affine and hybrid systems, IEEE Trans. Automatic Control 45(10): 1864– 1876. Bemporad, A. e Morari, M. (1999). Control of systems integrating logic, dynamics, and constraints, Automatica 35(3): 407–427. Bemporad, A., Morari, M., Dua, V. e Pistikopoulos, E. N. (1999). The explicit linear quadratic regulator for constrained systems, Relatório Técnico AUT99-16, Automatic Control Lab, ETH, Zürich, Switzerland. Benveniste, A., Borgne, M. L. e Guernic, P. L. (1993). Hybrid systems: the signal approach, In: R. Grossmann, A. Nerode, A. Ravn e H. Rischel (ed.), Hybrid Systems, n. 736In: Lecture Notes in Computer Science, Springer-Verlag. Blondel, V., Bournez, O., Koiran, P. e Tsitsiklis, J. (1999). The stability of saturated linear systems is undecidable, Journal of Computer Systems Science . Blondel, V. e Tsitsiklis, J. (1999). Complexity of stability and controllability of elementary hybrid systems, Automatica 35: 479–489. Borges, F. (2002). Analise e Controle de Sistemas de Estrutura Variavel, PhD thesis, Universidade Federal de Santa Catarina. Borrelli, F. (2002). Discrete Time Constrained Optimal Control, PhD thesis, Swiss Federal Institute of Technology, Zurich, Swiss. Branicky, M. (1994). Stability of switched and hybrid systems, Proc. Conf. Dec. Contr., p. 3498–3503. Branicky, M. (1998). Multiple lyapunov functions and other analysis tools for switched and hybrid systems, IEEE Trans. Automatic Control 43(4): 475–482. Branicky, M. S., Borkar, V. S. e Mitter, S. K. (1998). A unified framework for hybrid control: model and optimal control theory, IEEE Trans. Automat. Control 43(1): 31– 45. Referências Bibliográficas 151 Bristol, E. H. (1966). On a new measure of interactions for multivariable process control, Transaction on Automatic Control, IEEE AC-11: 133–134. Camacho, E. e Bordons, C. (2005). Model Predictive Control, Springer-Verlag. Cavalier, T. M., Pardalos, P. e Soyster, A. L. (1990). Modeling and integer programming techniques applied to propositional calculus, Comput. Oper. Res. 17(6): 561–570. Chandru, V. e Hooker, J. (1999). Optimization Methods for Logical Inference, Wiley Interscience Series in Discrete Mathematics and Optimization. Christiansen, D. (1997). Electronics engineers handbook, 4th ed., New York: IEEE Press/McGraw Hill, Inc. Chutinan, A. e Krogh, B. H. (1999). Verification of polyhedral invariant hybrid automata using polygonal flow pipe approximations, In: F. Vaandrager e J. van Schuppen (ed.), Hybrid Systems: Computation and Control, V. 1569 In: Lecture Notes inComputer Science, Springer-Verlag, New York, p. 76–90. DeCarlo, R., Branicky, M., Pettersson, S. e Lennartson, B. (2000). Perspectives and results on the stability and stabilizability of hybrid systems, Proc. IEEE 88: 1069–1082. Ezzine, J. e Haddad, A. (1989). On the controllability and observability of hybrid systems, Int. J. Control 49: 2045–2055. Fabian, G. (1999). A Language and Simulator for Hybrid Systems, PhD thesis, Technische Universiteit Eindhoven. Ferrari-Trecate, G., Cuzzola, F. A. e Morari, M. (2002a). Analysis of discrete-time pwa systems with boolean inputs, outputs and states, Hybrid Systems: computation and control (HSCC), Proceedings of the 5th international workshop on Hybrid Systems. Ferrari-Trecate, G., Cuzzola, F. e Morari, M. (2002b). Analysis of piecewise affine systems with logic states, In: C. J. Tomlin e M. R. Greenstreet (ed.), Proc. 5th International Workshop on Hybrid Systems: Computation and Control, V. 2289 In: Lecture Notes in Computer Science, Springer-Verlag, p. 194–208. Ferrari-Trecate, G., Mignone, D. e Morari., M. (2000). Moving horizon estimation for hybrid systems, Proc. American Contr. Conf. Referências Bibliográficas 152 Fletcher, R. e Leyffer, S. (1995). Numerical experience with lower bounds for miqp branch-and-bound., Relatório técnico, Dept. of Mathematics, University of Dundee, Scotland, U.K. Floudas, C. A. (1995). Nonlinear and Mixed-Integer Optimization, Princeton University. Glover, F. (1975). Improved linear integer programming formulation of nonlinear integer problems, Management Science 22(4): 455–460. Goshen-Meskin, D. e Bar-Itzhack, I. Y. (1992). Observability analysis of piece-wise constant systems-part i: Theory, IEEE Trans. Aerosp. Electr. Syst. 28(4): 1056–1067. Grossmann, R. L., Nerode, A., Ravn, A. P. e Rischel, H. (1993). Hybrid systems, V. 736, Lecture Notes in Computer Science. New York: Springer Verlag. Gutierrez, G. (2000). Diseño Integrado y Sı́ntesis de Procesos Aplicado al Proceso de Fangos Activados, PhD thesis, Universidad de Valladolid. Hassibi, A. e Boyd, S. (1998). Quadratic stabilization and control of piecewise-linear systems, Proc. American Contr. Conf., Philadelphia, Pennsylvania USA. Hayes, J. P. (1993). Introduction to digital logic design, Reading: Addison-Wesley. Heemels, W. P. M. H., Schumacher, J. M. e Weiland, S. (2000). Linear complementarity systems, SIAM Journal of Applied Mathematics 60(4): 1234–1269. Heemels, W., Schutter, B. D. e Bemporad, A. (2001). Equivalence of hybrid dynamical models, Automatica 37: 1085–1091. Hespanha, J., Bohacek, S., Obraczka, K. e Lee, J. (2001). Hybrid modeling of tcp congestion control, In: M. D. Benedetto e A. S. Vincentelli (ed.), Hybrid Systems: Computation and Control, V. 2034 In: Lecture Notes in Computer Science, Springer-Verlag, p. 291–304. Huerlimann, T. (2001). Reference Manual for the LPL Modeling Language, version 4.42 ed., Departement for Informatics, Université de Fribourg, Switzerland, http://www2iiuf.unifr.ch/tcs/lpl/TonyHome.htm. Hyttinen, M. e Bentzen, K. (2006). Operating experiences with a voltage source converter (hvdc light) on the gas platform troll a, Energex, Stavanger, Norway. Itkis, U. (1976). Control Systems of Variable Structure, John Wiley & Sons, New York. Referências Bibliográficas 153 Johannson, M. e Rantzer, A. (1998). Computation of piece-wise quadratic lyapunov functions for hybrid systems, IEEE Trans. Automatic Control 43(4): 555–559. Jones, P. e Stendius, L. (2006). The challenges of offshore power system construction . troll a, electrical power delivered successfully to an oil and gas platform in the north sea, European Wind Energy Conference & Exhibition, Athen, Greece. Kalman, R. E., Ho, Y. C. e Narendra, K. S. (1962). Controllability of linear dynamic systems, Contributions to Differential Equations, V. 1, New York: Wiley-Interscience. Kassakian, J., Schlecht, M. e Verghese, G. (1991). Principles of Power Electronics, Addison-Wesley. Kerrigan, E. C. (2000). Robust Constraint Satisfaction: Invariant Sets and Predictive Control, PhD thesis, Control Group Department of Engineering, University of Cambridge. Kerrigan, E. C. e Mayne, D. Q. (2002). Optimal control of constrained, piecewise affine systems with bounded disturbances, Proc. 42th IEEE Conf. Decision Control, Las Vegas, p. 1552–1557. Kesten, Y., Pnueli, A., Sifakis, J. e Yovine, S. (1993). Integration graphs: a class of decidable hybrid systems, In: R. Grossman, A. Nerode, A. Ravn e H. Rischel (ed.), Hybrid Systems, V. 736 In: Lecture Notes in Computer Science, Springer-Verlag, p. 179–208. Kohavi, Z. (1978). Switching and Finite Automata Theory, McGraw-Hill. Lee, J. e Cooley, B. (1997). Recent advances in model predictive control, Chemical Process Control - V, V. 93, AIChE Symposium Series - American Institute of Chemical Engineers, p. 201–216b. Luyben, M. L. (1993). Analyzing the Interaction Between Design and Control In Chemical Reactor Systems, PhD thesis, Princeton University. Luyben, M. L. e Floudas, C. A. (1994a). Analyzing the interaction of design and control 1. a multiobjective framework and application to binary distillation synthesis, Comp. Chem. Eng. (10): 933–969. Luyben, M. L. e Floudas, C. A. (1994b). Analyzing the interaction of design and control -1.a multiobjective framework and application to binary distillation synthesis, Comp. Chem. Eng. 18(10): 933–969. Referências Bibliográficas 154 Maciejowski, J. (2002). Predictive Control, Prentice Hall. Mattavelli, P., Rossetto, L., Spiazzi, G. e Tenti, P. (1993). General-purpose sliding-mode controller for dc-dc converter applications, PESC Conf. p. 609–615. Mayne, D. (1997). Nonlinear model predictive control: an assessment, Chemical Process Control - V, V. 93, AIChE Symposium Series - American Institute of Chemical Engineers, p. 217–231. Mayne, D. Q. e Rakovic, S. (2002). Optimal control of constrained piecewise affine discrete time systems using reverse transformation, Proc. 42th IEEE Conf. Decision Control, Las Vegas, p. 1546–1551. Mayne, D. Q. e Rakovic, S. (2003). Model predictive control of constrained piecewise affine discrete-time systems, INTERNATIONAL JOURNAL OF ROBUST AND NONLINEAR CONTROL 13: 261–279. Mayne, D., Rawlings, J., Rao, C. e Scokaert, P. (2000). Constrained model predictive control: Stability and optimality, Automatica 36(6): 789–814. Mendelson, E. (1964). Introduction to mathematical logic, New York: Van Nostrand. Middlebrook, R. e Cúk, S. (1976). A general unified approach to modelling switchingconverter power stages, IEEE Power Electronics Specialists Conference - PESC p. 18– 34. Mignone, D. (2001). The really big collection of logic propositions and linear inequalities, Relatório Técnico AUT01-11, Automatic Control Laboratory, ETH, Zürich, Switzerland. Mignone, D. (2002). Control and Estimation of Hybrid Systems with Mathematical Optimization, PhD thesis, Swiss Federal Institute of Technology, Zurich, Swiss. Mignone, D., Ferrari-Trecate, G. e Morari, M. (2000). Stability and stabilization of piecewise affine and hybrid systems: An lmi approach, Proc. 39th IEEE Conf. on Decision and Control. Miller, R. E. (1965). Switching theory, Combinational Circuits, V. 1, John Wiley. Morari, M. (1983). Design of resilient processing plants-iii. a general framework for the assesment of dynamic resilience, Chem. Eng. Sci. 38: 1881–1891. Referências Bibliográficas 155 Morari, M. (1992). Effect of design on the controllability of chemical plants, IFAC Workshop on Interactions Between Process Design and Process Control, J. D. Perkins, De., Pergamon Press, p. 3–16. Morari, M. e Zafiriou, E. (1989). Robust Process Control, Englewood Cliffs : Prentice-Hall, Inc. Murtagh, B. (1981). Advanced linear programming : computation and practice, McGrawHill. Nemhauser, G. e Wolsey, L. (1988). Integer and Combinatorial Optimization, Wiley. Nishida, N. e Ichikawa, A. (1975). Synthesis of optimal dynamic process systems by a gradient method, Ind. Eng. Chem. Proc. Des. Dev. 14: 236–242. Nishida, N., Ichikawa, A. e Tazki, E. (1974). Synthesis of optimal process systems with uncertainty, Ind. Eng. Chem. Proc. Des. Dev. 13: 209–214. Nishida, N., Liu, Y. A. e Ichikawa, A. (1976). Studies in chemical process design and synthesis ii. optimal synthesis of dynamic process systems with uncertainty, AIChE J. 22: 539–549. Peña, M., Camacho, E. F., Piñón, S. e Carelli, R. (2005). Model predictive controller for piecewise affine system, IFAC . Perkins, J. D. (1989). Interactions between process design and process control, International Federation of Automatic Control Symposium, Maastricht, The Netherlands. Pomar, M., Gutierrez, G., de Prada, C. e Normey-Rico, J. E. (2007). Integrated design & control applied to a buck boost converter, European Conferene Control . Pomar, M. J. (2005). Controle preditivo não linear com aplicaçãoo à eletrônica de potência, Master’s thesis, Universidade Federal de Santa Catarina. Qin, S. e Badgewell, T. (1997). An overview of industrial model predictive control technology, Chemical Process Control - V, V. 93, AIChE Symposium Series - American Institute of Chemical Engineers, p. 232–256. Raman, R. e Grossmann, I. (1991). Relation between milp modeling and logical inference for chemical process synthesis, Computers and Chemical Engineering 15(2): 73–84. Raman, R. e Grossmann, I. (1992). Integration of logic and heuristic knowledge in minlp optimization for process synthesis, Computers Chem. Engng. 16(3): 155–171. Referências Bibliográficas 156 Rashid, M. H. (1995). Electronica de Potencia: Circuitos, Dispositivos y Aplicaciones, 2nd ed., Prentice Hall Hispanoamericana. Sarabia, D., de Prada, C., Cristea, S., Mazaeda, R. e Colmenares, W. (2007). Hybrid nmpc control of a sugar house, In: F. B. L. Findeisen, Rolf; Allgöwer (ed.), Assessment and Future Directions of Nonlinear Model Predictive Control, V. 358 In: Lecture Notes in Control and Information Sciences, Springer-Verlag, p. 495–502. Sasao, T. (1999). Switching Theory for Logic Synthesis, Kluwer Academic. Schaft, A. V. D. e Schumacher, H. (1999). An introduction to hybrid dynamical systems, Lecture Notes in Control and Information Sciences, V. 251, Springer-Verlag. Schrijver, A. (1986). Theory of Linear and Integer Programming, Wiley-Interscience. Schutter, B. D. e Boom, T. V. D. (2001). On model predictive control for max-min-plusscaling discrete event systems, Automatica 37(7): 104–1056. Schutter, B. D. e Moor, B. D. (1999). The extended linear complementarity problem and the modeling and analysis of hybrid systems, In: P. Antsaklis, W. Kohn, M. Lemmon, A. Nerode e S. Sastry (ed.), Hybrid systems V, V. 1567 In: Lecture Notes in Computer Science, Springer-Verlag, Berlin, p. 70–85. Schweiger, C. A. e Floudas, C. A. (1997). Interaction of design and control: Optimization with dynamic models, Optimal Control: Theory, Algorithms, and Applications, Kluwer Academic Publishers B. V. Skogestad, S., Hovd, M. e Lundström, P. (1991). Towards integrating design and control : Use of frequency-dependent tools for controllability analysis, In PSE ’91 4th International Symposium on Process Systems Engineering, Montbello, Quebec, p. III.3.1– III.3.5. Skogestad, S. e Morari, M. (1987). The dominant time constant for distillation columns, Comput. Chem. Engr. 26: 2029–2035. Skogestad, S. e Postlethwaite, I. (1997). Multivariable Feedback Control. Analysis and Design, John Wiley and Sons. Skogestad, S. e Wolf, E. (1990). Controllability measures for disturbance rejection, IFAC Workshop on Interactions Between Process Design and Process Control, J. D. Perkins, Ed., Pergamon Press, p. 23–29. Referências Bibliográficas 157 Slupphaug, O. e Foss, B. (1997). Model predictive control for a class of hybrid systems, Proceedings of the European Control Conference, Brussels, Belgium. Slupphaugand, O., Vada, J. e Foss, B. (1997). Mpc in systems with continuous and discrete control inputs, Proceedings of the American Control Conference, Albuquerque, NM, USA. Sontag, E. (1985). Real addition and the polynomial hierarchy, Inform. Proc. Letters 20: 115–120. Sontag, E. (1988). Controllability is harder to decide than accessibility, SIAM J. Control and Opt. 26: 1106–1118. Sontag, E. (1996). Interconnected automata and linear systems: A theoretical framework in discrete-time, In: R. Alur, T. Henzinger e E. Sontag (ed.), Hybrid Systems III Verification and Control, n. 1066In: Lecture Notes in Computer Science, SpringerVerlag, p. 436–448. Sontag, E. D. (1981). Nonlinear regulation: the piecewise linear approach, IEEE Transactions on Automatic Control 26(2): 346–357. T.A. Henzinger, P.W. Kopke, A. P. e Varaiya, P. (1995). What’s decidable about hybrid automata ?, 27th ACM Symposium on the Theory of Computing, p. 373–381. Torrisi, F., Bemporad, A., Bertini, G., Hertach, P., Jost, D. e Mignone, D. (2000). Hysdel 2.0.5 - user manual, Relatório Técnico AUT02-10, Automatic Control Laboratory, ETH Zurich, http://control.ee.ethz.ch/. Torrisi, F. D. (2003). Modeling and Reach-Set Computation for Analysis and Optimal Control of Discrete Hybrid Automata, PhD thesis, Swiss Federal Institute of Technology, Zurich, Swiss. Tyler, M. e Morari, M. (1995). Stability of constrained moving horizon estimation schemes, Relatório Técnico AUT95-05, Automatic Control Laboratory, ETH Zürich. Utkin, V. (1977). Variable structure systems with sliding modes, IEEE Trans. Automatic Control 22(2): 212–222. Utkin, V. I. (1974 (English Translation 1978)). Sliding Mode and Their Application in Variable Structure Systems, MIR, Moscow. Referências Bibliográficas 158 Vorpérian, V. (1990). Simplified analysis of pwm converters using the model of the pwm switch: Parts i and ii, IEEE Transactions on Aerospace and Electronic Systems 26: 409–505. Wicks, M. A. e Peleties, P. (1994). Construction of piecewise lyapunov functions for stabilizing switched systems, Proc. Conf. Dec. Contr., p. 3492–3497. Williams, H. P. (1977). Logical problems and integer programming, Bull. Institute Math. Appli. 13: 18–20. Williams, H. P. (1993). Model building in mathematical programming, 3rd ed., New York: Wiley. Witsenhausen, H. (1966). A class of hybrid-state continuous-time dynamic systems, IEEE Transactions on Automatic Control AC-11(2): 161–167. Zieger, G. (1995). Lectures on Polytopes, Springer-Verlag. Ziegler, J. G. e Nichols, N. B. (1943). Process lags in automatic-control circuits, Transactions of the A. S. M. E. 65: 433–444.