Martin J.Pomar Garcia

Transcrição

UNIVERSIDADE FEDERAL DE SANTA CATARINA
Programa de Pós-Graduação em Engenharia de Automação e
Sistemas (PG-EAS)
Projeto Integrado de Controle e
Conversores de Potência com
aplicação a Industria do Petróleo.
Exame de qualificação submetido à
Universidade Federal de Santa Catarina
como parte dos requisitos para a
obtenção do grau de Doutor em Engenharia de Automação e Sistemas.
Martín J. Pomar García
Florianópolis, Agosto de 2007
Agradecimento
Agradeço o apoio financeiro da Agência Nacional do Petróleo, Gás
Natural e Biocombustíveis (ANP) e da Financiadora de Estudos e Projetos
(FINEP), por meio do Programa de Recursos Humanos da ANP para o Setor
do Petróleo e Gás PRH-34 ANP/MCT.
Programa de Pós-Graduação em Engenharia de
Automação e Sistemas (PG-EAS)
Projeto Integrado de Controle e
Conversores de Potência com
aplicação a Industria do Petróleo.
Exame de qualificação submetido à
como parte dos requisitos para a
obtenção do grau de Doutor em Engenharia de Automação e Sistemas.
Martı́n J. Pomar Garcı́a
Florianópolis, Agosto de 2007.
Projeto Integrado de Controle e Conversores de
Potência com aplicação a Industria do Petróleo.
Este Exame de Qualificação foi julgado adequado, servindo como requisito parcial para
o obtenção do tı́tulo de Doutor em Engenharia de Automação e Sistemas, e aprovada em
sua forma final pelo Programa de Pós-Graduação em Engenharia de Automação e Sistemas
da Universidade Federal de Santa Catarina.
Prof. Julio Elias Normey-Rico, Dr.
Prof. Cesar de Prada Moraga, Dr.
Orientadores
Prof. Eugênio de Bona Castelan, Dr.
Coordenador do curso de PG-EAS, UFSC.
Banca Examinadora
Prof. João Gomes da Silva Jr., Dr. - UFRGS.
Prof. Eduardo Camponogara, Dr. - UFSC
Prof. Alexandre Trofino Neto, Dr. - UFSC
Prof. Max Hering de Queiroz, Dr. - UFSC
Resumo do Exame de Qualificação apresentado à UFSC como parte dos
requisitos necessários para obtenção do grau de Doutor em Engenharia de
Automação e Sistemas.
Projeto Integrado de Controle e Conversores
de Potência com aplicação a Industria do
Petróleo.
Agosto/2007
Orientadores
: Prof. Julio E. Normey-Rico, Dr.
Prof. Cesar de Prada Moraga, Dr.
Palavras-chave
: Conversores de Potência, Conversor Buck-Boost, HVDC
Projeto Integrado, Sı́nteses de Processos
Sistema Hı́bridos, PWA, MLD
CPMI
Número de Páginas : 163
Este trabalho apresenta um introdução a duas áreas temáticas dentro da
teoria de Controle e Sistemas: (i) Projeto Integrado e Sı́nteses de Processos e
Controle, e (ii) Sistemas Hı́bridos.
Projeto Integrado e Sı́nteses, são áreas de concentração que tem sido investigadas e desenvolvidas para a industria de processos. Pouca, e em alguns casos
quasi nula extensão a outras áreas, como a Eletrônica de Potência, aparecem
na literatura.
Por outro lado, os Sistemas Hı́bridos são uma nova área de investigação
surgida como necessidade do presente contexto tecnológico.
Os Sistemas
Hı́bridos podem capturar o comportamento discreto, como por exemplo um
programa de computador, e o comportamento contı́nuo de processos fı́sicos.
Os dispositivos que estuda a Eletrônica de Potência em geral são Sistemas
Hı́bridos, e alguns deles são muito importantes na industria do petróleo e gás,
como é o caso do conversor HVDC que introduziremos neste trabalho.
O presente trabalho assim como a tese de doutorado, pretende extender
conceitos das duas áreas temáticas mencionadas acima, para poder serem aplicados a conversores de potência com aplicação a industria do petróleo e gás.
Sumário
Lista de Abreviaturas
1
1 Introdução
2
1.1
Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.2
Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
1.3
Organização do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2 Projeto Integrado e Sı́ntese
8
2.1
Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2
Algumas Medidas de Controlabilidade
2.3
2.4
2.5
8
. . . . . . . . . . . . . . . . . . . . 13
2.2.1
Indices de Controlabilidade para sistemas SISO . . . . . . . . . . . 14
2.2.2
Indices de Controlabilidade para sistemas MIMO . . . . . . . . . . 16
Projeto Integrado de Processos e Controle . . . . . . . . . . . . . . . . . . 32
2.3.1
Procedimento Geral de Projeto Integrado . . . . . . . . . . . . . . . 33
2.3.2
Exemplo: Projeto Integrado de un CBB e um controlador PID. . . 35
2.3.3
Exemplo: Projeto Integrado de un CBB e um CMD. . . . . . . . . 44
Sı́ntese de Processos e Controle . . . . . . . . . . . . . . . . . . . . . . . . 52
2.4.1
Sı́ntese de Processos . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.4.2
Sı́ntese de Processos e Controle . . . . . . . . . . . . . . . . . . . . 56
2.4.3
Exemplo: Sintese de processos. . . . . . . . . . . . . . . . . . . . . 61
Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3 Modelado de Sistemas Hı́bridos
65
3.1
Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.2
Sistemas Afins a Troços
3.2.1
3.3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Sistemas Mistos Lógicos Dinâmicos . . . . . . . . . . . . . . . . . . . . . . 74
3.3.1
Calculo Proposicional e Programação Linear Inteira . . . . . . . . . 74
iv
3.3.1.1
Proposições Lógicas . . . . . . . . . . . . . . . . . . . . . 74
3.3.1.2
Proposições Mistas Lógicas-Continuas . . . . . . . . . . . 77
3.3.2
Estrutura de Sistemas MLD . . . . . . . . . . . . . . . . . . . . . . 79
3.3.3
Sistema MLD bem posto e a tolerância ² . . . . . . . . . . . . . . . 82
3.3.4
Estado estacionário para sistemas MLD . . . . . . . . . . . . . . . . 84
3.3.5
Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.4
Equivalência entre sistemas MLD e PWA . . . . . . . . . . . . . . . . . . . 92
3.5
Conversão de modelos MLD-PWA . . . . . . . . . . . . . . . . . . . . . . . 93
3.6
Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
4 Controle Preditivo de Sistemas Hı́bridos
95
4.1
Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.2
Controle Preditivo de Sistemas MLD . . . . . . . . . . . . . . . . . . . . . 96
4.3
4.2.1
Problema de seguimento . . . . . . . . . . . . . . . . . . . . . . . . 104
4.2.2
Algoritmos MIQP . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.2.3
Controle Preditivo Misto Inteiro do CBB . . . . . . . . . . . . . . . 105
Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5 Conclusões e Cronograma
113
5.1
Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
5.2
Cronograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
A Indices de Controlabilidade para sistemas SISO
117
A.1 Indices de performance no domı́nio do tempo . . . . . . . . . . . . . . . . . 117
A.2 Indices de performance no domı́nio da freqüência . . . . . . . . . . . . . . 118
B Escalamento
123
C Modelado Eficiente de Sistemas MLD
127
C.1 Lógica Proposicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
C.2 Proposições Mistas Lógicas-Continuas . . . . . . . . . . . . . . . . . . . . . 138
C.3 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
C.4 The HYbrid Systems DEscription Language HYSDEL . . . . . . . . . . . . 148
Lista de Abreviaturas
CP
Conversor de Potência
HVDC
High Voltage Direct Current
SH
Sistemas Hı́bridos
DC
Direct Current
ISE
Integral Squared Error
RGA
Relative Gain Array
CBB
Conversor Buck-Boost
HA
Hybrid Automata
PWA
Piece Wise Affine
PWL
Piece Wise Linear
MLD
Mixed Logical Dynamical
LC
Linear Complementarity
ELC
Extended Linear Complementarity
MMPS
Max-Min-Plus-Scaling
LMI
Linear Matrix Inequalities
FNC
Forma Normal Conjuntiva
FBG
Formula Booleana Generalizada
FNCG
Forma Normal Conjuntiva Generalizada
HYSDEL
Hybrid Systems Description Language
SDP
Semi-Definite Programming
LP
Linear Programming
QP
Quadratic Programming
MILP
Mixed Integer Linear Programming
MIQP
Mixed Integer Quadratic Programming
SOS
Sum-of-Square
Capı́tulo 1
Introdução
1.1
Motivação
A Eletrônica de Potência é a área da eletrônica que se ocupa do condicionamento da
energia elétrica por meio de circuitos eletrônicos especializado chamados de Conversores de
Potência (CP). Além disso a Eletrônica de Potência lida com o acionamento de máquinas
elétricas e cargas de grande potência, em corrente direta ou alternada, através do uso de
dispositivos semi condutores de alta capacidade.
Esta área da engenharia tem alcançado um lugar muito importante na tecnologia
moderna nos últimos anos. Ela está presente em uma grande variedade de produtos de
nosso cotidiano. É difı́cil traçar os limites das aplicações da eletrônica de potência em
especial com a tendência atual no desenvolvimento de novos dispositivos semi-condutores
e microprocessadores; o limite superior ainda é indefinido. A Tabela 1.1 mostra algumas
das aplicações da Eletrônica de Potência (Rashid 1995).
Na area da industria petroquı́mica são inúmeras as aplicações onde está presente a
eletrônica de potência. À mais evidente seja talvez o controle da potência para alimentação
de grandes motores elétricos usados em bombas ou em grande compressores; substituindo
os rústicos sistemas de variação de velocidades mecânicos, tais como polias e variadores
hidráulicos, bem como os custosos motores de corrente contı́nua pelo conjunto motor
assı́ncrono e inversor, mais barato, de manutenção mais simples e reposição profusa.
Aplicações novas e de muito interesse vem sendo desenvolvidas recentemente é o caso
por exemplo dos High Voltage Direct Current, (HVDC), (Bahrman e Johnson 2007),
Introdução
3
Acondicionamento de Ar
Amplificadores de Audio
Iluminação
Calefação
Computadores
Corrente direta de alta voltage (HVDC)
Elevadores
Gravações magnéticas
Ferramentas elétricas
Ignição eletrônica
Moinhos
Veı́culos elétricos
Controle de Motores
Compensação de potência reativa
Bombas e Compressores
Soldadura
Trens
Regulação de tensão
Alarmes
Sistemas de partida para turbinas de Gás
Calderas
Cargador de Bateria
Controles lineares de motores de indução
Eletrodomésticos
Fonte de alimentação par aeronaves
Gruas e tornos
Fornos de cimento
Locomotivas
Processos Quı́micos
Minerı́a
Fontes de alimentação
Perfuração de poços de petróleo
Fontes de alimentação de energia solar
Produção de papel
Sistemas de partida para maquinas sı́ncronas
Acelerador de partı́culas
Tabela 1.1: Aplicações da Eletrônica de Potência
utilizados na alimentação energética de plataformas em alto mar. A tecnologia HVDC
e uma alternativa ambiental amigável, mais eficiente, e mais segura, para à alimentação
energética de plataformas marı́timas do que a geração tradicional usando turbinas de gás.
Consegue-se uma eficiência de transmissão de ∼ 90 − 94% e redução na emissão de CO2 ,
por exemplo no projeto Troll A, (plataforma de extração de gás em alto mar na Noruega),
conseguiu-se reduzir a emissão de CO2 em até 230.000tons/ano. Este tipo de soluções
demanda muito menos mantimento e pode ser controlado desde o continente o que faz
necessário muito menos pessoal capacitado na plataforma. A vida útil das instalações
também e maior (30 anos). Os riscos de acidente de trabalho e o nı́vel de ruı́do na
plataforma são menores. Em muitos casos é possı́vel mostrar os benefı́cios econômicos de
fornecer energia desde o continente que usando o gás produzido na plataforma (Hyttinen
e Bentzen 2006), (Jones e Stendius 2006). A Figura 1.1, mostra o esquema do conversor
HVDC do Projeto Troll A.
Todos os CP são dispositivos chaveados o que significa que pelo menos um dos seus
elementos constitutivos e um semi-condutor que vai operar como um interruptor através
de un sinal de controle que vai indicar quando ele deverá estar em estado de condução ou
em estado de corte, ou não condução. A saı́da requerida vai se obter variando o tempo de
condução e o tempo de corte da chave. Esta peculiaridade faz dos CP sistemas conhecidos
na literatura como sistemas hı́bridos (SH), sistemas em cujo modelo coexistem variáveis
Introdução
4
Figura 1.1: Esquema do conversor HVDC do Projeto Troll A
reais ou continuas (ex., tensão e corrente) e variáveis discretas (sinal de controle do tipo
ON-OFF).
O conceito de modelo de um sistema é associado tradicionalmente com as equações
diferenciais ou a diferença, derivadas das leis fı́sicas que governam a dinâmica do sistema
considerado. Conseqüentemente, a maioria das principais teorias de controle e ferramentas foram desenvolvidas para tais sistemas. Por outro lado, em muitas aplicações o
sistema a ser controlado é constituı́do também por regras lógicas, interruptores ou válvulas
tipo ON-OFF, seletores de velocidade, evoluções dependentes de regras tipo if-then else.
Freqüentemente na prática, o controle destes sistemas é realizado utilizando esquemas
baseados em regras heurı́sticas deduzidas da operação prática da planta (Bemporad e
Morari 1999).
Nos últimos anos o estudo de SH ou sistemas hierárquicos, constituı́dos por componentes dinâmicos no nı́vel inferior e por componentes lógicos/discretos no nı́vel superior,
tem recebido muita atenção e torno-se uma das principais areas de investigação no meio
acadêmico (Grossmann et al. 1993) e (Branicky et al. 1998). Desde o começo e durante
muito tempo a teoria clássica de controle preocupou-se principalmente com os sistemas
contı́nuos e a ciência da computação com os sistemas com dinâmica discreta, Figura 1.2.
Hoje em dia os sistemas a controlar estão tornando-se mais complexos e a interação da
dinâmica contı́nua e discreta está aumentando, o que requer portanto a necessidade de
desenvolver ferramentas novas par analisar e projetar controladores para este tipo de
sistemas (Kerrigan 2000).
Não obstante, em todos os casos encontrados na literatura, ambos os problemas, o
desenho do CP e o projeto do controle, é considerado independentemente. O circuito é
Introdução
5
Figura 1.2: Sistemas Hı́bridos
projetado primeiramente e então logo após o engenheiro de controle escolhe a estratégia
do controle e ajusta o controlador. Isto limita o desempenho atingı́vel do sistema porque
nenhum aspecto dinâmico do comportamento do dispositivo é feito durante a fase de
projeto do sistema (Pomar et al. 2007). Este método de projeto tradicional ignora a
idéia que as mudanças no projeto do processo podem fazer o sistema mais controlável ou
fornecem mais graus de liberdade para aumentar o desempenho (Luyben 1993).
Geralmente falando, o projeto do processo tradicionalmente é centrado em determinar
a estrutura, o tamanho e as condições de operação dos componentes em um ponto de
operação estacionário de acordo com especificações dadas da produção ou da operação.
Geralmente, nos estágios de projeto, embora a otimização seja usada freqüentemente
para dimensionar o sistema, não há nenhuma consideração explı́cita do comportamento
dinâmico do processo e a função de custo a otimizar inclui somente os termos associados
aos componentes ou aos custos de operação.
Uma vez que a planta foi construı́da, os engenheiros de controle tentam projetar um
sistema automático de controle que assegure a operação correta da planta, mesmo na
presença de incertezas e de perturbações. Esta tarefa é freqüentemente difı́cil ou mesmo
impossı́vel dado que no projeto original não se teve em conta os requerimentos de controle.
O Funcionamento adequado do processo, junto com seu sistema automático de controle,
não depende exclusivamente do tipo de controlador e dos seus parâmetros, mas também
do processo em si próprio (Luyben 1993).
O projeto integrado do processo e do controle é uma técnica em que as caracterı́sticas
do controle são consideradas nos estágios do projeto, permitindo assim considerar especi-
Introdução
6
ficações dinâmicas para que o sistema assegure uma flexibilidade e facilidade de operação.
Pode-se considerar o projeto integrado em malha aberta ou em malha fechada. A solução
obtida ao resolver o problema de projeto em malha aberta são os parâmetros fı́sicos da
planta associada aos valores mı́nimos da função de custo que verifica as restrições de
projeto do processo e que fornece um comportamento dinâmico desejado do sistema em
malha aberta. Neste caso o objetivo é facilitar a tarefa subseqüente: o projeto do controle.
Por outro lado, a solução do problema em malha fechada, além de fornecer os parâmetros
fı́sicos ótimos da planta, fornece também os parâmetros do controlador. Isto é, a sı́ntese
do controlador é incluı́da também no problema do projeto de planta com o objetivo de
fornecer a solução de menor custo além de garantir determinadas especificações dinâmicas
em malha fechada.
As primeiras idéias para integrar o controle com o projeto de processos foram propostas por Nishida e Ichikawa (1975) e Nishida et al. (1976). Morari (1992) e Perkins
(1989) recolheram alguns dos resultados importantes e dos esforços precedentes relativos
à interação entre o projeto e o controle. Morari (1983), Skogestad e Morari (1987), Morari
e Zafiriou (1989), Skogestad e Wolf (1990), Skogestad et al. (1991) fizeram contribuições
significativas na análise de controladores e no estudo da adaptabilidade dinâmica dos sistemas, introduzindo e analisando magnitudes de controle para a interação das variáveis e a
rejeição das perturbações. Não obstante, na área dos dispositivos eletrônicos de potência,
as contribuições na literatura sao muito escassas.
Este trabalho propõe soluções para o projeto de SH utilizando técnicas de projeto
integrado, controle preditivo e controle não linear aplicadas a CP e a sua utilização em
processos da industria do petróleo e gás natural.
1.2
Objetivos
Os objetivos de este trabalho podem agrupar-se em três diferentes areas temáticas:
Sistemas Hı́bridos Definir SH. Estudar as diferentes classes de SH e sua modelagem.
Extender os conceitos de controlabilidade e observabilidade a SH. Aprofundar no
conhecimento de soluções de controle avançado para SH tendo em conta o problema
da estabilidade e da robustez das diferentes estratégias de controle. Estabelecer
resultados comparativos entre as diferentes controladores, tomando como estudo de
caso um CP de corrente direta em corrente direta, (DC-DC), o conversor Buck-Boost
Introdução
7
(CBB).
Projeto Integrado Estudar as técnicas de projeto integrado na industria de processos.
Estender estas técnicas a SH, utilizando como estudo de caso o projeto integrado
de um CBB. Mostrar os benefı́cios de realizar o projeto integrado realizando uma
comparação de desempenho das prestações do CBB obtido no projeto integrado e o
da primeira parte.
Conversores de Potência Definir CP. Estudar as diferentes classes de CP e sua modelagem. Definir HVDC e suas aplicações na area de industria do petróleo e gás
natural. Aplicar as diferentes técnicas de controle mencionadas no começo a um
HVDC já construı́do, e finalmente aplicar as técnicas de projeto integrado para
poder comparar com o HVDC construı́do com as técnicas tradicionais.
1.3
Organização do trabalho
Este trabalho está organizado da seguinte forma:
No Capı́tulo 2 desenvolve-se aspectos teóricos sobre projeto integrados e sı́ntese de
processos e controle. Mostram-se alguns indices de controlabilidade usados na literatura, e exemplifica-se a metodologia com alguns estudos de caso que também mostram
os benefı́cios desta abordagem.
No Capı́tulo 3 é definido e caracterizado os SH. Apresentam-se duas estratégias de
modelado para SH, a relação entre ambas e os benefı́cios de cada contexto de modelagem
apresentado.
No Capı́tulo 4 apresentam-se o controle preditivo de SH num dos marcos de modelagem
apresentado no capı́tulo 3, o contexto MLD. Mostra-se através de um estudo de caso uma
serie de desafios e questões em aberto, que apresenta esta forma de controle.
No Capı́tulo 5 apresentam-se as conclusões do trabalho e o cronograma de atividades
durante a duração do curso de doutorado.
Capı́tulo 2
Projeto Integrado e Sı́ntese
2.1
Introdução
Historicamente, o projeto de um processo e seu controle tem sido realizados de forma
seqüencial pelos engenheiros de processo e de controle respectivamente. É bem sabido
que a primeira etapa, o projeto do processo, determina a controlabilidade inerente do
próprio processo e, por conseguinte, as propriedades de interação entre as variáveis, a
capacidade de rejeitar perturbações e a qualidade no seguimento a referências, tudo isso
com independência ao regulador colocado na etapa de controle. Assim freqüentemente o
engenheiro de controle se enfrenta a plantas pouco controláveis e o projeto e a sintonia
do sistema de controle torna-se uma tarefa difı́cil (Luyben 1993, Luyben e Floudas 1994a,
Luyben e Floudas 1994b, Gutierrez 2000).
No projeto de uma planta são involucradas duas áreas fundamentalmente: a sı́ntese
do processo e o projeto do processo.
Na sı́ntese do processo se determina a interconexão ótima entre as unidades do
processo como também o tipo de desenho das unidades dentro do sistema, para assim
alcançar objetivos de produção especı́ficados.
O projeto do processo é focado na determinação das condições de operação de cada
uma das unidades do processo e do dimensionamento que são requeridos para a produção
de um produto especı́fico.
Finalmente o controle de processos estabelece pautas de operação que asseguram
9
um comportamento estável do processo satisfazendo un conjunto de especificações transitórias e de regime permanente mesmo considerando a ação de perturbações e incertezas
nos modelos usados no projeto do sistema de controle.
A sı́ntese de processos tem sido levada a cabo tradicionalmente de maneira manual
e intuitiva, uma vez que se propõem diferentes esquemas de diagramas de fluxos, os
engenheiros se centram em escolher o esquema da planta economicamente ótima do ponto
de vista de custos de construção, mas sem ter em conta a seqüencia e interconexão ótima
entre as unidades que a compõem, e sem considerar as caracterı́sticas de controlabilidade
em malha aberta ou em malha fechada que teria a planta uma vez projetada.
O modo tradicional de abordar o projeto de processos mostra-se na Figura 2.1. Inicialmente o engenheiro de processos determina a estrutura do diagrama de fluxo, as
condições de operação em estado estacionário que se requerem para alcançar os objetivos de produção e o cálculo dos parâmetros fı́sicos da planta (tamanho das unidades do
processo). O objetivo principal procurado nesta tarefa tem sido a de otimizar um ı́ndice
econômico (minimizar o custo anual de manutenção, maximizar os benefı́cios, minimizar
o custo de construção, etc.), considerando unicamente a operação da planta em estado
estacionário, avaliando um grande número de estruturas alternativas, de condições de
projeto e parâmetros que satisfaçam os requerimentos de operação estabelecidos, selecionando finalmente a mais econômica tanto em custos de manutenção como de construção
das mesmas. Nesta etapa se dá pouca atenção à controlabilidade dinâmica do processo.
Uma vez projetada a planta, o engenheiro de controle se encarrega de estabelecer uma
estratégia de controle que assegure um comportamento dinâmico estável e que satisfaça
às exigências de qualidade do produto. Estes objetivos devem alcançar-se mesmo na
presença de grandes perturbações, de falhas nos equipamentos, variações de carga, etc.
Freqüentemente esta é uma tarefa difı́cil dado que a controlabilidade do processo, que
deveria ser uma parte integral nas etapas do projeto, não é tida em conta previamente. Nas
últimas três décadas a pressão exercida pelos avanços tecnológicos e a competitividade,
tem feito que a segurança, os custos de energia e as regulações governamentais em geral,
incrementem a complexidade e sensibilidade do processo em aras de conseguir maior
produtividade e qualidade dos produtos. As plantas tem passado a ser mais complexas
em relação ao fluxo de materiais (configurações complexas, re-circulação de fluxos, etc.)
e ao fluxo de energia (integração do calor). Estas novas condições do processo, fazem que
a tarefa de controle seja freqüentemente muito difı́cil e que se aposte pelo uso de técnicas
de controle avançado, como por exemplo o controle preditivo.
10
Figura 2.1: Projeto tradicional de processos.
A interação entre estas duas disciplinas (engenharia de processos e controle) surge
devido a que o projeto de processos determina de um modo inerente sua controlabilidade,
o que qualitativamente significa o bem que um processo é capaz de rejeitar perturbações,
quão severamente interagem as múltiplas variáveis e quão facilmente o sistema move-se
de um ponto de operação a outro. Um procedimento mais ótimo consistiria em integrar
na tarefa do projeto de processos restrições sobre a controlabilidade do sistema.
Existem duas razões fundamentais que tem condicionado o uso majoritário das técnicas
de projeto de processos tradicionais, uma é a falta de ferramentas de projeto assistidas
por computador que permitem o estudo dinâmico das plantas (somente nos últimos anos
11
tem-se evidenciado um desenvolvimento pronunciado nesta área) e a segunda razão são as
barreiras históricas e tecnológicas, existente entre o engenheiro de processos e o engenheiro
de controle, (Gutierrez 2000).
Atualmente, a situação do ponto de vista tecnológico permite realizar o projeto simultâneo do processo e do sistema de controle, levando em conta restrições de operação,
restrições do tipo fı́sico e considerando a controlabilidade do conjunto.
A definição de controlabilidade não é única, como demonstram as diversas definições
dadas por Ziegler e Nichols (1943), Kalman et al. (1962), etc. Mais especificamente,
Skogestad et al. (1991) definiu o conceito de controlabilidade como “a melhor qualidade
de resposta que possa se obter através de um controlador feedback ”, esta definição geral
proporciona um marco de trabalho conceitual com o qual pode tratar-se o problema de
projeto integrado. Alguns investigadores tem apontado a essa idéia como fundamental,
no que refere a incorporar a controlabilidade como uma magnitude nas etapas de projeto
do processo.
Conceitualmente podem distinguir-se quatro tipo de requerimentos:
Flexibilidade, habilidade que possui um sistema para trabalhar em diferentes pontos de
estado estacionário não consideradas no projeto.
Permutabilidade, habilidade que possui um sistema para se mover de um ponto de
estado estacionário a outro.
Controlabilidade, capacidade que possui o processo para alcançar e manter um valor
de equilı́brio desejado.
Controlabilidade em malha fechada, se define como o “melhor”comportamento
dinâmico do sistema (seguimento de referencias e rejeição de perturbações), que
pode alcançar o sistema em malha fechada. Por definição esta caracterı́stica não
depende só do controlador, mas também da própria planta, já que a controlabilidade
depende em grande medida da flexibilidade e permutabilidade que são proporcionados pelo próprio projeto do processo.
Projeto Integrado seria a técnica de projeto através da qual obtém-se os parâmetros
fı́sicos da planta que minimizem os custos de operação e construção, ao mesmo tempo que
satisfaçam caracterı́sticas de controlabilidade impostas ao processo, como mostra a Figura
2.2. Este problema se traduz matematicamente num problema de otimização não linear
12
multi-objetivo com restrições, onde os objetivos que se consideram são do tipo econômico
e de controle, e as restrições são os requerimentos fı́sico e de controlabilidade do processo,
que podem incluir: segurança, flexibilidade, operabilidade, etc.
Figura 2.2: Projeto tradicional de processos.
A integração da sı́ntese do processo e do controle, seria a técnica que permitiria
selecionar automaticamente a estrutura ótima da planta junto com a estrutura do controlador, isto é, obter uma planta cujas unidades estejam conectadas de uma maneira
ótima, seu dimensionamento represente o custo mı́nimo de construção e permita satisfazer os requerimentos para um funcionamento adequado do processo, paralelamente a
isto se obtém os parâmetros ótimos do regulador que proporcionem um comportamento
dinâmico do sistema fixado na etapa de projeto.
Na seqüencia descrevem-se alguns indices de controlabilidade utilizados na literatura
relacionados ao projeto e sı́ntese de processos, seguidamente apresenta-se a metodologia
de projeto integrado e a de sı́ntese de processos exemplificando cada método com estudos
de caso.
2.2
13
Algumas Medidas de Controlabilidade
O desenvolvimento teórico deste capı́tulo é realizado sobre modelos lineares, invariantes no tempo. No caso mono-variável considera-se:
y(s) = G(s)u(s) + Gd (s)d(s)
(2.1)
onde y é a saı́da do sistema, u é a entrada manipulada e d são as perturbações. G é a função
de transferência entrada-saı́da da planta e Gd a função de transferência perturbações-saı́da.
Para sistemas multi-variáveis, G(s) é uma matriz de funções de transferência.
Comentario 2.1 Vamos adotar a seguinte notação neste trabalho: quando a letra que
representa a função de transferência estiver em negrito então trata-se de um sistema
multi-variável e por tanto estaremos representando uma matriz de transferência, no caso
contrario tratara-se de um sistema mono-variável e estaremos representando uma função
de transferência.
A função de transferência G(s) serão funções racionais da forma:
G=
bnz snz + . . . + b1 s + b0
sn + an−1 sn−1 + . . . + a1 s + a0
(2.2)
onde n é a ordem do denominador e é chamado de ordem do sistema; nz e a ordem do
numerador. n − nz é chamado de ordem relativo do sistema.
Definição 2.1
• O sistema G(s) é estritamente próprio se lim G(s) = 0.
s→∞
• O sistema G(s) é semi-próprio se lim G(s) = D 6= 0.
s→∞
• O sistema G(s) que é estritamente próprio ou semi-próprio é próprio.
• O sistema G(s) é impróprio se lim G(s) = ∞.
s→∞
Para os sistemas próprios, com n ≥ nz , podemos fazer uma descrição no espaço de
estados, ẋ = Ax + Bu, y = Cx + Du, do sistema (2.2) da seguinte forma:
G(s) = C(sI − A)−1 B + D
(2.3)
14
Comentario 2.2 Todo sistema real tem ganho zero a uma freqüência suficientemente
grande, e por tanto é estritamente próprio.
A equação (2.1) é um modelo incremental do sistema, onde os sinais: u(s), d(s) e y(s),
geralmente são variáveis que representam o desvio do sinais verdadeiros respeito de um
ponto de equilı́brio ou referência, pois geralmente o modelo (2.1) é obtido a partir de uma
linearização de um modelo não-linear do sistema.
A seguir mostram-se os principais ı́ndices de controlabilidade para sistemas uma entrada uma saı́da (SISO), e logo após para sistemas de múltiplas entradas e múltiplas
saı́das (MIMO).
2.2.1
Indices de Controlabilidade para sistemas SISO
Performance no domı́nio do tempo
Uma forma tradicional de avaliar a performance de um sistema SISO é simular sua
resposta a um degrau unitário na entrada de referência e avaliar indices como:
• Tempo de subida (tr ).
• Tempo de 5% ou tempo de assentamento (ts ).
• Sobre-sinal (Mp ).
• Fator de redução (quociente entre o segundo e o primeiro pico do sinal de saı́da).
• Erro em estado estacionário (es→∞ ).
Os dois primeiros indices medem a velocidade de resposta, no entanto os últimos três
medem a qualidade da resposta. Para o leitor que não estiver familiarizado com estes
indices, sua definição encontram-se no apêndice A.
Comentario 2.3 Estes indices são válidos quando usamos um modelo incremental do
processo onde y(0) = 0
15
Outra forma de quantificar a performance no domı́nio do tempo é em termos de alguma
norma do sinal de erro: e(t) = y(t) − r(t). Por exemplo podemos usar a integral do
quadrado do erro (Integral Squared
qR Error - ISE), ou a raiz quadrada, que é a norma∞
2 do sinal de erro, ke(t)k2 =
|e(τ )|2 dτ . Observe que neste caso vários objetivos
0
relacionados com ambas, a velocidade e a qualidade da resposta, são combinados em um
único número. Outra vantagem da norma-2 é que o problema resultante de otimização é
numericamente fácil de resolver. Além do mais
qR podemos tomar em conta as magnitude
∞
de entrada considerando, por exemplo, J =
(Q|e(t)|2 + R|u(t)|2 dt, onde Q e R são
0
constantes positivas. Isto é similar ao control quadrático ótimo (LQ), mas no controle LQ
normalmente consideramos o impulso em lugar do degrau em r(t).
Performance no domı́nio da freqüência
Substituindo s por jw na função de transferência G(s) de um sistema estável, obtemos
a chamada descrição da resposta em freqüência. A resposta em freqüência pode ser usada
para descrever: (i) a resposta de um sistema estável a uma sinusoide de freqüência variável,
(ii) o conteúdo harmônico de um sinal determinı́stico via Transformada de Fourier, (iii) a
Distribuição Harmônica de um sinal estocátsico via a Função de Densidade Espectral de
Potência.
A grande vantagem da analise no domı́nio da freqüência comparado com a analise da
resposta ao degrau, e justamente que ela considera uma ampla classe de sinais (sinusoides
de qualquer freqüência). Isto facilita a caracterização das propriedades de realimentação,
e em particular o comportamento do sistema na região próximas a freqüência de corte
(largura de banda).
Alguns dos principais indices no domı́nio da freqüência, para sistemas SISO, são:
• Margem de Fase (PM) e Margem de Ganho (GM).
• Máximo Pico.
• Largura de Banda e Freqüência de Corte.
O leitor que não estiver familiarizado com estes indices no domı́nio da freqüência,
pode achar a definição assim como um desenvolvimento mais detalhado dos mesmos no
apêndice A.
2.2.2
16
Indices de Controlabilidade para sistemas MIMO
Considere-se uma planta MIMO com m entradas e l saı́das. Assim o modelo básico de
função de transferência é y(s) = G(s)u(s), onde y é um vetor l × 1, u é um vetor m × 1
e G(s) e uma matriz de funções de transferências l × m.
A principal diferença entre os sistemas SISO e MIMO e a aparição de direções. Direções
são relevantes para vetores e matrices mas não para escalares. No entanto, apesar da
complicação do fator da direção muitas das idéias apresentadas na seção anterior para
sistemas SISO podem ser estendidas para sistemas MIMO. A decomposição em valores
singulares (SVD) é uma forma útil de quantificar a direcionalidade, e vamos ver que
muitos dos resultados envolvendo valores absolutos (magnitude) para sistemas monovariáveis podem ser generalizados para sistemas multi-variáveis considerando o máximo
valor singular.
Analise da resposta em freqüência multi-variável
O domı́nio da freqüência é ideal para o estudo das direções em sistemas multi-variáveis.
Considere o sistema G(s) mostrado na Figura 2.3 com entrada d(s) e saı́da y(s).
Figura 2.3: Sistema G(s) com entrada d e saı́da y.
y(s) = G(s)d(s)
(2.4)
(Vamos chamar aqui a entrada de d em lugar de u para evitar confusões com a matriz
U usada mais adiante na decomposição de valores singulares). Na Seção 2.2.1 foi mencionado que a resposta em freqüência de um sistema SISO estável pode ser interpretada
fisicamente como a resposta do sistema a uma entrada sinusoidal de freqüência w. Esta
interpretação da resposta em freqüência pode ser generalizada a sistemas MIMO considerando os elementos gij (jw) da matriz G como a resposta do sistema na saı́da i a uma
entrada sinusoidal na entrada j.
Mais especificamente isto quer dicer que, aplicando no canal de entrada j um sinal escalar
17
sinusoidal persistente (ou seja ele é aplicado desde t = −∞):
dj = dj0 sin(wt + αj )
(2.5)
obtemos no canal de saı́da i o sinal persistente:
yi = yi0 sin(wt + βi )
(2.6)
onde a amplificação (ganho) e o corrimento de fase, podem ser obtidos a partir do número
complexo gij (jw) como segue:
yi0
= |gij (jw)|,
dj0
βi − αj = ∠gij (jw)
(2.7)
A resposta total do sistema a entradas simultâneas nos canais de entrada é, pelo principio
de superposição de sistemas lineares, igual a soma das respostas individuais, ou seja:
yi (w) = gi1 (jw)d1 (w) + gi2 (jw)d2 (w) + . . . =
X
gij (jw)dj (w)
(2.8)
j
Para sistemas SISO, y = Gd, o ganho a uma dada freqüência é simplesmente:
|y(w)|
|G(jw)d(w)|
=
= |G(jw)|
|d(w)|
|d(w)|
O ganho depende da freqüência w, mas como o sistema é linear não depende da magnitude
de entrada |d(w)|.
Para aplicar este conceitos em sistemas MIMO, onde os sinais de entrada e saı́da
são ambos vetores, é necessário usar normas especı́ficas. Por exemplo, se escolhemos a
norma-2, então a uma freqüência dada w a magnitude do vetor de entrada é:
kd(w)k2 =
sX
q
d210 + d220 + · · ·
(2.9)
2
2
y10
+ y20
+ ···
(2.10)
|dj (w)|2 =
j
e a magnitude do vetor de saı́da é:
s
ky(w)k2 =
X
i
q
|yi (w)|2 =
18
O ganho do sistema G(s) para uma sinal de entrada particular d(w) é dado por:
p
2
y 2 + y20
+ ···
ky(w)k2
kG(jw)d(w)k2
=
= p 10
2
2
kd(w)k2
kd(w)k2
d10 + d20 + · · ·
(2.11)
Novamente o ganho depende da freqüência w e é independente da magnitude de entrada
kd(w)k2 . No entanto par sistemas MIMO existem graus de liberdade adicionais e o ganho
depende da direção da entrada d.
"
Exemplo 2.1 Para um sistema com duas entradas, d =
d10
d20
#
, o ganho é em geral
diferente para as seguintes 5 entradas:
"
1
d1 =
#
"
, d2 =
0
0
#
"
, d3 =
1
#
0.707
"
, d4 =
0.707
#
0.707
−0.707
"
, d5 =
#
0.6
−0.8
(observe que todas as entradas tem a mesma magnitude kdk2 = 1, mas tem diferentes
direções). Por exemplo, para o sistema 2 × 2:
"
G1 =
5 4
#
(2.12)
3 2
(matriz constante) podemos calcular para as 5 entradas dj os seguintes vetores de saı́da:
"
y1 =
5
#
3
"
, y2 =
4
#
2
"
, y3 =
6.36
3.54
#
"
, y4 =
0.707
0.707
#
"
, y5 =
−0.2
#
0.2
e a norma-2 destas 5 saı́das é:
ky1 k2 = 5.83, ky2 k2 = 4.47, ky3 k2 = 7.30, ky4 k2 = 1.00, ky5 k2 = 0.28
Esta dependência do ganho em relação a direção de entrada é mostrada na Figura 2.4 onde
usamos
d20
d10
como variável independente para representar a direção de entrada. Vemos que,
dependendo de
d20
,
d10
o ganho varia entre 0.27 e 7.34.
O máximo valor do ganho em 2.11 é o máximo valor singular de G
max
d6=0
kGdk2
= max kGdk2 = σ(G)
kdk2 =1
kdk2
(2.13)
19
8
σ(G1 ) = 7.34
7
6
kyk2
kdk2
5
4
3
2
1
0
−5
σ(G1 ) = 0.27
−4
−3
Figura 2.4: Ganho
−2
−1
0
d20
d10
1
kG1 dk2
kdk2
como função de
2
d20
d10
3
4
5
para G1 em 2.12.
e o ganho mı́nimo é o mı́nimo valor singular de G,
min
d6=0
kGdk2
= min kGdk2 = σ(G)
kdk2 =1
kdk2
(2.14)
A primeira igualdade em (2.13) e (2.14) são válidas porque o ganho é independente da
magnitude de entrada para sistemas lineares.
Para achar uma generalização útil de |G| para o caso em que G é uma matriz, necessitamos do conceito de norma de um matriz: kGk.
Decomposição em Valores Singulares
Definição 2.2 Matriz Unitária.
A matriz (complexa) U é untaria se
U H = U −1
(2.15)
onde U H é a matriz conjugada transposta (Hermı́tica) de U e U −1 é a inversa de U .
Todos os autovalores da matriz unitária tem valor absoluto igual a 1, e todos seus
valores singulares são iguais a 1.
20
Definição 2.3 Decomposição em Valores Singulares (SVD).
Qualquer matriz complexa A, l × m, pode ser fatorizada na decomposição em valor
singular:
A = U ΣV H
(2.16)
onde a matriz U , l × l, e a matriz V , m × m, são unitárias, e a matriz Σ, l × m, contem
a matriz diagonal Σ1 com os valores singulares reais não negativos, σi , arrumados em
ordem descendente como em:
"
Σ=
ou
Σ1
#
0
h
; l≥m
(2.17)
i
Σ=
Σ1 0
; l≤m
(2.18)
onde
Σ1 = diag{σ1 , σ2 , . . . , σk }; k = min(l, m)
(2.19)
σ ≡ σ1 ≥ σ2 ≥ . . . ≥ σk ≡ σ
(2.20)
e
Os valores singulares são as raı́zes quadradas positivas dos k = min(l, m) maiores
autovalores de ambas matrices AAH e AH A. Ou seja:
σi (A) =
p
λi (AH A) =
p
λi (AAH )
(2.21)
Definida a SVD, vejamos como usar este conceito na resposta em freqüência de um
sistema MIMO G(s) com m entradas e l saı́das.
Considere uma freqüência fixa w onde G(jw) e uma matriz complexa constante l × m,
por simplicidade anotemos G(jw) por G. Qualquer matriz G pode ser decomposta em
uma SVD, ou seja podemos fazer:
G = U ΣV H
(2.22)
Direções de entrada e saı́da Os vetores colunas de U , (ui ), representam as direções de
saı́da da planta. Estes vetores são ortogonais e de tamanho igual a 1 (ortonormais),
isto é:
kui k2 =
p
|ui1 |2 + |ui2 |2 + . . . |uil |2 = 1
H
uH
i ui = 1, ui uj = 0, i 6= j
(2.23)
(2.24)
21
Assim mesmo, os vetores colunas de V , (vi ), representam as direções de entrada da
planta, também estes vetores são ortogonais e de tamanho igual a 1 (ortonormais).
Estas entradas e saı́das estão relacionadas através dos valores singulares. Para ver
isto note que como V é unitária temos que V H V = I, por tanto (2.22) pode ser
escrita como GV = U Σ para a qual a coluna i torna-se:
Gvi = σi ui
(2.25)
onde vi e ui são vetores e σi um escalar. Isto é, se consideramos uma entrada na
direção vi , então a saı́da é na direção ui . Além disso, como kvi k2 = 1 e kui k2 = 1
vemos que o i-ésimo valor singular σi da diretamente o ganho da matriz G nessa
direção. Em outras palavras:
σi (G) = kGvi k2 =
kGvi k2
kvi k2
(2.26)
Algumas vantagens da decomposição SVD em relação aos autovalores para analisar
ganhos e direções de plantas multi-variáveis são:
1. Os valores singulares dão melhor informação sobre o ganho da planta.
2. As direções da planta obtidas do SVD são ortogonais
3. SVD pode ser aplicado diretamente a plantas não quadradas.
Valores singulares máximo e mı́nimo Como já determinado, é possı́vel mostrar que
o maior ganho para qualquer direção de entrada é igual ao valor singular máximo,
σ(G) ≡ σ1 (G) = max
d6=0
kGdk2
kGv1 k2
=
kdk2
kv1 k2
(2.27)
e que o menor ganho para qualquer direção de entrada é igual ao valor singular
mı́nimo,
σ(G) ≡ σk (G) = min
d6=0
kGvk k2
kGdk2
=
kdk2
kvk k2
(2.28)
onde k = min{l, m}. Assim, para qualquer vetor d temos que:
σ(G) ≤
kGdk2
≤ σ(G)
kdk2
(2.29)
22
Exemplo 2.2 Considere novamente o sistema (2.12) do exemplo (2.1)
"
G1 =
5 4
#
(2.30)
3 2
A decomposição em valores singulares SVD de G1 é:
"
G1 =
|
0.872
0.490
#"
0.490 −0.872
{z
}|
7.343
0
U
0
#"
0.794 −0.608
0.272
0.608 0.794
{z
}|
{z
Σ
#H
}
VH
"
0.794
#
O maior ganho 7.343 é para uma entrada na direção v =
, e o menor ganho
0.608
"
#
−0.608
. Isto confirma o achado no
0.272 é para uma entrada na direção v =
0.794
exemplo (2.1).
Como em (2.30) ambas entradas afetam ambas saı́das, diremos que o sistema é
interativo. Além disso o sistema é mal condicionado, isto é, algumas combinações
das entradas tem um forte efeito nas saı́das, no entanto outras combinações tem
um efeito fraco. Isto pode ser quantificado pelo numero de condição, o quociente
entre os ganhos na direção forte e fraca:
σ(G)
σ(G)
(2.31)
7.343
σ(G)
=
= 27.0
σ(G)
0.272
(2.32)
γ(G) =
Para o sistema (2.30) é:
γ(G) =
Exemplo 2.3 Considere o sistema mostrado na Figura 2.5, o qual consiste numa
coluna de destilação da qual devemos extrair 2 produtos com distinta composição. O
produto no topo da coluna deve ter uma composição yD = 0.99 (saı́da y1 ), no entanto
que o produto da parte inferior de coluna deve ter uma composição xB = 0.01 (saı́da
y2 ), para isso contamos com 2 magnitude a manipular: o refluxo L (entrada u1 ) e
o vapor no intercambiador de calor V (entrada u2 )
23
Figura 2.5: Sistema columna de destilação.
O modelo em estado estacionário do sistema é,
"
G=
87.8
−86.4
#
(2.33)
108.2 −109.6
As variáveis foram escaladas como discutido no apêndice B. (O conceito, a justificativa e a metodologia de escalamento de um sistema, encontra-se no apêndice
B).
A decomposição em valores singulares SVD de G é:
"
G=
|
0.625 −0.781
0.781
#"
0.625
{z
}|
U
197.2
0
0
1.39
{z
#"
}|
0.707
−0.708
−0.708 −0.707
{z
Σ
Do primeiro vetor singular de entrada, υ = [0.707
#H
}
VH
− 0.708]T , vemos que o
ganho é 197.2 quando incrementamos uma entrada e decrementamos a outra entrada na mesma quantidade. Por outro lado, do segundo vetor singular de entrada,
υ = [−0.708
− 0.707]T , vemos que se incrementamos ambas entradas na mesma
proporção então o ganho é somente 1.39. A motivo disto é que a planta é tal que
as duas entradas se contra-restam entre elas. Isto porque o processo de destilação
é mal condicionado ao menos em estado estacionário, e o numero de condição é
γ(G) =
197.2
1.39
24
= 141.7
Para sistemas dinâmicos os valores singulares e suas direções associadas variam com
a freqüência. Para propósito de controle é a variação dos valores singulares no
intervalo de freqüência correspondente a largura de banda em malha fechada que é
de interesse principal.
Para o sistema da coluna de destilação cuja matriz de transferência é:
1
G(s) =
75s + 1
"
87.8
−86.4
#
108.2 −109.6
os valores singulares do sistema em função da freqüência são mostrados na Figura
2.6
Singular Values
50
40
σ*(G(0))
σ*(G(jw))
Singular Values (dB)
30
20
10
0
σ*(G(0))
σ*(G(jw))
−10
−20
−30
MATLAB:
sys=tf([87.8],[−86.4];[108.8],[−109.6],[75.1,1],[75.1,1];[75.1,1],[75.1,1])
sigma(sys)
−40
−4
10
−3
10
−2
10
Frequency (rad/sec)
−1
10
0
10
Figura 2.6: Valores singulares columna de destilação.
Plantas não-quadradas O SVD é também util para plantas não quadradas. Por exemplo, considere uma planta com 2 entradas e 3 saı́das. Neste caso o terceiro vetor
singular de saı́da, u3 , nos diz em qual direção de saı́da a planta não pode ser controlada. Similarmente, para plantas com mais entradas que saı́das, os vetores singulares
de entrada adicionais nos dizem em que direções as entradas não tem efeito.
25
Uso do valor singular mı́nimo da planta O valor singular mı́nimo da planta,
σ(G(jw)), avaliado como função da freqüência, é uma medida útil para avaliar
a factibilidade de alcançar um controle aceitável. Se as entradas e saı́das foram
escaladas como mostrado no apêndice B, então com uma entrada manipulada de
magnitude unitária (medida através da norma-2), podemos alcançar uma magnitude
de saı́da de pelo menos σ(G) em qualquer direção de saı́da. Geralmente desejamos
que σ(G) seja o maior possı́vel.
Valores Singulares para performance
O valor singular máximo da planta é muito útil para analisar a performance e a
robustez do sistema no domı́nio da freqüência.
Considere um sistema cuja estrutura mostra-se na Figura 2.7, o qual apresenta um
laço de realimentação negativa e tem um grau de liberdade (K).
Figura 2.7: Diagrama de blocos de um sistema em malha fechada.
A entrada ao controlador K(s) é r − ym onde ym = y + n é a medida da saı́da e n é o
ruido de medida. Por tanto a entrada à planta é:
u = K(s)(r − y − n)
(2.34)
O objetivo do controle é manipular u (projetar (K)) tal que o erro e se mantenha
26
dentro das especificações a pesar da perturbação d. O sinal erro e definido como:
e=y−r
(2.35)
onde r denota o valor de referência para a saı́da.
O modelo matemático da planta pode ser escrito como:
y = G(s)u + Gd (s)d
(2.36)
e para um controlador de um grau de liberdade a substituição de 2.34 em 2.36 da como
resultado:
y = GK(r − y − n) + Gd d
ou
(I + GK)y = GKr + Gd d − GKn
(2.37)
por tanto a resposta em malha fechada é:
y = (I + GK)−1 GK r + (I + GK)−1 Gd d − (I + GK)−1 GK n
{z
}
{z
}
{z
}
|
|
|
T
S
(2.38)
T
O erro é:
e = y − r = −Sr + SGd d − T n
(2.39)
onde é usado o fato que I − T = S. O correspondente sinal de entrada a planta é:
u = KSr − KSGd d − KSn
(2.40)
A seguinte notação e terminologia será usada:
L = GK Funç~
ao de Laço
S = (I + GK)−1 = (I + L)−1 Funç~
ao de Sensibilidade
T = (I + GK)−1 GK = (I + L)−1 L Funç~
ao de Sensibilidade Complementaria
S é a função de transferência em malha fechada da saı́da respeito a perturbação, no
entanto T é a função de transferência em malha fechada da saı́da respeito a referência.
S+T =I
(2.41)
27
Para os sistemas SISO |S(jw)| avaliada como função da freqüência da informação útil
sobre a efetividade do controle por realimentação. Por exemplo, é o ganho entre uma
entrada sinusoidal de referência e o erro de controle, |e(w)|/|r(w)| = |S(jw)|
Para sistemas MIMO uma generalização muito útil pode ser feita se considerarmos o
quociente ke(w)k2 /kr(w)k2 , onde r é o vetor de referência na entrada, e é o vetor do erro
de controle, e k · k é a norma-2 de um vetor. Como vamos explicar a seguir este ganho
depende da direção de r(w) e sabemos por (2.29) que dito ganho esta delimitado pelos
valores singulares máximo e mı́nimo de S.
σ(S(jw)) ≤
ke(w)k2
≤ σ(S(jw))
kr(w)k2
(2.42)
Em termos da performance, é razoável requerer que o ganho ke(w)k2 /kr(w)k2 se mantenha pequeno para qualquer direção de r(w), incluindo a direção do pior caso cujo ganho
é σ(S(jw)). Seja 1/|wP (jw)| (inversa da função peso de desempenho) o valor que representa a máxima magnitude permitida de kek2 /krk2 a cada freqüência. Isto resulta no
seguinte requerimento de performance:
σ(S(jw)) < 1/|wP (jw)| ⇔ σ(wP S) < 1, ∀w
⇔ kwP Sk∞ < 1
(2.43)
onde a norma H∞ é definida como o pico do valor singular máximo da resposta em
freqüência.
kM (s)k∞ , max σ(M (jw))
w
(2.44)
Tipicamente a função peso de desempenho wP pode ser da forma:
wP (s) =
∗
s/M + wB
∗
s + wB
A
(2.45)
1/|wP (jw)| representa a cota superior de |S(jw)|.
Os valores singulares de S(jw) podem ser traçados em função da freqüência. Tipicamente, o gráfico será pequeno em baixas freqüências onde a realimentação é efetiva e
aproximam-se a 1 em altas freqüências dado que qualquer sistema real e estritamente
próprio:
w → ∞ : L(jw) → 0 ⇒ S(jw) → I
(2.46)
28
M
0
Magnitude
10
∗
wB
−1
10
A
−2
10
−2
10
−1
10
0
10
Freqüência[rad/s]
Figura 2.8: Inversa da função peso de desempenho.
|1/wP (jw)|
.
1
10
2
10
Gráfico exato e assintótico de
O valor singular máximo, σ(S(jw)), usualmente possui um pico maior que 1 entorno
da freqüência de corte. Este pico é indesejado mas inevitável para sistemas reais.
Como para sistemas SISO definimos a largura de banda como a freqüência até onde
a realimentação é efetiva (veja apêndice A). Para sistemas MIMO a largura de banda
depende das direções, vamos ter uma região de largura de banda entre a menor freqüência
onde o valor singular máximo, σ(S), alcança 0.7 (o menor ganho ou a direção do pior caso),
e a maior freqüência onde o valor singular mı́nimo, σ(S), alcança 0.7 (o maior ganho ou
a melhor direção). Se desejamos associar uma única freqüência de largura de banda a
o sistema multi-variável, então consideramos a direção do pior caso (menor ganho), e
definimos
• Largura de banda, wB : a freqüência onde σ(S) cruza
√1
2
= 0.7 por baixo.
Então é entendido que a largura de banda é ao menos wB para qualquer direção do
sinal de entrada (referência ou perturbação).
29
Número de condição e RGA
Dois medidas usadas para quantificar o grau de direcionalidade e o nı́vel de interação
entre as variáveis em um sistema MIMO, são o numero de condição e a matriz de ganhos
relativos (RGA), respectivamente.
Número de condição
Definimos o numero de condição de uma matriz como u quociente entre o máximo e o
mı́nimo valor singular,
γ(G) ,
σ(G)
σ(G)
(2.47)
A matriz com um numero de condição grande é dita mal condicionada. Para uma matriz
não singular (quadrada) σ(G) = 1/σ(G−1 ), então γ(G) = σ(G)σ(G−1 ). Por tanto o
número de condição será grande sé ambas G e G−1 possuem elementos grandes.
O numero de condição depende fortemente do escalamentos, (o conceito, justificativa
e a metodologia de escalamento de um sistema encontra-se no apêndice B), das entradas
e saı́das. Sendo mais especifico, se D1 e D2 são matrices diagonais escaladas, então o
número de condição das matrices G e D1 GD2 podem ser arbitrariamente longe entre si.
Em geral, a matriz G deverá ser escalada em base a magnitudes fı́sicas, por exemplo,
dividindo cada entrada e saı́da pelo maior valor esperado ou desejado como discutido no
apêndice B.
Más também podemos considerar minimizar o número de condição sobre todos os
possı́veis escalamentos. Para achar o número de condição ótimo devemos resolver o
seguinte problema de minimização,
γ ∗ (G) = min γ(D1 GD2 )
D1 ,D2
(2.48)
O número de condição pode ser usado como uma medida da controlabilidade entradasaı́da, e em particular pode ser postulado que um número de condição grande indica
sensibilidade as incertezas. Isto não é verdade em geral, mas o contrário sim; se o número
de condição é pequeno, então o efeito multi-variável das incerteza não são severas.
30
Matriz de ganho relativos (RGA)
A matriz de ganhos relativos (RGA) de uma matriz quadrada não-singular é uma
matriz quadrada definida como,
RGA(G) = Λ(G) , G × (G−1 )T
(2.49)
onde × indica o produto elemento a elemento (produto de Schur ou Hadamard).
Bristol (1966) originalmente introduz a matriz RGA como uma medida em estado
estacionário da interação para um controle descentralizado. Infelizmente, por causa da
definição original, muitas pessoas descartaram a RGA pois só era útil para w = 0. Mas,
em muitos casos o valor da RGA a freqüências perto da freqüência de corte é muito
importante.
A RGA possui numerosas propriedades algébricas interessantes, as quais as mais importantes são:
1. É independente do escalamento das entradas e saı́das.
2. A soma das colunas e filas e igual a 1.
P
3. A norma-soma (kAksoma =
|aij |) da matriz RGA, kΛksoma , é muito próxima ao
número de condição γ ∗ (equação 2.48). Isto significa que uma planta com grandes
elementos na RGA é sempre mal condicionada (com um valor grande de γ(G)), mas
a inversa não é valida (isto é uma planta com um grande γ(G) pode ter uma RGA
com elementos pequenos)
4. Uma mudança relativa num elemento de G semelhante ao inverso negativo de seu
correspondente elementos-RGA produz uma singularidade.
5. A RGA é a matriz identidade se G é triangular superior ou inferior.
Da última propriedade segue que a RGA (o mais precisamente Λ(G) − I) da uma
medida da interação entrada-saı́da.
A definição da RGA pode ser generalizada a matrices não quadradas usando a pseudoinversa, (a pseudo-inversa de G é (GT G)−1 ).
Além das propriedades algébricas mencionadas anteriormente, a matriz RGA possui
numerosas propriedades de controle úteis:
31
1. RGA é um bom indicador da sensibilidade as incertezas:
(a) Incertezas no canal de entrada. Plantas com elementos grandes na RGA ao
redor da freqüência de corte são fundamentalmente difı́ceis de controlar pela
sensibilidade as incertezas de entrada (por exemplo causada pelas incertezas
ou omissão da dinâmica do atuador)
(b) Elementos incertos. Como implicado pela propriedade algébrica 4 acima, um
elemento grande na RGA implica sensibilidade a incerteza elemento a elemento. Entretanto, este tipo da incerteza não pode ocorrer na prática devido
aos acoplamentos fı́sicos entre os elementos da função de transferência. Conseqüentemente, a incerteza diagonal da entrada (que está sempre presente) é
geralmente de mais interesse para plantas com elementos-RGA grandes.
2. RGA e zeros no semi-plano direito. Se o signo de um elemento-RGA muda de s = 0
a s = ∞, então existe um zero no semi-plano direito em G ou em algum sub-sistema
de G.
3. Plantas não-quadradas. Entradas extras: se a soma dos elementos na coluna da RGA
é pequeno (<< 1), então se pode considerar suprimir a entrada correspondente.
Saı́das extras: se todos os elementos de um fila de uma RGA são pequenos (<< 1),
então a correspondente saı́da não pode ser controlada.
4. Dominância diagonal. A RGA pode ser usada para medir a dominância diagonal
pela simples quantidade:
RGA − number = kΛ(G) − Iksum
(2.50)
Para um controle descentralizado prefere-se emparelhamentos para a qual o numero
RGA na freqüência de corte seja próximo a 1.
5. RGA e controle descentralizado.
(a) Integridade:
para plantas estáveis evitar emparelhamentos entrada-saı́da
com elementos-RGA de estado estacionário negativos. Se não, se os subcontroladores são projetados independentemente cada um com ação integral,
então as interações causarão instabilidade ainda quando toda as malhas sejam
fechadas, ou quando a malha correspondente ao ganho relativo negativo tornase inativo (por exemplo por causa da saturação). Interessante, este é o único
uso da RGA relacionado diretamente à definição original de Bristol.
32
(b) Estabilidade: Preferir os emparelhamentos que correspondam a um númeroRGA perto de 0 nas freqüências de corte.
Exemplo 2.4 Considere a planta diagonal G, calcule a RGA e o número de condição,
"
G=
100 0
0
1
#
, Λ(G) = I, γ(G) =
σ(G)
100
=
= 100, γ ∗ (G) = 1
σ(G)
1
(2.51)
Aqui o número de condição e grande o que significa que o ganho da planta depende fortemente das direções de entrada. No entanto, dado que planta é diagonal não a interação
por tanto Λ(G) = I é γ ∗ (G) = 1, e normalmente não é esperado sensibilidade as incertezas.
Exemplo 2.5 Considere novamente o processo de destilação mostrado no exemplo 2.3,
para a qual temos a matriz de ganhos em estado estacionário,
"
G=
87.8
−86.4
#
(2.52)
108.2 −109.6
"
G−1 =
#
(2.53)
0.394 −0.320
"
Λ(G) =
0.399 −0.315
35.1
−34.1
−34.1
35.1
#
(2.54)
Neste caso γ(G) = 197.2/1.391 = 141.7 é somente ligeiramente maior que γ ∗ (G) =
138.268. A magnitude da soma dos elementos da matriz RGA é kΛksum = 138.275. O
número de condição é grande, mas como o valor singular mı́nimo σ(G) = 1.391 é maior
que 1 isto por si não implica um problema de controle. Entretanto, os elementos-RGA
grandes indicam problemas no controle, e problemas fundamentais do controle esperamse se a análise mostrar que G(jw) tem elementos-RGA também na região de freqüência
perto da freqüência de corte.
2.3
Projeto Integrado de Processos e Controle
Na tarefa de Projeto Integrado se consideram simultaneamente objetivos de controle
e objetivos econômicos, que podem traduzir-se em encontrar os parâmetros fı́sicos da
33
planta e um ponto em estado estacionário que minimize o custo de construção e operação
ao mesmo tempo que satisfaça certas caracterı́sticas de controlabilidade. O problema
pode formular-se da seguinte maneira, (Luyben 1993):
“Dada varias configurações da planta concebida para a realização de um conjunto
de tarefas (reações, separação, aquecimento, etc) e dado um conjunto de variáveis controladas, manipuladas e de perturbação, que estão relacionas através de um modelo
matemático, o objetivo fundamental é determinar a configuração ótima ou de melhor
compromisso do processo entre os objetivos econômicos e de controle.”
Esta formulação não especifica qual é o objetivo particular do controle ou como pode
obter-se a melhor solução de compromisso, o problema de projeto integrado pode formularse como um problema de otimização multi objetivo que facilita a liberdade de estabelecer
um certo número o tipo de objetivos, este não só tem que ter em conta a controlabilidade,
podem envolver objetivos de segurança ou meio ambientais por exemplo.
A determinação da melhor solução de compromisso recai no usuário, quem deve escolher em dependência as suas prioridades qual é a que ele considera a melhor solução.
Se as caracterı́sticas de controlabilidade que se estabelecem na etapa de projeto consideram o comportamento do sistema em malha aberta, o problema é dirigido a encontrar
a configuração ótima, tendo em conta aquela estrutura que resulte mais econômica. Se
o que se persegue fixar é o comportamento do sistema em malha fechada, o problema
conduz a determinar a estrutura de menor custo e os parâmetros ótimos do regulador que
cumpram com os requerimentos estabelecidos.
2.3.1
Procedimento Geral de Projeto Integrado
O procedimento de Projeto Integrado e executado seguindo os passos que se apresentam a continuação:
1. Proposta de diferentes estruturas alternativas
Se propõem diferentes estruturas do processo e se determinam os objetivos
econômicos e de controle que sejam de interesse.
2. Modelado das estruturas
Formula-se um modelo matemático de conhecimento de todas as estruturas pro-
34
postas e expressam-se as magnitudes de controlabilidade (em malha aberta ou malha
fechada) em função das variáveis de projeto desconhecidas a partir dos modelos linearizados de cada planta.
3. Obtenção dos parâmetros fı́sicos da planta
A solução do problema que se apresenta conduz a solução de um problema de
otimização multi objetivo não linear com restrições que formula-se da seguinte
maneira:
min
x
sujeito a :
U [f1 (x), f2 (x), . . .]
h(x) = 0
g(x) ≤ 0
x∈X
Onde:
U : representa o ı́ndice a minimizar e que relaciona os diferentes objetivos.
f1 (x), f2 (x), . . .: representam os objetivos de controle, econômicos e outros.
h(x): representa as equações de balanços e equilibrios do processo.
g(x): representa as restrições do processo, fı́sicas e de controle.
x: representa os parâmetros de dimensionamento e fı́sicos das unidades, a composição, temperaturas, etc.
4. Obtenção da melhor solução de compromisso
A melhor solução a um problema com múltiplos objetivos, consiste de aquelas
soluções onde um objetivo pode ser melhorado unicamente a expensas dos outros objetivos. Existem algoritmos de otimização multi objetivos (MOP), que acham
de maneira automática a melhor solução de compromisso.
No caso de projeto integrado em malha aberta, os objetivos de controle e econômicos
que podem impor-se podem ser por exemplo:
• minimizar o custo de operação e construção,
• minimizar o número de condição de perturbação,
• minimizar a distancia a 1 dos elementos positivos da RGA
• incluir dentro das restrições outras magnitudes de interesse relacionadas com
a operabilidade e flexibilidade das plantas.
35
No caso de projeto integrado onde considera-se o sistema em malha fechada, os
objetivos que podem impor-se, podem ser por exemplo:
• minimizar o custo de construção da planta,
• minimizar o número de condição da perturbação,
• minimizar o ganho da matriz de transferência em malha fechada respeito a
matriz de transferência em malha aberta,
• incluir nas restrições localização dos pólos da matriz de transferência em malha
fechada.
A seguir mostram-se dois exemplos de projeto integrado que permitem ilustrar as vantagens que podem obter-se com esta metodologia. Os dois exemplo são uma contribuição
deste trabalho preliminar, trata-se do projeto integrado de um conversor de potência, o
CBB.
2.3.2
Exemplo: Projeto Integrado de un CBB e um controlador
PID.
A Figura 2.9 mostra o circuito de um CBB ideal.
S
D
-
V CC
L
C
R
Vo
+
Figura 2.9: Diagrama do CBB.
O CBB é um conversor DC-DC tı́pico, normalmente usado como fonte de alimentação.
A principal propriedade deste conversor é que sua tensão de saı́da (V0 ) é ajustável podendo ser maior ou menor que a tensão continua primaria (Vcc ). Do ponto de vista do
controle o objetivo deste sistema é fornecer uma tensão de saı́da que possa seguir uma
referência desejada de tensão e rejeitar as perturbações causadas pelas variações de carga
representadas na Figura 2.9 pela resistência R. Para fazê-lo, uma adequada estratégia de
controle deve ser definida para atuar no interruptor S.
36
O CBB pode operar em dois modos diferentes. Se a corrente no inductor L não é zero
o CBB opera no modo de condução contı́nuo. Se não o modo descontı́nuo de operação é
considerado.
Tipicamente, dois modelos de CBB são usados na literatura. O modelo instantâneo
que considera todos os fenômenos dinâmicos relacionado à operação de interruptor.
E o modelo médio que não considera as dinâmicas de interruptor mas só o comportamento dominante causado pelos outros elementos do circuito, (Middlebrook e
Cúk 1976, Vorpérian 1990, Kassakian et al. 1991).
Modelo Instantâneo.
Para obter o modelo instantâneo do CBB, é definido q como um sinal que caracteriza
o comportamento dinâmico do interruptor:
(
S:
q = 0, se a chave esta aberta
q = 1, se a chave esta fechada
Assim, dois conjuntos de equações diferenciais descrevem o comportamento do CBB.
Se q = 0:
diL
1
=
vC
dt
L
dvC
1
vC
=
(−iL − )
dt
C
R
V0 = −vC
(2.55)
(2.56)
(2.57)
e se q = 1:
1
diL
=
Vi
dt
L
1 vC
dvC
= −
dt
C R
V0 = −vC
(2.58)
(2.59)
(2.60)
37
Combinando estes dois sub-sistemas o modelo instantâneo do CBB é obtido:
diL
1
=
(qVi + (1 − q)vC )
dt
L
dvC
1 vC
= − ( + (1 − q)iL )
dt
C R
V0 = −vC
(2.61)
(2.62)
(2.63)
que é um modelo com variáveis reais (iL , vC ) e inteiras (q).
Modelo Médio.
O modelo médio é obtido usando o modelo instantâneo e algumas hipóteses de simplificação. Assumindo que a freqüência de comutação do interruptor é muito maior que as
freqüências associadas à transferência de energia dos elementos passivos do circuito (R,
L, e C) é possı́vel substituir o sinal instantâneo de controle q(t) pelo sinal d(t) que dá,
em cada instante de tempo t, o valor médio de q(t) num perı́odo de comutação. Usando
esta aproximação, o modelo pode ser representado pelo seguinte conjunto de equações
(Borges 2002):
dibL
1
=
(dVi + (1 − d)c
vC )
dt
L
dc
vC
1 vc
C
= − ( + (1 − d)ibL )
dt
C R
V0 = −c
vC
(2.64)
(2.65)
(2.66)
Projeto Inicial.
O projeto tradicional de um CBB como o da Figura 2.9, começa com um conjunto
dado de especificações tal como:
• Fonte de tensão Vcc = Vi
• Intervalo da tensão de saı́da em que deve operar o CBB, V0 ∈ [V0min , V0max ], e
• Intervalo de carga a qual será submetido o CBB, R ∈ [Rmin , Rmax ].
e finaliza na determinação dos valores dos componentes do circuito, isto é: indutância L,
capacitância C e o perı́odo T do modulator de largura de pulso (PWM) conectado entre
38
o controle e o interruptor (S), tal que os seguintes requisitos de estado estacionário sejam
totalmente cumpridos:
• O CBB deve trabalhar em modo contı́nuo de condução, isto é, iL (t) ≥ 0, ∀t. Então,
idealmente, igualando a energia entregada pela fonte primaria à energia consumida
pelo carga R:
E(f onte) = E(carga)
V02
Vi ibS =
R
2
Vi d T
V02
Vi
≥
2L
R
Portanto
V02
1 Vi2 R 2
−
Td ≥ 0
2 L
(2.67)
Onde ibS é a corrente média pelo interruptor no limite de modo de condução contı́nua
e pode ser calculada como:
Vi d2 T
ibS =
2L
sendo d a fração de T que corresponde a posição fechada do interruptor S.
• A ondulação da corrente pelo inductor deve ser menos que 5%, isto é, 4iL ≤ 5%,
então:
Porque, 4iL =
Vi
T d ≤ 0.05ibL
L
Vi
T d,
L
(2.68)
pode ser obtida integrando a equação (2.58).
• A ondulação de tensão no capacitor deve ser menos que 5%, 4vC ≤ 5%, então:
(1 − d)T b Vi
[iL − ] ≤ 0.05c
vC
C
R
(2.69)
Para calcular (2.69) supusemos que se q = 0, então a corrente do capacitor é a
diferença entre a corrente pelo inductor L e a corrente na carga R,
iL − IR
C
Sendo esta corrente responsável pelas ondulação de tensão. Uma aproximação de
primeira ordem leva a:
4vC =
(1 − d)T b Vi
[iL − ]
C
R
39
portanto a (2.69)
Todos estes requisitos devem ser cumpridos ∀V0 ∈ [V0min , V0max ] e ∀R ∈ [Rmin , Rmax ].
Um estudo do pior caso permite escolher um conjunto de valores que satisfazem as
especificações acima citadas. Um exemplo de tal conjunto é dado na Tabela 2.1. Opcionalmente, um procedimento de otimização sob o modelo e restrições de especificação
podem ser usados para escolher tal conjunto com um critério econômico.
Elemento
Valor
Tensão da fonte (Vi )
48V
Resistência (valor min) (Rmin )
40Ω
Resistência (valor max) (Rmax )
120Ω
Tensão de saı́da (valor min) (VoM in )
12V
Tensão de saı́da (valor max) (VoM ax )
100V
Indutância (H)
5.2 ∗ 10−3 Hy
Capacitância (C)
2.6355 ∗ 10−6 F
Freqüência de chaveamento (T )
3.3823 ∗ 10−6 s
Tabela 2.1: Parâmetros do CBB.
Uma vez o CBB foi projetado, um controlador de baixo de custo, como por exemplo
um PID com uma lei de controle da forma:
d = KP +
KI
+
s
KD
+1
1
s
N
(2.70)
pode ser sintonizado para manter a tensão de saı́da num valor desejado apesar das mudanças na carga. Mas isto não é fácil dado que o CBB é um dispositivo não-linear com
um vasto leque de condições operativas e que pode ser submetido a mudanças significativas na carga. Então o procedimento de sintonização do controlador PID realizado foi o
seguinte: linearizou-se o modelo do CBB no meio do intervalo de operação e para com este
modelo sintonizou-se o PID. Em seguida comprovou-se o desempenho do CBB operando
em malha fechada para todo o intervalo de operação desejado. O conjunto de parâmetros
do PID obtido para o ponto de operação V0 = 56V e R = 80Ω, correspondente ao CBB
de tabela 2.1, é dado na tabela 2.2. Onde N é a constante de tempo do filtro da ação
derivativa.
40
Element Value
KP
−6.8688 ∗ 10−4
KI
0.7004
KD
1.3188 ∗ 10−6
N
446.0379
Tabela 2.2: Parâmetros do PID.
Projeto Integrado.
No projeto da planta analisada na seção anterior, a dinâmica e as caracterı́sticas de
controle não são levadas em conta. Só uma vez a planta foi projetada, a tarefa de achar
os melhores parâmetros para o controlador é que começa, restritos pelos limites imposto
pelo projeto do CBB.
Um alternativa é integrar ambas fases calculando simultaneamente o valor dos componentes do CBB e a sintonia do controlador PID satisfazendo as restrições operacionais e de
controle. Além do mais, para garantir um desempenho adequado em todo o intervalo de
operação, uma metodologia de projeto chamada: projeto multi-ponto, será introduzida.
Os elementos chave da metodologia proposta de projeto integrado são:
1. Uma estrutura do processo do sistema a ser projetado primeiramente é proposto.
Pode ser uma já fixada, tal como a estrutura mostrada na Figura 2.9, ou a mesma
sujeita a modificações. Por simplicidade, não consideraremos a última possibilidade.
2. Um modelo matemático do processo é formulado. Em nosso caso corresponde ao
conjunto de equações ( 2.64,2.65,2.66).
3. A estrutura de controle é definida e o modelo matemático é aumentado com as
equações do controlador, em nosso caso (2.70). O resultante modelo de malha
fechada é uma função dos ainda desconhecidos parâmetros do processo e do controle.
4. As especificações e restrições de operabilidade, concernentes ambas ao estado estacionário do processo e a resposta dinâmica do sistema, são adicionadas e formuladas
como um conjunto de pontos de operação a ser escolhidos cobrindo o intervalo
de funcionamento desejado. Exemplos das restrições em estado estacionário são
(2.67,2.68,2.69). Se necessário, algumas caracterı́sticas dinâmicas podem ser impostas sob as magnitudes obtidas dos modelos linearizados calculados em cada um
dos pontos de operação.
41
5. A seleção dos parâmetros do processo e controle é feito por otimização de um função
custo F (x) que reflete objetivos econômico e de desempenho, em relação à variável
de decisão x, que inclui os parâmetros desconhecidos de projeto, sob as restrições
do modelo e as especificações descritas anteriormente, tanto em forma de igualdade
ou forma de desigualdade:
P :
Minimize
F (x)
x
Subject to:
g(x) ≤ 0
h(x) = 0
x∈R
Em nosso caso, por simplicidade, a função custo F (x) inclui somente termos de desempenho que correspondem aos erros quadráticos acumulados em quatro experimentos
representativas cobrindo as piores situações extremas de operação:
Z
F (x) =
Z
e21 dt
+
Z
e22 dt
Z
e23 dt
e24 dt
(2.71)
Os erros ei são definidos como as diferenças entre o set-point (tensão de saı́da desejada) e a
real calculada através do modelo em malha fechada. Desta forma F (x) inclui uma medida
de respostas dinâmicas relevantes. Como a caracterı́stica principal de um conversor de
potência é dada por sua capacidade de rejeitar perturbações, isto é, mudanças na carga,
e em nosso caso tem que operar entre 12V e 100V , os quatro experimentos selecionadas
foram:
• com uma tensão de referência de 12V , o carga R foi mudada de 40Ω a 120Ω.
O F (x) foi calculado simulando quatro vezes o sistema em malha fechada. Cada simulação corresponde a um valor dado da variável de decisão x = [L C T KP KI KD N ]T .
As restrições (2.67, 2.68, 2.69) também são avaliadas em cada um dos quatro estados estacionários dado na tabela 2.3 correspondente com as quatro experiências.
42
i
1
2
3
4
V0
12
12
100
100
R
120
40
120
40
Tabela 2.3: Pontos de Operação.
Finalmente, um conjunto de restrições dinâmicas adicionais são impostas para garantir
estabilidade e o tipo de resposta em malha fechada. Estas restrições correspondem aos
pólos em malha fechada do sistema, os quais deveram estar contidos na região mostrada na
Figura 2.10. O calculo dos pólos é feito através do modelo linearizado em malha fechada
Figura 2.10: Região permitida para os autovalores em malha fechada.
em cada um dos quatro pontos de operação selecionados.
Note que, neste caso, o ponto de operação será escolhido pelo operador dentro do
intervalo especificado, por tanto, a tensão de saı́da não é dada pelo projeto. Em outros
casos de projeto integrado, o objetivo pode ser especificado em termos de custos dos
componentes e especificações tal como consumo de energia. Então o melhor ponto de
operação pode ser selecionado pela otimização, cumprindo as restrições.
43
Resultado.
O projeto integrado então é formulado como a solução do problema não linear de
programação:
Minimize
F (x)
x
Subject to:
[2.61][2.62][2.63]
∀t
[2.64][2.65][2.66]
∀t
[2.67]
i = 1, 2, 3, 4
[2.68]
i = 1, 2, 3, 4
[2.69]
i = 1, 2, 3, 4
poles(Ai , Bi , Ci ) ∈ C i = 1, 2, 3, 4
x ∈ Rn
Onde:
x = [L C T KP KI KD N ]T
F (x) =
R
e21 dt +
R
e22 dt
R
e23 dt
R
e24 dt
n=7
Ai (x), Bi (x), Ci (x), corresponde aos modelos linearizados em cada um dos quatro pontos selecionados.
O algoritmo de programação quadrática seqüencial (SQP) implementado em Matlabr
foi usado para resolver o problema. Os parâmetros ótimos de projeto são dados na tabela
2.4.
Respostas comparativas das soluções com e sem projeto integrado são mostrados na
Figuras 2.11 e 2.12 para as quatro experiências.
Como podemos ver, o CBB projetado levando em conta a dinâmica em malha fechada,
mostra desempenho superior que o CBB projetado pelo método tradicional.
44
Parâmetros
L
C
T
KP
KI
KD
N
Valor
5.2 ∗ 10−3 H
3.2220 ∗ 10−4 F
3.3334 ∗ 10−6
4.7158 ∗ 10−4
1.0158
1.8806 ∗ 10−5
824.7588
Tabela 2.4: Solução
Os problemas de projeto integrado, incorporando caracterı́sticas de controle tanto
em malha aberta como fechada, são complexos. Isto á devido, fundamentalmente, ao
tamanho do problema em si e as não-linearidades das equações que devem-se resolver.
As técnicas matemáticas de programação não sempre garantem uma solução global ao
problema. Além do mais, o tempo de cálculo pode ser significativo. Mas neste sentido,
devemos salientar que o projeto é feito fora de linha, por tanto o tempo de cálculo não
é um fator importante na hora de aplicar esta metodologia de projeto. Outro ponto a
mencionar é que técnicas de programação estocásticas podem ser usadas na procura do
ótimo global como uma alternativa.
2.3.3
Exemplo: Projeto Integrado de un CBB e um CMD.
Seja o mesmo conversor elevador-redutor do exemplo anterior, onde foi considerado,
fazendo certas suposições, o seu correspondente modelo médio para realizar o projeto. A
seguir, vamos a realizar o projeto do CBB mas agora considerando o mesmo como um
sistema hı́brido, ou seja um sistema que mistura variáveis continuas (tensão e corrente)
e variáveis discretas (sinal de controle sobre a chave {0, 1}), e por tanto vamos realizar o
projeto em base a seu modelo instantâneo.
Para isso primeiro vamos ter que definir uma nova estrutura para o controlador que
permita levar em conta a caracterı́stica hı́brida do sistema, e por tanto atue diretamente
sobre a chave e não mais sobre o PWM que facia as vezes de “conversor de sinal contı́nuodiscreto”.
45
Vref = 12V
120
100
R(Ω)
80
60
40
20
0
0.15
0.16
0.17
0.18
Time(s)
0.19
0.2
0.21
1
Initial Design
Integrated design
e(V)
0.5
0
−0.5
−1
0.15
0.16
0.17
0.18
Time(s)
0.19
0.2
0.21
Figura 2.11: Resposta comparativa nas experiências 1 e 2.
Controle por Modos Deslizantes (CMD)
O controle por modos deslizantes (CMD) é uma técnica de controle não-linear ampliamente estudada na literatura e tem sido aplicada com bons resultados nos sistema de
estrutura variável, (Borges 2002), sistemas que apresenta descontinuidades nas equações
que o modelam. Devido a essas descontinuidades a maioria das ferramentas matemáticas
desenvolvidas para equações diferenciais e sistemas dinâmicos não são aplicáveis pois
pressupõem a continuidade das equações, (Itkis 1976) (Utkin 1974 (English Translation
1978)).
Essencialmente a lei de controle para sistemas de estrutura variável atua direcionando
as trajetórias do sistema a una variedade do plano de fase chamada superfı́cie de deslizamento ou de comutação e uma vez nela se mantém confinada a essa variedade dando
origem a que se conhece como modo deslizante.
A trajetória de um modo deslizante não verifica a equação diferencial ordinaria (EDO)
46
Vref = 100V
120
100
R(Ω)
80
60
40
20
0
0.15
0.16
0.17
0.18
Time(s)
0.19
10
0.2
0.21
Initial Design
Integrated Design
e(V)
5
0
−5
−10
0.15
0.16
0.17
0.18
Time(s)
0.19
0.2
0.21
de nenhuma das estruturas, mas ela existe como solução global do problema.
As superficies de comutação são projetadas de tal maneira que o movimento dos estados do sistema confinados à mesma exibam o comportamento desejado de regulação o
tracking.
Consideremos o seguinte sistema ao qual devemos projetar un controlador por modos
deslizantes, (Mattavelli et al. 1993):
ẋ = f (x, t, u)
onde:
x ∈ D ⊆ Rn é o vetor de estados.
f : D × Rn → Rn é uma função vectorial.
u é a entrada de controle.
(2.72)
47
Seja σ(x, t) : D × R → R uma função continua com gradiente não nulo em D, a partir
da qual definimos a seguinte superfı́cie:
S = {(x, t) ∈ D × R, σ(x, t) = 0}
(2.73)
que chamamos de superfı́cie de comutação e será projetada de forma tal que a lei de
controle:
(
u(x, t) =
u+ (x, t) se σ(x, t) > 0
u− (x, t) se σ(x, t) < 0
(2.74)
direcione as trajetórias do sistema em direção à mesma e que contenha o ponto de
equilı́brio que desejamos alcançar em estado estacionário. A função f vai apresentar
então, uma descontinuidade em S devido a essa ação de controle:
(
f (x, t, u) =
f + (x, t, u+ ) se σ(x, t) → 0+
f − (x, t, u− ) se σ(x, t) → 0−
(2.75)
Para que um modo deslizante exista as trajetórias do sistema das duas sub-estruturas,
correspondentes aos dois diferentes valores do vetor função f , devem estar direcionados à
superfı́cie de deslizamento o de comutação. Então:
lim fi+ < 0 ⇒
σ→0+
lim ∇σ.f + < 0
σ→0+
(2.76)
lim fi− > 0 ⇒
σ→0−
lim ∇σ.f − > 0
σ→0−
i representa os componentes do vetor ẋ, e ∇σ é o gradiente de função σ.
Como:
n
dσ X ∂σ dxi
=
= ∇σ.f
dt
∂xi dt
i=1
(2.77)
então a condição de existência dos modos deslizantes pode formular-se nos seguintes termos:
lim+
σ→0
dσ
dt
<0
⇒ lim σ dσ
<0
dt
σ→0
lim dσ
σ→0− dt
>0
(2.78)
48
A região do espaço de estados:
Ω = {(x, t) ∈ D × R, σ(x, t)σ̇(x, t) < 0}
(2.79)
define a região de existência dos modos deslizantes.
Por tanto o domı́nio dos modos deslizantes queda definido em:
ψ =S∩Ω
(2.80)
Modos deslizantes puros aparecem apenas quando x ∈ S, ∀t > 0 na região Ω, o que
demanda uma freqüência de comutação infinitamente alta, não alcançável em sistemas
reais. A limitação em freqüência resulta em um movimento dentro da vizinhança da
superfı́cie de comutação, chamada de fenômeno de chattering. Em sistemas reais o controle
apresenta um comportamento de histérese.
Na figura 2.13 mostra-se o esquema básico de controle por modos deslizantes.
Figura 2.13: Esquema básico de controle.
A curva de comutação é uma combinação linear das variáveis de estado, isto resulta
numa implementação muito simples do controle real:
S = (x, t) ∈ D × R, σ(x, t) = k(iL − iLe ) + (vC − vCe ) = 0
onde:
(2.81)
49
(iLe , vCe ), é o ponto de equilı́brio que desejamos alcançar em estado estacionário.
k, é um parâmetro de projeto.
A lei de controle comutado é:
(
q(t) =
0 si σ(x, t) > +β
1 si σ(x, t) < −β
(2.82)
Em uma implementação real o erro da corrente no inductor, (iL − iLe ), calcula-se
através de um filtro passa alto (HPF), o que faz que necessariamente o valor médio em
estado estacionário deste erro seja 0. Se a função de comutação S devido à histerese
no controle não tem valor médio nulo, então aparecerá um erro em estado estacionário
na tensão de saı́da. Este problema resolve-se colocando un controle PI na função de
deslizamento S. A ação integral só atua quando o sistema está sobre a superfı́cie de
deslizamento e desta forma não afeta o comportamento do sistema durante o transitório.
Outros refinamentos aplicados no controle em um esquema real são: limitar a corrente
maxima pelo inductor e eliminar a dependência da freqüência de chaveamento com o
ponto de operação.
A figura 2.14 mostra o esquema real de controle por modos deslizantes para o CBB.
Neste trabalho por simplicidade o esquema de controle a ser usado em simulação é o
que mostra-se na Figura 2.15
Onde:
K
τ
−4.1025 1e − 3
O ganho K determinou-se a partir de imposição das condições de existência dos modos
deslizantes e a constante de tempo do filtro se determinou usando a regra prática que
indica que esse tempo deve ter um valor próximo à constante de tempo natural do sistema.
Projeto Integrado tomando em conta requisitos de controle.
Na seção anterior, o projeto do circuito do CBB e do sistema de controle foram executados em dois passo independentes. Só depois que o circuito do CBB foi projetado a
tarefa de achar os melhores parâmetros para o controlador foi começada, restringido pelos
50
Figura 2.14: Esquema real de controle.
limites imposto do projeto do CBB.
Uma alternativa é integrar ambas tarefas calculando simultaneamente os valores dos
componentes do CBB e os parâmetros do controlador, satisfazendo ambos, restrições
operacionais e de controle. A seguir mostra-se o desenvolvimento desta alternativa.
Os elementos chave da metodologia proposta de projeto integrado são as mesmas que
apontadas no exemplo anterior.
Uma estrutura do processo do sistema a ser projetado primeiramente é proposto,
(Figura 2.9). Um modelo matemático do processo é formulado. Em nosso caso corresponde ao conjunto de equações (2.61, 2.62, 2.63). A estrutura de controle é definida.
As especificações e restrições de operabilidade, concernentes ambas ao estado estacionário
do processo e a resposta dinâmica do sistema, são adicionados e formuladas como um
conjunto de pontos de operação a serem escolhidos cobrindo o intervalo de funcionamento
desejado. A seleção dos parâmetros do processo e controle é feito por otimização de um
função custo F (x) que reflete objetivos econômico e de desempenho, em relação à variável
de decisão x, que inclui os parâmetros desconhecidos de projeto, sob as restrições do mod-
51
Figura 2.15: Esquema simulado.
elo e as especificações descritas anteriormente, tanto em forma de igualdade ou forma de
desigualdade:
P :
Minimize F (x)
x
Sujeito a:
g(x) ≤ 0
h(x) = 0
x∈R
Neste exemplo será usada a mesma função de custo do exemplo anterior, para o caso do
PID, a qual inclui somente termos de desempenho que correspondem aos erros quadráticos
acumulados em quatro experimentos representativos, (os mesmos do exemplo anterior),
cobrindo as situações extremas de operação:
F (x) =
e21 dt
+
Z
Z
Z
Z
e22 dt
e23 dt
e24 dt
(2.83)
Os erros ei são definidos como as diferenças entre a referência (tensão de saı́da desejada)
e a real calculada através do modelo em malha fechada.
O F (x) foi calculado simulando quatro vezes o sistema em malha fechada. Cada
simulação coincide a um valor dado da variável de decisão x = [L C K τ ]T . As restrições
52
(2.67, 2.68, 2.69) também são avaliadas em cada um dos quatro estados estacionários dados
na tabela 2.3 correspondentes com as quatro experiências.
Note que, como o ponto de operação será escolhido pelo operador dentro de um intervalo especificado, a tensão de saı́da não é dada pelo projeto. Em vez disso, um projeto
global “multiponto”foi escolhido para tratar com a variabilidade do ponto de operação e da
perturbação (carga), fornecendo um desempenho robusto ao conjunto CBB-controlador.
Resultado.
Os parâmetros ótimos de projeto obtidos são mostrados na tabela 2.5.
Parâmetro
L
C
K
τ
Valor
1.47 ∗ 10−3 H
2.94 ∗ 10−4 F
−4
1 ∗ 10−4
Tabela 2.5: Solução obtida com o projeto integrado
Respostas comparativas da solução inicial e do projeto integrado são mostrados nas
Figuras 2.16 e 2.19 para as quatro experiências.
Como podemos ver novamente, o CBB projetado levando em conta a dinâmica em
malha fechada, mostra desempenho superior que o CBB projetado pelo método tradicional.
2.4
Sı́ntese de Processos e Controle
Anteriormente, partindo de uma estrutura da planta já dada, obtém-se o custo mı́nimo
da mesma, satisfazendo certas caracterı́sticas de controlabilidade impostas. O problema
abordado nesta seção, difere do anterior, em que trata-se de obter a estrutura ótima da
planta, junto com os parâmetros fı́sicos que minimizem seu custo, e os parâmetros ótimos
do controlador que verifiquem com as condições de controlabilidade fixadas previamente
de forma simultânea, este problema se resolve no contexto da Otimização Não-Linear
Mista-Inteira.
53
14
Vref
V com Proj. Integrado
O
13.5
VO sem Proj. Integrado
13
VO(V)
Detalhe A
Detalhe B
12.5
12
11.5
11
10.5
0.05
0.06
0.07
0.08
0.09
0.1
0.11
tempo(s)
0.12
0.13
0.14
0.15
Detalhe A
Detalhe B
12.2
Vref
Vref
O
12.3
O
12.1
V sem Proj. Integrado
V sem Proj. Integrado
O
O
12
VO(V)
VO(V)
12.2
12.1
11.9
11.8
12
11.7
11.9
11.6
11.8
0.0495
0.05
0.0505
0.051
tempo(s)
0.0515
0.052
Figura 2.17: Detalhe A.
2.4.1
11.5
0.099
0.0995
0.1
0.1005
tempo(s)
0.101
0.1015
Figura 2.18: Detalhe B.
Sı́ntese de Processos
Nishida et al. (1974), definiu: “a sı́ntese de processos é um ato de determinar a interconexão ótima entre as unidades do processo como também o tipo, o número e o desenho
das unidades dentro do sistema de processos, isto implica selecionar um sistema particular
dentro de um sistema geral que contenha o comportamento especificado”.
O problema de sı́ntese de processos pode estabelecer-se como segue: dada as especificações de entrada e as especificações de saı́da, obter um diagrama de fluxos do processo
que transforme as entradas dadas a um produto desejado, levando em conta os custes
de construção e exploração, a qualidade do produto, requerimentos meio ambientais, se-
54
130
Vref
O
120
Detalhe A
VO(V)
110
Detalhe B
100
90
80
70
0.05
0.06
0.07
0.08
0.09
0.1
0.11
tempo(s)
0.12
0.13
0.14
0.15
Detalhe A
Detalhe B
108
104
Vref
107
Vref
VO com Proj. Integrado
VO com Proj. Integrado
102
106
105
100
103
VO(V)
VO(V)
104
102
101
98
96
100
99
94
98
0.0495
0.05
0.0505
0.051
0.0515 0.052
tempo(s)
0.0525
0.053
0.0535
Figura 2.20: Detalhe A.
92
0.0995
0.1
0.1005 0.101 0.1015 0.102 0.1025 0.103 0.1035 0.104 0.1045
tempo(s)
Figura 2.21: Detalhe B.
gurança e operabilidade. Isto conduz a solução de três problemas fundamentalmente,
(Floudas 1995):
1. ¿Quais são as unidades do processo que devem ser incluı́das no processo?
2. ¿Como devem ser interligadas as unidades do processo?
3. ¿Que condição de operação e dimensões devem ter as unidades do processo?
O uso da otimização na sı́ntese de processos tem-se desenvolvido e focado na solução
destes problemas. A mesma involucra três passos:
55
1. A representação das estruturas alternativas do processo a traves de uma superestrutura do processo.
2. O modelo matemático da super-estrutura.
3. O desenvolvimento e utilização de um algoritmo para a solução do modelo
matemático.
Cada uma das três etapas é crucial para a determinação da estrutura ótima do diagrama de fluxos do processo.
A super-estrutura é, um super-conjunto de todos os projetos de interesse alternativos
ao processo. A representação dos processos alternativos baseia-se conceitualmente na
idéia da teoria dos grafos. Os nodos utilizam-se para representar as entradas, as saı́das
e cada unidade da super-estrutura. As flechas em uma direção representam as conexões
desde as entradas das unidades do processo, e as conexões da saı́da, as flechas de dupla
direção representam as interconexões de realimentação entre as unidades do processo,
(Floudas 1995), veja um exemplo na figura 2.22.
Figura 2.22: Representação da super-estrutura.
Uma vez definida a árvore é necessário construir um modelo matemático da mesma
utilizando variáveis contı́nuas e binárias, as variáveis binárias são utilizadas para indicar a
existência ou não dos nodos dentro da rede e as variáveis contı́nuas representam os nı́veis
56
dos valores a traves das flechas. A formulação resultante é um Problema de Programação
Não Linear Mista Inteira (MINLP), que se mostra a continuação:
min
x,y
sujeito a :
f (x, y)
h(x, y) = 0
g(x, y) ≤ 0
(2.84)
x ∈ X ⊆ Rn
y ∈ Y ⊆ {0, 1}m
onde:
x: é um vetor de n variáveis contı́nuas que representam os fluxos, as composições,
temperaturas, pressões, e tamanhos das unidades do processo.
y: é um vetor de m variáveis binárias que representam as alternativas do processo.
f (x, y): é uma função de um objetivo que representa o critério de projeto.
h(x, y) = 0: são q restrições de igualdade que representam os balanços de massa e
energia, e as expressões de equilı́brio do processo.
g(x, y) ≤ 0: são as p restrições de desigualdade que representam as especificações de
projeto e as restrições lógicas.
O passo final da otimização é o desenvolvimento e aplicação de um algoritmo de
otimização que dê solução ao modelo matemático.
2.4.2
Sı́ntese de Processos e Controle
Para resolver os problemas de sı́ntese de processos, as técnicas tradicionais
concentraram-se em determinar a configuração econômicamente ótima do processo dentro
de um conjunto de alternativas possı́veis que satisfazem os requerimentos de operação.
As magnitudes de controlabilidade geralmente não são consideradas. As técnicas tradicionais de controle de processos uma vez dada a configuração do mesmo analisam o modo
de achar a melhor seleção de pares de variáveis manipuladas e controladas assim como os
parâmetros do regulador que permitem o melhor comportamento do sistema em malha
fechada.
57
Nas últimas décadas, tem se apreciado um auge na evolução do desenvolvimento de
ferramentas matemáticas que permitem resolver o problema de sı́ntese de processos incorporando a controlabilidade como um dos objetivos dentro do projeto.
O problema de interação entre o projeto e a controlabilidade no marco da sı́ntese de
processos requer de, (Schweiger e Floudas 1997):
• Uma super-estrutura do processo que englobe todas as alternativas possı́veis.
• Um modelo matemático que descreva a super-estrutura do processo.
• Os conjuntos de variáveis manipuladas e controladas
• Valores desejados da saı́da do processo.
• Conjunto de estruturas de controle alternativas.
• Conjunto de variáveis de perturbação.
• Restrições.
• Custos.
• Horizonte finito de tempo.
O objetivo é determinar a estrutura do processo, a condições de operação, a estrutura
do controlador e seus parâmetros de ajuste que otimizem tanto a controlabilidade do
processo como os custes e que garantam uma operação factı́vel da planta.
No problema de sı́ntese do processo, é muito complexo e numericamente caro a utilização de modelos lineares, devido que requer-se apresentar e formular o modelo linear
na forma MINLP, ao mesmo tempo que se incluam de igual maneira as magnitudes de
controlabilidade expostas neste trabalho, isto nos obriga a trabalhar com modelos não
lineares. É evidente a deficiência de magnitudes de controlabilidade para sistemas não
lineares. Uma possı́vel magnitude usada tradicionalmente é a integral do quadrado do
erro (ISE):
Z
J=
(yref − y)2 dt
(2.85)
onde: erro = yref − y
Esta magnitude apresenta vários inconvenientes, primeiro que somente reflete a
dinâmica das variáveis medidas e omite a dinâmica das variáveis de estado não medidas.
58
este inconveniente pode se solucionar incorporando restrições de trajetória na formulação
do problema.
Outro problema referente ao uso da ISE como magnitude de controlabilidade e seleção
da estrutura de controle tem a ver com a seleção dos parâmetros do controlador, já que
busca dos parâmetros ótimos do controlador baseado na ISE, traiz consigo múltiplos
ótimos locais, além do que não existe uma correspondência um a um entre a estrutura de
controle e a ISE.
A pesar dos problemas associados a esta magnitude, seu uso tem alguns aspectos
positivos, primeiro é fácil de calcular e pode-se determinar diretamente com uma parte do
modelo do processo, segundo reflete o comportamento dinâmico do processo em termos
da variável de saı́da.
Os projetos que apresentam caracterı́sticas dinâmicas “pobres”, tem um valor muito
grande da ISE, no entanto os melhores projetos terão um valor mais pequeno de esta
magnitude. Finalmente podemos acrescentar que a ISE é uma função diferenciável e
facilita seu uso em métodos baseados em gradiente.
A formulação matemática deste problema caracteriza-se por diferentes tipos de
variáveis e restrições. Igual que no problema anterior, as variáveis se dividem em duas
categorias: contı́nuas e inteiras. A diferença vem dada pela introdução de dinâmica no
projeto, (Schweiger e Floudas 1997), que faz que as variáveis contı́nuas possam ser:
v : variáveis de projeto ou variáveis de decisão invariantes no tempo,
z(t) variáveis dinâmicas,
u(t) variáveis de controle ou variáveis de decisão variantes no tempo.
A formulação do problema de interação entre o projeto e o controle no marco da sı́ntese de
processos consta primeiramente do indice a minimizar (maximizar) U , este ı́ndice por sua
vez se compõe dos objetivos de controle e os objetivos econômicos, J1 e J2 , que dependeram
das variáveis dinâmicas (z), as variáveis de controle (u) e as variáveis inteiras (y). ou seja,
dependeram de:
min U (J1 (ż1 (ti ), z1 (ti ), z2 (ti ), u(ti ), v, y), J2 (ż1 (ti ), z1 (ti ), z2 (ti ), u(ti ), v, y))
(2.86)
onde z1 (t) é um vetor de n variáveis dinâmicas cujas derivadas no tempo ż1 (t) aparecem
59
explicitamente, e z2 (t) é um vetor de m variáveis dinâmicas cujas derivadas não aparecem
explicitamente. Note-se que ti é o instante de tempo.
Sujeito a um conjunto de restrições que podem classificar-se e descrever da seguinte
maneira:
1. O modelo dinâmico que representa a estrutura do processo e modela-se utilizando
um sistema de equações algébricas e diferenciais (DAE):
f1 (ż1 (t), z1 (t), z2 (t), u(t), v, y, t) = 0
f2 (z1 (t), z2 (t), u(t), v, y, t) = 0
(2.87)
Onde f1 representa n equações diferenciais, e f2 , m equações algébricas dinâmicas.
As variáveis v e y, são parâmetros para o sistema DAE e variáveis para a otimização,
v é um vetor de p variáveis contı́nuas invariantes no tempo, e y é um vetor de q
variáveis binárias. As variáveis de controle representadas por u(t) é um vetor de r
variáveis. O tempo t é uma variável independente para o sistema dinâmico e t0 é o
tempo inicial.
2. As condições iniciais para o sistema dinâmico também constituem restrições ao
problema
z1 (t0 ) = z10
z2 (t0 ) = z20
(2.88)
3. Restrições pontuais que involucram as variáveis dinâmicas num instante de tempo
especı́fico:
h0 (ż1 (ti ), z1 (ti ), z2 (ti ), u(ti ), v, y) = 0
g 0 (ż1 (ti ), z1 (ti ), z2 (ti ), u(ti ), v, y) ≤ 0
(2.89)
Onde ti é o instante de tempo onde deve verificar-se a restrição, o ı́ndice i pode
tomar valores desde 0 até N , onde N é o número de instantes de tempo que é
necessário no problema e tN é o tempo final.
4. Restrições que involucram unicamente as variáveis invariantes no tempo:
h00 (v, y) = 0
g 00 (v, y) ≤ 0
(2.90)
5. Seleção da estrutura de controle. A lei de controle pode ser por exemplo um PI, cuja
lei de controle é fácil de implementar. Por tanto ao problema também adiciona-se
60
a seleção da estrutura do regulador, que significa determinar os pares de variáveis
manipuladas e controladas, correspondentes à estrutura ótima da planta obtida,
assim como os valores de ajuste dos parâmetros do regulador, para qual utilizam-se
também variáveis binárias. Este problema se adiciona como restrição e se formula
da seguinte maneira:
uf (t)−u0,f −
X
½ ·
¸¾
Z t
1
s ∈ S krs (zmed,s (t) − zset,s ) +
(zmed,s (t) − zset,s )
= 0, ∀r ∈ R
τrs 0
(2.91)
Onde uf (t) é o conjunto de variáveis manipuladas, zmed,s é o conjunto de variáveis
medidas, zset,s representa o conjunto de consignas das variáveis controladas, krs , τrs
são os parâmetros do regulador (o ganho e o tempo integral respectivamente), R e
S, representam o conjunto de variáveis manipuladas e controladas respectivamente.
6. Restrições adicionais:
L
U
Krs
y rs ≤ Krs ≤ Krs
y rs ∀r ∈ R, ∀s ∈ S
U
L
y rs ≤ τrs ≤ τrs
y rs
τrs
P
s ∈ Sy rs ≤ 1
P
r ∈ Ry rs ≤ 1
∀r ∈ R, ∀s ∈ S
∀r ∈ R
(2.92)
∀s ∈ S
Onde y rs são as variáveis binárias que indicam a existência dos pares entre as
variáveis manipuladas r e as controladas s. As dois primeiras desigualdades fixam
o intervalo em que encontram-se os parâmetros do regulador em caso de existência
(limites inferior e superior), no entanto que as últimas desigualdades lógicas, garantem que pelo menos exista uma malha de controle (um par para cada variável
manipulada e controlada). Tudo isso sujeito as restrições de pertença:
v ∈ ν ⊆ Rp
y ∈ {0, 1}q
ti ∈ [t0 , tN ]
(2.93)
i = 0...N
O problema que obtém-se é um problema de Otimização Multi-Objetivo Mista Inteira
de Controle Ótimo.
O problema de controle ótimo resolve-se parametrizando o problema de programação
de dimensão infinita a um problema de programação de dimensão finita, para o qual
aplica-se uma lei de controle como por exemplo PI.
61
O problema multi-objetivo, pode-se resolver se convertemos J2 (o J1 ) em uma restrição
de contorno o pontual, e se inclui no conjunto das restrições h0 , com a qual o problema
que se obtém é um problema de programação com um só objetivo. A notação matemática
desta formulação pode se simplificar se combinamos no conjunto das variáveis x, todas as
variáveis invariantes no tempo (os parâmetros do regulador, os volumes, áreas, etc.). A
parametrização do controle obtém-se da conversão das variáveis de controle em variáveis de
estado, daı́ que o conjunto de variáveis dinâmicas se acrescentem as variáveis de controle:
z2 = {z2 (t), u(t)}. As equações de parametrização do controle, ψ(w, z(t)), são equações
algébricas que se acrescentam ao sistema DAE e podem ser incluı́das no conjunto de
equações f2 . As variáveis binárias y, que são usadas para selecionar a estrutura de controle
se agrupam no conjunto original das variáveis binárias. Já que as restrições de seleção
da estrutura de controle envolvem os parâmetros do controlador e as variáveis binárias,
podem ser incluı́das nas restrições do tipo g 00 (x, y).
Aplicando esta notação obtém-se o seguinte problema MINLP/DAE
min
x,y
J(ż1 (ti ), z1 (ti ), z2 (ti ), x, y)
sujeito a :
f1 (ż1 (t), z1 (t), z2 (t), x, y, t) = 0
f2 (z1 (t), z2 (t), x, y, t) = 0
z1 (t0 ) = z10
z2 (t0 ) = z20
h0 (ż1 (ti ), z1 (ti ), z2 (ti ), x, y) = 0
g 0 (ż1 (ti ), z1 (ti ), z2 (ti ), x, y) ≤ 0
(2.94)
h00 (x, y) = 0
g 00 (v, y) ≤ 0
x∈X
ti ∈ [t0 , tN ]
i = 0...N
2.4.3
Exemplo: Sintese de processos.
Desejamos produzir o produto C a partir dos produtos A e B, através dos processos I,
II e III. O produto C pode ser produzido somente através do processo I, os processos I e
62
Processo
I
II
III
Relação
C = 0.9B
B = ln(1 + A)
B = 1.2 ln(1 + A)
Tabela 2.6: Conversões
Processo
I
II
III
Capacidade máx.
2ton/h de C
5ton/h de B
4ton/h de B
Tabela 2.7: Capacidades máximas
III e os processos I e II. Os processos II e III não podem realizar-se simultaneamente.
Figura 2.23: Diagrama de fluxo do problema.
Os dados do problema são os mostrados nas tabelas 2.6, 2.7, 2.8 e 2.9.
A demanda do produto C é de 1ton/h máximo.
63
Produto Preço
A
1.800$/ton
B
7.000$/ton
C
13.000$/ton
Tabela 2.8: Preços
Processo Custo Fixo
Custo Variável
I
3.5 ∗ 103 $/ton 2.0 ∗ 103 $/ton
II
1.0 ∗ 103 $/ton 1.0 ∗ 103 $/ton
III
1.5 ∗ 103 $/ton 1.2 ∗ 103 $/ton
Tabela 2.9: Custe da Inversão
A formulação do problema é a seguinte:
max
P R = 13C − 1.8A2 − 1.8A3 − 7B1 − 3.5y1 − 2C − 1.0y2 − 1B2 − 1.5y3 − 1.2B3
Sujeito a
P I C − 0.9(B1 + B2 + B3 ) = 0
P II B2 − ln(1 + A2 ) = 0
P III B3 − 1.2 ln(1 + A3 ) = 0
B1 = B2 + B3
C≤1
C ≤ 2y1
B2 ≤ 4y1
B3 ≤ 5y3
y1 + y2 + y3 = 0, 1
n~
ao negatividade
2.5
Conclusões
Neste capı́tulo foram desenvolvido aspectos teóricos relacionados com o Projeto Integrado de Processos e Controle assim como de Sı́nteses de Processos.
Foi exemplificada a metodologia de Projeto Integrado através de dois estudos de caso.
No primeiro projetou-se un conversor de potência, o CBB, com um controle tipo PID. No
segundo exemplo considerou-se o modelo hı́brido do CBB e projetou-se o conversor com
um controlador por modos deslizantes. A aplicação da metodologia de projeto integrado
a sistemas de potência são uma contribuição deste trabalho preliminar.
64
Será objetivo da tese extender o leque de aplicação dos indices de controlabilidade
vistos neste capı́tulo a SH, assim como procurar novos indices que permitam caracterizar
aspectos relacionados a controlabilidade de esta classe de sistemas.
Também foi mostrado a forma de apresentar um problema de sı́ntese de processo
através de um exemplo simples mas que exemplifica a metodologia.
Os conceitos de projeto integrado e sı́ntese aparecerão e desenvolverão no âmbito de
processos. A extensão da metodologia a área da Eletrônica de Potência pretende ser uma
contribuição da tese de doutorado.
Capı́tulo 3
Modelado de Sistemas Hı́bridos
3.1
Introdução
Um modelo é uma representação simplificada do mundo real, que tem um grau suficiente de complexidade para permitir a descrição do comportamento que interessa ser
estudado. Ao mesmo tempo um modelo deve excluir todas as caracterı́sticas que não
são relevantes para a pesquisa e possam obstaculizar uma solução eficiente de tarefas
especificadas.
Cada área da ciência e da engenharia desenvolveram seus próprios formalismos para
obter modelos que permitissem resolver os problemas de interesse nas áreas correspondentes. Na teoria de controle e sistemas a atenção esta voltada para a manipulação das
variáveis do sistema que permitam alcançar metas como estabilização, rejeição a perturbações e robustez. A idéia chave é o uso de estruturas realimentadas, onde a evolução
de algumas variáveis monitoradas determina a ação atual e futura sobre o sistema. Conseqüentemente o conceito de modelo de um sistema, é tradicionalmente associado com as
equações diferenciais ou a diferenças que descrevem a evolução do sistema. Um modelo
é derivado tipicamente das leis fı́sicas que governam a dinâmica do sistema, ou pela estimação de seqüências experimentais de dados coletados com a finalidade de modelar a
planta (Mignone 2002).
O computador e programas lógicos, estão cada vez mais envolvidos em aplicações de
controle numa extensa classe de sistemas por causa de sua confiabilidade e pelo baixo
custo de fabricação de dispositivos eletrônicos. Isto trouxe duas conseqüências; primeiro,
66
aumento-se as capacidades funcionais avançadas de muitos dispositivos de uso comum,
como por exemplo os “sistemas eletrônicos embutidos”nos carros modernos para melhorar
a habilidade do condutor de dirigir o carro sob circunstâncias adversas (Balluchi et al.
2000); em segundo, apareceram novos desafios nas areas das pesquisas teóricas de controle
e ciências da computação. Com o fim de abordar estes desafios, novas classes de modelos
foram definidos, os sistemas hı́bridos (SH). Os SH podem capturar o comportamento
discreto de programas de computador e o comportamento contı́nuo de processos fı́sicos
(Torrisi 2003).
Desde uma perspectiva histórica, o termo hı́brido foi introduzido dado que nenhum
único modelo conhecido era capaz de capturar a dinâmica discreta e contı́nua ao mesmo
tempo. Era então necessário combinar as potencialidades de diferentes estruturas de
modelagem para descrever o comportamento de fenômenos hı́bridos.
Muitos fenômenos fı́sicos admitem uma descrição hı́brida, por exemplo, circuitos que
integram relês ou diodos (Pomar et al. 2007), redes biomoleculares (Alur et al. 1999), e
redes TCP/IP (Hespanha et al. 2001).
Os modelos hı́bridos são necessários para poder atacar numerosos problemas em diversos processos, como o calculo das trajetórias do sistema, análise de estabilidade e de
alcanzabilidade, controle, estimação de estados, etc. (Torrisi 2003).
Como ainda não estão disponı́veis métodos tratáveis para analisar sistemas hı́bridos
em geral, diversos autores tem focalizado sua atenção em subclasses especiais de sistemas
dinâmicos hı́bridos para os quais técnicas de analise e/ou projeto estão sendo atualmente
desenvolvidas.
Alguns exemplos de tais subclasses são: os Autômatos Hı́bridos (Hybrid Automata
(HA)) (Schaft e Schumacher 1999), Sistemas Afins a Troços (Piece Wise Affine (PWA)
systems) (Sontag 1981), Sistemas Mixtos Lógicos Dinâmicos (Mixed Logical Dynamical
(MLD) systems) (Bemporad e Morari 1999), Sistemas Lineares Complementarios (Linear Complementarity (LC) systems) (Heemels et al. 2000), Sistemas Lineares Complementarios Extendidos (Extended Linear Complementarity (ELC) systems (Schutter e
Moor 1999)), e os Max-Min-Plus-Scaling (MMPS) systems (Schutter e Boom 2001).
Em Heemels et al. (2001) a equivalência entre subclasses de sistema é abordada. É
mostrado que sob algumas condições técnicas, as últimas cinco subclasses de modelos
mencionadas são equivalentes.
Tarefa
Controle
Estabilidade
Verificação
Identificação
Detecção de Faltas
Estimação
67
Modelo
MLD, PWA, MMPS
PWA
PWA
PWA
MLD
MLD
Tabela 3.1: Modelo sugerido para cada tarefa
Cada sub-classe tem suas vantagens. A equivalência entre as diferentes subclasses
permite facilmente transferir as propriedades teóricas (por exemplo: estabilidade, controlabilidade, observabilidade, etc.) e ferramentas de uma sub-classe a outra.
A tabela 3.1 sugere o modelo recomendado para algumas das tarefas mais tı́picas da
engenharia de controle. Por causa de sua generalidade não implica que alguns problemas
especı́ficos não possam ser resolvidos de uma maneira mais eficiente usando um contexto
de modelado diferente (Torrisi 2003).
Nas seguintes seções desenvolvera-se as duas subclasses de SH mais estudadas na
literatura, os sistemas PWA e MLD, exemplificando cada uma delas com o Conversor de
Potência Buck-Boost (CBB).
3.2
Sistemas Afins a Troços
Entre as várias estruturas usadas para modelar sistemas hı́bridos em tempo discreto a
mais estudada no meio acadêmico é a estrutura Afim a Troços (Piece Wise Affine systems,
(PWA)) (Sontag 1981).
Os sistemas PWA são capazes de modelar um grande número de processos fı́sicos, tais
como sistemas com não-linearidades estáticas (por exemplo: saturação do acionador),
aproximar dinâmicas não-lineares com exatidão arbitrária via múltiplas linearizações em
diferentes pontos de operação (Torrisi 2003), sistemas chaveados onde o comportamento
dinâmico é descrito por um número finito de modelos lineares junto com um conjunto de
regras lógica para trocar entre estes modelos (Borrelli 2002), etc.
Os sistemas PWA são definidos particionando o espaço de estado e de entrada em
regiões poliédricas, e associando a cada região uma equação afim de atualização de estados
diferente, isto é:
68
·
x(t + 1) = Ai x(t) + Bi u(t) + fi
y(t) = Ci x(t) + gi
para
x(t)
u(t)
¸
∈ Ci
(3.1)
onde:
• x são os estados contı́nuos e binários:
#
"
xc
x=
, xc ∈ Rnc , xl ∈ {0, 1}nl , n , nc + nl
xl
• y são as saı́das contı́nuas e binárias:
"
y=
yc
yl
#
, yc ∈ Rpc , yl ∈ {0, 1}pl , p , pc + pl
• u são as entradas contı́nuas e binárias:
"
#
uc
u=
, uc ∈ Rmc , ul ∈ {0, 1}ml , m , mc + ml
ul
• {Ci }s−1
i=0 é uma partição poliédrica do espaço dos conjuntos de estados e entradas,
Ci ⊆ Rn+m , n , nc + nl , m , mc + ml
• as matrizes Ai , Bi , Ci , fi , gi são constantes e tem dimensões adequadas.
Comentario 3.1 Os sub-indices c e l nas equações anteriores denotam os componentes
contı́nuos e lógicos (ou binários) de cada vetor respectivamente. Assim nc e a quantidade
de elementos contı́nuos e nl a quantidade de elementos binários que possui o vetor de
estados. O mesmo para os demais vetores.
Cada subsistema definido pelo conjunto (Ai , Bi , Ci , fi , gi ), é denominado de componente do sistema PWA (3.1). Se fi e gi são nulos, o sistema (3.1) é chamados de linear a
troços (Piece Wise Linear (PWL) system).
3.2.1
Exemplo
Exemplo 3.1 Modelo PWA do Conversor Buck-Boost (CBB)
69
Como foi visto no capı́tulo 2, o CBB pode operar em dois modos diferentes. Se a
corrente pelo inductor L não é zero o CBB opera no modo de condução contı́nua (MCC).
Se não o modo de operação descontı́nua (MCD) é considerado.
O sinal de controle do sistema é q ∈ {0, 1}, (sinal sobre o interruptor S), e os estados
do sistema são a corrente pelo inductor iL ∈ R e a tensão sobre o capacitor vC ∈ R,
como observa-se o sistema mistura sinais contı́nuos e discretos (binários) por tanto é
claramente um sistema hı́brido.
Se o interruptor estiver fechado (q = 1) então o conjunto de equações que descreve o
comportamento do sistema é:
1
Vcc
L
1 vC
= −
C R
= −vC
i˙L =
(3.2)
v˙C
(3.3)
V0
(3.4)
onde L C e R são a indutância, capacitância e resistência respectivamente, VO é a tensão
de saı́da.
Se o interruptor estiver aberto (q = 0) então o conjunto de equações que descrevem
o comportamento do sistema depende da corrente pelo inductor L. Se iL > 0, (MCC),
então:
1
vC
L
1
vC
=
(−iL − )
C
R
= −vC
i˙L =
(3.5)
v˙C
(3.6)
V0
(3.7)
más se iL = 0, (MCD), o conjunto de equações que descreve o comportamento do sistema
será:
i˙L = 0
1 vC
C R
= −vC
v˙C = −
V0
(3.8)
(3.9)
(3.10)
Discretizando a dinâmica contı́nua com um tempo de amostragem igual a Ts , temos
70
então:
(
iL (t + 1) = iL (t) + TLs Vcc
¡
¢
Ts
vC (t + 1) = 1 − RC
vC (t)

Ts

 iL (t + 1) = iL (t) + L vC (t)
(q = 0) ⇒ (iL > 0) ⇒
vC (t + 1) = − TCs iL (t)+

¢
 ¡
Ts
vC (t)
1 − RC
(
iL (t + 1) = iL (t)
¡
¢
(iL = 0) ⇒
Ts
vC (t + 1) = 1 − RC
vC (t)
(q = 1) ⇒
(3.11)
(3.12)
(3.13)
O conjunto de equações (3.11, 3.12 e 3.13) representam a descrição PWA do CBB.
Apesar do fato que modelos PWA são uma composição de sistemas dinâmicos lineares
invariantes no tempo (componentes), suas propriedades estruturais tais como estabilidade,
controlabilidade e observabilidade, são complexas e articuladas como tı́picas de sistemas
não-lineares (Borrelli 2002).
No que diz respeito a estabilidade, além dos resultados simples mas muito conservadores, tais como achar uma função quadrática comum de Lyapunov para todos os componentes, pesquisadores começaram a desenvolver ferramentas de análise e sı́ntese para
sistemas PWA só recentemente (Johannson e Rantzer 1998, Mignone et al. 2000, FerrariTrecate et al. 2002b). Adotando funções de Lyapunov quadráticas a troços, um enfoque
computacional baseados em Desigualdades Matriciais Lineares (Linear Matrix Inequalities
(LMI)) foi proposto em Hassibi e Boyd (1998) e Johannson e Rantzer (1998) para análise
de estabilidade e sı́ntese do controlador. A construção de funções de Lyapunov para sistemas chaveados também foi abordado em Wicks e Peleties (1994). Para a classe mais
geral de sistemas chaveados da forma ẋ = fi (x), i = 1, ..., s, Branicky (1994) e Branicky
(1998) fizeram uma extensão do critério de Lyapunov baseado em múltiplas funções de
Lyapunov. Em seu recente artigo, Blondel e Tsitsiklis (1999) mostraram que a verificação
da estabilidade de sistemas autônomos PWA é N P-hard (isto é, em geral a estabilidade
de sistemas PWA não pode ser avaliada por um algoritmo em tempo polinomial, a menos
que P = N P), até mesmo para sistemas PWA simples com só dois componentes. Várias
propriedades globais (tais como convergência global e estabilidade assintótica) de sistemas
PWA foram mostradas recentemente undecidable em Blondel et al. (1999).
A pesquisa sobre critérios de estabilidade para sistemas PWA foi motivada pelo fato
que a estabilidade de cada sub-sistema componente não é suficiente para garantir a esta-
71
bilidade do sistema PWA (e vice versa). Em Branicky (1998), se dá um exemplo onde subsistemas estáveis, más convenientemente combinados, geram um sistema PWA instável.
Sistemas estáveis construı́do de subsistemas instáveis são mostrados em Utkin (1977).
Estes exemplos salientam sobre as restrições que devem ser impostas no chaveamento
para garantir que uma composição de componentes estáveis se mantenha estável.
Exemplo 3.2 Considere o sistema autônomo:
"
ẋ1
#
ẋ2
"
= Ap(t)
x1
#
x2
onde as matrices componentes do sistema são:
"
A1 =
−1 −100
10
−1
#
"
A2 =
−1
10
#
−100 −1
√
Ambas dinâmicas são estáveis e com os mesmos autovalores: −1 ± j 1000
A lei de comutação é:
(
+
p(t ) =
1 se p(t) = 2 e se x2 (t) =
−x1 (t)
k
2 se p(t) = 1 e se x2 (t) = kx1 (t)
Esta lei de comutação conduz a um sistema instável para k = −0.2 como mostra a Figura
3.1
Figura 3.1: Trajetória do sistema no espaço de estados
72
Exemplo 3.3 Considere o sistema autônomo:
"
ẋ1
#
"
= Ap(t)
ẋ2
x1
#
x2
onde as matrices componentes do sistema são:
"
A1 =
0 10
0
0
#
"
A2 =
1.5
#
2
−2 −0.5
√
Ambas dinâmicas são instáveis e com os mesmos autovalores: 0.5 ± j 3
A lei de comutação é:
(
p(t+ ) =
1 se p(t) = 2 e se x2 (t) =
−kx1 (t)
2
2 se p(t) = 1 e se x2 (t) = kx1 (t)
Esta lei de comutação conduz a um sistema estável para k = 0.5 como mostra a Figura
3.2
Figura 3.2: Trajetória do sistema no espaço de estados
Muito pouca pesquisa tem focalizado a atenção nas propriedades de observabilidade
e controlabilidade de sistemas hı́bridos além de contribuições limitadas no campo dos
Timed Automatas (Alur et al. 1993, T.A. Henzinger e Varaiya 1995, Kesten et al. 1993)
e o trabalho precursor de Sontag (1981) para sistemas PWA. Desnecessário dizer, que
estes conceitos são fundamentais para entender se um observador de estado e um controlador para um sistema hı́brido, podem ser projetados e quão bom será sua performance.
Por exemplo, em Ferrari-Trecate et al. (2000), propriedades de observabilidade foram di-
73
retamente exploradas para projetar estimadores de estados convergentes para sistemas
hı́bridos .
As propriedades de controlabilidade e observabilidade foram investigadas em Ezzine e
Haddad (1989) e Goshen-Meskin e Bar-Itzhack (1992) para sistemas lineares variantes no
tempo, e em particular para a classe de sistemas assim chamado de constantes a troços
(onde as matrizes na representação de espaço de estados são funções do tempo constantes
a troços). Embora em princı́pio aplicável, estes resultados não permitem capturar as
peculiaridades dos sistemas PWA.
Questões gerais de N P-hardness sobre a avaliação de controlabilidade de sistemas
não-linear foram abordadas por Sontag (1988).
Seguindo seus resultados anteriores
(Sontag 1981, Sontag 1985), Sontag (1996) analisa a complexidade computacional da observabilidade e controlabilidade de sistemas PWA através de argumentos baseado na linguagem de álgebra linear a troços. O autor prova que a observabilidade/controlabilidade
é N P-Completa sobre o tempo finito, e é undecidable sobre o tempo infinito (isto é, em
geral não pode ser resolvido em tempo finito por meio de qualquer algoritmo). Usando
um raciocı́nio diferente, o mesmo resultado foi derivado em Blondel e Tsitsiklis (1999).
Em Bemporad, Ferrari-Trecate e Morari (2000) os autores fornecem duas importantes
contribuições à análise da controlabilidade e observabilidade de sistemas hı́brido e PWA:
(i) mostram ao leitor que a observabilidade e a controlabilidade podem ser muito complexas; apresentam numerosos contra-exemplos que descartam conjeturas óbvias sobre
herdar propriedades de observabilidade/controlabilidade dos subsistemas lineares componentes do sistema; (ii) fornecem testes de observabilidade e controlabilidade baseadas em
Programação Linear (LP) e Mista Inteira Linear (MILP).
A motivação principal para concentrar-nos em modelos em tempo-discreto vem da necessidade de analisar estes sistemas e resolver problemas de otimização, tal como o controle
ótimo ou problemas de seqüenciamento, para a qual a contra parte em tempo contı́nuo
não é fácil o cálculo. Por esta razão necessitamos um meio para descrever sistemas PWA
em tempo-discreto numa forma conveniente para transformar problemas de análise-sı́ntese
em problema mais compacto de otimização. A estrutura MLD descrita na seguinte seção
foi desenvolvida para tal propósito. Em particular, será provado que modelos MLD são
bem sucedido para transformar problemas de otimização com dinâmica hı́brida em programas misto inteiro lineares e quadráticos, solucionáveis via técnicas Branch and Bound
por exemplo (Nemhauser e Wolsey 1988), (Borrelli 2002).
3.3
74
Sistemas Mistos Lógicos Dinâmicos
Os Sistemas Mistos Lógicos Dinâmicos (Mixed Logical Dynamical systems, (MLD))
são um marco para modelar e controlar aqueles sistemas descritos por leis fı́sicas, regras
lógicas, e restrições de operação, interdependentes.
Sua caracterı́stica fundamental é permitir uma formulação e resolução sistemática de
vários problemas de análise e sı́ntese usando técnicas matemáticas de otimização.
De acordo com as técnicas descritas por exemplo em Williams (1993), Cavalier et al.
(1990) e Raman e Grossmann (1992), a lógica proposicional é transformada em desigualdades lineares que envolvem variáveis inteiras e variáveis contı́nuas, o que permite chegar
no sistema MLD, sistemas descritos por equações dinâmicas lineares sujeitas a inequações
lineares, mistas inteiras, isto é equações e inequações envolvendo variáveis contı́nuas e
binárias (ou lógicas, ou {0, 1}).
Os sistemas MLD generalizam um amplo conjunto de modelos entre os quais estão os
sistemas hı́bridos lineares, a maquina de estado finita, alguma classe de sistemas a eventos
discretos, sistemas lineares com restrições, e sistemas não lineares cujas não linearidades
podem ser expressas por funções lineares a troços.
3.3.1
Calculo Proposicional e Programação Linear Inteira
3.3.1.1
Proposições Lógicas
Seguindo a notação padrão (Williams 1977, Cavalier et al. 1990, Williams 1993), vamos
adotar as letras maiúsculas Xi para representar proposições, por exemplo “x ≥ 0”ou “a
temperatura está quente”. O literal Xi pode ser verdadeiro (V) ou falso (F). A Algebra
Booleana permite-nos combinar proposições simples em proposições compostas por meios
de operadores. Estes são:
∧
operador AN D
∨
operador OR
·
operador N OT (complemento)
→ implicancia
↔ se e somente se
⊕
OR exclusivo
75
Um tratamento mais detalhado da algebra booleana pode ser encontrada em textos
de projeto de circuitos digitais, como por exemplo Christiansen (1997) e Hayes (1993).
Para uma exposição rigorosa veja por exemplo Mendelson (1964).
Os operadores lógicos satisfazem diversas propriedades (Christiansen 1997) que podem
ser usadas para transformar proposições compostas em proposições compostas equivalentes envolvendo operadores diferentes, simplificando proposições complexas. É sabido
que todos os operadores lógicos podem ser definidos nos termos de um subconjunto deles
o qual é dito ser um conjunto completo dos operadores.
Exemplo 3.4 O conjunto de operadores {∨, ·} e um conjunto completo de operadores,
pois os outros operadores podem ser expressos em termos de estes aplicando equivalências
lógicas, por exemplo:
X1 → X2 equivalente a X 1 ∨ X2
(3.14)
X1 → X2 equivalente a X 2 → X1
(3.15)
X1 ↔ X2 equivalente a (X1 → X2 ) ∧ (X2 → X1 )
(3.16)
X1 ∧ X2 equivalente a X 1 ∨ X 2
(3.17)
A uma proposição Xi pode associar-se uma variável lógica δi ∈ {0, 1} a qual terá um
valor igual a um 1 se Xi = V , ou 0 se Xi = F .
Um problema de lógica proposicional onde a proposição X1 deve ser provada verdadeira
dado un conjunto de proposições (compostas) envolvendo proposições X2 , ..., Xn , podem
de fato ser resolvidos apropriadamente por meio de programação linear inteira traduzindo
as proposições compostas originais em desigualdades lineares que envolvem as variáveis
binárias δi . Estes desigualdades são denominados desigualdades lineares inteiras.
De fato, é fácil ver que as proposições e restrições lineares mostradas na tabela 3.2 são
equivalentes.
Existem métodos e formulações alternativos para transformar problemas de lógica
proposicional em problemas de programação matemática inteira equivalentes, e nenhum
método é uniformemente melhor do que o outro. Em Cavalier et al. (1990) conclui-se
que a eleição de uma abordagem de modelado eficiente depende da forma das proposições
lógicas. Está claro que um pre-processo procurando uma redução no problema de lógica
proposicional trás grandes benefı́cios na solução numérica quando resolvermos o problema
relação
AN D (∧)
X1 ∧ X2
76
proposição lógica
[δ1 = 1] ∧ [δ2 = 1]
(des)igualdade mista inteira
δ1 = 1
δ2 = 1
−δ1 + δ3 ≤ 0
−δ2 + δ3 ≤ 0
δ1 + δ2 − δ3 ≤ 1
X3 ↔ (X1 ∧ X2 )
[δ3 = 1] ↔ [δ1 = 1] ∧ [δ2 = 1]
OR (∨)
X1 ∨ X2
[δ1 = 1] ∨ [δ2 = 1]
δ1 + δ2 ≥ 1
[δ3 = 1] ↔ [δ1 = 1] ∨ [δ2 = 1]
δ1 − δ3 ≤ 0
δ2 − δ3 ≤ 0
−δ1 − δ2 + δ3 ≤ 0
[δ1 = 1]
δ1 = 0
[δ1 = 1] ⊕ [δ2 = 1]
δ1 + δ2 = 1
X3 ↔ (X1 ∨ X2 )
N OT (.)
X1
XOR (⊕)
X1 ⊕ X2
X3 ↔ (X1 ⊕ X2 ) [δ3 = 1] ↔ [δ1 = 1] ⊕ [δ2 = 1]
IM P LY (→)
X1 → X2
IF F (↔)
X1 ↔ X2
−δ1 − δ2 + δ3 ≤ 0
−δ1 + δ2 − δ3 ≤ 0
δ1 − δ2 − δ3 ≤ 0
δ1 + δ2 + δ3 ≤ 2
[δ1 = 1] → [δ2 = 1]
δ1 − δ2 ≤ 1
[δ1 = 1] ↔ [δ2 = 1]
δ1 − δ2 = 0
Tabela 3.2: Conversão de relações lógicas básicas em desigualdades inteiras
77
de programação mista inteira. O problema de encontrar a forma mı́nima, é bem conhecido
no âmbito de projeto de redes digitais. Existe uma variedade de métodos para executar
esta tarefa. Para uma exposição detalhada o leitor pode consultar Hayes (1993).
3.3.1.2
Proposições Mistas Lógicas-Continuas
Com a técnica de dedução computacional, mostrada na seção anterior, podemos então
modelar a parte lógica do processo (chaves ON/OFF, mecanismos discretos, redes combinatórias e seqüenciais) e o conhecimento heurı́stico de operação da planta através de
desigualdades lineares inteiras. Mas como estamos interessados em sistemas que não só
tenham parte lógica mas também dinâmica, devemos estabelecer um laço entre estes dois
mundos. Em particular necessitamos estabelecer uma metodologia de como construir
proposições de eventos operacionais respeito à dinâmica continua. A idéia chave é usar
desigualdades lineares mistas inteiras, isto é desigualdades envolvendo variáveis continuas, x ∈ Rn , e variáveis lógicas, δ ∈ {0, 1}. Em Raman e Grossmann (1991) e Raman e
Grossmann (1992) a idéia de introduzir o conhecimento qualitativo na sı́nteses do processo
usando lógica proposicional é apresentada. Uma aplicação mais recente de alocação de
recursos e seqüenciamento é descrito em Glover (1975). Na tabela 3.3 mostra-se uma lista
de equivalências, que permite realizar a tradução de algumas proposições mistas lógicascontinuas num conjunto de desigualdades a ser usado como restrições nos problemas de
otimização matemática. Uma lista extensiva de tais transformações é dada em Mignone
(2001). Notar que as relações que envolvem a forma [δ = 0] em vez de [δ = 1] nas tabelas
3.2 e 3.3 podem ser obtidos substituindo δ por (1 − δ) nas desigualdades correspondentes.
Exemplo 3.5 Como mostra-se na tabela 3.3, consideremos por exemplo a proposição
X , [f (x) ≤ 0]
(3.18)
onde f : R 7→ R e linear, supõe-se que x ∈ X , onde X é um conjunto delimitado dado, e
define-se:
M , max f (x)
(3.19)
m , min f (x)
(3.20)
x∈X
x∈X
relação
IM P LY (→)
[f (x) ≤ 0] → X
X → [f (x) ≤ 0]
IF F (↔)
[f (x) ≤ 0] ↔ X
78
proposição lógica
(des)igualdade mista inteira
[f (x) ≤ 0] → [δ = 1]
f (x) ≥ ² + (m − ²)δ
[δ = 1] → [f (x) ≤ 0]
f (x) ≥ M − M δ
f (x) ≤ M (1 − δ)
f (x) ≥ ² + (m − ²)δ
z
≤ Mδ
−z ≤ −mδ
z
≤ f (x) − m(1 − δ)
−z ≤ −f (x) + M (1 − δ)
[f (x) ≤ 0] ↔ [δ = 1]
P roduct
IF X T HEN z = f (x)
ELSE z = 0
z = δ.f (x)
Tabela 3.3: Conversão de relações mistas lógicas continuas básicas em desigualdades
mistas inteiras. M , m em R são as cotas superior e inferior da função linear f (x) para
x ∈ X , ² > 0 é uma tolerância pequena, geralmente a precisão da maquina
Teoricamente, uma sobre-estimação (sub-estimação) de M (m) é suficiente para nosso
propósito. Entretanto, estimativas mais realı́sticas fornecem benefı́cios computacionais
(Williams 1993).
Associando a variável binária δ com a proposição X, é possı́vel transformar 3.18 nas
seguintes desigualdades mistas inteiras:
f (x) ≤ M − M δ
(3.21)
f (x) ≥ ² + (m − ²)δ
(3.22)
onde ² é uma pequena tolerância (tipicamente a precisão da maquina) além da qual a
restrição é considerado como violada. Para verificar a equivalências entre a proposição
lógica e o conjunto de desigualdades (3.21, 3.22), pode verificar-se que 3.21 e 3.22 se
reduzem as quatro restrições da coluna “implicação resultante”da Tabela C.1, contanto
que as suposições adicionais correspondentes da coluna “quantidade fixa”sejam feitas.
quantidade fixa
δ=0
δ=1
f (x) ≤ 0
f (x) ≥ ²
desigualdade 3.21
f (x) ≤ M (inativa)
f (x) ≤ 0
δ ∈ {0, 1} (inativa)
δ=0
desigualdade 3.22
f (x) ≥ ²
f (x) ≥ m (inativa)
δ=1
δ ∈ {0, 1} (inativa)
implicação resultante
f (x) ≥ ²
f (x) ≤ 0
δ=1
δ=0
Tabela 3.4: Implicações de 3.21 e 3.22
Observar que de acordo como a coluna “quantidade fixa”da tabela C.1, uma das desigualdade de 3.21 e 3.22 torna-se inativa no sentido que sempre se cumpre, supondo 3.19,
79
3.20 e δ ∈ {0, 1}.
De um ponto de vista semântico, notar que o intervalo de δ na coluna direita da tabela
3.3 é entendida como um subconjunto dos números reais. Mesmo que estejamos falando
sobre δ como uma variável lógica ou discreta, quando fazemos a transformação para as
desigualdades, a suposição inerente é que:
δ ∈ {0, 1} ⊂ R
(3.23)
A tradução de proposições lógicas ou declarações mistas lógicas-continuas em desigualdades, vistas na seção 3.3.1, é um passo que determina criticamente o tamanho do modelo
MLD resultante em termos do número de variáveis. É importante achar modelos que tenham um número pequeno de variáveis binárias, pois isto permite melhorar a velocidade
de resolução dos problemas matemáticos de otimização, necessários para análise, sı́ntese
e supervisão de sistemas hı́bridos. No apêndice C propõe-se métodos eficientemente para
a tradução de proposições lógicas em desigualdades diminuindo o número de variáveis
auxiliares necessárias. Os métodos são aplicáveis quando as proposições lógicas são mais
complexas que as mostradas na Tabela 3.2, envolvendo combinações arbitrárias de operadores.
3.3.2
Estrutura de Sistemas MLD
Os modelos MLD para sistemas hı́bridos se baseiam na combinação de três idéias e
observações apresentadas isoladamente na literatura (Mignone 2002). Estas idéias são:
1. Representação de proposições lógicas como desigualdades lineares que envolvem
variáveis binárias.
2. Representação de proposições que acoplam relações lógicas às variáveis contı́nuas
como desigualdades lineares que envolvem variáveis contı́nuas e binárias.
3. A inclusão de variáveis binárias e restrições lineares na descrição de sistemas estimados contı́nuos.
Os primeiros dois pontos foram considerados na seção 3.3.1. O último ponto combina
todas as desigualdades que são construı́das a partir dos métodos da seção 3.3.1 num
80
conjunto de restrições. Para permitir uma formulação computacionalmente tratável dos
problemas de análise e sı́ntese do sistema, um modelo linear em tempo discreto é escolhido
para descrever a evolução dos estados. Como os componentes lógicos influenciam na
dinâmica contı́nua, é necessário introduzir variáveis binárias na descrição do sistema. Um
dos primeiros trabalhos usando esta idéia, é publicado em Witsenhausen (1966), onde um
modelo linear é escolhido, permitindo-se haver estados e entradas tanto contı́nuas como
discretas.
A forma geral de um sistema MLD é dado pelas seguintes expressões:
x(k + 1) = Ax(k) + B1 u(k) + B2 δ(k) + B3 z(k)
(3.24)
y(k) = Cx(k) + D1 u(k) + D2 δ(k) + D3 z(k)
(3.25)
E2 δ(k) + E3 z(k) ≤ E1 u(k) + E4 x(k) + E5
(3.26)
A equação (3.24) é a função de atualização dos estados. (3.25) é a função de saı́da e o
conjunto de desigualdades em (3.26) coleta as restrições inerentes do sistema assim como
as traduções das proposições lógicas como indicado nas tabelas 3.2 e 3.3. O significado
das variáveis é o seguinte:
• x são os estados contı́nuos e binários:
"
#
xc
x=
, xc ∈ Rnc , xl ∈ {0, 1}nl , n , nc + nl
xl
• y são as saı́das contı́nuas e binárias:
"
y=
yc
yl
#
, yc ∈ Rpc , yl ∈ {0, 1}pl , p , pc + pl
• u são as entradas contı́nuas e binárias:
#
"
uc
, uc ∈ Rmc , ul ∈ {0, 1}ml , m , mc + ml
u=
ul
• δ ∈ {0, 1}rl são as variáveis auxiliares binárias
• z ∈ Rrc são as variáveis auxiliares contı́nuas
81
Observe que removendo a equação (3.26) e fazendo δ e z iguais a 0, as equações (3.24)
e (3.25) reduzem-se a um sistema linear sem restrições em tempo discreto no espaço de
estados. As varáveis δ e z são introduzidas quando traduzimos as proposições lógicas
em desigualdades lineares. Todas as restrições estão contidas na desigualdade (3.26). A
descrição (3.24, 3.25, 3.26) só aparenta ser linear dado que as variáveis δ, xl , yl e ul são
binárias. Veremos o procedimento de modelado na forma MLD na seção 3.3.5.
O sistema (3.24, 3.25, 3.26) é suposto ser “completamente bem posto”(Bemporad e
Morari 1999). Isto significa que dado o estado x(k) e a entrada u(k) a desigualdade (3.26)
tem uma única solução para δ(k) e z(k). Em outras palavras, em cada instante de tempo,
o mapeamento (x(k), u(k)) 7→ δ(k) e (x(k), u(k)) 7→ z(k) resultam em um único valor.
Conseqüentemente, x(k + 1) é unicamente definido, permitindo encontrar uma trajetória
única do estado x(.) dado um estado inicial x(0) e uma seqüência de entrada u(0)...u(N ).
É condição para realizar uma correta simulação de um sistema MLD que este seja “bem
posto”.
Algoritmo 3.1 Simulação de um sistema MLD:
1. Faça k = k0 e escolha x(k).
2. Dado x(k) e u(k), obtenha δ(k) e z(k) que verifique (3.26).
3. Determine x(k + 1) de (3.24)
4. Faça k = k + 1 e vá ao passo 2.
É possı́vel determinar δ(k) e z(k) no passo 2 através de um Teste de Factibilidade
Misto Inteiro (Mixed Integer Feasibility Test (MIFT)), (Mignone 2002). A assunção que o
sistema seja bem posto é usualmente não restritiva na prática. Mesmo que seja fácil definir
sistemas MLD que não sejam bem postos, estes casos são freqüentemente de interesse
somente no âmbito acadêmico, e surgem se o sistema não for precisamente modelado.
Para a simulação de grandes sistemas, algoritmos computacionais mais eficientes do que
o algoritmo 3.1 podem ser realizados (Torrisi 2003).
As matrices A, B1 , B2 , B3 , C, D1 , D2 , D3 , E1 , ..., E5 são reais e de dimensões apropriadas. Se bem as matrizes A, B1 , B3 são matrices genéricas, algumas entradas têm que
ser excluı́das, se estados binários estão presentes em x. Mais precisamente, o componente lógico xl do estado não pode depender diretamente das variáveis continuas xc , uc ,
82
z através de 3.24. As correspondentes entradas em A, B1 , B3 devem ser zero para um
modelo MLD válido (Torrisi 2003, Ferrari-Trecate et al. 2002a). Por exemplo, a matriz
A deverá ter a forma:
"
A=
3.3.3
Acc
Acd
#
0nl xnc Add
Sistema MLD bem posto e a tolerância ²
Para a tradução de algumas proposições lógicas em desigualdades, é necessário introduzir pequenas tolerâncias (² > 0), como pode ser visto na Tabela 3.3. A justificação
principal para estas variáveis é a capacidade de expressar as desigualdades como nãoestritas, antes que como desigualdades estritas. Isto permite sua inclusão como restrições
em problemas de otimização.
Esta seção descreve um par de conseqüências desta aproximação para as restrições
assim obtidas e mostra, como depende da escolha de ² que o sistema seja bem posto.
Exemplo 3.6 Considere por exemplo a proposição:
[δ = 1] ↔ [f (x) ≤ 0]
(3.27)
e sua tradução
f (x) ≤ M − M δ
(3.28)
f (x) ≥ ² + (m − ²)δ
(3.29)
É fácil de verificar que as desigualdades (3.28) e (3.29) definem as relações:
[δ = 1] ↔ [m ≤ f (x) ≤ 0]
(3.30)
[δ = 0] ↔ [² ≤ f (x) ≤ M ]
(3.31)
0 < f (x) < ²
(3.32)
Se f (x) toma valores entre
A variável δ permanece indefinida e as desigualdades (3.28) e (3.29) são infactı́veis para
qualquer par (δ, f (x)) ∈ {0, 1} × (0, ²). De fato, se por exemplo f (x) = 2² , então (3.28) e
83
(3.29) tornam-se
²
≤ M − Mδ
2
²
−
≥ (m − ²)δ
2
(3.33)
(3.34)
Aqui, (3.33) é factı́vel para δ = 0 somente, no entanto que (3.34) só pode ser satisfeita com
δ = 1. Note que se (3.32) nunca ocorrer, nenhum problema de factibilidade é esperado.
Neste caso ² pode ser escolhido como a precisão representavel da máquina.
Com uma interpretação geométrica podemos visualizar, se há alternativas para representar (3.27), além de (3.28) e (3.29). Graficando o conjunto de pontos válidos no plano
(δ, y), onde y = f (x), como se mostra na Figura 3.3.
Figura 3.3: Conjunto de pontos válidos de 3.27 no plano (δ, y) representado como as linhas
marcadas
Da Figura 3.3, vemos que o ponto (δ, y) = (0, 0) é um elemento do fecho convexo de
pontos válidos, mesmo que ele mesmo é inválido. Note que estendendo o espaço com
variáveis binárias adicionais não ajuda neste caso, já que o conjunto de pontos válidos é
um conjunto aberto. Isto não satisfaz a suposição de conjunto compacto no Teorema C.5.
Para qualquer extensão do domı́nio do espaço (δ, y) com variáveis auxiliares, o conjunto
de pontos válidos é um conjunto não-convexo.
Um meio de representar esta relação como desigualdades é sacrificar a propriedade
que o modelo seja bem posto. A solução (3.28) e (3.29) modifica o conjunto de pontos
válidos, tal que há uma lacuna, em que δ é indefinido, como se mostra em Figura 3.4.
Isto significa que estritamente falando o sistema não é completamente bem posto, já
que para y ∈ (0, ²) nenhum δ é definido. Se estamos dispostos a sacrificar que o modelo
deja bem posto, podemos propor uma tradução alternativa, como se mostra na Figura
3.5.
84
Figura 3.4: Conjunto de pontos válidos de 3.27 no plano (δ, y) usando a abordagem ². Os
pontos válidos são representado como as linhas marcadas
Figura 3.5: Conjunto de pontos válidos de 3.27 no plano (δ, y) sem ser o sistema bem
posto. Os pontos válidos são representado como as linhas marcadas
Aqui nós não temos zonas da variável contı́nua y, onde a variável binária δ é indefinida,
mas temos ambos possı́veis valores de δ, se y = 0. As desigualdades neste caso são obtidas
colocando ² ≤ 0 em (3.28) e (3.29).
3.3.4
Estado estacionário para sistemas MLD
Os sistemas MLD podem exibir várias propriedades que são tı́picas de sistemas nãolineares, como múltiplos pontos de equilı́brios isolados ou ciclos limites. Propriedades
como deadlocks ou livelocks, tipicamente encontradas em sistemas a eventos discretos,
podem ser achados também em modelos MLD.
O valor de estado estacionário xf de um sistema MLD pode ser determinado resolvendo
o seguinte problema de programação mista inteira
min
xf ,uf ,δf ,zf
(kyf − rkρy + kxf kρ4 + kuf kρ1 + kzf kρ3 + kδf kρ2
(3.35)
85
Sujeito a:
xf = Axf + B1 uf + B2 δf + B3 zf
(3.36)
yf = Cxf + D1 uf + D2 δf + D3 zf
(3.37)
E2 δf + E3 zf ≤ E1 uf + E4 xf + E5
(3.38)
Aqui k · k é uma norma arbitrária, o vetor r é a referência constante, ρi = ρTi é uma
matriz de ponderação não-negativa. Em general, o conjunto completo de todos os estados
estacionários é definido pelos pontos factı́veis que satisfazem (3.36-3.38). No entanto,
como a solução xf , uf , δf , zf tipicamente é usada para propósitos de controle, estamos
interessados numa solução de (3.35-3.38), onde ρy À ρj , (j = 1...4) isto é um estado
estacionário que produz uma saı́da perto da referência.
Devido a grande variedade de comportamentos que podem apresentar sistemas MLD,
o resultado (xf , uf , δf , zf ) de (3.35-3.38) devem ser melhor analisados antes de seu uso
num esquema de controle. Algumas dificuldades que podem surgir são listadas a seguir:
Estado estacionário inalcansável O estado constante obtido com (3.35-3.38) pode ser
inalcansável. Chamamos um estado xe inalcansável, se existe um estado inicial x0 ,
para o qual nenhuma entrada factı́vel [u(0), u(1), ..., u(N )] de tamanho N (N ≥ 1)
existe, tal que x(N ) = xe para todo N .
Multiplicidade de estados estacionários Mesmo que todas as ponderações ρi em
(3.35) são escolhidos diferentes de zero, os estados estacionários obtidos com (3.35
-3.38) podem ser não-únicos por causa da presença das variáveis binárias. Um
exemplo simples deste fenômeno é um sistema PWA, onde o estado estacionário
correspondente a dinâmica afim da região Xi permanece em Xi para todo i. Sistemas podem ser achados, com estados estacionários que dão o mesmo valor de
(3.35) para todos os estados estacionários dos subsistemas.
Ciclos Limites Considere o problema de estabilizar um sistema MLD a uma referência
constante r. Ao procurar por um estado que forneça uma saı́da y que permaneça
perto de r, (3.35-3.38) pôde dar uma solução única e alcançável. No entanto, em
alguns casos o equilı́brio assim obtido é distante da referência. Deve-se observar que
o erro acumulado sobre um horizonte finito de comprimento M
M
X
k=1
kyf (k) − rk
86
pode ser menor, por exemplo, quando y segue um ciclo de estados em vez de se
manter num valor constante. O tal ciclo é gerado pelo chaveamento periódico dos
componentes discretos do sistema. Em outras palavras, o sistema vai por meio de
um ciclo de estados permanecer perto da referência, em vez de convergir a um estado
constante.
Para sistemas que exibam ciclos limite, em vez de achar um único estado estacionario, podem-se procurar por seqüências inteiras de estados. A otimização então
é dada por:
min
xf ,uf ,δ f ,z f
(ky f − rkρy + kxf kρ4 + kuf kρ1 + kz f kρ3 + kδ f kρ2
(3.39)
Sujeito a:
xf (1) = Axf (0) + B1 uf (0) + B2 δf (0) + B3 zf (0)
xf (2) = Axf (1) + B1 uf (1) + B2 δf (1) + B3 zf (1)
..
.
xf (N ) = Axf (N − 1) + B1 uf (N − 1) + B2 δf (N − 1) + B3 zf (N − 1)
xf (0) = Axf (N ) + B1 uf (N ) + B2 δf (N ) + B3 zf (N )
E2 δf (0) + E3 zf (0) ≤ E1 uf (0) + E4 xf (0) + E5
..
.
E2 δf (N ) + E3 zf (N ) ≤ E1 uf (N ) + E4 xf (N ) + E5
As variáveis xf , uf , δ f , z f em (3.39) são seqüencias das variáveis correspondentes
xf , uf , δf , zf de comprimento N , isto é


xf (0)
uf (0)



.
..
 uf = 
..
xf = 
.



xf (N )
uf (N )




δf (0)
zf (0)




.
..
 δf = 
 zf = 
..
.




δf (N )
zf (N )



r

 
 r =  ... 

 
r

r é o vetor constante de referência. Em general o comprimento N da seqüência não é
sabido previamente e deve ser achado iterativamente. Se um ciclo curto é requerido,
resolvemos o problema de otimização
min{
min
N ∈N yf (0),...,yf (N )
ky f − rkρe + γ(N )}
87
+
Onde γ(·) : R+
0 → R0 é uma função monótona crescente estrita, não-negativa que
penaliza o uso de ciclos longos de comprimento N .
3.3.5
Exemplos
Exemplo 3.7 Conversor Buck-Boost (CBB)
Para um melhor entendimento da metodologia de transformação das equações diferenciais que descrevem a dinâmica do sistema a um modelo no contexto MLD, vamos supor
que o CBB somente trabalha no MCC.
Para obter o modelo MLD (3.24-3.26) a partir das equações dinâmicas do CBB
((3.2-3.4) e (3.5-3.7)), em primeiro lugar é necessário associar a proposição “chave
fechada”uma variável auxiliar, por tanto:
[q = 1] ↔ [chave f echada]
Então temos que:
1
1
Vcc q + vC
L
L
1
1
= −
vC − iL (1 − q)
RC
C
= −vC
i˙L =
(3.40)
v˙C
(3.41)
V0
(3.42)
onde L C e R são a indutância, capacitância e resistência respectivamente, VO é a tensão
de saı́da.
Discretizando as equações anteriores com um perı́odo de amostragem Ts :
Ts Vcc
Ts
Vcc q(k) + vC (k)(1 − q(k)) + iL (k)
L
L
Ts
Ts
vC (k) − iL (k)(1 − q(k)) + vC (k)
vC (k + 1) = −
RC
C
V0 = −vC
iL (k + 1) =
(3.43)
(3.44)
(3.45)
onde k denota o tempo discreto o qual fazendo abuso da notação vamos omitir daqui para
frente.
Como se observa nas equações anteriores a corrente pelo inductor iL e a tensão sobre o
capacitor aparecem multiplicadas por a variável binária auxiliar q. É necessário introduzir
88
por tanto duas variáveis auxiliares como indica a tabela 3.3:
z1
z1
z1
z1
z1
=
≤
≥
≤
≥
iL q
MI q
mI q
iL − mI (1 − q)
iL − MI (1 − q)
z2
z2
z2
z2
z2
onde:
=
≤
≥
≤
≥
vC q
MV q
mV q
vC − mV (1 − q)
vC − MV (1 − q)
onde:
MI , max iL
mI , min iL
MV
mV
, max vC
, min vC
As transformações acima podem resumir-se na seguinte representação MLD do CBB:
"
i+
L
#
vC+
















"
=
−MI
− TCs 1 −










−mI 




MI 
q + 


−MV 




mV 




−mV 

MV
mI
#"
Ts
L
1
1
Ts
RC
0
iL
vC

#
"
+
Ts VCC
L
#
q+
0

0
"
0


 0
0 
0




1
0 
1
0
# 
"


−1 0 
 z1 ≤  −1 0

 0
0
1  z2
0



 0
0 −1 
0




0
1 
1
 0
0 −1
0 −1
−1

0
− TLs
Ts
C
0

#"
z1
#
(3.46)
z2
0



 0



 −m
I
"

#


 x1
 MI

+
 x
 0


2



 0



 −m
V


MV
















(3.47)
+
onde: i+
L = iL (k + 1) e vC = vC (k + 1).
Exemplo 3.8 Sistema de Controle de Temperatura
O exemplo que vamos desenvolver nesta seção é reportado em Bemporad, FerrariTrecate e Morari (2000). A temperatura xc de uma sala é controlada por um termostato,
que liga ou desliga um aquecedor de acordo com a temperatura medida. Quando o aquecedor está desligado, xc diminui de acordo com a dinâmica de primeiro-ordem ẋc = −Kxc ;
quando o aquecedor está ligado, ẋc = −K(u − xc ), onde u é proporcional a potência do
aquecedor, mu ≤ u ≤ Mu . O autômato hı́brido que modela o sistema de controle de
temperatura é mostrado na Figura 3.6.
89
Figura 3.6: Sistema de controle de temperatura
Para traduzir o autômato na forma MLD (3.24-3.26), vamos discretizar a dinâmica
contı́nua com tempo de amostragem igual a Ts , temos então
(
xc (t + 1) =
λxc (t),
se aquecedor desligado
λxc (t) + (1 − λ)u(t), se aquecedor ligado
(3.48)
onde λ , e−KTs . Então, introduzimos as variáveis binárias auxiliares
[δ1 (t) = 1] ↔ [xc (t) ≥ M ]
(3.49)
[δ2 (t) = 1] ↔ [xc (t) ≥ m]
(3.50)
Que toma em conta o cruzamento das linhas de guarda (obviamente, m < M ). As
equações (3.49,3.50) podem ser transformadas em desigualdades lineares mistas inteiras
usando a tabela 3.2, (vamos supor que os limites inferior mx e superior Mx sobre xc são
conhecidos).
O estado lógico xl (t + 1) é necessitado para armazenar o estado do aquecedor, e evoluciona de acordo com a equação
xl (t + 1) = δ3 (t)
(3.51)
[δ1 (t) = 1] → [δ3 (t) = 0]
(3.52)
[δ2 (t) = 1] → [δ3 (t) = 1]
(3.53)
onde
[δ1 (t) = 0] ∧ [δ2 (t) = 0] → [δ3 (t) = δ4 (t)]
(3.54)
90
e
δ4 (t) = xl (t)
(3.55)
Como δ1 e δ2 não podem ser 1 ao mesmo tempo, incluı́mos a restrição
δ1 (t) + δ2 (t) ≤ 1
(3.56)
As equações (3.52) e (3.53) são traduzidas em desigualdades de acordo com a tabela
3.2. A equação (3.54) é equivalente a
δ1 (t) + δ2 (t) ≤ δ3 (t) − δ4 (t) ≤ δ1 (t) + δ2 (t)
(3.57)
Embora (3.57) pode ser imediatamente verificada por inspeção, ela foi obtida aplicando a
técnica da FNC.
A dinâmica (3.48) pode ser reescrita equivalentemente como
xc(t + 1) = λxc (t) + xl (t)(1 − λ)u(t)
(3.58)
Por causa do produto envolvendo xl e u(t), introduzimos a variável contı́nua auxiliar
z(t) = xl u(t) = δ4 (t)u(t), que pode ser transformada em desigualdades lineares mistas
inteiras, de acordo com a Tabela 3.3.
As transformações acima podem resumir-se na seguinte representação MLD do sistema
de controle de temperatura:
"
x(t + 1) =
λ 0
0 0
#
"
x(t) +
0 0 0 0
0 0 1 0
#
"
δ(t) +
1−λ
0
#
z(t)
(3.59)
91
0
Mx − m
0
0






0
m
−
m
−
²
0
0
x






M
−
m
0
0
0



x





 M − Mx − ²
0
0
0






1
1
0
0 








0
1
−1
0






1
0
1
0 





 δ(t) + 

−1
−1
1
−1








−1
−1
−1
1 






0
0
0
−1








0
0
0
1 






0
0
0
−M
u









0
0
0
mu






0
0
0
−m
u



0
0
0
Mu

−1

 1


 1

 −1


 0

 0


 0

+
 0

 0

 0


 0

 0


 0

 0

0
h
onde δ ,
δ1 δ2 δ3 δ4
iT
h
ex,
xc xl
iT




.
0


0



 0 
0 






0
0 








0
0 





0 
 0 



 0 
0 






0 
 0 



 0  u(t)
z(t)
≤
0 






 0 
0 



 0 
0 






 0 
0 



 0 
1 








0 
−1



 1 
1 



−1
−1



Mx
0



 −m − ² 
0 






0 
 −mx 



 M −² 
0 






1
0 








0
0 





1
0 





 (3.60)


0
0  x(t) + 






0
0 






0
−1 







0
1 






0
0 







0
0 






−m
0 
u


Mu
0
3.4
92
Equivalência entre sistemas MLD e PWA
Definição 3.1 (Bemporad 2004) Sejam
P
e
P
sistemas hı́bridos no espaço de estados,
P P
com iguais dimensões nos estados, entradas, e saı́das.
1 e
2 são ditos equivalentes se
1
2
para todo x1 (k) = x2 (k) e u1 (k) = u2 (k), então o estado sucessor x1 (k+1) = x2 (k+1) e as
saı́das y1 (k) = y2 (k), onde k ∈ Z≥0 e Z≥0 é o conjunto de números inteiros não-negativos.
Note que se as trajetórias são persistentes, isto é, definidas para todo k ∈ Z≥0 então
a Definição 3.1 implica que começando do mesmo estado inicial e aplicando a mesma
seqüência de entrada, o estado e trajetórias de saı́da dos dois sistemas equivalentes são
idênticos.
O seguinte resultado é proposto em Bemporad, Ferrari-Trecate e Morari (2000) e é
uma extensão fácil do resultado correspondente proposto em Bemporad e Morari (1999)
para sistemas lineares a troços (PWL) (isto é, sistemas PWA com fi = gi = 0).
Proposição 3.1 (Bemporad 2004) Considere o sistema bem posto PWA (3.1) e seja o
conjunto Ω de estados e entradas factı́veis acotado. Então, existe um sistema MLD (3.243.26) tal que (3.1) e (3.24-3.26) são equivalentes.
Comentario 3.2 Como os modelos MLD só permitem que desigualdades não-estritas
sejam incluı́das em (3.26), ao reescrever um sistema PWA descontı́nuo como um modelo
MLD desigualdades estritas como x(k) < 0 devem ser aproximadas por x(k) ≤ −² para
algum ² > 0 (tipicamente a precisão de máquina), com o suposição que −² < x(k) < 0
não pode ocorrer devido ao número finito de bits usado para representar números reais
(nenhum problema existe quando o PWA é contı́nuo, onde a desigualdade estrita pode
ser reescrita equivalentemente como não-estrita, ou ² = 0); veja (Heemels et al. 2001)
e (Bemporad e Morari 1999) para mais detalhes. De um ponto de vista estritamente
teórico, a proposição feita na proposição 3.1 é, portanto, não exata para sistemas PWA
descontı́nuos. Como discutido previamente, um meio de iludir tal inexatidão é permitir
que parte das desigualdades em (3.26) sejam estritas, ou evitar desigualdades estritas na
definição das dinâmicas PWA. Por outro lado, de um ponto de vista numérico esta questão
não é relevante.
A proposição inversa de 3.1 foi estabelecida em Bemporad, Ferrari-Trecate e Morari
(2000) sob a condição que o sistema MLD seja completamente bem posto. Uma prova
mais geral e levemente diferente é mostrada a seguir.
93
Definição 3.2 (Bemporad 2004) O conjunto de estado+entradas factı́veis Ω ⊆ Rnc ×
{0, 1}nl × Rmc × {0, 1}ml é o conjunto de pares estados+entradas (x(k), u(k)) para a qual
(3.26) tem uma solução para algum δ(k) ∈ Rrl , z(k) ∈ Rrc .
Proposição 3.2 (Bemporad 2004) Para cada sistema completamente bem posto MLD
(3.24-3.26) existe um sistema bem posto PWA (3.1), isto é, o conjunto factı́vel de
estados+entradas de (3.24-3.26) Ω podem ser particionados numa coleção de poliedros
S
convexos {Ωi }si=1 , Ω = si=1 Ωi , e existem 5 tuplas (Ai , Bi , Ci , fi , gi ), i = 1, ..., s, tal que
todas as trajetórias x(k), u(k), y(k) do sistema MLD (3.24-3.26) também satisfazem (3.1).
Prova (Bemporad 2004)
3.5
Conversão de modelos MLD-PWA
Os sistemas PWA podem ser representados na forma
MLD (3.24−3.26). A tradução
"
#
consiste em definir variáveis lógicas δi [δi = 1] ↔ [ x ∈ Ci ] e impondo a condição de
u
Ls
OR-exclusivo
i=1 [δi = 1]. Para mais detalhes, o leitor pode consultar (Bemporad e
Morari 1999).
Embora técnicas de controle e estimação de estados baseadas em otimização mista
inteira online ou programação mista inteira multiparamétrica offline foram propostas para
modelos MLD (Bemporad e Morari 1999, Bemporad, Ferrari-Trecate e Morari 2000), a
maioria das outras técnicas hı́bridas exigem uma formulação PWA, tal como: criterios de
estabilidade (DeCarlo et al. 2000, Johannson e Rantzer 1998, Ferrari-Trecate et al. 2002b),
sı́ntese do controlador ótimo afim a troços (Bemporad et al. 2002, Kerrigan e Mayne
2002, Mayne e Rakovic 2002), e verificação de propriedades de segurança via análise de
alcanzabilidade (Asarin et al. 2000, Chutinan e Krogh 1999, Bemporad, Ferrari-Trecate
e Morari 2000). Além do mais, as simulações de sistemas hı́bridos são muito mais fáceis
para sistemas PWA (avaliação de um função PWA por cada passo de tempo), que para
sistema MLD (um teste de factibilidade mista inteira por cada passo de tempo (Bemporad
e Morari 1999)).
A transformação inversa de MLD a PWA descrita em Bemporad, Ferrari-Trecate e
Morari (2000) exige a enumeração de todas as possı́veis combinações das variáveis binárias
contida no modelo MLD. Em Bemporad (2004) se fornece um algoritmo eficiente que evita
94
tal enumeração e calcula muito eficientemente a forma equivalente PWA de um sistema
dado MLD.
A tradução eficiente de um modelo MLD a PWA permite estender o uso de ferramentas
desenvolvidas para sistemas PWA, a muitos problemas hı́bridos não-triviais da vida real,
como os que podem ser descritos na linguagem de modelado HYSDEL por exemplo,
(Bemporad 2004). Uma implementação de Matlab deste algoritmo está disponı́vel em
http://www.dii.unisi.it/~bemporad/tools.html e são incluı́dos em Hybrid Toolbox
for Matlab (Bemporad 2003). Para mais detalhes, o leitor pode consultar (Bemporad
2004).
3.6
Conclusões
Neste capı́tulo foi introduzido o conceito de Sistema Hı́brido, o qual surge desde uma
perspectiva histórica dado que nenhum único modelo conhecido era capaz de capturar a
dinâmica discreta e contı́nua ao mesmo tempo.
Ainda não existem métodos para analisar sistemas hı́bridos em geral, por tanto diversos autores tem focalizado sua atenção em subclasses especiais de sistemas dinâmicos
hı́bridos. Muitas de estas subclasses são equivalentes fazendo certas hipóteses e por tanto,
propriedades e ferramentas de um contexto podem ser trasladados a outro contexto. Neste
capı́tulo foram desenvolvido aspectos teóricos relacionados com duas destas subclasses ou
contextos de modelagem.
A primeira subclasse vista foi a PWA. Este contexto de modelagem tem recebido
muita atenção no meio acadêmico devido a que é nesse contexto, onde é possı́vel analisar
propriedades importantes tais como controlabilidade, observabilidade e estabilidade mais
facilmente. Foi mostrado um exemplo de esta subclasse: o CBB.
A segundo contexto visto foi o MLD. Esta subclasse permite o modelado de forma
sistemática de uma quantidade grande de diferentes tipos de SH, dai sua importância. A
metodologia de modelagem neste contexto foi mostrada através de dois estudos de caso:
(i) o CBB, (ii) Sistema de controle de temperatura.
Capı́tulo 4
Controle Preditivo de Sistemas
Hı́bridos
4.1
Introdução
O enfoque tradicional para projetar controladores embutidos é baseado no desenvolvimento de regras apoiadas na heurı́stica, ou no conhecimento da planta pelos operários.
Tais regras freqüentemente são baseadas no “sentido comum”e tomam em conta cenários
especı́ficos da planta. Contudo a análise da planta controlada total para todos os possı́veis
cenários é normalmente uma tarefa dura, que tipicamente é resolvida na indústria executando um grande número de simulações ou experimentos sobre o próprio controlador.
Esforços recentes de pesquisa tem produzido técnicas que permitem a sı́ntese direta de
controladores para sistemas hı́bridos. O objetivo deste capı́tulo é expor alguma de estas
técnicas de controle.
Os principais métodos ou técnicas de controle disponı́veis hoje em dia são:
• Controle preditivo de sistemas MLD usando otimização mista inteira on-line
(Bemporad e Morari 1999).
• Realimentação de estados linear a troços, para o sistema equivalente PWA (Mignone
et al. 2000, Mayne e Rakovic 2003, Peña et al. 2005).
• Obter a forma explı́cita do controlador preditivo através de técnicas de otimização
multiparamétrica (Bemporad, Borrelli e Morari 2000).
Controle Preditivo de Sistemas Hı́bridos
96
• Controle preditivo não linear obtido a partir de uma parametrização das variáveis
inteiras em variáveis reais e usando otimização não linear on-line (Sarabia et al.
2007).
O primeiro método é aplicado diretamente a sistemas hı́bridos no contexto MLD e será
objeto de estudo na seguinte seção. O segundo e o terceiro método é aplicado ao modelo
equivalente PWA, no segundo método a lei de controle é achada on-line no entanto que
no terceiro método a lei explicita de controle e achada off-line. A quarta técnica pode ser
aplicada a sistemas a troços mas gerais como os Sistemas Não-Lineares a Troços (Piece
Wise Non Linear (PWNL) Systems), a ação de controle em cada passo de tempo é achada
on-line.
4.2
Controle Preditivo de Sistemas MLD
Como já foi dito no capı́tulo 3, uma grande quantidade de processos hı́bridos podem ser
modelados pela estrutura MLD. Então, é interessante do ponto de vista prático e teórico
saber se um sistema MLD pode ser estabilizado em um estado de equilı́brio ou pode
seguir uma trajetória desejada de referência, via controle por realimentação. A seguir
veremos como o Controle Preditivo Baseado no Modelo (CPBM), fornece ferramentas
bem sucedidas para executar estas tarefas.
O CPBM é uma forma de controle por realimentação, onde o valor atual das variáveis
manipuladas é determinado on-line como a solução de um problema de controle ótimo
sobre um horizonte de comprimento dado. O comportamento do sistema sobre o horizonte
é predito com um modelo onde o estado atual da planta é o estado inicial para esta
predição. Mesmo que um conjunto talvez grande de ações de controle é calculado, só o
primeiro é implementado. Quando uma informação atualizada sobre o estado da planta
está disponı́vel no seguinte instante de amostragem, a otimização é repetida sobre o
horizonte deslocado. A capacidade de incluir sistematicamente restrições e a possibilidade
de manipular plantas com múltiplas entradas e saı́das fizeram do CPBM uma técnica
atraente na indústria de processo (Lee e Cooley 1997, Mayne 1997, Qin e Badgewell
1997, Mayne et al. 2000). Para uma apresentação ampla de CPBM clássico o leitor pode
consultar: Maciejowski (2002) e Camacho e Bordons (2005).
No presente contexto, devido à presença de variáveis inteiras, o procedimento de
otimização é um problema de Programação Mista Inteira. Uma primeira tentativa em
97
usar Programação Mista Inteira on-line para controlar sistemas dinâmicos submetidos a
restrições lógicas apareceu em Tyler e Morari (1995). Outros trabalhos apontando em
combinar CPBM a controle hı́brido apareceram em Slupphaug e Foss (1997) e Slupphaugand et al. (1997).
A aplicação dos conceitos de CPBM a sistemas MLD foi proposta em Bemporad e
Morari (1999). Supondo uma função de custo quadrática e dado o estado inicial x0 , a
otimização no tempo t = 0, para um sistema MLD, tem a seguinte forma:
min J(v0T −1 , x0 )
v0T −1
,
T −1
X
kv(k) − ue k2Q1 + kδ(k|t) − δe k2Q2
k=0
+kz(k|t) − ze k2Q3 + kx(k|t) − xe k2Q4
+ky(k|t) − ye k2Q5
(4.1)
sujeito a :
x(T |t) = xe
x(k + 1|t) = Ax(k|t) + B1 v(k) + B2 δ(k|t) + B3 z(k|t)
y(k|t) = Cx(k|t) + D1 v(k) + D2 δ(k|t) + D3 z(k|t)
E2 δ(k|t) + E3 z(k|t) ≤ E1 v(k) + E4 x(k|t) + E5
(4.2)
onde k ¦ kQ = ¦T Q¦; Q1 = QT1 > 0 e Qi = QTi ≥ 0, i = 2, . . . , 5, são matrices de
ponderação dadas; xe , ue , δe , ze e ye são um ponto de equilı́brio dado que satisfazem as
equações (3.25, 3.26), para a qual lembramos podem aparecer as possı́veis dificuldades
mostradas na seção 3.3.4. v0T −1 = [v(0|0), v(1|0), . . . , v(T − 1|0)] ∈ Rnv ×T é a seqüência
de variáveis manipuladas sobre um horizonte de T passos de tempo calculada no tempo
t = 0; v0k−1 é a seqüência v0T −1 truncada nos primeiros k valores. x(k|t) é o estado do
sistema no tempo t + k calculado a partir do estado inicial x0 com a seqüência de entrada
v0k−1 ou seja x(k|t) , x(t + k, x0 , v0k−1 ); δ(k), z(k), y(k) são similarmente definidas. As
matrizes de ponderação nas variáveis auxiliares δ e z permitem formular o problema de
otimização com uma função de custo definida positiva. Para uma aplicação prática no
entanto, os pesos Q1 , Q2 , Q5 são mais importante, dado que determinam a compensação
entre o esforço da ação de controle e a exatidão do seguimento a referência.
Assumamos por momento que a solução ótima {vt∗ (k)}k=0,...,T −1 existe. De acordo com
a filosofia de horizonte deslizante mencionada acima, estabelecemos que a ação de controle
sobre a planta será:
u(t) = vt∗ (0)
(4.3)
98
e descartamos as subseqüentes entradas ótimas vt∗ (1), . . . , vt∗ (T − 1), enseguida repete-se
todo o procedimento de otimização no tempo t + 1. A lei de controle (4.1,4.2) é chamada
na literatura como lei de Controle Preditivo Mista Inteira (CPMI).
Várias formulações de controladores preditivos para sistemas MLD poderiam ser propostos. Por exemplo, o número de graus de liberdade do controle pode ser reduzido
a Nu < T impondo que u(k) ≡ u(Nu − 1), ∀k = Nu , . . . , T . No entanto, enquanto
em outros contextos isto reduz enormemente o tamanho do problema de otimização ao
custo geralmente de uma menor performance, aqui o ganho computacional é somente
parcial dado que durante todo T as variáveis δ(k) e z(k) permanecem na otimização.
Formulações de horizonte infinito são impróprias por razões tanto práticas e teóricas. De
fato, aproximar o horizonte infinito com um T grande é computacionalmente proibitivo,
dado que o número de variáveis {0, 1} envolvidas no problema de programação mista
inteira quadrática (MIQP) depende linearmente de T .
Um resultado importante do ponto de vista teórico no que tem a ver com a estabilidade
do sistema resultante em malha fechada (sistema MLD + lei de controle CPBM) se mostra
no seguinte teorema:
Teorema 4.1 Seja (xe , ue , δe , ze ) um ponto de equilı́brio. Suponha que o estado inicial
x(0) é tal que existe uma solução factı́vel do problema (4.1, 4.2) em t = 0. Então ∀Q1 =
QT1 > 0, Q2 = QT2 ≥ 0, Q3 = QT3 ≥ 0, Q4 = QT4 ≥ 0, e , Q5 = QT5 ≥ 0, a lei MIPC (4.1,
4.2) estabiliza o sistema, que equivale a:
lim x(t) = xe
t→∞
lim u(t) = ue
t→∞
lim kδ(t) − δe kQ2 = 0
t→∞
lim kz(t) − ze kQ3 = 0
t→∞
lim ky(t) − ye kQ5 = 0
t→∞
Verificando as restrições (3.26).
Prova (Bemporad e Morari 1999)
Comentario 4.1 O teorema anterior tem pouca aplicação prática, pois ele se baseia sobre
99
a hipótese da existência da solução, coisa que é impossı́vel conhecer a priori. A restrição
imposta ao problema de otimização: x(T |t) = xe , pode fazer o problema infactı́vel e por
tanto sem solução.
Definamos o vetor ν(k) como:


v(k)


ν(k|t) =  δ(k|t) 
z(k|t)
(4.4)
Usando a definição (4.4), a função custo (4.1) pode ser expressa como:
min J(ν0T −1 , x0 ) ,
ν0T −1
T −1
X
kν(k|t) − νe k2Qν + kx(k|t) − xe k2Q4 + ky(k|t) − ye k2Q5
(4.5)
k=0
onde:

Q1
0

Qν =  0
Q2
0
0
0


0 
Q3
(4.6)
Expressando a equação (4.5) na forma matricial, temos que:
min J(V ) , kV − Ve k2Qν + kX − Xe k2Q4 + kY − Ye k2Q5
V
onde:


V =

ν(0)
..
.
(4.7)


, é o vetor a ser calculado pelo algoritmo do otimização.

ν(T − 1)


x(1)
 . 

X =  .. 
, é o vetor composto pelos vetores de estado preditos nos instantes de
x(T )
tempo: k = 1 . . . T − 1.


y(1)
 . 

Y =  .. 
, é o vetor composto pelos vetores saı́da preditos nos instantes de tempo:
y(T )
k = 1 . . . T − 1.
100
Ve , Xe e Ye , são similarmente definidos a partir de: νe = [ve , δe , ze ]T , xe e ye respectivamente.
A relação entre V e X pode obter-se desenvolvendo a equação (3.24) tendo em conta
a definição (4.4):
x(k + 1) = Ax(k) + Bν(k)
onde:

B1
0

B= 0
B2
0
0
(4.8)

0

0 
B3
(4.9)
por tanto:
x(1) = Ax(0) + Bν(0)
x(2) = Ax(1) + Bν(1) = A2 x(0) + ABν(0) + Bν(1)
..
.
. = ..
x(T ) = AT x(0) + AT −1 Bν(0) + . . . + Bν(T − 1)
Em forma matricial:

 
x(1)

 
 x(2)  
 . =
 .  
 .  
x(T )
Definindo:
A


B
0



 AB B
 x(0) +  .
..

 .
.

 .
AT
AT −1 · · ·
A2
..
.



Λ=


A


0
0
0
..
.
0
..
.






AB B
B
0


 AB B

 e Φ= .
..
 .

.
 .

T −1
T
A
···
A
A2
..
.
ν(0)
ν(1)
..
.






(4.10)
ν(T − 1)
0
0
0
..
.
0
..
.






(4.11)
AB B
temos então que:
X = Λx(0) + ΦV
(4.12)
Fazendo o mesmo para achar a relação entre V e Y :
y(k) = Cx(k)
(4.13)
101
por tanto:
y(1) = Cx(1) = C(Ax(0) + Bν(0)) = CAx(0) + CBν(0)
y(2) = CA2 x(0) + CABν(0) + CBν(1)
..
.
. = ..
y(T ) = CAT x(0) + CAT −1 Bν(0) + . . . + CBν(T − 1)
Em forma matricial:
 

CA
y(1)

 
 y(2)   CA2
 . = .
 .   .
 .   .






 x(0) + 




CAT
y(T )
CB
0
0
0
CAB
..
.
CB
..
.
0
...
0
..
.
CAT −1 B
···
CAB CB

ν(0)





ν(1)
..
.






(4.14)
ν(T − 1)
Definindo:

CA


CB
0
0
0



 CA2 
 CAB
CB
0
0


Ω=
e
Ψ
=
..
..
..
...
 .. 

.
.
.
 . 

T
T −1
CA
CA B · · · CAB CB






(4.15)
temos então que:
Y = Ωx(0) + ΨV
(4.16)
Desenvolvendo a equação (4.7) tendo em conta as equações (4.12) e (4.16), chegamos
a seguinte expressão:
1
min J(V ) , V T HV + cT V + f
V
2
(4.17)
que é a forma clássica como se apresenta a função custo em problemas quadráticos mistos
inteiros (Mixed Integer Quadratic Program - MIQP), onde:
¤
£
H = 2 ΨT Q5 Ψ + ΦT Q4 Φ + Qν
¤
£
cT = 2 (Ωx(0) − Ye )T Q5 Ψ + (Λx(0) − Xe )T Q4 Φ − VeT Qν
f = (Ωx(0) − Ye )T Q5 (Ωx(0) − Ye ) + (Λx(0) − Xe )T Q4 (Λx(0) − Xe )
+VeT Qν Ve
(4.18)
(4.19)
(4.20)
(4.21)
102
O mesmo desenvolvimento podemos fazer com as restrições do problema MIQP (4.1,
4.2). Como já foi dito, por questões práticas a primeira restrição de (4.2): x(T |t) = xe
será suprimida pois pode fazer o problema infactı́vel, a segunda e terceira restrições são de
igualdade, e já foram tidas em conta na solução do problema através do desenvolvimento
anterior, onde são introduzidas na função custo (4.1). Por tanto fica só o desenvolvimento
da desigualdade:
E2 δ(k|t) + E3 z(k|t) ≤ E1 v(k) + E4 x(k|t) + E5
(4.22)
a qual podemos por na seguinte forma:
− E4 x(k|t) + Eν ν(k) ≤ E5
onde:


Eν = 
−E1
0
0
E2
0
0
0
(4.23)


0 
E3
(4.24)
−E4 x(0) + Eν ν(0) ≤ E5
−E4 x(1) + Eν ν(1) = −E4 Ax(0) − E4 Bν(0) + Eν ν(1) ≤ E5
..
.
. ≤ ..
−E4 AT −1 x(0) − E4 AT −2 Bν(0) − . . . − E4 Bν(T − 2) + Eν ν(T − 1) ≤ E5
Em forma matricial:



E4
Eν
0



 E4 A 

−E4 B
Eν
 x(0) + 
−
.
.
..



..
..
.



E4 AT −1
−E4 AT −2 B · · ·
0
0
0
..
.
0
..
.
−E4 B Eν


ν(0)










ν(1)
..
.
(4.25)
ν(T − 1)
Definindo:



Ξ = −


E4
E4 A
..
.
E4 AT −1






 e Γ=




Eν
0
0
0
−E4 B
..
.
Eν
..
.
0
..
.
0
..
.
−E4 AT −2 B · · ·
−E4 B Eν






(4.26)
103
temos então que:
Ξx(0) + ΓV ≤ U
(4.27)
onde: U é uma matriz composta por T matrices E5 na forma: U = [E5 . . . E5 ]T
Com todo o desenvolvimento anterior obtemos a seguinte expressão do problema MIQP
(4.1-4.2):
min J(V ) ,
V
1 T
V HV + cT V + f
2
(4.28)
Ξx(0) + ΓV ≤ U
(4.29)
sujeito a :
Passando as matrices e vetores: H, cT , f , Ξ, Γ e U a algum algoritmo de otimização
MIQP, se existir a solução o algoritmo resolverá o problema dando como resultado um
certo V ∗ , do qual tomaremos somente o primeiro elemento para aplicar na planta de
acordo com a filosofia do CPBM.
Comentario 4.2 Apesar do fato que existem métodos muito eficientes para calcular a
solução ótima (global) do problema MIQP (4.28-4.29), no pior caso o tempo de solução
depende exponencialmente do número de variáveis inteiras. Em princı́pio, isto talvez
limite o alcance de aplicação deste método somente a sistemas muito lentos, desde que
para a implementação em tempo-real o perı́odo de amostragem deve ser suficientemente
grande para permitir o cálculo do pior caso. No entanto, a prova do teorema anterior não
∗
exige que a seqüências de controle avaliada {Ut∗ }∞
t=0 , ({Ut } denota a seqüência ótima de
controle ou seja: {vt∗ (0), . . . , vt∗ (T − 1)), seja o ótimo global. De fato, somente se requer
que:
∗
J(Ut+1
, x(t + 1)) ≤ J(U1∗ , x(t + 1))
(4.30)
A seqüência U1 está disponı́vel do cálculo prévio (realizado no tempo t), e pode ser usada para iniciar o algoritmo MIQP em t+1. A otimização então pode ser interrompida em
∗
que satisfaz (4.30). Por
qualquer passo intermediário para obter a solução suboptima Ut+1
exemplo, quando é usado o método Branch and Bound para resolver o problema MIQP,
a nova seqüência de controle Ut∗ pode ser selecionada como a solução do subproblema QP
que é factı́vel inteiro e tem o valor mais baixo. Obviamente neste caso o desempenho de
seguimento se vê deteriorado, pois não estamos aplicando na planta a solução ótima do
problema MIQP.
4.2.1
104
Problema de seguimento
Para problemas de seguimento, o objetivo é que a saı́da y(t) siga uma trajetória de
referência r(t). Para cada passo de tempo t, os valores de ye , xe , ue , δe , e ze , da equação
(4.1) correspondendo a r(t) podem ser calculados resolvendo o seguinte problema MIQP:
min
xe ,ue ,δe ,ze
kye − r(t)k2Q5 + ρ(kxe k2 + kue k2 + kδe k2 + kze k2 )
(4.31)
s.a.
xe = Axe + B1 ue + B2 δe + B3 ze
E2 δe + E3 ze ≤ E1 ue + E4 xe + E5
(4.32)
onde ye = Cxe + D1 ue + D2 δe + D3 ze . O parámetro ρ > 0 é qualquer número positivo
(pequeno) e é necessário para assegurar a convexidade estrita do valor da função (4.31).
Este procedimento permite definir un ponto estacionário ye o mais próximo possı́vel a r(t)
compatı́vel com as restrições.
4.2.2
Algoritmos MIQP
Nesta seção mencionaremos alguns dos algoritmos existentes para resolver problemas
de Programação Matemática Mista Inteira.
Não é o objetivo deste trabalho realizar um aprofundamento teórico de cada algoritmo
em particular, somente quer-se mostrar as ferramentas existentes, quando melhor sua
aplicação, e suas vantagens frente as outras.
Com a exceção de estruturas particulares, problemas de programação mista inteira
envolvendo variáveis {0, 1} são classificados como N P−completos, o que significa que
no pior caso, o tempo de solução cresce exponencialmente com o tamanho do problema
(Raman e Grossmann 1991). Apesar desta natureza combinatória, vários enfoques algoritmicos foram propostos e foram aplicadas com êxito a problemas de meio e grande
tamanho (Floudas 1995), os quatro mais importantes são:
Método dos Planos de Corte , onde uma nova restrição (ou “corte”) são gerados é
adicionadas para reduzir o domı́nio factı́vel até que uma solução {0, 1} ótima seja
achada.
Método de Decomposição , onde a estrutura matemática dos modelos é explorado via
105
partição de variáveis, dualidade, e métodos de relaxação.
Métodos Lógicos , onde restrições disjuntivas ou técnicas simbólicas de inferência são
utilizadas as quais podem ser expressadas em termos de variáveis binárias.
Método de Ramificação e Corte (Branch and Bound ) , onde as combinações
{0, 1} são exploradas a traves de uma árvore binária, a região factı́vel é particionada
em sub-domı́nios sistematicamente, e limites inferiores e superiores válidos são gerados em diferentes nı́veis da árvore binária.
Vários autores concordam no fato que os métodos de Branch and Bound são os melhor
sucedidos para resolver problems de programação mista inteira. Fletcher e Leyffer (1995)
mostra um estudo numérico que compara diferentes enfoques, e o método Branch and
Bound mostrou ser superior em ordem de magnitude.
O algoritmo Branch and Bound consiste em resolver e gerar novos problemas QP a
traves de uma árvore de procura, onde os nós da árvore correspondem a sub-problemas QP.
A ramificação é obtida gerando nós-filhos de nós-pais de acordo com regras de ramificação,
que podem ser baseadas, por exemplo, em prioridades especificadas previamente sobre as
variáveis inteiras, ou na quantia que as restrições de integralidade são transgredidas. Os
nós são marcados como pendente, se o problema correspondente QP não foi resolvido, se
o nó já foi plenamente explorado é marcado como explorado. O algoritmo para quando
todos os nós foram explorados. O êxito do algoritmo Branch and Bound baseia-se no
fato que sub-arvores inteiras podem ser excluı́das da exploração. Isto acontece se o subproblema correspondente QP é infactivel ou uma solução inteira é achada. No segundo
caso, o valor correspondente da função de custo serve como limite superior na solução
ideal do problema MIQP, e é usado para explorar outros nós tendo valor ótimo maior ou
limite inferior.
4.2.3
Controle Preditivo Misto Inteiro do CBB
Esta seção apresenta o estudo do CPMI para o CBB analisado nos capı́tulos anteriores.
O objetivo deste exemplo é apresentar diversos problemas relacionados com a definição
da estratégia, o projeto do controlador, a otimização, a estabilidade e as limitações relacionadas com a própria estrutura do problema. Mostraremos que, a pesar de que o CBB
é um sistema de baixa ordem, o projeto do CPMI apresenta vários desafios, vários destes
106
considerados temas abertos na pesquisa de controle preditivo hı́brido. Assim, o exemplo
é um elemento motivador dos estudos que serão realizados nesta tese.
O primeiro passo para projetar um CPMI é formular um modelo do processo para
poder realizar o cálculo das predições. Neste estudo de caso este primeiro passo já foi
dado no capı́tulo 3 onde o modelo MLD do CBB foi obtido:
"
i+
L
#
vC+
















"
=
−MI
− TCs 1 −









−mI 






MI 

q
+

−MV 






mV 


−mV 


MV
mI
#"
Ts
L
1
1
Ts
RC
0
iL
vC
#
"
+

Ts VCC
L
#
q+
0

0
"
0


 0
0 
0




1
0 
1
0
# 
"


−1 0 
 z1 ≤  −1 0
 0
0
1 
0
 z2



 0
0 −1 
0




0
1 
1
 0
0 −1
0 −1
−1
0
− TLs
Ts
C
0


#"
z1
#
(4.33)
z2
0



 0



 −m
I
"

#


 x1
 MI

+
 x
 0


2



 0



 −m
V


MV
















(4.34)
O segundo passo no projeto do CPMI é a escolha da função custo a ser minimizada.
Como o objetivo de controle é que o CBB siga referências de tensão constantes num
intervalo entre [12V, 100V ], poderı́amos considerar, em principio, a seguinte função de
custo:
J(ν0T −1 , x0 ) ,
T −1
X
ky(k|t) − ye k2Q5
(4.35)
k=0
onde foi excluı́do o termo kν(k|t) − νe k2Qν pois como o sinal de controle é do tipo binário
{0, 1}, não tem sentido falar sobre a ponderação do sinal de controle. Em sistemas
contı́nuos o parâmetro Qν é escolhido de foram tal de evitar a saturação do atuador
ou ações de controle muito fortes, mas para sistema hı́brido onde o sinal de controle é somente binário não tem sentido falar sobre saturação ou ações de controle fortes, o controle
é 1 ou 0.
Definida a função custo, surge o primeiro problema de aplicação direta da metodologia
tradicional de CPMI visto nas seções anteriores. ¿Como definir ye quando o sistema possui
sinal de control puramente binário?. Si escolhemos ye em cada perı́odo de amostragem
como mostrado na seção 4.2.1, então em estado estacionário o sinal de controle poderia
tomar o valor 0, e por tanto a corrente no inductor assim como a tensão no capacitor
107
iriam para 0, ou o valor 1 e então a corrente pelo inductor iria para infinito (caso ideal) e
a tensão no capacitor para 0. Em regime permanente, o valor do sinal de controle achado
se repetiria indefinidamente de acordo com a filosofia do CPBM. Ou seja qualquer que
seja o valor de referência que colocarmos no problema (4.31) a tensão de saı́da do CBB
em estado estacionário iria para 0.
A solução achada foi colocar diretamente o valor da referência que deseja-se alcançar
em vez de ye na função custo:
J(ν0T −1 , x0 )
,
T −1
X
ky(k|t) − r(k)k2Q5
(4.36)
k=0
onde r(k) é o valor da referência conhecida no instante de tempo t + k. Isto faz, como
veremos nos resultados de simulação a seguir, que em estado estacionário se repita uma
seqüência de 0 e 1 no sinal de controle e não mais um único valor (0 ou 1). Por tanto
o sinal de controle será periódico e de perı́odo desconhecido. Como o sinal de controle
é periódico também o sinal de saı́da será um sinal periódico com valor médio o valor da
referência, pelo menos isso é o que se esperaria.
O termo kx(k|t) − xe k2Q4 também foi omitido, dado que o único objetivo de controle
que interessa em principio, é que a saı́da y(t) do CBB siga uma referência constante r(t).
Escolhendo um horizonte de predição T = 3, freqüência de amostragem fs = 150kHz
e o valor da referência r(t) = 12V , obtemos a resposta em malha fechada mostrada na
Figura 4.1. Ampliando a Figura na região do estado estacionário, (Figura 4.2), é possı́vel
observar o comportamento periódico do sinal de saı́da causado pela natureza binária do
sinal de controle.
Se aumentarmos a freqüência de amostragem para fs = 200kHz, podemos observar
da Figura 4.3 que o sistema em malha fechada perde a estabilidade. Esta é outra peculiaridade que apresenta o sistema por ter um controle do tipo binário.
Em Pomar (2005) foi projetada uma lei de controle preditivo para o mesmo CBB visto
neste estudo de caso com a mesma função de custo (equação (4.36)), mas usou-se o modelo
médio do CBB, por tanto a lei obtida era contı́nua. O sinal de controle u(t) era um número
real pertencente ao intervalo [0, 1]. A pesar do sistema possuir um modo instável (quando
a posição da chave estiver fechada, q = 1), a lei de controle contı́nua permitia estabilizar o
sistema qualquer que fosse o perı́odo de amostragem escolhido adequadamente. Isto não
acontece no caso do CPMI, devido novamente a natureza binária da lei de controle.
108
vO(V)
15
10
vO
5
vref
0
0
0.5
1
1.5
2
tempo(s)
2.5
−3
x 10
iL(A)
0.5
0
0
0.5
1
1.5
2
Controle
tempo(s)
2.5
−3
x 10
1
0.5
0
0
0.5
1
1.5
2
tempo(s)
2.5
−3
x 10
Figura 4.1: Resposta do sistema em malha fechada: CBB + CPMI
Utilizando a seguinte função de custo, podemos resolver o problema da estabilidade:
min J(ν0T −1 , x0 )
ν0T −1
,
T −1
X
kx(k|t) − rx (k)k2Q4
(4.37)
k=0
onde rx (k) é o valor da referência conhecida para os estados do sistema no instante de
tempo t + k. A Figura 4.4 mostra a resposta do sistema em malha fechada para uma
freqüência de amostragem fs = 200kHz, T = 3 e com a função custo (4.37).
Esta nova estratégia considera na otimização tanto a corrente como a tensão e por isso
evita que o controle da corrente seja perdido por causa da natureza hı́brida do sinal de
controle.
Quando fecha-se a chave, q = 1, o inductor armazena energia, e o capacitor descarregase através da carga R, a tensão de saı́da diminui; ao abrir-se a chave, q = 0, então o
inductor entrega parte da energia armazenada, carregando o capacitor C, a tensão de
saı́da aumenta. Ocorre, se não considerarmos a corrente na estratégia de controle, que
dado um certo conjunto de valores dos parâmetros L, C, R e T s, que o inductor pode
carregar-se tanto (não á controle de corrente), que o controlador pode preferir manter a
109
12.06
12.04
12.02
vO(V)
12
11.98
11.96
11.94
11.92
11.9
11.88
9
9.2
9.4
9.6
tempo(s)
9.8
10
−3
x 10
Figura 4.2: Resposta do sistema em estado estacionário.
chave fechada e que a tensão de saı́da diminua, que abrir a chave e carregar o capacitor
com uma tensão muito alta, (a tensão de saı́da aumentaria mais colocando q = 1 do que
diminuiria colocando q = 0). Mas isto provoca que o inductor siga carregando-se e assim
sucessivamente. O sistema torna-se instável.
Se tratarmos de seguir uma referência constante de 100V na saı́da, com um horizonte
de predição T = 3, freqüência de amostragem fs = 50kHz, e usando a função custo
(4.37), observamos que o sistema no consegue alcançar em regime permanente o valor
de referência, (Figura 4.5), aumentando-se o horizonte de predição T o valor do erro em
regime permanente diminui, mas como já foi colocado nas seções anteriores isto aumenta
significativamente a complexidade computacional do problema. A Figura 4.5 mostra
diferentes respostas do sistema em malha fechada para diferentes valores do horizonte de
predição.
O estudo de caso apresentado nesta seção deixa uma serie de questionamentos e problemas em aberto que serão estudados ao longo da tese. Um sistema hı́brido pode apresentar sinais de controle contı́nuos unicamente, contı́nuos e discretos ou puramente discretos
como o caso do CBB. As propriedades de controlabilidade, observabilidade e estabilidade
não estão definidas de forma geral para qualquer tipo de sistema hı́brido, e como já vimos
110
vO
15
10
vO
5
vref
0
0
0.5
1
1.5
2
tempo(s)
2.5
1.5
2
tempo(s)
2.5
1.5
2
tempo(s)
2.5
3
3.5
−3
x 10
iL(A)
100
50
controle
0
0
0.5
1
3
3.5
−3
x 10
1
0.5
0
0
0.5
1
3
3.5
−3
x 10
Figura 4.3: Resposta do sistema para fs = 200kHz.
no capitulo anterior é uma questão teórica em aberto. Assim surgem questões como: dado
um conjunto de possı́veis condições iniciais para o sistema hı́brido, ¿existe alguma lei de
controle que permita atingir um valor de referência desejado em regime permanente?. No
caso do CPMI, qual é a relação entre o valor do horizonte de predição T e o erro em
regime permanente. Que T seria necessário, por exemplo, no caso do CBB para alcançar
uma tensão de referência de 100V . Se existir ese valor de horizonte de predição T e ele
for um valor muito grande, ¿não haveria uma forma, através de uma penalização terminal
ou restrição terminal no CPMI, de alcançar ese valor de referência com um T menor?.
Da mesma forma, ¿como poderia-se garantir a estabilidade do sistema em malha fechada
com uma lei do tipo CPMI?.
4.3
Conclusões
Neste capı́tulo foram desenvolvidos aspectos teóricos e práticos do CPMI, e ficaram
explicitadas algumas questões em aberto, que serão objeto de estudo desta tese.
A importância fundamental do CPMI reside em que, como o contexto MLD permite
111
vO(V)
15
10
vref
5
vO
0
0
0.5
1
1.5
2
tempo(s)
2.5
1.5
2
tempo(s)
2.5
1.5
2
tempo(s)
2.5
3
3.5
−3
x 10
iL(A)
0.4
0.2
controle
0
0
0.5
1
3
3.5
−3
x 10
1
0.5
0
0
0.5
1
3
3.5
−3
x 10
Figura 4.4: Resposta do sistema para fs = 200kHz, N = 3 e função de custo (4.37).
a modelagem de uma grande quantidade de processos hı́bridos é interessante do ponto de
vista prático e teórico saber como projetar uma lei de controle preditivo nesse contexto.
O CPMI é similar ao já conhecido CPBM classico, mas devido à presença de variáveis
inteiras, o procedimento de otimização é um problema de Programação Mista Inteira.
Todo modelo MLD tem um equivalente PWA e viceversa. Se bem como já foi dito o
contexto MLD permite a modelagem de uma grande quantidade de processos hı́bridos,
propriedades como controlabilidade, observabilidade e estabilidade se estudam melhor no
contexto PWA. Por tanto o passo a seguir desta tese é o estudo destas propriedades no
contexto PWA assim como técnicas de controle preditivo.
112
T=3
vO(V)
100
vO
50
0
vref
0
0.5
1
1.5
2
tempo(s)
T=6
2.5
3
3.5
4
−3
x 10
vO(V)
100
vO
50
0
vref
0
0.5
1
1.5
2
tempo(s)
T=9
2.5
3
3.5
4
−3
x 10
vO(V)
100
vO
50
0
vref
0
0.5
1
1.5
2
tempo(s)
2.5
3
3.5
4
−3
x 10
Figura 4.5: Resposta do sistema para fs = 50kHz, T = 3, T = 6 e T = 9.
Capı́tulo 5
Conclusões e Cronograma
5.1
Conclusões
O trabalho final da tese, será orientado principalmente ao projeto integrado de controle
e sistemas hı́bridos em particular a conversores de potência com aplicação a Industria do
Petróleo. Com este fim nesta etapa previa iniciou-se o estudo teórico da metodologia de
projeto integrado para processos, e aplicou-se os conhecimentos adquiridos a un conversor
de potência DC-DC, o conversor Buck-Boost. Também estudou-se diferentes formas de
modelagem de sistemas hı́bridos, em particular desenvolveu-se o contexto MLD de modelagem por ser este um marco que permite a modelagem de uma grande quantidade de
processos hı́bridos. Também mostrou-se neste trabalho prévio como projetar uma lei de
controle preditivo no contexto MLD. Para exemplificar a técnica de modelado MLD de
um sistema hı́brido forma realizado dois estudos de caso: (i) Sistema de Controle de Temperatura, (ii) Conversor Buck-Boost. Para exemplificar a metodologia do projeto da lei
de controle CPMI, projetou-se um controlador CPMI para o CBB. Ficaram uma serie de
questões em aberto a ser investigadas na tese. Será também objetivo de investigação desta
tese o estudo e a aplicação de diferentes técnicas de projeto de controladores preditivo no
contexto de modelagem PWA.
Finalmente e como objetivo principal desta tese realizara-se o projeto integrado de
um conversor de potência HVDC e a sua lei de controle preditivo. Os conversores HVDC
são uma nova alternativa para alimentação energética de plataformas de extração de gas
em alto mar, e oferecem uma serie de benefı́cios em comparação aos geradores a turbinas
a gás usados tradicionalmente nas plataformas. A tecnologia HVDC e uma alterna-
114
tiva ambiental amigável, mais eficiente, e mais segura, este tipo de soluções demanda
muito menos mantenimento y pode ser controlado desde o continente o que faz necessário
muito menos pessoal capacitado na plataforma, em muitos casos é possı́vel mostrar os
benefı́cios econômicos de fornecer energia desde o continente que usando o gás produzido
na plataforma.
As principais contribuições preliminares são:
1. O projeto integrado do processo e do controle é uma técnica aplicada fundamentalmente no âmbito de processos. Uma contribuição preliminar deste trabalho foi a
aplicação desta técnica no âmbito da eletrônica de potência.
2. A aplicação das técnicas de projeto integrado a sistema hı́bridos também e outra
contribuição deste trabalho preliminar.
3. Também a aplicação do contexto MLD de modelado a conversores de potência assim como o projeto da lei de controle MIPC e uma contribuição preliminar deste
trabalho.
5.2
Cronograma
Atividades já realizadas:
• (A) Realização dos créditos em disciplinas.
• (B) Revisão bibliográfica sobre projeto integrado de processos e controle.
• (C) Revisão bibliográfica sobre modelado de sistemas hı́brido e controle preditivo
de sistemas no contexto MLD.
• (D) Realização de estudo de caso: Conversor Buck-Boost.
Atividades a serem realizadas:
• (E) Estudo das propriedades de controlabilidade e estabilidade para sistema hı́bridos
no contexto PWA. Tratara-se de achar respostas as questões abertas quando
projetou-se a lei de controle CPMI ao CBB.
115
• (F) Estudo de técnicas de controle preditivo no contexto PWA.
• (G) Extensão das técnicas de projeto integrado e controle a sistemas hı́bridos, tendo
em conta propriedades de controlabilidade e estabilidade especifica para este tipo
de sistemas.
• (H) Realização do estudo se caso: Projeto Integrado de um conversor HVDC e uma
lei preditiva hı́brida.
• (I) Defesa da Tese de Doutorado.
Foi realizado um estágio no exterior como parte do curso de Doutorado, no Departamento de Ingenierı́a de Sistemas da Universidad de Valladolid, Espanha.
As atividades realizadas no estágio de doutorado realizado no exterior foram:
• (B)
• (C)
• (D) Começou-se o estudo de caso.
Atividades a serem realizadas no Brasil:
• (A)
• (D) Finalização do estudo de caso.
• (E)
• (F)
• (G)
• (H)
• (I) Defesa da Tese de doutorado.
116
Figura 5.1: Cronograma.
Apêndice A
Indices de Controlabilidade para
sistemas SISO
A.1
Indices de performance no domı́nio do tempo
• tempo de subida (tr ), tempo que leva o sinal de saı́da para alcançar 90% do seu
valor final. Usualmente requer-se que este tempo seja pequeno.
• tempo de 5% ou tempo de assentamento (ts ), tempo depois da qual o sinal de saı́da
mantém-se em ±5% do seu valor final. Usualmente requer-se que este tempo seja
pequeno.
• Sobre-sinal, valor de pico do sinal de saı́da dividido pelo valor final. Tipicamente
este valor deve ser 1, 2 (20%) ou menor.
• Fator de redução, o quociente entre o segundo e o primeiro pico do sinal de saı́da.
Tipicamente este valor deve ser 0, 3 ou menor.
• Erro em estado estacionário, a diferença entre o valor final da saı́da e o valor final
desejado. Usualmente requer-se que eta diferença seja pequena ou nula.
Os indices que caracterizam a resposta do sistema no domı́nio do tempo podem ver-se
na Figura A.1.
118
Step Response
A
Sobre−sinal
=A
Fator de redução = B/A
B
Amplitude
1.05
1
0.95
0.9
0
tr
ts
0
Time (sec)
Figura A.1: Caracterı́sticas da resposta em malha fechada a um degrau na referência.
A.2
Indices
de
performance
no
domı́nio
da
freqüência
Margens de Fase e Ganho
A margem de ganho é definida como:
GM =
1
|L(jw180 )|
(A.1)
onde w180 é a freqüência onde a curva L(jw) no plano complexo, corta o eixo real negativo
entre −1 e 0, isto é:
∠L(jw180 ) = −180o
(A.2)
Se a mais de um corte o maior valor de |L(jw180 )| é considerado. O MG é o fator em que
|L(jw)| pode aumentar antes de que o sistema em malha fechada se torne instável.
O MG é diretamente uma salvaguarda contra a incerteza do ganho em estado estacionário (erro). Tipicamente requer-se que M G > 2. Se o gráfico de (L) corta o eixo real
119
Nyquist Diagram
1
0.8
0.6
L(jw180 )
Imaginary Axis
0.4
0.2
1−
0
1
GM
w = +∞
PM
−0.2
−0.4
L(jw)
L(jwc )
−0.6
−0.8
−1
−1
−0.8
−0.6
−0.4
−0.2
0
Real Axis
0.2
0.4
0.6
0.8
1
Figura A.2: Gráfico de L(jw) par uma planta estável.
negativo entre −1 e −∞ então um margem de redução de ganho pode ser similarmente
definido tomando o menor valor do corte de |L(jw180 )| no eixo real.
A margem de fase é definida como:
P M = ∠L(jwc ) + 180o
(A.3)
|L(jw)| = 1
(A.4)
onde wc é a freqüência onde:
A PM nos proporciona o valor da fase negativa que podemos adicionar a L(s) na freqüência
wc antes que a fase a essa freqüência seja −180o o que corresponde a um sistema instável
em malha fechada. Tipicamente requer-se que o PM seja maior que 30o . A PM é diretamente uma salvaguarda contra a incerteza no tempo de retardo ou tempo morto do
sistema.
120
Máximo Pico
O pico máximo da função de sensibilidade e sensibilidade complementaria são definidos
como:
MS = max |S(jw)|; MT = max |T (jw)|
w
w
(A.5)
(Note que MS = kS(jw)k∞ e MT = kT (jw)k∞ em termos da norma H∞ ). Tipicamente
requer-se que MS < 2(6dB) e MT < 1, 25(2dB). Um valor grande de MS ou MT (maior
que 4) indica uma pobre performance do sistema assim como uma pobre robustez. Dado
que S + T = 1 então para qualquer freqüência
||S| − |T || ≤ |S + T | = 1
é por tanto MS e MT diferem como máximo em 1. Um valor grande de MS por tanto
ocorre se e somente se MT e grande. O limite superior de MT é uma especificação clássica
no projeto de controladores.
Vamos dar agora uma justificativa de por que delimitar o valor de MS . Sem controle
(u = 0), temos que e = y − r = Gd d − r, e com controle por realimentação e = S(Gd d −
r). Por tanto o controle por realimentação melhora a performance reduzindo |e| para
toda a freqüência onde |S| < 1. Usualmente, |S| é pequeno a baixas freqüências, por
exemplo, |S(0)| = 0 para sistemas com ação integral. Mas como todos os sistemas reais
são estritamente próprios, temos que a altas freqüências L → 0 ou equivalentemente
S → 1. Nas freqüências intermédias não e possı́vel evitar na prática valores de pico,
MS , maiores que 1. Então há uma região de freqüências intermédias onde o controle por
realimentação degrada a performance, e o valor de MS é uma medida do pior caso desta
degradação. Podemos ver MS como uma medida de robustez. Para manter a estabilidade
em malha fechada o número de vezes que L(jw) rodeia o ponto crı́tico −1 não deve mudar,
por tanto desejamos que L se mantenha longe deste ponto. A menor distancia entre L(jw)
e o ponto −1 é MS−1 , e por tanto para a robustez, um pequeno valor de MS , e melhor. Em
resumo tanto como para a estabilidade como para a robustez é desejável que MS esteja
perto de 1.
O pico máximo e os margens de ganho e fase estão relacionados. Especificamente,
para um MS dado, podemos garantir que:
GM
MS
≥
; PM ≥ 2 arcsin
MS − 1
µ
1
2MS
¶
≥
1
[rad]
MS
(A.6)
121
Por exemplo, com MS = 2 garantimos que GM ≥ 2 e P M ≥ 29.0o . Similarmente para
um valor dado de MT podemos garantir que:
GM
1
≥1+
; PM ≥ 2 arcsin
MT
µ
1
2MT
¶
>
1
[rad]
MT
(A.7)
e por tanto com MT = 2 temos que GM ≥ 1.5 e P M ≥ 29.0o
Prova (Skogestad e Postlethwaite 1997)
Em conclusão vemos que as especificações de máximo pico de |S(jw)| ou |T (jw)| (MS
ou MT ), podem facer as especificações nos margens de ganho e fase não necessárias. Por
exemplo exigindo que MS < 2 implica na comum regra geral GM > 2 e P M > 30o .
Também existe uma correlação entre os picos no domı́nio da freqüência e do tempo, o
leitor interessado pode leer sobre este tópico em (Skogestad e Postlethwaite 1997).
Largura de Banda e Freqüência de Corte
O conceito de largura de banda e muito importante para entender os benefı́cios e o
compromisso performance-robustez do controle por realimentação. Acima analisamos os
picos da função de transferência em malha fechada, os quais estão relacionados com a
qualidade da resposta do sistema. No entanto, para a performance devemos considerar a
velocidade da resposta e isto conduz a considerar a largura de banda do sistema. Em geral
uma grande largura de banda corresponde a um sistema com tr pequeno, dado que sinais
de alta freqüência passam mais facilmente na saı́da. Mas também indicam um sistema
mais sensı́vel aos ruı́dos e as variações nos parâmetros. Se o sistema tiver uma largura de
banda pequena então ele será em geral mais lento mas mais robusto.
Definição A.1 A largura de banda (em malha fechada) wB , e a freqüência onde |S(jw)|
cruza para abaixo por primeira vez
√1
2
= 0.707(≈ −3dB).
Uma definição alternativa, tradicionalmente usada para definir largura de banda m
sistemas de controle é a seguinte: A largura de banda em termos de T , wBT , é a maior
freqüência onde |T (jw)| cruza para cima
√1
2
= 0.707(≈ −3dB).
Definição A.2 A freqüência de corte wc , é definida como a freqüência onde |L(jwc )|
cruza por cima por 1 pela primeira vês.
122
Possui a vantagem de ser fácil de calcular, e usualmente da um valor entre wB e wBT
Especificamente para sistemas com P M < 90o temos que:
wB < wc < wBT
(A.8)
wB (a qual e definida em termos de |S|) e wc (em termos de |L|) são bons indicadores de
performance em malha fechada, no entanto wBT (em termos de |T |) pode ser ora errôneos
em alguns casos. O motivo e que desejamos um T ≈ 1 para ter uma boa performance, e
não e suficiente que |T | ≈ 1, devemos considerar a fase. Por outro lado, para uma boa
performance desejamos que S esteja perto de zero, e este será o caso se |S| ≈ 0 sem ter
em conta a fase de S.
Apêndice B
Escalamento
Quando se precisa utilizar técnicas de analise e controle baseadas em indices de
otimização que ponderam diversas variáveis do sistema com magnitudes diferentes, o
escalamento é muito importante. O escalamento faz as tarefas de analise do modelo e
projeto do controlador muito mais fáceis. A tarefa de escalamento requer que o engenheiro crie certos critérios no começo do processo do projeto sobre os requerimentos de
performance do sistema. Para fazer isso devem ser tomadas decisões sobre a magnitude
esperada das perturbações e mudanças na referência, as magnitudes permitidas para cada
sinal de entrada, e as magnitudes permitidas para a desviação dos sinais de saı́da.
Seja o modelo linear incremental não escalado:
b eb = yb − rb
bu + G
cd d;
yb = Gb
(B.1)
onde (b) é usado para descrever as variáveis não escaladas. A idéia do escalamento é
fazer as variáveis menores que 1 em magnitude. Isto e feito dividindo cada variável por
seu maior valor esperado ou mudança permitida. Para as perturbações e as variáveis de
entrada, usamos as variáveis escaladas:
d=
db
dbmax
, u=
u
b
u
bmax
(B.2)
onde dbmax é a variação esperada máxima na perturbação, e u
bmax é a mudança permitida
máxima da entrada.
As variáveis yb, eb e rb tem as mesmas unidades, por tanto o mesmo fator de escalamento
Escalamento
124
pode ser aplicado a cada uma delas. Duas alternativas são possı́veis:
• ebmax máximo erro permitido.
• rbmax máxima mudança esperada no valor da referência.
Como o maior objetivo do controle e minimizar o erro eb, vamos usualmente escolher para
o escalamento ebmax , por tanto:
y=
yb
ebmax
, r=
rb
ebmax
, e=
eb
ebmax
(B.3)
Para formalizar o procedimento de escalamento se introduzem os fatores de escalamento:
De = ebmax , Du = u
bmax , Dd = dbmax , Dr = rbmax
(B.4)
Para sistemas de múltiplas entradas e múltiplas saı́das (MIMO) cada variável dos
b rb, u
vetores d,
b e eb tem valores máximos diferentes, en dito caso Dd , Dr , Du e De se
transformam em matrices de escalamento diagonal.
As variáveis escaladas correspondentes, para usar com o propósito de controle, são por
tanto:
−1
b u = D−1 u
b, e = De−1 eb, r = De−1 rb
d = Dd−1 d,
u b, y = De y
(B.5)
Substituindo (B.5) em (B.1) temos que:
b uu + G
cd Dd d; De e = De y − De r
De y = GD
(B.6)
e introduzindo as funções de transferência escaladas:
b u , Gd = D−1 G
cd Dd
G = De−1 GD
e
(B.7)
chegamos no seguinte modelo em termos das variáveis escaladas:
y = Gu + Gd d, e = y − r
(B.8)
Aqui u e d são menores a 1 em magnitude. E útil também em alguns casos introduzir a
referência escalada re, menor que 1 em magnitude. Isto e feito dividindo a referência pelo
Escalamento
125
valor da mudança máxima esperada:
re =
rb
rbmax
= Dr−1 rb
(B.9)
temos então que:
r = Re
r
onde R , De−1 Dr =
(B.10)
rbmax
ebmax
O diagrama de blocos do sistema com as variáveis escaladas mostra-se na Figura B.1;
podemos agora expressar o objetivo de controle, para dito sistema, da seguinte forma:
em termos das variáveis escaladas |d(t)| ≤ 1 e re(t) ≤ 1, será nosso objetivo de controle
manipular u, com |u(t)| ≤ 1, tal que |e(t)| = |y(t) − r(t)| ≤ 1 durante todo o tempo.
Figura B.1: Modelo em termos das variáveis escaladas.
Comentario B.1
• Muitas das interpretações dos indices de controlabilidade mostrados a seguir dependem criticamente de um correto escalamento.
• Com o escalamento mostrado anteriormente, o pior comportamento do sistema é
analisado considerando a perturbação d com magnitude 1, e a referência re com
magnitude 1.
• O escalamento da saı́da em (B.3) em termos do erro é usado quando se analisa
uma planta dada. No entanto se o objetivo é selecionar quais saı́das serão controladas, então podemos escalar a saı́da respeito de sua variação esperada, (usualmente
similar a rbmax ).
Escalamento
126
• Se a variação esperada ou permitida de uma variável arredor de 0 é não simétrica,
então a maior variação deve ser usada para dbmax e a menor variação para u
bmax e
ebmax
Apêndice C
Modelado Eficiente de Sistemas
MLD
A tradução de proposições lógicas ou declarações mistas logicas/continuas em desigualdades, vistas na seção 3.3.1, é um passo que determina criticamente o tamanho do
modelo MLD resultante em termos do número de variáveis. É importante achar modelos
que tenham um número pequeno de variáveis binárias, pois isto permite melhorar a velocidade de resolução dos problemas matemáticos de otimização, necessários para análise,
sı́ntese e supervisão de sistemas hı́bridos. Nesta apêndice propõe-se métodos eficientemente para a tradução de proposições lógicas em desigualdades diminuindo o número de
variáveis auxiliares necessárias. Os métodos são aplicáveis quando as proposições lógicas
são mais complexas que as mostradas na Tabela 3.2, envolvendo combinações arbitrárias
de operadores.
C.1
Lógica Proposicional
Observações Gerais
Suponha que Xi e uma variável booleana. A formula booleana F
F (X1 , ..., Xn )
(C.1)
Modelado Eficiente de Sistemas MLD
128
é uma combinação arbitraria de vaiáveis Xi por meio de operadores lógicos (., ∨, ∧, ⊕, ←
, →, ↔). A formula booleana F é uma Forma Normal Conjuntiva (FNC) ou Produto de
Sumas, se é escrita na seguinte forma:
F =
n
^
ψi
(C.2)
Xij
(C.3)
i=1
onde
ψi =
n
_
i=1
A formula booleana ψi e chamada termos do produto ou maxterms, e Xij termos da suma.
É bem sabido que qualquer formula booleana pode ser transformada numa FNC, usando as
leis distributivas, negação e De Morgan. A FNC é mı́nima si ela possui o mı́nimo número
de maxterms e cada maxterms tem o número mı́nimo de termos da suma. Esta definição
de minimalidade vem do campo de desenho de circuitos lógicos onde cada operador lógico
da FNC e implementado usando uma comporta lógica ou tendo entradas adicionais em
comportas com multi-entradas. Toda formula booleana pode ser reescrita como uma FNC
mı́nima (Kohavi 1978)
A formula booleana f é chamada de função booleana se, após renomear os literais,
esta é usada para definir o literal Xn como função de (X1 , ..., Xn−1 ):
Xn ↔ f (X1 , ..., Xn−1 )
(C.4)
que também pode ser escrita como Xn = f (X1 , ..., Xn−1 ), onde f é uma função booleana
arbitraria.
De forma mais geral, podemos definir relações entre variáveis booleanas
X1 , ..., Xn com uma relação booleana:
F (X1 , ..., Xn ) = T
(C.5)
onde F é uma fórmula booleana. Observar que cada função booleana é também uma
relação booleana, mas u oposto não e verdade. O problema de satisfazer uma relação
booleana é o problema de determinar se existe uma designação de {F, T } a seus literais tal
que a correspondente formula booleana seja avaliada como verdadeira. Uma designação
verdadeira de uma formula booleana é chamada de ponto válido. A idéia de resolver
estes problemas de inferências lógicas com métodos de otimização conta con ferramentas
da área da programação inteira (Chandru e Hooker 1999, Nemhauser e Wolsey 1988,
Schrijver 1986). Observar que:
129
• Cada função booleana tem exatamente 2n−1 pontos válidos
• A formula booleana com exatamente 2n−1 pontos válidos não precisa ser uma função
booleana.
Associando variáveis binárias δi ∈ {0, 1} com cada variável booleana Xi ∈ {F, T }, um
ponto válido da fórmula booleana pode ser descrito equivalentemente como um elemento
do conjunto {0, 1}n ⊂ [0, 1]n . Por tanto o conjunto de todos os pontos válidos de uma
fórmula booleana podem ser representados como o conjunto de vértices de um hipercubo
[0, 1]n , isto é como os vértices de um politopo em [0, 1]n . Vamos chamar PCH o politopo
determinado por todos os pontos válidos da fórmula booleana F :
PCH (F ) , {x ∈ [0, 1]n : x ∈ conv(todos os pontos validos de F )}
(C.6)
Aqui, conv(Y ) denota o fecho convexo do conjunto de pontos Y .
Um politopo tem duas respresentações padrões: a representação-V que especifica o
politopo por seus vértices e a representação-H que especifica o politopo como a intersecção
de semi-espaços dados por desigualdades lineares (Zieger 1995). Um vértice, em que todos
os componentes são inteiros, é chamado de vértice integral.
Os seguintes métodos são uma generalização das regras mostradas na Tabela 3.2. A
meta é achar desigualdades lineares equivalentes para as relações booleanas arbitrárias
C.5. Vamos mostrar três métodos com este fim: o método de substituição, o método
analı́tico, e o método geométrico.
Método de substituição
Dado a relação booleana C.5, este método consiste em reconhecer termos elementar listados na tabela 3.2 e substituirlos com variáveis booleanas adicionais. A idéia é facilmente
aplicável já que é baseado na aplicação recursiva das regras básicas da tabela 3.2. No entanto, a introdução de variáveis adicionais é uma desvantagem severa e é desnecessária
como vamos mostrar com os próximos métodos.
130
Método analı́tico ou método da FNC
O método analı́tico consiste primeiro em converter C.4 ou C.5 na FNC, o que pode
ser realizado automaticamente usando um de várias técnicas disponı́vel, veja por exemplo
Miller (1965) e Sasao (1999). Consideremos a FNC da forma:
m
^
j=1



_
i∈Pj
Xi ∨
_
Xi 
(C.7)
i∈Nj
Onde Pj denota o conjunto de ı́ndices do literal que aparece em forma positiva no
j − th maxterm, e Nj denota o conjunto de ı́ndices do literal que aparece em forma
negada no j − th maxterm. A FNC indica que todos os maxterms devem ser verdadeiros
para que a fórmula booleana seja verdadeira. Quando impomos um conjunto de restrições
num problema de otimização exigimos também que os pontos válidos satisfaçam todas
as desigualdades simultaneamente. Para cada maxterms podemos portanto deduzir uma
desigualdade inteira. Observe ainda mais que um maxterm é verdadeiro, se e somente se
ao menos um de seus termos da soma é verdadeiro. Com esta observação, o conjunto de
desigualdades lineares inteiras correspondendo a C.7 é:

P
P

1
≤
δ
+

i
i∈P
i∈N1 (1 − δi )
1

..
.

P

 1 ≤ P
i∈Pm δi +
i∈Nm (1 − δi )
(C.8)
As desigualdades C.8 podem ser incluı́dos como restrições no modelo MLD em
3.26. Com estas desigualdades podemos definir o conjunto PF N C para qualquer fórmula
booleana F como:
PF N C , {x ∈ [0, 1]n : (C.8) e satisf eita com x = [δ1 , ..., δn ] ∈ [0, 1]n }
(C.9)
PF N C (F ) é o politopo no hipercubo da unidade de dimensão n que inclui todos os
pontos inteiros x ∈ {0, 1}n para a qual F (x) = T . É o conjunto de pontos definido por
C.8 relaxando a restrição de integrality em δi de δi ∈ {0, 1} a δi ∈ [0, 1].
Nenhuma das variáveis auxiliares necessitam ser introduzidas com esta técnica. Outra
131
vantagem é sua simplicidade uma vez conhecida a FNC da fórmula booleana desejada.
Uma desvantagem é o esforço que se deve fazer no calculo simbólico da FNC de uma
fórmula booleana arbitrária. Isto pode exigir técnicas como os mapas de Karnaugh, veja
por exemplo Kohavi (1978), se a formula booleana é dada implicitamente por seu pontos
válido. Outra desvantagem deste método tem a ver com o conjunto PF N C . Como será
visto depois, PF N C pode ser um conjunto que é maior do que realmente necessário para
definir os pontos factı́veis inteiros. De fato, PF N C pode ter vértices não-integral.
Algoritmo C.1 Então, usando as equivalências da Tabela 3.2 é possı́vel converter qualquer expressão lógica em outra expressão envolvendo variáveis inteiras si a expressão
lógica inicial se escreve na sua FNC.
Q1 ∧ Q2 ∧ · · · ∧ Qn
Onde as Q são expressões de P escritas como disjunções. O algoritmo para obtenção da
FNC é:
1. Substituir implicações por sua expressão equivalente:
P1 → P2 ↔ P 1 ∨ P2
2. Aplicar a lei de De Morgan para deslocar para dentro as negações:
(P1 ∧ P2 ) ↔ P 1 ∨ P 2
(P1 ∨ P2 ) ↔ P 1 ∧ P 2
3. Utilizar a propriedade distributiva para chegar na FNC.
(P1 ∧ P2 ) ∨ P3 ↔ (P1 ∨ P3 ) ∧ (P2 ∨ P3 )
Exemplo C.1
(P1 ∧ P2 ) ∨ P3 → (P4 ∨ P5 )
1. Paso 1
[(P1 ∧ P2 ) ∨ P3 ] ∨ (P4 ∨ P5 )
2. Paso 2
[(P 1 ∨ P 2 ) ∧ P 3 ] ∨ (P4 ∨ P5 )
132
3. Paso 3
[(P 1 ∨ P 2 ) ∨ (P4 ∨ P5 )] ∧ [P 3 ∨ (P4 ∨ P5 )]
£
¤
£
¤
P 1 ∨ P 2 ∨ P4 ∨ P5 ∧ P 3 ∨ P4 ∨ P5
Por tanto colocamos [(P1 ∧ P2 ) ∨ P3 → (P4 ∨ P5 )] na FNC: [Q1 ∧ Q2 ], onde:
Q1 = P 1 ∨ P 2 ∨ P4 ∨ P5
e
Q2 = P 3 ∨ P4 ∨ P5
Associando as variáveis inteiras δ1 , δ2 , δ3 , δ4 e δ5 a P1 , P2 , P3 , P4 e P5 respectivamente
obtemos a seguinte representação em desigualdades lineares inteiras:
(1 − δ1 ) + (1 − δ2 ) + δ4 + δ5 ≥ 1
(1 − δ3 ) + δ4 + δ5 ≥ 1
Método geométrico, ou método da tabela de verdade
O terceiro método é baseado numa interpretação geométrica. Mostraremos que este
método supera a desvantagem concernente com PF N C (F ) do método analı́tico descrito
previamente. Ele permite uma tradução automática de tabelas de verdade que representam fórmulas booleanas, em desigualdades lineares inteiras.
Uma tabela de verdade para a fórmula booleana F (X1 , ...Xn ) é uma lista completa
dos pontos válidos de F (.), isto é todos os vetores X = (X1 , ..., Xn ) ∈ {F, T }n para qual
F (X) = T . A tabela de verdade pode ser montado para qualquer fórmula booleana,
por exemplo por enumeração. As filas da tabela de verdade formam uma lista completa
dos pontos válidos, isto é todos esses pontos em {0, 1}n que fazem F (X) verdadeiro, ou
satisfazem Xn = f (X1 , ..., Xn−1 ).
Quando modelamos sistemas na forma MLD freqüentemente encontramo-nos com os
seguintes problemas:
P1 Impor que a fórmula booleana F (X1 , ..., Xn ) seja verdadeira, isto é adicionar a restrição dada pela relação booleana F (X1 , ..., Xn ) = T
133
P2 Definir a função booleana Xn = f (X1 , ..., Xn−1 )
Assume-se que ambos f e F são definidos com o operadores básicos ∧, ∨, ., →, ↔, ⊕.
O problema P1 especifica uma restrição ou uma caracterı́stica do sistema.
Exemplo C.2 Um exemplo de P1 é a proposição que dois entradas binárias u1 e u2
não podam tomar o valor “1”ao mesmo tempo, se um tercer entrada u3 for zero. O
correspondente fórmula booleana F1 fica assim:
F1 (u1 , u2 , u3 ) = u3 → (u1 ∧ u2 )
Enquanto P1 tem o caráter de uma restrição, P2 define uma quantidade auxiliar a
ser adicionada no modelo MLD e tem o caráter de uma equação algébrica.
Exemplo C.3 Um caso tı́pico onde aparece P2 é a definição de uma transição de estado
num automata finito. X1 , ..., Xn−1 codifica o estado presente e as entradas e Xn é o estado
subseqüente. Então, a função f representa a função de transição de estados.
Como é imediato transformar relações booleanas em tabelas de verdade, sem perda de
generalidade vamos supor que F , f são definidos via uma tabela de verdade. Observe que
a tabela de verdade em P2 tem sempre 2n−1 filas e n colunas. Por outro lado a tabela de
verdade de P1 pode ter qualquer número de filas de 1 a 2n−1 .
Exemplo C.4 Para ilustrar mais a diferença entre P1 e P2, considere o exemplo da
fórmula booleana X1 ∧ X2 e da função booleana X3 = X1 ∧ X2 . As tabelas de verdade são
dadas na tabela C.1.
X1
V
X2
V
⇒
δ1
1
δ2
1
X1
V
V
F
F
X2
V
F
V
F
X3
V
F
F
F
δ1
1
⇒ 1
0
0
δ2
1
0
1
0
δ3
1
0
0
0
Tabela C.1: Tabelas de verdade para a fórmula X1 ∧X2 (esquerda) e para a função booleana
X3 = X1 ∧ X2 (direita)
Note que no primeiro caso há só um ponto válido e a tabela de verdade consiste portanto
de uma só fila.
134
Considere o hipercubo H , [0, 1]n , e permita que H denote o conjunto de seus vértices.
Seja conv(S) o fecho convexo do conjunto S ⊆ H, e CH (S) o conjunto complemento de
S em H, isto é
CH (S)
[
S=H
\
CH (S) S = ∅
O lema C.1 diz que o subconjunto S de H pode estar “envolvido”dentro de um politopo
que não contem qualquer vetor do conjunto complemento CH (S).
Lema C.1 Seja S ⊆ H. Então conv(S) ∩ CH (S) = ∅
Para ver a demonstração veja Mignone (2002).
Considere agora a tabela de verdade T expressando os pontos válidos associados com
os problemas P1 ou P2. Seja m o número de filas em T , e seja T = {R1 , ..., Rm } o
conjunto de filas Ri de T considerado como um vetor em Rm , isto é a coleção de todos os
pontos válidos. Cada componente da fila Ri é 0 ou 1 e por tanto Ri ∈ H, isto é Ri é um
vértice do hipercubo H.
Teorema C.1 Seja T a tabela de verdade com T filas, associada a fórmula booleana F
nos literais X1 , ...Xn . Então F (X1 , ..., Xn ) é verdadeiro se e somente se o vetor associado
δ , [δ1 , ..., δn ] ∈ {0, 1}n satisfaz as desigualdades
Aδ ≤ B
onde A e B definem o politopo
PCH , {δ ∈ [0, 1]n : Aδ ≤ B} = conv(T )
(C.10)
Além do mais, cada tradução inteira P = {δ ∈ [0, 1]n : Aδ ≤ B} de F é tal que PCH ⊆ P ,
isto é PCH é mı́nimo.
O enfoque proposto não introduz qualquer variável booleana adicional. Esta caracterı́stica, e a minimalidade do conjunto relaxado, são particularmente atraentes quando
135
o modelo é usado num problema de otimização. Se bem e verdade que não há nenhuma
necessidade em fazer manipulações simbólicas para achar a FNC, este método sofre de
pesados requerimentos computacionais para achar o fecho convexo dos pontos válidos e
grandes requisitos de armazenamento para armazenar a tabela de verdade. Algumas ferramentas de software para calcular os pontos do fecho convexo são listados no próximo
parágrafo.
Calculo do fecho convexo
Existem vários pacotes para transformar um poliedro P da forma
P = {x : x =
m
X
λi xi +
p
X
i=1
µi ri }
i=1
onde xi , ri são os pontos extremos e direções extremas de P respectivamente, e
0 ≤ λi ≤ 1,
m
X
λi = 1, mui ≥ 0
i=1
à forma
P = {x : Ax ≤ B}
Para um exame detalhado destes pacotes, o leitor pode consultar a pagina
http://www.geom.umn.edu/software/cglist/ch.html.
Exemplo C.5 Considere a função booleana X3 = X1 ∧ X2 , cuja tabela de verdade é dada
em Tabela C.1. As filas da tabela de verdade são representadas como pontos em R3 na
Figura C.1. Seu fecho convexo, coincide com as desigualdades lineares mencionado na
segunda regra da Tabela 3.2.
Comparação dos métodos
Há casos onde o método de substituição dá um número menor de desigualdades que
os outros métodos (Cavalier et al. 1990). No entanto, a complexidade de introduzir
variáveis binárias adicionais devem ser evitadas. Os outros dois métodos não exigem a
introdução de qualquer variável adicional. No entanto, eles exigem pre-processamento,
136
Figura C.1: Fecho convexo das filas da tabela de verdade de X3 = X1 ∧ X2
tanto seja para construir a tabela de verdade ou para derivar a FNC. Especialmente,
construir a tabela de verdade completa e derivar o fecho convexo de suas filas pode ser
um tarefa computacionalmente cara, mesmo que programas de computador eficientes
estejam disponı́vel para este propósito. Notar, no entanto, que é uma tarefa que pode ser
feita offline. Em alguns casos a tabela de verdade talvez contenha só um número pequeno
de filas, porque algumas combinações das variáveis independentes podem ser excluı́das a
priori.
Usando o método de tabela de verdade ou a transformação a FNC para achar as
desigualdades que representam uma fórmula de booleana não têm por que dar os mesmos
resultados num método como em outro. O Teorema C.1 afirma que PCH ⊆ PCN F . Em
outras palavras, todos os vértices inteiros de PCN F são pontos válidos da fórmula booleana
correspondente, contudo PCN F pode ter vértices de não-integrais. Existem fórmulas de
booleanas, para as quais PCH 6= PCN F , ainda que PCN F seja derivado de uma FNC
mı́nima.
Exemplo C.6 Considere a fórmula booleana descrita por:
(X1 ∨ X2 ) ∧ (X1 ∨ X3 ) ∧ (X2 ∨ X3 )
(C.11)
Dado que C.11 está na FNC, podemos usar C.8 para obter as correspondentes desigual-
dades como
137

1 1 0

x1


1



  
PCN F = {x ∈ [0, 1]3 :  1 0 1   x2  ≥  1 }
0 1 1
x3
1
(C.12)
A tabela de verdade de C.11 contem as filas [1, 1, 0], [1, 0, 1], [0, 1, 1], [1, 1, 1]. A fórmula
booleana C.11 é caracterizada pelo fato que ao menos duas variáveis booleanas são verdadeiras. Portanto pode ser mostrado que
PCH = {x ∈ [0, 1]3 : x1 + x2 + x3 ≥ 2}
(C.13)
Enquanto em PCH todos vértices são inteiros por construção, PCN F inclui um vértice
em (0.5, 0.5, 0.5) que não é inteiro. Este exemplo ilustra que as desigualdades originadas
da FNC podem descrever uma representação não minima da relaxação de uma proposição
lógica, por causa da presença de vértices não inteiros. Por enumeração direta, pode
ser mostrado que além de C.11 há só uma fórmula booleana envolvendo três variáveis
booleanas, para qual PCH 6= PCN F , a saber
(X1 ∨ X2 ) ∧ (X1 ∨ X3 ) ∧ (X2 ∨ X3 ) ∧ (X 1 ∨ X 2 ∨ X 3 )
(C.14)
Para todas as outras fórmulas booleanas em {0, 1}3 é possı́vel assegurar que PCH = PCN F .
Figura C.2: Esquerda: PCH das filas da tabela de verdade de (C.11), Direita: PF N C de
(C.11), o vértice claro e não inteiro
138
Desigualdades de Clausal
O conjunto de desigualdades Ax ≤ b é clausal, se cada elemento de A é 0, 1 ou −1, e
cada bi satisfaz
bi = 1 − ]{α : α = Aij = −1, j = 1...n}
(C.15)
Onde Aij é o elemento j − th da fila i em A e ] denota a cardinalidade de conjunto
(Chandru e Hooker 1999). O conjunto de desigualdades C.8 associadas com a FNC é
clausal por construção.
Teorema C.2 Seja F uma fórmula booleana. Se PCH (F ) é dado por desigualdades
clausales, então existe uma FNC, tal que PCH (F ) = PCN F (F ).
C.2
Proposições Mistas Lógicas-Continuas
Nesta seção os resultados da seção C.1 são estendidos a proposições mistas lógicascontı́nuas. Vamos a considerar os mesmos três enfoques que foram desenvolvidos para
as fórmulas booleanas e mostra sua aplicação a proposições envolvendo variáveis tanto
contı́nuas como binárias.
A Fórmula Booleana Generalizada (FBG) é a extensão da fórmula booleana obtida
ei = [fi (x) ≤ 0] sejam agregadas como termos
permitindo que desigualdades lineares X
adicionais na fórmula booleana. A Forma Normal Conjuntiva Generalizada (FNCG) é
definido assim, como a expressão:
p
^
Ã mj
_
j=1
i=1
[fij (x) ≤ 0] ∨
nj
_
!
[δkj = 1]
(C.16)
k=1
Cada FBG admite uma representação FNCG equivalente. Vamos mostrar que cada
FNCG pode ser traduzida em desigualdades mistas inteiras, contanto que um número suficiente de variáveis auxiliares seja introduzido. Vamos a desenvolver um meio sistemático
para traduzir proposições lógicas complexas em desigualdades mistas inteiras. Uma designação (x, δ) ∈ Rn1 × {0, 1}n2 que faz C.16 verdadeira, é chamada de ponto válido.
139
Motivação
No que segue, vamos supor que as cotas inferior e superior da função real afim fi (x) =
a0i x
− bi , fi : Rn 7→ R são conhecidos. Considere a disjunção lógica
m
_
[fi (x) ≤ 0]
(C.17)
i=1
que em general define um conjunto não-convexo em Rn , por exemplo o conjunto da Figura
C.3 correspondente a disjunção
[x1 ≤ 0] ∨ [x2 ≤ 0]
(C.18)
onde m1 ≤ x1 ≤ M1 , m2 ≤ x2 ≤ M2 . O conjunto na Figura C.3 é não-convexo, e portanto
não pode ser escrito como um sistema linear de restrições {x ∈ Rn : Cx ≤ d}. De fato,
o conjunto convexo mais pequeno contido na região factı́vel de C.18 contem pontos no
primeiro quadrante excluı́dos por C.18.
Figura C.3: Conjunto factı́vel definido por C.18
No entanto, introduzindo variáveis binárias adicionais δ ∈ {0, 1}, torna-se possı́vel
representar a disjunção como um conjunto de restrições mistas inteiras. Usando as Tabelas
3.2 e 3.3, podemos introduzir δ1 , δ2 ∈ {0, 1} como
δ1 , [x1 ≤ 0]
(C.19)
δ2 , [x2 ≤ 0]
(C.20)
140
A proposição na Equação C.18 torna-se
δ1 ∨ δ2
(C.21)
Cada uma das três proposições C.19, C.20, C.21 podem ser traduzidas em desigualdades usando as Tabelas 3.2 e 3.3. Isto mostra que no espaço (x1 , x2 , δ1 , δ2 ), isto é
num subconjunto de R4 , o conjunto factı́vel de C.18 podem ser representados como
{x ∈ R2 × {0, 1}2 : Cx ≤ d}. Isto implica que depois da relaxação das restrições de
integralidade a 0 ≤ δi ≤ 1, o conjunto factı́vel de C.18 torna-se um conjunto convexo
poliédrico em {x ∈ R4 : Cx ≤ d}. Aumentar a dimensão do espaço através de variáveis
binárias permite uma representação convexa do conjunto que nas coordenadas originais
de interesse não é convexo.
Método de substituição
Semelhante ao caso das relações lógicas, o método de substituição consiste em aplicar
iterativamente as regras de Tabelas 3.2 e 3.3 substituindo proposições lógicas elementares
com variáveis auxiliares binárias adicionais. Com as Equações C.19, C.20, C.21 ilustramos o método. Ao contrário à substituição para função puramente lógica na Seção
C.1, mostramos através da proposição lógica C.18, que a introdução de variáveis auxiliares pode ser necessária para traduções mistas lógica-contı́nuas. O método de substituição
contudo pode introduzir mais variáveis que necessário, como será mostrado logo.
Forma Normal Conjuntiva Generalizada
Nesta seção vamos a fornecer um procedimento geral para traduzir FBG num conjunto de desigualdades lineares mistas inteiras. A prova do Teorema C.4 contem algumas
sugestões construtivas para esta tradução.
Teorema C.3 O FNCG com funções reais afins fij (x)
p
^
Ã mj
_
j=1
i=1
[fij (x) ≤ 0] ∨
nj
_
!
[δkj = 1]
(C.22)
k=1
pode ser traduzida num conjunto de desigualdades mistas inteiras adicionando
Pp
0
j=1 dlog2 (mj
141
+ 1)e variáveis binárias, onde m0j ≤ mj é o número de restrições não-
redundante no conjunto {x : fij (x) > 0, i = 1, ..., mj }
A restrição [fj (x) ≤ 0] é redundante para a proposição C.17, se
(
x:
m
_
)
[fi (x) ≤ 0]
(
=
m
_
x:
i=1
)
[fi (x) ≤ 0]
(C.23)
i=1,i6=j
Teorema C.4 A proposição lógica com m funções afins fi (x)
m
_
[fi (x) ≤ 0]
(C.24)
i=1
pode ser traduzido num conjunto de desigualdades mistas inteiras adicionando l =
dlog2 (m0 )e variáveis binárias, onde m0 ≤ m é o número de restrições não-redundante
Prova.
A prova é construtiva e envolve os seguintes passos:
1. Defina o fechamento do conjunto não factı́vel B como
B = {x :
m
^
[fi (x) ≥ 0]}
(C.25)
i=1
Como todos os fi são afins, B é convexo.
2. Elimine as restrições redundantes. Isto pode ser feito resolvendo para cada i =
1, ..., m um programa linear da forma
Jc (i) =
s.a.
minx fi (x)
Vm
j=1,j6=i [fi (x)
(C.26)
≥ 0]
Se Jc ≥ 0, a i − th restrição é redundante. Isto dá o número de m0 restrições nãoredundante. Note que a disjunção C.24 pode ser escrita equivalentemente só usando
as restrições não-redundantes. Este passo aponta em ter uma representação mı́nima
de C.24. Além do mais, m0 é o número de facetas do politopo B.
142
3. De acordo com Bemporad et al. (1999), o conjunto X\B pode ser particionado
em m0 conjuntos disjuntos convexos Cj . Cada conjunto pode ser descrito pelas
desigualdades
Cj = {x : Aj x ≤ bj }
Onde através de uma numeração apropriada, nós temos Aj ∈ Rj×s e bj ∈ Rj (j =
1, ..., m0 ).
4. Temporariamente introduza m0 variáveis binárias δj com a propriedade que
[δj = 1] ↔ [x ∈ Cj ]
De acordo com as regras da Seção 3.3.1, as últimas relações podem ser traduzidas
em desigualdades mistas inteiras como:
Aj x − bj ≤ Mj (1 − δj )
m0
X
(j = 1, ..., m0 )
δi = 1
(C.27)
(C.28)
i=1
5. Codifique as regiões Ci como segue: Introduza l = dlog2(m0 )e variáveis binárias
µ1 , ..., µl tal que
[δj = 1] ↔ [j = 1 +
l−1
X
2i µi+1 ]
(C.29)
i=0
Use-as em C.27 para obter:
A1 x − b1 ≤ M1 (l − (1 − µ1 ) − ... − (1 − µl ))
A2 x − b2 ≤ M2 (l − µ1 − ... − (1 − µl ))
..
.
. ≤ ..
Am0 x − bm0 ≤ Mm0 (l − µ1 − ... − µl )
Se m0 < 20 , adicionar restrições para excluir as combinações de µ1 , ..., µl que não
são usados para codificar qualquer região. Para a representação com δj , C.28 expressa o fato que exatamente um δj é um para cada ponto de dados x. Isto não é
exigido quando trabalhamos com µ1 , ..., µl , desde que cada código µ1 , ..., µl que for
identifique uma região, ou a exclua.
143
¤
O número de desigualdades resultantes do algoritmo descrito acima é dado por
• (i) os limites em x ou em cada função fi (x)
P 0
m0 (m0 +1)
• (ii) m
restrições definindo µ1 , ..., µl , e
i=1 i =
2
• (iii) as restrições excluindo as combinações não utilizadas de µ1 , ..., µl
Observe que negligenciando o passo 2 do procedimento de remoção de redundância
aumentamos o número de variáveis auxiliares binárias a dlog2 (m)e, mas não se muda o
algoritmo.
Corolário C.1 A proposição lógica com m funções afins fi (x)
m
_
[fi (x) ≤ 0] ∨
i=1
n
_
[δk = 1]
(C.30)
k=1
pode ser traduzida num conjunto de desigualdades mistas inteiras adicionando l0 =
dlog2 (m0 + 1)e variáveis binárias, onde m0 ≤ m é o número de restriç4oes não-redundante
W
no disjunção m
i=1 [fi (x) ≤ 0].
Finalmente, o último passo consiste em traduzir qualquer FBG a desigualdades sobre
variáveis binárias e contı́nuas. Isto pode ser feito considerando as desigualdades [fi (x) ≤ 0]
como variáveis booleanas simbólicas e manipulando todas as funções de acordo com a
Seção C.1.
1. Substitua cada desigualdade [fi (x) ≤ 0] sobre variáveis contı́nuas com variáveis
booleanas yi .
2. Ache a FNC da expressão usando os métodos descritos na Seção C.1.
3. Faça a substituição inversa, substitua as variáveis booleanas yi com [fi (x) ≤ 0].
4. Aplique o teorema acima.
Note que a eficiência do enfoque apresentado aqui pode crescer, se o esquema da a
possibilidade de reconhecer partes comuns nas relações lógicas, como a múltipla ocorrência
de uma desigualdade [f ij(x) ≤ 0] em C.22.
144
Exemplo C.7 Considere a seguinte FBG
4
_
[fi (x) ≤ 0]
(C.31)
i=1
onde x = [x1 , x2 ]T ∈ [−10, 10]2 ⊂ R2 , fi : R2 7→ R e
f1 (x) = x1 + x2
(C.32)
f2 (x) = 2x1 + x2 + 2
(C.33)
f3 (x) = x2 − 1
(C.34)
f4 (x) = 1.5x1 + x2 + 4.5
(C.35)
(C.36)
O conjunto de pontos factı́veis é não-convexo, (área pintada na Figura C.4).
Vamos aplicar o procedimento descrito na demonstração do Teorema C.4 para achar
às desigualdades que descrevem C.31, seguindo os mesmos passos e a terminologia introduzida no teorema.
1. O conjunto B é dado por
não sombreada.
V4
i=1 [fi (x)
≥ 0] e é mostrada na Figura ?? como a área
145
i
1
2
3
JC (i) -0.5 -7.33 -11
4
3.5
Tabela C.2: Solução de C.26 para o exemplo C.31
2. Resolvendo C.26 chegamos no resulta mostrado na Tabela C.2. Portanto i = 4
denota uma restrição redundante e m0 = 3.
3. O conjunto Cj é:
C1 = {x ∈ R2 : [1 1]x ≤ 0}
"
#
"
#
−1 −1
0
2
C2 = {x ∈ R :
x≤
}
2
1
−2


 
−1 −1
0

 
2 
C3 = {x ∈ R :  −2 −1  x ≤  2 }
0
1
(C.37)
(C.38)
(C.39)
1
4. Usando as cotas de x, as expressões C.27 tornam-se:
h
i
1 1 x ≤ 20(1 − δ1 )
"
#
"
#
−1 −1
0
20
x−
≤
(1 − δ2 )
2
1
−2
32

 



−1 −1
0
20


 


 −2 −1  x −  2  ≤  28  (1 − δ3 )
"
#
0
1
1
(C.40)
(C.41)
(C.42)
9
5. Aqui se mantiene que l = 2 e codificamos as regiões como:
[δ1 ] ⇔ [µ1 µ2 ] = [0 0]
(C.43)
[δ2 ] ⇔ [µ1 µ2 ] = [1 0]
(C.44)
[δ3 ] ⇔ [µ1 µ2 ] = [0 1]
(C.45)
Finalmente, definindo X = [x1 x2 µ1 µ2 ]T e usando as expressões acima, obtemos as
146
desigualdades desejadas como











1
1
−20 −20


0


 20
−20 


 30

2
1
30 −30 

X ≤ 
 20
−1 −1 −20 20 


 30

−2 −1 −30 30 

10
0
1 −10 10
−1 −1
20











(C.46)
Método geométrico
Estamos motivados a creer que a interpretação geométrica de introduzir variáveis
binárias adicionais é uma ampliação a dimensão do espaço considerado. No espaço dimensional mais alto, a região especificada é um conjunto convexo. A projeção sobre
o espaço de variáveis originais é ainda não-convexo. Enquanto isto é uma interpretação
atraente, não é imediatas generalizá-lo ao procedimento para achar as desigualdades, além
do espaço de dimensões baixas. De fato, não está claro a priori, como aumentar o espaço
com variáveis binárias adicionais. Para o FBG C.18 esboçamos na Figurar C.5 o efeito
de aplicar a idéia do seguinte algoritmo:
1. Introduza naux = 1 variável binária auxiliar.
2. Divida o conjunto não-convexo em conjuntos disjuntos convexos, a união deles deverá ser o conjunto original.
3. Designe a cada subconjunto obtido uma combinação diferente das variáveis binárias
auxiliares.
4. Calcule no espaço dimensional mais alto o fecho convexo dos vértices.
5. Se o fecho convexo contem pontos excluı́dos pela proposição lógica,
• aumente o número naux de variáveis binárias auxiliares em 1. Ou
• escolha uma divisão diferente em 2. Ou
• Escolha um código diferente em 3.
Em general, não recomendamos confiar com estas interpretações geometrical para
traduzir FBG em desigualdades, devido às ações pouco metódicas a serem tomadas no
ponto 5.
147
C.3
Resumo
Nas Seções C.1 e C.2 vimos uma diferença fundamental entre a tradução de relações
puramente lógicas e relações mistas lógica-contı́nuas em desigualdades: a primeira pode
ser traduzida sem adicionar variáveis, enquanto a segunda pode exigir a introdução de
variáveis de booleanas.
Teorema C.5 Seja P uma proposição lógica envolvendo nc variáveis contı́nuas e nb
variáveis binárias. Seja V ⊂ XV = Rnc × {0, 1}nb o conjunto de pontos válidos de P
e suponha que V é um conjunto compacto. Então, introduzindo na variáveis binárias,
e = Rnc × {0, 1}na +nb de diV pode sempre ser delimitada por desigualdades no espaço X
mensão na + nb + nc tal que no espaço dimensional mais alto o fecho convexo de pontos
válidos não contem qualquer ponto inválido.
Além do mais, se nc = 0 então na = 0
C.4
148
The HYbrid Systems DEscription Language
HYSDEL
A derivação de modelos MLD “a mão” é uma tarefa tediosa e envolve a aplicação
repetida das regras apresentado nas seções prévias. Este procedimento ainda é mais complicado se o objetivo é achar o modelo com o menor número de variáveis ou desigualdades
envolvidas. Com o fim de simplificar o modelado para o usuário, um compilador foi desenvolvido para realizar a tradução automatizada de uma descrição do modelo de alto
nı́vel na forma MLD. O objetivo do compilador é gerar as matrizes Ai , Bi , C, Di e Ei em
(3.24, 3.25, 3.26). Estas matrizes são geradas na sintaxe do Matlab (.mat).
A linguagem de especificação do problema ao compilador é HYSDEL (HYbrid System
DEscription Language), (Torrisi et al. 2000).
HYSDEL é confeccionado para modelar sistemas MLD e PWA, mas é de modo algum
a única linguagem de modelado para sistemas hı́bridos. Outras linguagens e ferramentas
são descritas por exemplo em (Benveniste et al. 1993, Fabian 1999). A ferramenta LPL é
descrita em (Huerlimann 2001). Permite o modelado de sistemas contendo componentes
lógicos e traduz o modelo no formato MPS (Murtagh 1981), um formalismo comum para
a especificação de problemas matemáticos de otimização.
Referências Bibliográficas
Alur, R., Belta, C., Ivancic, F., Kumar, V., Mintz, M., Pappas, G. J., Rubin, H. e Schug,
J. (1999). Hybrid modeling and simulation of biomolecular networks, In: M. D.
Benedetto e A. S. Vincentelli (ed.), Hybrid Systems: Computation and Control, V.
2034 In: Lecture Notes in Computer Science, Springer-Verlag, p. 19–33.
Alur, R., Courcoubetis, C., Henzinger, T. e Ho., P.-H. (1993). Hybrid automata: An algorithmic approach to the specification and verification of hybrid systems, In: A. Ravn,
R. Grossman, A. Nerode e H. Rischel (ed.), Hybrid Systems, V. 736 In: Lecture Notes
in Computer Science, Springer-Verlag, p. 209–229.
Asarin, E., Bournez, O., Dang, T. e O.Maler (2000). Reachability analysis of piecewiselinear dynamical systems, In: B. Krogh e N. Lynch (ed.), Hybrid Systems: Computation and Control, V. 1790 In: Lecture Notes in Computer Science, Springer-Verlag,
New York, p. 20–31.
Bahrman, M. P. e Johnson, B. K. (2007). The abcs of hvdc transmission technologies,
Power and Energy Magazine, IEEE 5(2): 32–44.
Balluchi, A., Benvenuti, L., Benedetto, M. D., Pinello, C. e Vincentelli, A. S. (2000).
Automotive engine control and hybrid systems: Challenges and opportunities, Proceedings IEEE 88(7): 888–912.
Bemporad, A. (2003). Hybrid Toolbox-User’s Guide,.
Bemporad, A. (2004).
Efficient conversion of mixed logical dynamical systems into
an equivalent piecewise affine form, IEEE Transactions on Automatic Control
49(5): 832–838.
Bemporad, A., Borrelli, F. e Morari, M. (2000). Piecewise linear optimal controllers for
hybrid systems, Proceedings of the American Control Conference .
150
Bemporad, A., Borrelli, F. e Morari, M. (2002). On the optimal control law for linear
discrete time hybrid systems, In: M. Greenstreet e C. Tomlin (ed.), Hybrid Systems:
Computation and Control, V. 2289 In: Lecture Notes in Computer Science, SpringerVerlag, New York, p. 105–119.
Bemporad, A., Ferrari-Trecate, G. e Morari, M. (2000). Observability and controllability
of piecewise affine and hybrid systems, IEEE Trans. Automatic Control 45(10): 1864–
1876.
Bemporad, A. e Morari, M. (1999). Control of systems integrating logic, dynamics, and
constraints, Automatica 35(3): 407–427.
Bemporad, A., Morari, M., Dua, V. e Pistikopoulos, E. N. (1999). The explicit linear
quadratic regulator for constrained systems, Relatório Técnico AUT99-16, Automatic Control Lab, ETH, Zürich, Switzerland.
Benveniste, A., Borgne, M. L. e Guernic, P. L. (1993). Hybrid systems: the signal
approach, In: R. Grossmann, A. Nerode, A. Ravn e H. Rischel (ed.), Hybrid Systems,
n. 736In: Lecture Notes in Computer Science, Springer-Verlag.
Blondel, V., Bournez, O., Koiran, P. e Tsitsiklis, J. (1999). The stability of saturated
linear systems is undecidable, Journal of Computer Systems Science .
Blondel, V. e Tsitsiklis, J. (1999). Complexity of stability and controllability of elementary
hybrid systems, Automatica 35: 479–489.
Borges, F. (2002). Analise e Controle de Sistemas de Estrutura Variavel, PhD thesis,
Universidade Federal de Santa Catarina.
Borrelli, F. (2002). Discrete Time Constrained Optimal Control, PhD thesis, Swiss Federal
Institute of Technology, Zurich, Swiss.
Branicky, M. (1994). Stability of switched and hybrid systems, Proc. Conf. Dec. Contr.,
p. 3498–3503.
Branicky, M. (1998). Multiple lyapunov functions and other analysis tools for switched
and hybrid systems, IEEE Trans. Automatic Control 43(4): 475–482.
Branicky, M. S., Borkar, V. S. e Mitter, S. K. (1998). A unified framework for hybrid
control: model and optimal control theory, IEEE Trans. Automat. Control 43(1): 31–
45.
151
Bristol, E. H. (1966). On a new measure of interactions for multivariable process control,
Transaction on Automatic Control, IEEE AC-11: 133–134.
Camacho, E. e Bordons, C. (2005). Model Predictive Control, Springer-Verlag.
Cavalier, T. M., Pardalos, P. e Soyster, A. L. (1990). Modeling and integer programming
techniques applied to propositional calculus, Comput. Oper. Res. 17(6): 561–570.
Chandru, V. e Hooker, J. (1999). Optimization Methods for Logical Inference, Wiley
Interscience Series in Discrete Mathematics and Optimization.
Christiansen, D. (1997).
Electronics engineers handbook, 4th ed., New York: IEEE
Press/McGraw Hill, Inc.
Chutinan, A. e Krogh, B. H. (1999). Verification of polyhedral invariant hybrid automata
using polygonal flow pipe approximations, In: F. Vaandrager e J. van Schuppen (ed.),
Hybrid Systems: Computation and Control, V. 1569 In: Lecture Notes inComputer
Science, Springer-Verlag, New York, p. 76–90.
DeCarlo, R., Branicky, M., Pettersson, S. e Lennartson, B. (2000). Perspectives and results
on the stability and stabilizability of hybrid systems, Proc. IEEE 88: 1069–1082.
Ezzine, J. e Haddad, A. (1989). On the controllability and observability of hybrid systems,
Int. J. Control 49: 2045–2055.
Fabian, G. (1999). A Language and Simulator for Hybrid Systems, PhD thesis, Technische
Universiteit Eindhoven.
Ferrari-Trecate, G., Cuzzola, F. A. e Morari, M. (2002a). Analysis of discrete-time pwa
systems with boolean inputs, outputs and states, Hybrid Systems: computation and
control (HSCC), Proceedings of the 5th international workshop on Hybrid Systems.
Ferrari-Trecate, G., Cuzzola, F. e Morari, M. (2002b). Analysis of piecewise affine systems
with logic states, In: C. J. Tomlin e M. R. Greenstreet (ed.), Proc. 5th International
Workshop on Hybrid Systems: Computation and Control, V. 2289 In: Lecture Notes
in Computer Science, Springer-Verlag, p. 194–208.
Ferrari-Trecate, G., Mignone, D. e Morari., M. (2000). Moving horizon estimation for
hybrid systems, Proc. American Contr. Conf.
152
Fletcher, R. e Leyffer, S. (1995). Numerical experience with lower bounds for miqp
branch-and-bound., Relatório técnico, Dept. of Mathematics, University of Dundee,
Scotland, U.K.
Floudas, C. A. (1995). Nonlinear and Mixed-Integer Optimization, Princeton University.
Glover, F. (1975). Improved linear integer programming formulation of nonlinear integer
problems, Management Science 22(4): 455–460.
Goshen-Meskin, D. e Bar-Itzhack, I. Y. (1992). Observability analysis of piece-wise constant systems-part i: Theory, IEEE Trans. Aerosp. Electr. Syst. 28(4): 1056–1067.
Grossmann, R. L., Nerode, A., Ravn, A. P. e Rischel, H. (1993). Hybrid systems, V. 736,
Lecture Notes in Computer Science. New York: Springer Verlag.
Gutierrez, G. (2000). Diseño Integrado y Sı́ntesis de Procesos Aplicado al Proceso de
Fangos Activados, PhD thesis, Universidad de Valladolid.
Hassibi, A. e Boyd, S. (1998). Quadratic stabilization and control of piecewise-linear
systems, Proc. American Contr. Conf., Philadelphia, Pennsylvania USA.
Hayes, J. P. (1993). Introduction to digital logic design, Reading: Addison-Wesley.
Heemels, W. P. M. H., Schumacher, J. M. e Weiland, S. (2000). Linear complementarity
systems, SIAM Journal of Applied Mathematics 60(4): 1234–1269.
Heemels, W., Schutter, B. D. e Bemporad, A. (2001). Equivalence of hybrid dynamical
models, Automatica 37: 1085–1091.
Hespanha, J., Bohacek, S., Obraczka, K. e Lee, J. (2001). Hybrid modeling of tcp congestion control, In: M. D. Benedetto e A. S. Vincentelli (ed.), Hybrid Systems: Computation and Control, V. 2034 In: Lecture Notes in Computer Science, Springer-Verlag,
p. 291–304.
Huerlimann, T. (2001). Reference Manual for the LPL Modeling Language, version 4.42
ed., Departement for Informatics, Université de Fribourg, Switzerland, http://www2iiuf.unifr.ch/tcs/lpl/TonyHome.htm.
Hyttinen, M. e Bentzen, K. (2006). Operating experiences with a voltage source converter
(hvdc light) on the gas platform troll a, Energex, Stavanger, Norway.
Itkis, U. (1976). Control Systems of Variable Structure, John Wiley & Sons, New York.
153
Johannson, M. e Rantzer, A. (1998). Computation of piece-wise quadratic lyapunov
functions for hybrid systems, IEEE Trans. Automatic Control 43(4): 555–559.
Jones, P. e Stendius, L. (2006). The challenges of offshore power system construction .
troll a, electrical power delivered successfully to an oil and gas platform in the north
sea, European Wind Energy Conference & Exhibition, Athen, Greece.
Kalman, R. E., Ho, Y. C. e Narendra, K. S. (1962). Controllability of linear dynamic systems, Contributions to Differential Equations, V. 1, New York: Wiley-Interscience.
Kassakian, J., Schlecht, M. e Verghese, G. (1991). Principles of Power Electronics,
Addison-Wesley.
Kerrigan, E. C. (2000). Robust Constraint Satisfaction: Invariant Sets and Predictive
Control, PhD thesis, Control Group Department of Engineering, University of Cambridge.
Kerrigan, E. C. e Mayne, D. Q. (2002). Optimal control of constrained, piecewise affine
systems with bounded disturbances, Proc. 42th IEEE Conf. Decision Control, Las
Vegas, p. 1552–1557.
Kesten, Y., Pnueli, A., Sifakis, J. e Yovine, S. (1993). Integration graphs: a class of
decidable hybrid systems, In: R. Grossman, A. Nerode, A. Ravn e H. Rischel (ed.),
Hybrid Systems, V. 736 In: Lecture Notes in Computer Science, Springer-Verlag,
p. 179–208.
Kohavi, Z. (1978). Switching and Finite Automata Theory, McGraw-Hill.
Lee, J. e Cooley, B. (1997). Recent advances in model predictive control, Chemical Process
Control - V, V. 93, AIChE Symposium Series - American Institute of Chemical
Engineers, p. 201–216b.
Luyben, M. L. (1993). Analyzing the Interaction Between Design and Control In Chemical
Reactor Systems, PhD thesis, Princeton University.
Luyben, M. L. e Floudas, C. A. (1994a). Analyzing the interaction of design and control 1. a multiobjective framework and application to binary distillation synthesis, Comp.
Chem. Eng. (10): 933–969.
Luyben, M. L. e Floudas, C. A. (1994b). Analyzing the interaction of design and control
-1.a multiobjective framework and application to binary distillation synthesis, Comp.
Chem. Eng. 18(10): 933–969.
154
Maciejowski, J. (2002). Predictive Control, Prentice Hall.
Mattavelli, P., Rossetto, L., Spiazzi, G. e Tenti, P. (1993). General-purpose sliding-mode
controller for dc-dc converter applications, PESC Conf. p. 609–615.
Mayne, D. (1997). Nonlinear model predictive control: an assessment, Chemical Process
Control - V, V. 93, AIChE Symposium Series - American Institute of Chemical
Engineers, p. 217–231.
Mayne, D. Q. e Rakovic, S. (2002). Optimal control of constrained piecewise affine discrete
time systems using reverse transformation, Proc. 42th IEEE Conf. Decision Control,
Las Vegas, p. 1546–1551.
Mayne, D. Q. e Rakovic, S. (2003). Model predictive control of constrained piecewise affine
discrete-time systems, INTERNATIONAL JOURNAL OF ROBUST AND NONLINEAR CONTROL 13: 261–279.
Mayne, D., Rawlings, J., Rao, C. e Scokaert, P. (2000). Constrained model predictive
control: Stability and optimality, Automatica 36(6): 789–814.
Mendelson, E. (1964). Introduction to mathematical logic, New York: Van Nostrand.
Middlebrook, R. e Cúk, S. (1976). A general unified approach to modelling switchingconverter power stages, IEEE Power Electronics Specialists Conference - PESC p. 18–
34.
Mignone, D. (2001). The really big collection of logic propositions and linear inequalities, Relatório Técnico AUT01-11, Automatic Control Laboratory, ETH, Zürich,
Switzerland.
Mignone, D. (2002). Control and Estimation of Hybrid Systems with Mathematical Optimization, PhD thesis, Swiss Federal Institute of Technology, Zurich, Swiss.
Mignone, D., Ferrari-Trecate, G. e Morari, M. (2000). Stability and stabilization of
piecewise affine and hybrid systems: An lmi approach, Proc. 39th IEEE Conf. on
Decision and Control.
Miller, R. E. (1965). Switching theory, Combinational Circuits, V. 1, John Wiley.
Morari, M. (1983). Design of resilient processing plants-iii. a general framework for the
assesment of dynamic resilience, Chem. Eng. Sci. 38: 1881–1891.
155
Morari, M. (1992). Effect of design on the controllability of chemical plants, IFAC Workshop on Interactions Between Process Design and Process Control, J. D. Perkins,
De., Pergamon Press, p. 3–16.
Morari, M. e Zafiriou, E. (1989). Robust Process Control, Englewood Cliffs : Prentice-Hall,
Inc.
Murtagh, B. (1981). Advanced linear programming : computation and practice, McGrawHill.
Nemhauser, G. e Wolsey, L. (1988). Integer and Combinatorial Optimization, Wiley.
Nishida, N. e Ichikawa, A. (1975). Synthesis of optimal dynamic process systems by a
gradient method, Ind. Eng. Chem. Proc. Des. Dev. 14: 236–242.
Nishida, N., Ichikawa, A. e Tazki, E. (1974). Synthesis of optimal process systems with
uncertainty, Ind. Eng. Chem. Proc. Des. Dev. 13: 209–214.
Nishida, N., Liu, Y. A. e Ichikawa, A. (1976). Studies in chemical process design and
synthesis ii. optimal synthesis of dynamic process systems with uncertainty, AIChE
J. 22: 539–549.
Peña, M., Camacho, E. F., Piñón, S. e Carelli, R. (2005). Model predictive controller for
piecewise affine system, IFAC .
Perkins, J. D. (1989). Interactions between process design and process control, International Federation of Automatic Control Symposium, Maastricht, The Netherlands.
Pomar, M., Gutierrez, G., de Prada, C. e Normey-Rico, J. E. (2007). Integrated design
& control applied to a buck boost converter, European Conferene Control .
Pomar, M. J. (2005). Controle preditivo não linear com aplicaçãoo à eletrônica de potência,
Master’s thesis, Universidade Federal de Santa Catarina.
Qin, S. e Badgewell, T. (1997). An overview of industrial model predictive control technology, Chemical Process Control - V, V. 93, AIChE Symposium Series - American
Institute of Chemical Engineers, p. 232–256.
Raman, R. e Grossmann, I. (1991). Relation between milp modeling and logical inference
for chemical process synthesis, Computers and Chemical Engineering 15(2): 73–84.
Raman, R. e Grossmann, I. (1992). Integration of logic and heuristic knowledge in minlp
optimization for process synthesis, Computers Chem. Engng. 16(3): 155–171.
156
Rashid, M. H. (1995). Electronica de Potencia: Circuitos, Dispositivos y Aplicaciones,
2nd ed., Prentice Hall Hispanoamericana.
Sarabia, D., de Prada, C., Cristea, S., Mazaeda, R. e Colmenares, W. (2007). Hybrid nmpc
control of a sugar house, In: F. B. L. Findeisen, Rolf; Allgöwer (ed.), Assessment and
Future Directions of Nonlinear Model Predictive Control, V. 358 In: Lecture Notes
in Control and Information Sciences, Springer-Verlag, p. 495–502.
Sasao, T. (1999). Switching Theory for Logic Synthesis, Kluwer Academic.
Schaft, A. V. D. e Schumacher, H. (1999). An introduction to hybrid dynamical systems,
Lecture Notes in Control and Information Sciences, V. 251, Springer-Verlag.
Schrijver, A. (1986). Theory of Linear and Integer Programming, Wiley-Interscience.
Schutter, B. D. e Boom, T. V. D. (2001). On model predictive control for max-min-plusscaling discrete event systems, Automatica 37(7): 104–1056.
Schutter, B. D. e Moor, B. D. (1999). The extended linear complementarity problem and
the modeling and analysis of hybrid systems, In: P. Antsaklis, W. Kohn, M. Lemmon,
A. Nerode e S. Sastry (ed.), Hybrid systems V, V. 1567 In: Lecture Notes in Computer
Science, Springer-Verlag, Berlin, p. 70–85.
Schweiger, C. A. e Floudas, C. A. (1997). Interaction of design and control: Optimization with dynamic models, Optimal Control: Theory, Algorithms, and Applications,
Kluwer Academic Publishers B. V.
Skogestad, S., Hovd, M. e Lundström, P. (1991). Towards integrating design and control :
Use of frequency-dependent tools for controllability analysis, In PSE ’91 4th International Symposium on Process Systems Engineering, Montbello, Quebec, p. III.3.1–
III.3.5.
Skogestad, S. e Morari, M. (1987). The dominant time constant for distillation columns,
Comput. Chem. Engr. 26: 2029–2035.
Skogestad, S. e Postlethwaite, I. (1997). Multivariable Feedback Control. Analysis and
Design, John Wiley and Sons.
Skogestad, S. e Wolf, E. (1990).
Controllability measures for disturbance rejection,
IFAC Workshop on Interactions Between Process Design and Process Control, J.
D. Perkins, Ed., Pergamon Press, p. 23–29.
157
Slupphaug, O. e Foss, B. (1997). Model predictive control for a class of hybrid systems,
Proceedings of the European Control Conference, Brussels, Belgium.
Slupphaugand, O., Vada, J. e Foss, B. (1997). Mpc in systems with continuous and discrete
control inputs, Proceedings of the American Control Conference, Albuquerque, NM,
USA.
Sontag, E. (1985). Real addition and the polynomial hierarchy, Inform. Proc. Letters
20: 115–120.
Sontag, E. (1988). Controllability is harder to decide than accessibility, SIAM J. Control
and Opt. 26: 1106–1118.
Sontag, E. (1996). Interconnected automata and linear systems: A theoretical framework
in discrete-time, In: R. Alur, T. Henzinger e E. Sontag (ed.), Hybrid Systems III Verification and Control, n. 1066In: Lecture Notes in Computer Science, SpringerVerlag, p. 436–448.
Sontag, E. D. (1981). Nonlinear regulation: the piecewise linear approach, IEEE Transactions on Automatic Control 26(2): 346–357.
T.A. Henzinger, P.W. Kopke, A. P. e Varaiya, P. (1995). What’s decidable about hybrid
automata ?, 27th ACM Symposium on the Theory of Computing, p. 373–381.
Torrisi, F., Bemporad, A., Bertini, G., Hertach, P., Jost, D. e Mignone, D. (2000). Hysdel
2.0.5 - user manual, Relatório Técnico AUT02-10, Automatic Control Laboratory,
ETH Zurich, http://control.ee.ethz.ch/.
Torrisi, F. D. (2003). Modeling and Reach-Set Computation for Analysis and Optimal
Control of Discrete Hybrid Automata, PhD thesis, Swiss Federal Institute of Technology, Zurich, Swiss.
Tyler, M. e Morari, M. (1995). Stability of constrained moving horizon estimation schemes,
Relatório Técnico AUT95-05, Automatic Control Laboratory, ETH Zürich.
Utkin, V. (1977). Variable structure systems with sliding modes, IEEE Trans. Automatic
Control 22(2): 212–222.
Utkin, V. I. (1974 (English Translation 1978)). Sliding Mode and Their Application in
Variable Structure Systems, MIR, Moscow.
158
Vorpérian, V. (1990). Simplified analysis of pwm converters using the model of the pwm
switch: Parts i and ii, IEEE Transactions on Aerospace and Electronic Systems
26: 409–505.
Wicks, M. A. e Peleties, P. (1994). Construction of piecewise lyapunov functions for
stabilizing switched systems, Proc. Conf. Dec. Contr., p. 3492–3497.
Williams, H. P. (1977). Logical problems and integer programming, Bull. Institute Math.
Appli. 13: 18–20.
Williams, H. P. (1993). Model building in mathematical programming, 3rd ed., New York:
Wiley.
Witsenhausen, H. (1966). A class of hybrid-state continuous-time dynamic systems, IEEE
Transactions on Automatic Control AC-11(2): 161–167.
Zieger, G. (1995). Lectures on Polytopes, Springer-Verlag.
Ziegler, J. G. e Nichols, N. B. (1943). Process lags in automatic-control circuits, Transactions of the A. S. M. E. 65: 433–444.

Martin J.Pomar Garcia

Transcrição

Documentos relacionados

capítulo 11 - Novos Olhos

Teorema de Ptolomeu

Teorias da luz. Experiências

Superando o Turismo

Capítulo 29 Meta-heurísticas Aplicadas ao Desenvolvimento de

Baixar Material Teórico

MA13 – Geometria – AV1 – 2014 Quest˜ao 1 [ 2,0 pt ] Considere um

Congruência de triângulos I - MA13 - Unidade 2

Empanada de Frango com Sultanas Ingredientes p/ a massa

termos imobiliários