Piloto Automático de uma Aeronave

Transcrição

UNIVERSIDADE TÉCNICA DE LISBOA
INSTITUTO SUPERIOR TÉCNICO
Piloto Automático de uma Aeronave
José Miguel Freitas Fiúza, nº49399, AE - Sistemas, Decisão e Controlo
Leonardo Bione Da Silva, nº49402, AE - Sistemas, Decisão e Controlo
LICENCIATURA EM ENGENHARIA ELECTROTÉCNICA E DE COMPUTADORES
Relatório de Trabalho Final de Curso
Prof. Orientador: J. Miranda Lemos
Prof. Acompanhante: Bertinho M. A. Costa
Setembro de 2005
Agradecimentos
Agradecemos a todos os professores, que nos ajudaram neste trabalho e no curso, pela motivação e conhecimento transmitido. Um especial agradecimento aos nossos orientadores, Prof.
Miranda Lemos e Prof. Bertinho Costa, todo o apoio e amizade dada ao longo do trabalho
que tornou possı́vel a sua realização.
Agradecemos aos nossos Pais e familiares todo o apoio, compreensão e encorajamento dispensado.
Agradecemos a todos os nossos colegas e amigos, que nos acompanharam ao longo do projecto,
a amizade dada.
Finalmente agradecemos a compreensão de todos os que se encontraram privados da nossa
atenção/companhia quando nos encontrávamos a realizar este trabalho.
i
Resumo
O objectivo deste trabalho consiste no projecto de um sistema de controlo de voo automático
de uma aeronave não tripulada de pequenas dimensões.
Inicialmente estudou-se um modelo matemático, de base fı́sica, que traduz a dinâmica relevante
da aeronave para efeitos de projectos de sistemas de controlo. Este modelo é implementado
em Simulink.
Segue-se a sua caracterização dinâmica, incluindo regimes lineares (pequenas variações em
torno do um ponto de equilı́brio) e não lineares. Mostra-se a variação do regime linear em
função do ponto de trabalho. Estuda-se também as perturbações possı́veis que possam afectar
a aeronave.
Posteriormente realiza-se o projecto para a estrutura do sistema de controlo das várias cadeias
necessárias.
Com esta estrutura desenvolvem-se controladores locais lineares para posteriormente serem
colocados numa arquitectura de gain scheduling.
Estuda-se também técnicas de controlo adaptativo, aplicado à aeronave, nomeadamente o
algoritmo MUSMAR - Multivariable Multipredictive Adaptive Regulator.
Finalmente desenvolve-se um sistema de guiamento para a aeronave.
Todos os controladores desenvolvidos são testados com o modelo fı́sico da aeronave.
Palavras Chave: Aeronave, Sistema de Guiamento, Controladores Locais Lineares, Controlo
Adaptativo, MUSMAR, Gain Scheduling.
iii
Abstract
The objective of this work consists on the project of an automatic flight control system for an
uninhabited aircraft of small dimensions.
Firstly, for the purpose of the project of control systems, a mathematical model, of physical
basis, which translates the relevant dynamics of the aircraft, is studied. This model is then
implemented in Simulink.
It follows its dynamic characterization, including linear regimes (small variations around the
one break-even point) and not linear regimes. It is presented the variation of the linear regime
in function of the work point. One also studies the possible disturbances affecting the aircraft.
Later, the project for the structure of the control system with the necessary chains is fulfilled.
With this structure, local linear controllers are developed, which will later be placed in a gain
scheduling architecture.
One also studies adaptive control techniques, applied to the aircraft, nominated algorithm
MUSMAR - Multivariable Multipredictive Adaptive Regulator. Finally a guidance system for
the aircraft is developed.
All the developed controllers are tested with the physical model of the aircraft.
Keywords: Aircraft, Guidance System, Local Linear Controllers, Adaptative Control, MUSMAR, Gain Scheduling.
v
Índice
Agradecimentos
i
Resumo
iii
Abstract
v
Índice
vi
Lista de Figuras
ix
Lista de Tabelas
xv
Notação
xix
1 Introdução
1.1 Conteúdo e estrutura do relatório . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Contribuições e considerações do trabalho . . . . . . . . . . . . . . . . . . . .
1
2
2
2 Aeronave - simulação e análise do modelo
2.1 Sistema de eixos de referência . . . . . . . . . . . . . .
2.2 Modelo da aeronave . . . . . . . . . . . . . . . . . . . .
2.3 Simulação e Análise . . . . . . . . . . . . . . . . . . . .
2.3.1 Modos Longitudinais - Phugoid e Perı́odo Curto
2.3.2 Modos Laterais - Yaw, Espiral e Roll . . . . . .
2.3.3 Caracterização dinâmica . . . . . . . . . . . . .
.
.
.
.
.
.
3
3
5
6
7
7
8
.
.
.
.
11
11
11
11
14
4 Estrutura do Sistema de Controlo
4.1 Controlo longitudinal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Controlo lateral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
15
19
5 Controladores Locais Lineares
5.1 Amostragem do Sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Identificação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.1 Sinal Utilizado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
23
24
25
3 Perturbações
3.1 Perturbações atmosféricas . . . . . . . . . .
3.1.1 Modelo de uma rajada de ar discreta
3.1.2 Modelos contı́nuos de turbulência . .
3.2 Sensores . . . . . . . . . . . . . . . . . . . .
vii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ÍNDICE
.
.
.
.
.
.
.
.
.
.
.
.
.
26
27
27
28
29
31
31
32
33
35
35
35
36
6 Gain Scheduling
6.1 Métodos de comutação de ganhos . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
37
38
7 Controlo Adaptativo
7.1 Algoritmos preditivos de horizonte extendido . . . . . . . . . . . . . . .
7.2 Parâmetros do MUSMAR . . . . . . . . . . . . . . . . . . . . . . . . .
7.3 Controlo adaptativo na cadeia de pitch . . . . . . . . . . . . . . . . . .
7.3.1 MUSMAR sem integrador na cadeia de controlo . . . . . . . . .
7.3.2 MUSMAR com integrador na cadeia de controlo . . . . . . . . .
7.3.3 MUSMAR com inclusão de variáveis de estado no pseudoestado
7.3.4 MUSMAR com velocidade variável . . . . . . . . . . . . . . . .
7.3.5 Variação do custo em função do horizonte T . . . . . . . . . . .
7.4 Controlo adaptativo nas restantes cadeias . . . . . . . . . . . . . . . . .
7.4.1 Controlo adaptativo na cadeia de roll . . . . . . . . . . . . . . .
7.4.2 Controlo adaptativo na cadeia de yaw . . . . . . . . . . . . . .
7.4.3 Controlo adaptativo na cadeia de velocidade . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
41
42
44
46
46
47
49
50
52
53
53
53
54
.
.
.
.
.
.
.
55
55
56
58
59
60
62
64
5.3
5.4
5.5
5.6
5.7
5.2.2 Estrutura dos Modelos . . . . . . . . . . . . . . . . . .
5.2.3 Simulação . . . . . . . . . . . . . . . . . . . . . . . . .
Princı́pios do Controlo Polinomial . . . . . . . . . . . . . . . .
Especificações para os controladores . . . . . . . . . . . . . . .
Limitações do Sistema - Saturações e Anti-windup . . . . . . .
Limites de Incerteza nos Modelos e Estabilidade Robusta . . .
5.6.1 Funções de Sensibilidade e Sensibilidade Complementar
5.6.2 Estudo da Robustez . . . . . . . . . . . . . . . . . . .
5.6.3 Estudos Realizados . . . . . . . . . . . . . . . . . . . .
Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.7.1 Cadeia de Velocidade . . . . . . . . . . . . . . . . . . .
5.7.2 Cadeia de pitch . . . . . . . . . . . . . . . . . . . . . .
5.7.3 Perturbações atmosféricas . . . . . . . . . . . . . . . .
8 Sistema de Guiamento
8.1 Geração de trajectórias . . . . . . .
8.2 Sistema de controlo . . . . . . . . .
8.3 Resultados . . . . . . . . . . . . . .
8.3.1 Subida . . . . . . . . . . . .
8.3.2 Circunferência . . . . . . . .
8.3.3 Espiral . . . . . . . . . . . .
8.3.4 Rajada discreta e aquisição
.
.
.
.
.
.
.
.
.
.
.
.
.
.
viii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ÍNDICE
9 Conclusões
65
A Modelo da aeronave
A.1 O modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.2 Os parâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.3 Modelo da Aeronave em Simulink . . . . . . . . . . . . . . . . . . . . . . . . .
69
69
71
74
B Sensores
B.1 Giroscópio de rotação . .
B.2 Giroscópio vertical . . .
B.3 Altı́metro e velocı́metro .
B.4 GPS . . . . . . . . . . .
.
.
.
.
75
75
76
76
77
.
.
.
.
.
79
79
80
80
83
86
.
.
.
.
.
.
.
.
91
91
93
95
97
97
99
100
102
.
.
.
.
105
105
107
107
108
.
.
.
.
.
.
.
.
C Identificação
C.1 Máxima Verosimilhança . .
C.2 Resultados . . . . . . . . . .
C.2.1 Cadeia de velocidade
C.2.2 Cadeia de altitude .
C.2.3 Cadeia Lateral . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
D Controlo Polinomial
D.1 Princı́pios do Controlo Polinomial
D.2 Controlo Robusto . . . . . . . . .
D.3 Polinómios R, S, T . . . . . . . .
D.4 Resultados do controlo polinomial
D.4.1 Cadeia Velocidade . . . .
D.4.2 Cadeia Pitch . . . . . . .
D.4.3 Cadeia Roll . . . . . . . .
D.4.4 Cadeia Yaw . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
E Controlo Adaptativo
E.1 Modelos preditivos . . . . . . . . . . . . . . . .
E.2 Modelo preditivo do MUSMAR . . . . . . . . .
E.3 Identificação do modelo preditivo do MUSMAR
E.4 MUSMAR - Cadeia de roll . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
F Guiamento
111
F.1 Sistemas de guiamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
F.2 Referências das trajectórias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
F.3 Outras trajectórias testadas no guiamento . . . . . . . . . . . . . . . . . . . . 114
Bibliografia
127
ix
Lista de Figuras
1.1
Diagrama genérico de navegação, guiamento e controlo. . . . . . . . . . . . . .
1
2.1
2.2
Desenho do aeromodelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Referenciais Terra e Avião e sentidos positivos para velocidades lineares e angulares. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Sentidos positivos dos ângulos de ataque e de sideslip. . . . . . . . . . . . . . .
Sentidos positivos das deflexões das superficies móveis. . . . . . . . . . . . . .
Modos Longitudinais - Phugoid e Perı́odo Curto. . . . . . . . . . . . . . . . .
Modos Laterais - Yaw, Espiral e Roll. . . . . . . . . . . . . . . . . . . . . . . .
Dependência do lugar geométrico dos valores próprios do sistema com o ponto
de equilı́brio e variação da dinâmica com a velocidade. . . . . . . . . . . . . .
3
3.1
3.2
Rajada discreta com Vm = 10 m/s e dm = 10 m. . . . . . . . . . . . . . . . . .
Velocidades lineares e angulares com altitude= 1000 m e velocidade= 21 m/s.
12
14
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12
4.13
4.14
4.15
4.16
4.17
Sistema de controlo de velocidade. . . . . . . . . . . . . . . . . . . . . .
Controlo da velocidade. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Sistema de controlo de altitude. . . . . . . . . . . . . . . . . . . . . . .
Variação da altitude. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Perturbação na velocidade e no pitch causada pela variação na altitude.
Sistema de controlo de velocidade. . . . . . . . . . . . . . . . . . . . . .
Controlo da velocidade. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Sistema de controlo de altitude. . . . . . . . . . . . . . . . . . . . . . .
Variação da altitude. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Perturbação na velocidade e no pitch causada pela variação na altitude.
Sistema de controlo de curvas. . . . . . . . . . . . . . . . . . . . . . . .
Controlo lateral - Variação da posição resultante do controlo lateral. . .
Controlo lateral - yaw, roll e sideslip. . . . . . . . . . . . . . . . . . . .
Controlo lateral - Variação da posição resultante. . . . . . . . . . . . .
Controlo lateral - Variação da posição resultante do controlo lateral. . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
16
16
17
17
17
18
18
18
19
19
20
20
20
21
21
22
22
5.1
5.2
5.3
5.4
5.5
5.6
Modelo de um sistema amostrado. . . . . . . .
Esquema de um controlador com dois graus de
Esquema do Anti-windup. . . . . . . . . . . .
Exemplo do efeito integrator windup. . . . . .
Esquema do sistema de controlo. . . . . . . .
Diagramas de Bode de modelos de incerteza. .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
23
27
30
30
31
33
2.3
2.4
2.5
2.6
2.7
xi
. . . . . .
liberdade.
. . . . . .
. . . . . .
. . . . . .
. . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
5
6
7
8
9
LISTA DE FIGURAS
5.7
5.8
Verificação da condição de estabilidade robusta. . . . . . . . . . . . . . . . .
Verificação da condição de estabilidade robusta entre os vários modelos locais
velocidade e pitch. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.9 Controlo de velocidade (22 m/s) - velocidade e TH . . . . . . . . . . . . . . .
5.10 Controlo de pitch (22 m/s) - pitch e elevadores. . . . . . . . . . . . . . . . .
5.11 Controlo de velocidade e de pitch com perturbações atmosféricas. . . . . . .
.
.
.
.
.
34
6.1
6.2
6.3
6.4
6.5
Instabilidade causada por comutação rápida de controladores.
Exemplo de atribuição de pesos. . . . . . . . . . . . . . . . . .
Gain Scheduling - Velocidade. . . . . . . . . . . . . . . . . . .
Gain Scheduling - Pitch. . . . . . . . . . . . . . . . . . . . . .
Gain Scheduling - Roll. . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
37
38
39
40
40
7.1
7.2
7.3
Diagrama de blocos do MRAS. . . . . . . . . . . . . . . . . . . . . . . . . . .
Diagrama de blocos do STR. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MUSMAR sem integrador aplicado à cadeia de pitch. Ganhos, seguimento e
elevadores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Diagrama de blocos - MUSMAR. . . . . . . . . . . . . . . . . . . . . . . . . .
Diagrama de blocos - MUSMAR com integrador. . . . . . . . . . . . . . . . .
MUSMAR com integrador aplicado à cadeia de pitch e com uma referência no
pseudoestado. Ganhos, seguimento e elevadores. . . . . . . . . . . . . . . . . .
MUSMAR com integrador aplicado à cadeia de pitch e sem referências no pseudoestado. Ganhos, seguimento e elevadores. . . . . . . . . . . . . . . . . . . .
MUSMAR com inclusão da variável de estado Q. Ganhos, seguimento e elevadores.
MUSMAR com velocidade variável. Velocidade e seguimento. . . . . . . . . . .
MUSMAR com velocidade variável. Ganhos e elevadores. . . . . . . . . . . . .
MUSMAR com menor peso na cadeia de controlo. Velocidade e seguimento. .
MUSMAR com velocidade variável e com ρ variável. Velocidade e seguimento.
Influência do horizonte T no custo. . . . . . . . . . . . . . . . . . . . . . . . .
MUSMAR - cadeia de yaw. Ganhos, seguimento e ailerons. . . . . . . . . . . .
MUSMAR - cadeia de velocidade. Ganhos, seguimento e Th. . . . . . . . . . .
41
42
Diagrama de blocos genérico de navegação, guiamento e controlo. . . . . . . .
Diagrama de blocos - referências e saı́das. . . . . . . . . . . . . . . . . . . . . .
Transformação do vector velocidade nos vários componentes vectoriais. ∗ representa a projecção no plano XOY e não o plano X ou o plano Y. . . . . . . . .
Aproximação polinomial para cálculo do offset de pitch - resultado obtido e
respectivo zoom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Subida em malha aberta - altitude e erro à trajectória . . . . . . . . . . . . . .
Subida em malha fechada - altitude e erro à trajectória . . . . . . . . . . . . .
Circunferência em malha aberta - trajectória no plano XOY, altitude e erro à
trajectória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
56
7.4
7.5
7.6
7.7
7.8
7.9
7.10
7.11
7.12
7.13
7.14
7.15
8.1
8.2
8.3
8.4
8.5
8.6
8.7
xii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
34
35
36
36
46
47
48
48
49
50
50
51
51
52
53
54
54
57
59
60
60
61
LISTA DE FIGURAS
8.8
8.9
8.10
8.11
8.12
8.13
8.14
Circunferência em malha aberta - referências geradas para os controladores internos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Circunferência em malha fechada - trajectória no plano XOY, altitude e erro à
trajectória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Espiral em malha aberta - trajectória no plano XOY, altitude e erro à trajectória
Espiral em malha aberta - trajectória . . . . . . . . . . . . . . . . . . . . . . .
Espiral em malha fechada - trajectória no plano XOY, altitude e erro à trajectória
Espiral em malha fechada - trajectória . . . . . . . . . . . . . . . . . . . . . .
Sinusóide lateral com uma rajada de ar . . . . . . . . . . . . . . . . . . . . . .
61
62
62
63
63
64
64
A.1 Diagrama de blocos em Simulink do modelo da aeronave. . . . . . . . . . . . .
74
B.1
B.2
B.3
B.4
75
76
77
77
Giroscópio de rotação.
Giroscópio vertical. . .
Tubo de Pitot. . . . .
GPS. . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
C.1 Resposta ao escalão do sistema linear e não linear para as várias regiões. . . .
C.2 Resposta ao escalão dos modelos obtidos para as várias zonas de funcionamento.
C.3 Diagrama de Bode para os 4 pontos de funcionamento. . . . . . . . . . . . . .
C.4 Mapa dos pólos e zeros para as diferentes velocidades. . . . . . . . . . . . . . .
C.6 Resposta ao escalão dos modelos obtidos. . . . . . . . . . . . . . . . . . . . . .
C.9 Resposta ao escalão do sistema linear e não linear para as várias cadeias. . . .
C.10 Resposta ao escalão dos modelos obtidos para as várias zonas de funcionamento..
D.1 Esquema de um controlador com dois graus de liberdade.
D.2 Diagramas de Bode de modelos de incerteza - pitch. . . .
D.3 Verificação da condição de estabilidade robusta. . . . . .
D.4 Diagramas de Bode de modelos de incerteza - velocidade.
D.5 Diagramas de Bode de modelos de incerteza - pitch. . . .
D.6 Controlo de velocidade (18 m/s) - saı́das e actuações. . .
D.9 Controlo de pitch (18 m/s) - saı́das e actuações. . . . . .
xiii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
81
81
82
83
84
84
86
86
87
88
88
89
90
91
93
94
94
95
97
98
98
99
99
100
LISTA DE FIGURAS
D.12 Controlo de roll (18 m/s) - saı́das e actuações. . . . . . . . . . . . . . . . . . .
100
101
101
102
D.16 Controlo de yaw (18 m/s) - saı́das e actuações. . . . . . . . . . . . . . . . . . .
102
103
103
104
E.1 MUSMAR - cadeia de roll. Ganhos, seguimento e ailerons. . . . . . . . . . . .
109
E.2 MUSMAR - cadeia de roll com velocidade variável. Velocidade e seguimento. .
109
E.3 MUSMAR - cadeia de roll com velocidade variável. Ganhos e ailerons. . . . . .
110
F.1 Sistema de guiamento em malha aberta . . . . . . . . . . . . . . . . . . . . . .
111
F.2 Sistema de guiamento em malha fechada . . . . . . . . . . . . . . . . . . . . .
111
F.3 Subida em malha aberta - referências geradas para os controladores internos .
112
F.4 Subida em malha fechada - referências geradas para os controladores internos .
112
F.5 Circunferência em malha fechada - referências geradas para os controladores
internos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
113
F.6 Espiral em malha aberta - referências geradas para os controladores internos .
113
F.7 Espiral em malha fechada - referências geradas para os controladores internos .
114
F.8 Curva em malha aberta - trajectória no plano XOY, altitude e erro à trajectória 114
F.9 Curva em malha aberta - referências geradas para os controladores internos . .
115
F.10 Curva em malha fechada - trajectória no plano XOY, altitude e erro à trajectória115
F.11 Curva em malha fechada - referências geradas para os controladores internos .
116
F.12 Circunferência em malha aberta - trajectória no plano XOY, altitude e erro à
trajectória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
116
F.13 Circunferência em malha aberta - referências geradas para os controladores internos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
117
F.14 Circunferência em malha fechada - trajectória no plano XOY, altitude e erro à
trajectória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
117
F.15 Circunferência em malha fechada - referências geradas para os controladores
internos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
118
F.16 Sinusóide lenta em malha aberta - trajectória no plano XOY, altitude e erro à
trajectória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
118
F.17 Sinusóide lenta em malha aberta - referências geradas para os controladores
internos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
119
F.18 Sinusóide lenta em malha fechada - trajectória no plano XOY, altitude e erro à
trajectória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
119
F.19 Sinusóide lenta em malha fechada - referências geradas para os controladores
internos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
120
xiv
LISTA DE FIGURAS
F.20 Sinusóide rápida em malha aberta - trajectória no plano XOY, altitude e erro à
trajectória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
F.21 Sinusóide rápida em malha aberta - referências geradas para os controladores
internos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
F.22 Sinusóide rápida em malha fechada - trajectória no plano XOY, altitude e erro
à trajectória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
F.23 Sinusóide rápida em malha fechada - referências geradas para os controladores
internos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
F.24 Subida em malha aberta - altitude e erro à trajectória . . . . . . . . . . . . . .
F.25 Subida em malha aberta - referências geradas para os controladores internos .
F.26 Subida em malha fechada - altitude e erro à trajectória . . . . . . . . . . . . .
F.27 Subida em malha fechada - referências geradas para os controladores internos .
F.28 Sinusóide em altitude em malha aberta - altitude e erro à trajectória . . . . .
F.29 Sinusóide em altitude em malha aberta - referências geradas para os controladores internos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
F.30 Sinusóide em altitude em malha fechada - altitude e erro à trajectória . . . . .
F.31 Sinusóide em altitude em malha fechada - referências geradas para os controladores internos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
xv
120
121
121
122
122
123
123
124
124
125
125
126
Lista de Tabelas
2.1
2.2
Pontos de equilı́brio para diferentes velocidades. . . . . . . . . . . . . . . . . .
Variação nas saı́das face a perturbações em cada entrada. . . . . . . . . . . . .
9
10
5.1
Especificações para os Controladores. . . . . . . . . . . . . . . . . . . . . . . .
29
8.1
Interpolação - offset do pitch. . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
C.1 Resultados da identificação TH → V elocidade U . . . . . . . . . . . . . . . . . .
C.2 Largura de banda, margem de fase e margem de ganho dos sistemas TH →
V elocidade U . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C.3 Resultados da identificação ηe → θ. . . . . . . . . . . . . . . . . . . . . . . . .
C.4 Largura de banda, margem de fase e margem de ganho dos sistemas ηe → θ. .
C.5 Resultados da identificação ηa → φ. . . . . . . . . . . . . . . . . . . . . . . . .
C.6 Resultados da identificação φ → ψ. . . . . . . . . . . . . . . . . . . . . . . . .
80
D.1
D.2
D.3
D.4
95
96
96
97
Controladores
Controladores
Controladores
Controladores
R,
R,
R,
R,
S
S
S
S
e
e
e
e
T
T
T
T
da
da
da
da
cadeia
cadeia
cadeia
cadeia
de
de
de
de
velocidade para as várias regiões.
roll para as várias regiões. . . . .
yaw para as várias regiões. . . . .
pitch para as várias regiões. . . .
xvii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
82
83
85
87
89
Notação
Lista de sı́mbolos - aeronáutica
A
Aspect ratio.
a
Declive da curva de sustentação para a asa finita.
b
Envergadura.
c
Corda da asa.
CM
D
Coeficiente do momento de pitch.
Arrasto.
e
Factor de eficiência da aeronave.
g
Aceleração gravı́tica.
hF
Altura desde o eixo Ox ao centro de pressões do estabilizador vertical.
Ixx , Iyy , Izz
Momentos de inércia em torno dos eixos Ox , Oy e Oz , respectivamente.
Ixy , Iyz , Ixz
Produtos de inércia no sistema cartesiano Oxyz .
Ke
Taxa de crescimento do motor.
l
Sustentação por unidade de comprimento.
l
Comprimento, braço de um momento.
L
Momento de roll.
L
Sustentação.
m
Massa do avião.
M
Momento de pitch.
N
Momento de yaw.
xix
Notação
Ox , Oy , Oz
Eixo, no referencial Avião dos xx, yy e zz, respectivamente.
Oxy
Plano, no referencial Avião, formado pelos vectores Ox e Oy .
Oxz
Plano, no referencial Avião, formado pelos vectores Ox e Oz .
P
PP
Pmax
Q
Velocidade angular de roll.
Passo do hélice.
Potência máxima.
Velocidade angular de pitch.
q
Pressão dinâmica.
R
Velocidade angular de yaw.
T
AR
Matriz de transformação dos vectores do referencial Avião para Terra.
A
TR
Matriz de transformação dos vectores do referencial Terra para Avião.
S
Área de uma superfı́cie.
Sd
Área do disco do hélice.
T
Tracção do propulsor.
TH
Ajuste da abertura do carburador.
Tθ , T φ , T ψ
U
Matriz associada à rotação do ângulo θ, φ e ψ respectivamente.
Velocidade segundo o eixo Ox .
A
V
Vector definido no referencial A.
T
V
Vector definido no referencial T.
V
Velocidade segundo o eixo Oy .
VxT
Velocidade segundo o eixo XT .
VyT
Velocidade segundo o eixo YT .
xx
Notação
VzT
Velocidade segundo o eixo ZT .
V
Velocidade do avião.
V0
Velocidade através do hélice.
W
Velocidade segundo o eixo Oz .
XT , YT , ZT
Eixo, no referencial Terra dos xx, yy e zz, respectivamente.
X
Força segundo o eixo Ox .
Y
Força segundo o eixo Oy .
Z
Força segundo o eixo Oz .
α
Ângulo de ataque ou de incidência.
αL0
Ângulo de sustentação nula.
β
Ângulo de deslizamento lateral ou sideslip.
∆
Variação do ângulo de sustentação nula por variação da deflexão da superfı́cie móvel.
η
Ângulo de deflexão da superfı́cie de controlo.
γ1 ...γ11
Parâmetros vários do modelo.
φ
Ângulo de inclinação lateral ou de roll.
ψ
Ângulo de azimute ou de roll.
ρ
Densidade do ar.
θ
Atitude ou ângulo de pitch.
εT
Ângulo de incidência do estabilizador horizontal.
xxi
Notação
Lista de ı́ndices - aeronáutica
(.)ac
Referente ao centro aerodinâmico.
(.)a
Referente a componentes aerodinâmicas.
(.)g
Referente a componentes gravı́ticas.
(.)p
Referente a componentes propulsivas.
(.)a
Referente ao aileron.
(.)e
Referente ao leme de profundidade.
(.)f
Referente ao flap.
(.)r
Referente ao leme de direcção.
(.)W
Referente à asa.
(.)T
Referente ao estabilizador horizontal.
(.)F
Referente ao estabilizador vertical.
(.)B
Referente à fuselagem.
xxii
Notação
Lista de sı́mbolos - controlo
A, B, C
Polinómios que representam o modo como estes afectam a saı́da, a entrada e o
ruı́do respectivamente.
E(.|I)
Operador valor médio condicionado à informação I(t).
f load
Variável que possibilita carregar ou não o estado realizado na simulação anterior.
I
Matriz identidade.
J
Funcional de custo.
kp , k i , k d
Ganho proporcional, integral e derivativo, respectivamente.
NA
Número de amostras do erro de seguimento no pseudoestado.
NB
Número de amostras da entrada no pseudoestado.
NG
Número de amostras da referência no pseudoestado.
NV
Número de amostras da perturbação acessı́vel, V (t), no pseudoestado.
NX
Número de amostras da perturbação acessı́vel, X(t), no pseudoestado.
NW
Número de amostras da perturbação acessı́vel, W (t), no pseudoestado.
q
Operador avanço.
(.)∗ (q −1 )
Operador atraso q −1 .
R, S, T
Controlador polinomial - polinómio ligado à entrada, referência e à saı́da, respectivamente.
S
s(.)
Sobreelevação.
Pseudoestado.
T
Horizonte de predição.
Ts
Perı́odo de amostragem.
ts
Tempo de estabelecimento.
xxiii
Notação
y(.), u(.), r(.)
Saı́da, entrada e referência de um processo, respectivamente.
ρ
Factor de penalização da acção de controlo.
η
Dither.
λ
Factor de esquecimento.
ỹ
Erro associado a y.
ŷ
Valor estimado de y.
xxiv
Notação
Abreviaturas
ARMAX
ARX
Auto-Regressive Moving Average with Exogenous Input.
Auto-Regressive with Exogenous Input.
D/A, A/D
DFRLS
Conversor Digital-Analógico e Analógico-Digital, respectivamente.
Directional Forgetting Recursive Least Squares.
GPC
Generalized Predictive Control.
GPS
Global Positioning System.
IV
Variáveis Instrumentais.
LQ
Linear Quadrático.
MIMO
Multiple Input Multiple Output.
MISO
Multiple Input Single Output.
MRAS
Model-Reference Adaptive Systems.
MUSMAR
NASA
PEM
PID
PI
PD
PRBS
STR
UAVs
ZOH
Multivariable Multipredictive Adaptive Regulator.
National Aeronautics and Space Administration.
Minimização do Erro de Predição.
Proporcional-Integral-Derivativo.
Proporcional-Integral.
Proporcional-Derivativo.
Pseudo Random Binary Signals.
Self-Tuning Regulator.
Uninhabited Aerial Vehicles.
Zero Order Hold.
xxv
Capı́tulo 1
Introdução
Este trabalho aborda o problema do controlo automático de uma aeronave não tripulada.
Nos dias que correm, com o constante desenvolvimento da indústria de aviação, são muitos os
aviões, militares e comerciais, a serem projectados e construı́dos.
Uma das áreas mais activas no desenvolvimento de aviões é a dos veı́culos aéreos não tripuláveis
(Uninhabited Aerial Vehicles - UAVs) onde actualmente 32 nações estão a desenvolver e construir mais de 250 modelos. Só o Estados Unidos, a nı́vel militar, tem 20 ou em serviço (Predator, Pioneer, Hunter e Shadow 200 ) em desenvolvimento (Global Hawk, Fire Scout, Predator
B, etc.) prevendo-se que o investimento deste, no departamento da defesa, seja superior a 10
biliões de dollars em 2007 correspondendo a um aumento para 300 sistemas de UAVs em 2010.
A sua utilidade é bastante notória em diversas aplicações como as militares (e.g. reconhecimento, controlo de fronteiras, etc.) e civis (e.g. procura e salvamentos, vigia em pontos de
interesse como o espaço marı́timo, o florestal, o tráfego, etc.). Mesmo a National Aeronautics
and Space Administration ( NASA) está desenvolver UAVs para pesquisas atmosféricas.
Pretende-se, com os UAVs, propiciar maior segurança e eficiência em tarefas de grande importância para o mundo e sociedade sendo para isso necessário certos automatismos. Deste
modo foram/são muitos os estudos realizados, separando a metodologia tradicional os sistemas
automáticos em 3 grandes partes - Navegação, Guiamento e Controlo.
A primeira permite o conhecimento dos estado da aeronave nomeadamente as posições, velocidades e acelerações em relação a um determinado referencial. O guiamento tem o objectivo
de determinar a melhor trajectória e os movimentos necessários para a executar. Por fim o
último sistema tem a função de realizar o controlo da aeronave, segundo os ângulos associados
aos 3 eixos: Ox , Oy e Oz . Na figura 1.1 pode-se ver a forma do sistema genérico de navegação,
guiamento e controlo.
Forças e
momentos
exteriores
Actuação
Comando
Trajectória
Guiamento
Controlo
Aeronave
Posição,
Velocidade,
Aceleração
Navegação
Figura 1.1: Diagrama genérico de navegação, guiamento e controlo.
1
Introdução
1.1
Conteúdo e estrutura do relatório
Este relatório tem a seguinte estrutura:
No primeiro capı́tulo é dada uma perspectiva geral do problema em estudo e uma noção do
que é apresentado neste trabalho.
Segue-se o segundo capı́tulo onde se explica, caracteriza o modelo da aeronave e implementa-se
o modelo da aeronave em Simulink versão 5.0 do MATLAB versão 6.5. Realiza-se a simulação
e caracterização dinâmica do modelo. Esta última inclui regimes lineares e não lineares, modos
de oscilação próprios do avião e variação do regime linear em função do ponto de trabalho.
Apresenta-se no terceiro capı́tulo os efeitos atmosféricos e o ruı́do nos sistemas e sensores que
possam afectar a aeronave.
No quarto capı́tulo projecta-se a arquitectura do sistema de controlo recorrendo a técnicas de
controlo clássico (PID - proporcional, integral, derivativo).
Posteriormente no quinto capı́tulo projectam-se os controladores, discretos, locais lineares para
as várias cadeias de controlo (recorre-se aos princı́pios do controlo polinomial).
No sexto capı́tulo integram-se os controladores obtidos numa arquitectura de gain scheduling.
Estuda-se técnicas de controlo adaptativo nomeadamente o algoritmo MUSMAR no sétimo
capı́tulo.
No oitavo capı́tulo apresenta-se um sistema de guiamento para a aeronave
Por último no nono capı́tulo retiram-se as conclusões ao trabalho desenvolvido.
1.2
Contribuições e considerações do trabalho
As contribuições deste trabalho são:
• Implementação em Simulink de um modelo da dinâmica de uma aeronave de pequenas
dimensões.
• Caracterização da dinâmica deste modelo incluindo regimes lineares e não lineares.
• Projecto de um sistema de controlo de voo.
• Projecto de controladores locais lineares usando técnicas polinomiais.
• Integração dos controladores numa arquitectura gain scheduling.
• Desenvolvimento de controladores adaptativos.
• Projecto de uma sistema de guiamento.
No desenvolvimento do modelo da dinâmica da aeronave não se teve em conta dinâmicas
adicionais por parte dos sensores.
2
Capı́tulo 2
Aeronave - simulação e análise do
modelo
Neste capitulo apresenta-se o modelo fı́sico da aeronave, de pequenas dimensões utilizada.
O modelo é obtido a partir de um aeromodelo (Figura 2.1) de 1/4 de escala de um Piper PA
18 Super Cub equipado com um motor de 50 cc.
Elevador
Ailerons
Leme
Flaps
Figura 2.1: Desenho do aeromodelo.
As suas caracterı́sticas principais são as seguintes:
• Envergadura = 2.7 m
• Comprimento = 1.72 m
• Massa = 10.5 Kg
O motor que equipa este avião é um QUADRA de 50 cc a dois tempos, capaz de fornecer uma
potência de 3.4 KW (4.5 bhp). Em voo, o aeromodelo atinge velocidades entre 70 e 100 km/h.
2.1
Sistema de eixos de referência
Definem-se os seguintes sistemas referenciais:
No sistema Avião, fixo à aeronave, o eixo Ox aponta para a frente; o eixo Oy aponta no sentido
da asa direita; e o eixo Oz aponta para baixo (figura 2.2).
Define-se ainda outro sistema de eixos que é o sistema Terra. Neste, XT , YT e ZT , são definidos
apontando para Norte, Este, e para o centro da terra, respectivamente (Figura 2.2).
Neste trabalho, os gráficos relacionados com a altitude encontram-se com o sentido do eixo ZT
trocado, para uma melhor vizualização/compreensão dos resultados.
Inicialmente definiu-se que estes dois referenciais encontram-se alinhados, existindo apenas
uma diferença segundo Z (translação).
3
Aeronave - simulação e análise do modelo
Oy
Y,V
O
Q,
O
Ox
X,U
P,
YT(E)
TERRA
XT(N)
Oz
R,
Z,W
ZT
Figura 2.2: Referenciais Terra e Avião e sentidos positivos para velocidades lineares e angulares.
São também definidos, três ângulos (φ, θ, e ψ) denominados ângulos de Euler para a orientação
da aeronave (Figura 2.2).
• φ Ângulo de inclinação lateral ou de roll
• θ Atitude longitudinal ou ângulo de pitch
• ψ Azimute ou ângulo de yaw
A transformação do referencial Terra para o referencial Avião, pode ser obtida por uma
sequência de três rotações, tendo cada rotação uma matriz associada. A transformação total
é obtida pelo produto das três matrizes, multiplicadas pela ordem de rotação. As sequências
de rotações seguem tipicamente a seguinte ordem: yaw ψ, pitch θ e roll φ. As matrizes de
rotação são dadas por:

Tψ
Tθ
Tφ

cos(ψ) sin(ψ) 0
=  −sin(ψ) cos(ψ) 0 
0
0
1


cos(θ) 0 −sin(θ)

1
0
=  0
sin(θ) 0 cos(θ)


1
0
0
=  0 cos(φ) sin(φ) 
0 −sin(φ) cos(φ)
(2.1)
(2.2)
(2.3)
A matriz total é então definida por:


c(ψ)c(θ)
s(ψ)c(θ)
−s(θ)
A
 c(ψ)s(θ)s(φ) − s(ψ)c(φ) s(ψ)s(θ)s(φ) + c(ψ)c(φ) c(θ)s(φ) 
TR =
c(ψ)s(θ)c(φ) + s(ψ)s(φ) s(ψ)s(θ)c(φ) − c(ψ)s(φ) c(θ)c(φ)
(2.4)
Nota: s(.) e c(.) corresponde, respectivamente, a sin(.) e cos(.).
Esta matriz transforma coordenadas de vectores do referencial Terra, em coordenadas do referencial Avião. A transformação inversa é dada pela transposta da matriz anterior.
4


c(ψ)c(θ) c(ψ)s(θ)s(φ) − s(ψ)c(φ) c(ψ)s(θ)c(φ) + s(ψ)s(φ)
T
 s(ψ)c(θ) s(ψ)s(θ)s(φ) + c(ψ)c(φ) s(ψ)s(θ)c(φ) − c(ψ)s(φ) 
AR =
−s(θ)
c(θ)s(φ)
c(θ)c(φ)
(2.5)
Esta matriz transforma coordenadas de vectores do referencial Avião, A V , em coordenadas do
referencial Terra, T V , do seguinte modo:
T
V =TA RA V
(2.6)
Dado que a trajectória de voo da aeronave não coincide, normalmente, com o eixo longitudinal
do avião definem-se os ângulos:
• α - ângulo de ataque ou de incidência
• β - ângulo de deslizamento lateral ou de sideslip
Estes correspondem aos ângulos que o vector velocidade faz com o eixo Ox nos planos Oxz e
Oxy do avião, respectivamente como se pode ver na figura 2.3.
x
V
x
V
Figura 2.3: Sentidos positivos dos ângulos de ataque e de sideslip.
2.2
Modelo da aeronave
A base do modelo teve como referência o trabalho e tese de mestrado de Luı́s Mendonça Rato
e Rui Neves da Silva ([2],[3]).
O modelo da aeronave pode ser visto como a associação de 3 submodelos - modelo gravı́tico,
modelo aerodinâmico e modelo propulsivo. Estes tem a finalidade de calcular as forças (X, Y e Z)
e momentos externos (L, M e N ) existentes na aeronave.
Com as forças e momentos calculam-se as velocidade lineares (U, V e W ) e rotacionais
(P, Q e R) da aeronave. A partir das velocidades de rotação obtém-se os ângulos de Euler
(θ, φ e ψ).
No anexo A apresentam-se todas as equações do modelo e os respectivos parâmetros, a partir
dos quais foi possı́vel implementar o modelo em Simulink. O diagrama de blocos em Simulink
pode ser visualizado também no anexo A.
5
2.3
Simulação e Análise
Nesta secção descreve-se a simulação do modelo não linear usando o sistema de blocos Simulink
implementado, e caracteriza-se o modelo do ponto de vista do comportamento dinâmico.
O modelo tem como entradas:
• deflexão dos ailerons - ηa
• deflexão do leme de estabilização horizontal - ηe
• deflexão do leme de estabilização vertical - ηr
• deflexão dos flaps - ηf
• abertura da admissão de ar do motor - TH
Em baixo mostram-se os sentidos positivos dos deflectores.
r
f
a
a
e
Figura 2.4: Sentidos positivos das deflexões das superficies móveis.
e como saı́das:
• velocidades segundos os eixos Ox , Oy e Oz (U , V , W )
• velocidades de rotação em torno dos eixos Ox , Oy e Oz (P , Q, R)
• ângulos de roll, de pitch e de yaw
O modelo simulado tem algumas diferenças em relação ao modelo completo apresentado devido
a algumas simplificações na dinâmica do propulsor. Considera-se que no modelo propulsivo
que as forças aplicadas são apenas segundo o eixo longitudinal e os momentos são nulos.
O ponto de equilı́brio, que corresponde a um voo em linha recta, na horizontal atinge-se com:
• Potência. 6.24%
• Deflexão ailerons: 0.0 rad
• Deflexão elevadores: -0.0285 rad
• Deflexão leme: 0.0 rad
• Deflexão flaps: 0.0 rad
• Velocidade: 21.156 m/s
6
• Pitch: 5.6 × 10−5 rad
É em torno desta situação de equilı́brio que se faz a análise do comportamento dinâmico
do sistema. A introdução de perturbações nos actuadores vai excitar os modos de oscilação
próprios do avião, modos estes que podem ser divididos em modos longitudinais e laterais.
2.3.1
Modos Longitudinais - Phugoid e Perı́odo Curto
A estabilidade da dinâmica longitudinal de uma perturbação pode ser vista pelo conhecimento
dos valores próprios da matriz Along (matriz da dinâmica longitudinal de dimensão 4x4).
Expandindo a equação |λI −Along | = 0 chega-se a uma equação de 4a ordem. Para a maioria dos
tipos de aeronave constata-se que a equação invariavelmente factoriza em 2 factores quadráticos
(que correspondem a dois modos de movimento - Phugoid e o Perı́odo Curto),
2
2
(λ2 + 2ζph wph λ + wph
)(λ2 + 2ζpc wpc λ + wph
)=0
(2.7)
O modo de oscilação Phugoid é um modo que se caracteriza por oscilações muito lentas de
velocidade e altitude. Este modo é excitado introduzindo uma perturbação nos elevadores. Na
figura 2.5 observa-se o resultado face a uma pequena perturbação. Como seria de esperar há
pequenas variações em θ, tendendo este ângulo para a posição de equilı́brio no final.
O modo de Perı́odo Curto é também provocado por perturbações nos elevadores e está relacionado com a dependência do momento aplicado na cauda com o ângulo de ataque, α. Por
observação da figura 2.5 pode-se identificar o modo oscilatório de perı́odo curto, o qual tem
variações de amplitude muito baixas e se extingue rapidamente.
θ [º]
5
0
−5
250
300
350
400
450
250
300
350
400
450
250
300
350
400
450
α [º]
1
0.5
Elevadores [º]
Elevadores [º]
0
−1.6
−1.8
−2
−2.2
Tempo [s]
Figura 2.5: Modos Longitudinais - Phugoid e Perı́odo Curto.
2.3.2
Modos Laterais - Yaw, Espiral e Roll
De forma análoga aos modos longitudinais, da expansão de |λI − Alat | = 0 onde Alat agora
representa a dinâmica lateral de dimensão 5x5, chega-se uma equação de 5a ordem. Esta
equação pode ser factorizada em 4 factores em que um deles é quadrático (modo yaw ). Dois
7
dos outros 3 factores correspondem ao modo roll e ao espiral e o último factor (com valor
próprio nulo) representa a variável de estado,não realimentada, ψ.
λ(λ + e)(λ + r)(λ2 + 2ζy wy λ + wy2 ) = 0
(2.8)
O modo oscilatório de Yaw representado na figura 2.6 é um modo de oscilação lateral que é
excitado introduzindo perturbações no leme. Como se observa da figura 2.6 verifica-se que ψ
aumenta ao longo do tempo, sendo tal o esperado visto que ao leme foi aplicado um escalão.
O ângulo β inicialmente aumenta devido à perturbação tendendo para a posição de equilı́brio
no final.
Em resultado das perturbações no leme existe também um outro modo lateral. Trata-se do
modo espiral representado da figura 2.6. Este modo pode ser estável ou instável, no entanto é
sempre muito lento. Como se observa pela figura o modo espiral trata-se de um volta praticamente coordenada, no referencial Terra, volta na qual a inclinação provoca a compensação da
força centrı́fuga com a componente radial de sustentação.
Face a perturbações nos ailerons é excitado o modo de roll, que se observa na figura 2.6.
Como é visı́vel a perturbação nos ailerons provoca uma variação do roll, ângulo φ, e ao fazer
os ailerons retornar à sua posição original o ângulo φ retorna ao estado inicial. Este modo
permite também a manobra de curva por parte da aeronave.
0
0
−ψ
β
−10
−5
−15
φ [º]
ψ e β [º]
−5
−20
−10
−25
248
250
252
254
256
Tempo [s]
258
260
1000
−15
200
Y [m]
500
300
250
300
350
400
450
350
400
450
0.1
−500
−1000
0
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
X [m]
Ailerons [º]
−0.1
0
Leme [º]
250
0
−0.25
−0.2
−0.3
−0.4
−0.5
200
250
300
Tempo [s]
350
400
450
−0.5
200
Tempo [s]
Figura 2.6: Modos Laterais - Yaw, Espiral e Roll.
2.3.3
Caracterização dinâmica
Tendo em conta o ponto de equilı́brio definido é possı́vel obter o modelo linearizado do sistema.
ẋ = Ax + Bu
y = Cx + Du
(2.9)
No caso em estudo são admitidos como estados do sistema as saı́das referidas anteriormente
assim como as dinâmicas dos actuadores e a dinâmica para o sistema propulsor. Desta forma e
calculando os valores próprios da matriz A é possı́vel calcular todos os pólos do sistema. Foram
8
obtidos os seguintes pólos:
Pólos = [0, −27.41, −0.54 ± j1.72, −0.01, −5.21 ± j6.11
−11.26, −0.04 ± j0.52, −60, −60, −60, −60]
(2.10)
Os quatro pólos em -60 correspondem às dinâmicas dos actuadores e o pólo em -11.26 corresponde à dinâmica do sistema propulsor, sendo que os restantes correspondem aos pólos dos
modos descritos anteriormente, sendo possı́vel estabelecer uma ligação. Os modos phugoid,
perı́odo curto e yaw são modos oscilatórios, e como tal tem pólos complexos conjugados a eles
associados. Sendo o modo de perı́odo de curto muito rápido terá de ter largura de banda mais
elevada, pelo que corresponde aos pólos em −5.21 ± j6.11. O modo yaw é também um modo
rápido sendo portanto os pólos correspondentes aos colocados em −0.54 ± j1.72. Finalmente
ao modo phugoid estão associados os pólos em −0.04 ± j0.52 o que também está de acordo
como observado na figura 2.5 em que este modo é lento. O modo de roll corresponde a um
sistema de 1a ordem ao qual corresponde o pólo em -27.41 rad/s. Resta apenas o pólo em -0.01
rad/s que corresponde ao modo espiral.
O pólo em 0 corresponde à variável de estado ψ que não é realimentada pelo sistema.
Realizou-se de seguida o estudo de outros pontos de equilı́brio com a alteração da velocidade
da aeronave. Estudaram-se os casos para as velocidades de 21.16 m/s, 15 m/s e 30 m/s,
embora seja possı́vel encontrar inúmeros pontos de equilı́brio com a velocidade. Na tabela 2.1
apresentam-se alguns pontos de equilı́brio para a aeronave.
Velocidade (m/s)
18
21
24
-0.0481 -0.0285 -0.0169
4.72
6.24
8.22
15
ηe (rad) -0.0790
TH (%)
3.88
27
-0.0084
11.00
30
-0.0023
14.57
Tabela 2.1: Pontos de equilı́brio para diferentes velocidades.
Na figura 2.7 observa-se a dependência do lugar geométrico dos valores próprios do sistema
para as velocidades referidas. À medida que a velocidade aumenta os pólos deslocam-se para
a esquerda do semi-plano complexo esquerdo, ou seja correspondentes dinâmicas mais rápidas.
10
8
6
V=21.15
V=15
V=30
4
2
6
0
4
−2
−4
θ [º]
Imaginario
2
0
−6
−2
−8
−4
−10
−6
−8
−10
−70
V=21.15
V=15
V=30
−12
−14
−60
−50
−40
−30
−20
−10
0
10
Real
−16
240
260
280
300
320
340
360
Tempo [s]
380
400
420
440
Figura 2.7: Dependência do lugar geométrico dos valores próprios do sistema com o ponto de
equilı́brio e variação da dinâmica com a velocidade.
9
Na figura é também possı́vel constatar essas dinâmicas, obtidas com o modelo não linear, com
o aumento da velocidade, em que no caso de 30 m/s temos as dinâmicas mais rápidas, que
correspondem a tempos de estabelecimento menores.
Realizou-se uma série de testes tendo em vista uma percepção da dinâmica da aeronave e
das implicações das variações das entradas nas saı́das. As perturbações, com duração de 20
segundos, realizadas com aeronave em equilı́brio (voo horizontal rectilı́neo), foram de 1 grau
para os deflectores e de 10% para a potência do motor.
Na tabela 2.2 apresenta-se os vários casos notando que a 2a coluna corresponde ao equilı́brio.
U (m/s)
V (m/s)
W (m/s)
P
Q
R
φ (rad)
θ (rad)
ψ (rad)
21.1558
0
0.0012
0
0
0
0
0.0001
0
Perturbação em:
ηa
ηe
ηf
33.4471 19.6937 21.9972
-1.0611
0
0
-0.7258 0.2398 -0.0508
-0.1128
0
0
0.3756 0.0020 0.0064
-0.2350
0
0
-1.0281
0
0
-0.1976 -0.0245 0.0009
-4.8365
0
0
ηr
21.9120
0.1014
-0.0589
0.0135
0.0307
0.1153
0.2669
-0.0153
1.2916
TH
20.3652
0
0.0396
0
-0.0173
0
0
0.1560
0
Tabela 2.2: Variação nas saı́das face a perturbações em cada entrada.
No primeiro teste, perturbação nos ailerons, é notória, como seria de esperar, a sua ligação
às velocidades de rotação. Este revela ter uma dinâmica muito rápida, visı́vel na grande
variação de ψ, e uma ligação às rotações não só segundo ψ mas também segundo φ e θ devido
à sustentação. Pode permitir assim realizar curvas com grande eficiência. De notar ainda o
aumento considerativo em U (velocidade ”instantânea”do avião segundo Ox ) devido ao facto
de o avião se encontrar a descer.
Perturbando os elevadores, consegue-se uma variação de θ, como seria de esperar, o que permite
atingir diferentes altitudes.
As saı́das, como é visı́vel, revelam ter para o caso dos flaps uma dependência bastante menor que
qualquer outra entrada. Estes são usados normalmente e apenas em aterragens e descolagens
tendo em vista o aumento da sustentação.
Perturbando o leme vê-se que as implicações nas saı́das são semelhantes ao caso dos ailerons.
Contudo este revela ser mais lento (para o mesmo tempo deu menos voltas) e ser mais independente às outras variáveis de rotação (P e Q) o que o torna mais limitativo.
Pode parecer, como se pode observar pela tabela 2.2, que o aumento na potência do motor não
influencia as velocidades. Tal não é verdade, como seria de esperar, pois apesar das velocidades
do avião se manterem constantes no referencial Avião, estas em relação ao referencial Terra
aumentam (Vz =0 m/s → Vz '4 m/s). Este facto é visı́vel pelo aumento de θ.
10
Capı́tulo 3
Perturbações
Quando se efectua o controlo automático de uma aeronave o seu movimento pode ser afectado
pelos comandos do sistema de guiamento, efeitos atmosféricos e ruı́do nos sistemas e sensores.
Visto que os comandos do sistema de guiamento são perturbações intencionais ou desejadas
estuda-se nesta secção os efeitos atmosféricos e o ruı́do nos sistemas e sensores (perturbações
indesejadas) de modo a que o sistema de controlo as possa atenuar.
3.1
Perturbações atmosféricas
O ar no qual a aeronave voa nunca se encontra parado o que provoca um erro na sua trajectória.
Estas perturbações no ar, também conhecida por turbulência, tem a sua origem em diversos
factores onde o único método capaz de analisar de uma maneira eficaz os problemas dinâmicos
onde esta está envolvida são os métodos estatı́sticos.
No entanto as rajadas de ar, que são bem definidas por uma função determinı́stica particular,
também ocorrem mas de uma forma aleatória.
Apresenta-se de seguida o modelo de uma rajada de ar discreta assim como os modelos
contı́nuos de turbulência.
3.1.1
Modelo de uma rajada de ar discreta
O modelo matemático, representativo de uma rajada discreta (figura 3.1), que melhor se adequa
a uma aeronave tem a forma de (1-cos) sendo definido por:

 0
xg (x) =

Vm
(1
2
Vm
− cos( dπtm ))
se
se
se
x<0
0 < x < dm
x > dm
(3.1)
onde Vm representa a amplitude que varia entre 1m/s (calma) e 20m/s (severa), x a distância
percorrida e dm o comprimento da rajada em metros.
3.1.2
Modelos contı́nuos de turbulência
Existem duas representações analı́ticas para a função densidade espectral de potência da turbulência atmosférica que tem grande utilidade no estudo de controlo de aeronaves.
A primeira representação, espectro de Von Karman, é a melhor adaptada ao espectro obtido
de registos de turbulência atmosférica. No entanto, em estudos analı́ticos é menos adequada
11
Perturbações
12
10
Velocidade do Vento (m/s)
8
6
4
2
0
0
2
4
6
8
10
12
14
16
18
20
Distância (m)
Figura 3.1: Rajada discreta com Vm = 10 m/s e dm = 10 m.
por causa das potências fraccionarias. Em baixo define-se o modelo de Von Karman:
σu2 (2Lu /π)
Φug (Ω) =
[1 + (1.339Lu Ω)2 ]5/6
(3.2)
Φvg (Ω) =
σv2 (Lv /π)[1 + 8/3(1.339Lv Ω)2 ]
[1 + (1.339Lv Ω)2 ]11/6
(3.3)
Φwg (Ω) =
σw2 (Lw /π)[1 + 8/3(1.339Lw Ω)2 ]
[1 + (1.339Lw Ω)2 ]11/6
(3.4)
A segunda representação, modelo de Dryden, é mais adequada porque, por ser mais simples, é
mais facilmente programada e por isso foi a utilizada no trabalho,
Φug (Ω) =
σu2 (2Lu /π)
(1 + L2u Ω2 )
(3.5)
σv2 (Lv /π)(1 + 3L2v Ω2 )
Φvg (Ω) =
(1 + L2v Ω2 )2
Φwg (Ω) =
(3.6)
σw2 (Lw /π)(1 + 3L2w Ω2 )
(1 + L2w Ω2 )2
(3.7)
Nos dois modelos, Ω = Uw0 é a frequência espacial em rad/f t, onde w é a frequência angular
em rad/s; σ é a amplitude r.m.s da turbulência em f t/s, U0 é a velocidade da aeronave em
f t/s e L é um factor de escala em f t.
Os espectros das perturbações das velocidades angulares devido à turbulência são dados por
[11]:
1
w 3
)
σw2 0.8( πL
4b
Φpg (Ω) =
Lw (1 + 4bΩ
)2
π
(3.8)
Φqg (Ω) =
Ω2
Φ (Ω)
2 wg
1 + ( 4bΩ
)
π
(3.9)
Φrg (Ω) =
Ω2
Φvg (Ω)
1 + ( 3bΩ
)2
π
(3.10)
12
Perturbações
onde b é a envergadura. Para o caso do aeromodelo de 1/4 de escala de um Piper PA 18 Super
Cub b = 2.7 m [1].
De acordo com as referências militares [11], para altitudes menores que 300 m tem-se:
σw = 0.1W20 ;
σu
σv
1
=
=
σw
σw
(0.177 + 0.000823h)0.4
Lu = h; Lv = Lw =
h
(0.177 + 0.000823h)1.2
em que W20 é a velocidade do vento a 6 m de altura e h representa a altitude. Tipicamente
para turbulências calmas a 6 m a velocidade do vento é 8 m/s, para turbulências moderadas a
velocidade do vento é 15 m/s e para turbulências severas 23 m/s.
Para altitudes maiores que 600 m a turbulência assume-se isotropica. Assim tem-se:
σu = σw = σv
Lu = Lv = Lw = 1750 f t
A intensidade da turbulência é, neste caso, determinada a partir de uma tabela [11] que indica
a intensidade em função da altitude e da probabilidade da turbulência ser excedida.
Finalmente para altitudes entre 300 m e 600 m as velocidades de turbulência lineares e as
angulares são determinadas a partir de uma interpolação linear dos casos obtidos para 300 m
e 600 m.
De modo a gerar o sinal de turbulência é utilizado ruı́do branco com uma densidade espectral de
potência ΦN (w) = 1.0. Este passa por um filtro com uma determinada resposta em frequência
de modo a que o sinal filtrado tenha uma densidade espectral de potência igual a Φi (w). Com
isto temos:
Φi (w) = |Gi (s)|2s=jw
(3.11)
Com as densidades espectrais de potência definidas anteriormente, (3.5 a 3.10), chegam-se aos
seguintes filtros:
√
Ku
s + λu
√
Kv (s + βv )
Gv (s) =
(s + λv )2
√
Kw (s + βw )
Gw (s) =
(s + λw )2
q
1
w 3
σw 0.8( πL
)
4b
Gp (s) = √
4b
s)
Lw (1 + πU
0
Gu (s) =
(3.12)
(3.13)
(3.14)
(3.15)
Gq (s) =
πsGw (s)
0
4b(s + πU
)
4b
(3.16)
Gr (s) =
πsGv (s)
0
3b(s + πU
)
3b
(3.17)
13
Perturbações
em que,
Ku =
2U0 σu2
3U0 σv2
3U0 σw2
; Kv =
; Kw =
Lu π
Lv π
Lw π
λu =
U0
U0
; λv =
;
Lu
Lv
λw =
U0
U0
U0
; βv = √
; βw = √
Lw
3Lv
3Lw
Esta turbulência afecta a dinâmica da aeronave logo as perturbações devem aparecer em todos
os estados (saı́das e estados realimentados). Assim é necessário ”passar”estas perturbações
pela aeronave.
De modo a simular estas perturbações, tanto a rajada de ar como a representação continua de
turbulência, utilizou-se blocos existentes em Simulink que se baseiam nos modelos. De seguida
apresenta-se um exemplo de turbulência continua utilizando estes mesmos blocos.
3
0.4
2.5
P
Q
R
0.3
Velocidade Angular do Vento (m/s)
Velocidade Linear do Vento (m/s)
2
1.5
1
0.5
0
−0.5
U
V
W
−1
−1.5
0
2
4
6
8
10
12
0.2
0.1
0
−0.1
−0.2
14
16
18
20
Tempo (s)
−0.3
0
2
4
6
8
10
12
14
16
18
20
Tempo (s)
Figura 3.2: Velocidades lineares e angulares com altitude= 1000 m e velocidade= 21 m/s.
3.2
Sensores
A maioria dos sensores utilizados nos sistemas de controlo na aviação são sensores de inércia, tal
como giroscópios e acelerómetros. Assumiu-se que através de um número mı́nimo de sensores,
é possı́vel obter toda a informação para o controlo e estabilização da aeronave (anexo B).
Para a medição das velocidades angulares recorrem-se a giroscópios de rotação; para a medição
dos ângulos de pitch, roll e yaw recorrem-se a giroscópios verticais. Para medição das velocidades e altitude utilizam-se velocı́metros e altı́metros respectivamente. Existem ainda sensores
que nos possibilitam a medição dos ângulos de ataque e sideslip.
Admite-se que os sensores não introduzem dinâmicas adicionais (funcionam apenas como ganhos proporcionais).
O ruı́do no sinal de saı́da, normalmente de origem eléctrica, é tipicamente representado por
um sinal aleatório com distribuição Gaussiana (usualmente caracteriza-se o ruı́do como sendo
estacionário de média nula).
14
Capı́tulo 4
Estrutura do Sistema de Controlo
O objectivo deste capı́tulo é o projecto de um sistema de controlo para a aeronave.
As principais variáveis são reguladas por cadeias de realimentação projectadas separadamente.
Para os controladores das várias cadeias, foram utilizadas neste capitulo técnicas de controlo
clássico (sistemas de controlo usando PIDs). Visto que o objectivo nesta fase não era o desenvolvimento dos controladores mas sim o estabelecimento do diagrama de blocos do sistema de
controlo, as especificações para afinação dos controladores são assim pouco apertadas.
Para as principais cadeias de controlo requeridas pelas manobras mais usuais da aeronave
escolheram-se como variáveis:
• Ângulo de pitch, θ.
• Ângulo de yaw, ψ.
• Ângulo de roll, φ.
• Velocidade, U.
• Altitude, h.
Com base nestas variáveis um piloto ou um sistema de guiamento pode controlar a trajectória
da aeronave.
O ângulo de yaw e o ângulo de roll permitem realizar curvas. A altitude, bem como manobras
de subida/descida, pode ser controlada através do ângulo de pitch e a leitura dos sensores de
altitude. É ainda feito o controlo da velocidade, visto que em certos casos com esta variável
controlada é possı́vel estabelecer relações quase directas entre as variáveis de controlo (por
exemplo o ângulo de pitch e a variação de altitude).
A aeronave contém 5 variáveis de entrada: ailerons, flaps, leme, elevadores e potência do motor
(throttle).
A função dos flaps é, principalmente, aumentar a sustentação máxima nos momentos de
aterragem e descolagem o que fez com que não fosse considerado no sistema de controlo
considerando-se que permanecem na posição de repouso.
Dadas as variáveis de entrada verifica-se que não existe apenas uma única estruturação das
cadeias de controlo por forma a realizar as tarefas desejadas.
4.1
Controlo longitudinal
O controlo longitudinal consiste no controlo da velocidade e altitude. O controlo da velocidade
é benéfico pois existe uma grande sensibilidade da velocidade em relação às variações de pitch,
que tem necessariamente de ocorrer com a variação de altitude. Para além disso, com a
velocidade controlada existe quase uma relação directa com o ângulo de pitch e a variação de
15
altitude, o que é uma caracterı́stica muito vantajosa para o guiamento. Desta forma estas duas
cadeias de controlo funcionam em simultâneo.
Como descrito anteriormente existem várias opções para as cadeias de controlo, sendo neste
trabalho apresentado duas opções. No caso do controlo longitudinal escolheram-se as seguintes
cadeias de controlo:
• Elevadores, ηe → velocidade, U.
• Potência, TH → altitude, h.
ou
• Elevadores, ηe → altitude, h.
• Potência, TH → velocidade, U.
No primeiro caso a cadeia de controlo desenvolvida é muito simples e foi construı́da numa
base muito intuitiva. Este esquema não é muito viável visto que levaria a maiores consumos
de combustı́vel porque para manobras de subida usa-se apenas o motor sendo as variações
da velocidade obtidas variando o arrasto. Outra limitação verifica-se quando se trabalha com
razoáveis diferenças de velocidade onde pode não ser possı́vel manter uma altitude.
No sistema de controlo de velocidade (figura 4.1) o controlador é um PID com ganhos kp = 0.08,
ki = 0.005 e kd = 0.1.
+
r
ηe
K(s)
-
y
G(s)
U
Figura 4.1: Sistema de controlo de velocidade.
Na figura 4.2 apresenta-se o resultado de uma variação da velocidade do estado de equilı́brio
(21.156 m/s) para 22 m/s.
Velocidade [m/s]
22.2
22
21.8
21.6
21.4
21.2
21
296
298
300
302
304
306
308
310
298
300
302
304
306
308
310
25
Elevadores [º]
20
15
10
5
0
−5
296
Figura 4.2: Controlo da velocidade.
Como se observa, a resposta apresenta um comportamento semelhante a um sistema de 1a
ordem, ou seja sem grandes sobreelevações, temos porém um tempo de estabelecimento de
16
cerca de 10 a 15 segundos. Note-se que, apesar de ser pouco visı́vel, existe um efeito de fase
não minima devido ao uso dos elevadores como actuador.
O esquema de controlo para a altitude encontra-se na figura 4.3, em que o controlador é um
simples controlador proporcional de ganho -0.01.
+
r
th
K(s)
-
y
G(s)
Pos z
Figura 4.3: Sistema de controlo de altitude.
Variando a altitude em 10 metros obtém-se o resultado na figura 4.4.
1012
1010
Altitude [m]
1008
1006
1004
1002
1000
998
545
550
555
545
550
555
560
565
570
560
565
570
16
Motor [%]
14
12
10
8
6
Tempo [s]
Figura 4.4: Variação da altitude.
O tempo de estabelecimento é de cerca de 15/20 segundos seguindo posteriormente a referência
com erro estático nulo.
Nas figura 4.5 mostram-se os efeitos da variação da altitude na velocidade e ângulo θ.
Velocidade [m/s]
21.3
21.25
21.2
21.15
21.1
545
550
555
545
550
555
560
565
570
560
565
570
7
6
θ [º]
5
4
3
2
1
0
Tempo [s]
Figura 4.5: Perturbação na velocidade e no pitch causada pela variação na altitude.
Como se observa as variáveis depois de uma perturbação induzida pela variação da referência
acabam por tender para as suas condições de equilı́brio. No caso da velocidade esta estabiliza
17
muito mais depressa graças ao controlador de velocidade que se encontra a funcionar em
paralelo.
No caso da velocidade ser controlada a partir do motor (figura 4.6), o controlador é um PID
com ganhos kp = 0.5, ki = 0.25 e kd = 0.05.
+
r
th
K(s)
-
y
G(s)
U
Figura 4.6: Sistema de controlo de velocidade.
A variação na referência da velocidade (de 21.156 m/s para 22 m/s) está representado na figura
4.7.
Velocidade [m/s]
22.2
22
21.8
21.6
21.4
21.2
21
296
298
300
302
304
306
308
310
298
300
302
304
306
308
310
100
Motor [%]
80
60
40
20
0
296
Tempo [s]
Figura 4.7: Controlo da velocidade.
Como se constata, a variação da velocidade é bastante rápida com erro estático nulo, não se
observando qualquer efeito de fase não minima. O sistema de controlo para a altitude (figura
4.8) é um pouco mais complexo. Consiste na cascata de dois controladores PID, visto que a
variação de altitude é atingida com a variação de ângulo de pitch. O 1o controlador (K1), o da
altitude é um simples controlador proporcional de ganho -0.02; o 2o controlador (K2) para o
ângulo de pitch é um PI (a componente derivativa é ”aproveitada”através do estado Q sendo
a constante K igual a 0.4) cujos valores são kp = −6 e ki = 0.001. Estes valores tem em conta
que o 2o controlador deve ”reagir”de uma forma mais rápida que o 1o .
r
+
K1(s)
Pos z
+
K2(s)
-
+
+
ηe
K
θ
y
G(s)
Q
Figura 4.8: Sistema de controlo de altitude.
Variando a altitude de 1000 m para os 1010 m como se observa na figura 4.9 os tempos de
resposta são aceitáveis e com erro estático nulo.
18
1012
Altitude [m]
1010
1008
1006
1004
1002
1000
998
544
546
548
550
552
554
556
558
560
562
544
546
548
550
552
554
556
558
560
562
0
−2
Elevadores [º]
−4
−6
−8
−10
−12
Figura 4.9: Variação da altitude.
Nas figura 4.10 é possı́vel observar as perturbações na velocidade e a variação no ângulo de
pitch, como já havia sido referido anteriormente.
Velocidade [m/s]
21.3
21.2
21.1
21
20.9
544
546
548
550
552
554
556
558
560
562
544
546
548
550
552
554
556
558
560
562
10
8
θ [º]
6
4
2
0
Tempo [s]
Figura 4.10: Perturbação na velocidade e no pitch causada pela variação na altitude.
Verifica-se, que existem pequenas perturbações na velocidade o que se consegue rejeitar através
do controlador de velocidade.
4.2
Controlo lateral
O controlo lateral é importante para que a aeronave possa executar voltas. A manobra de
curva pode ser obtida de duas formas; uma aeronave faz uma volta variando o leme (o que
implica variação no ângulo de yaw ) ou inclinando-se lateralmente (ângulo de roll ) no sentido
da rotação o que tem como consequência uma variação no ângulo ψ. Desta forma é possı́vel
também desenvolver duas cadeias de controlo.
• Leme, ηr → ângulo de yaw, ψ.
ou
• Ailerons, ηa → ângulo de yaw, ψ.
19
É também necessária a actuação no leme para que a aeronave possa realizar voltas coordenadas,
ou seja evitar deslizamento horizontal, devendo desta forma o ângulo de sideslip (β) ser nulo.
• Leme, ηr → sideslip, β = 0
Apenas para o segundo caso se encontra em funcionamento o regulador de sideslip.
Para o primeiro caso o esquema de controlo é muito simples, controlador PD de ganhos kp = −1
e kd = −6, e pode observar-se na figura 4.11.
+
r
ηr
K(s)
-
y
G(s)
ψ
Figura 4.11: Sistema de controlo de curvas.
Com o controlador desenvolvido é então possı́vel realizar curvas, como é possı́vel observar na
figura 4.12, que mostra uma trajectória descrita no plano [x,y], que resulta da variação do
ângulo de yaw pelo controlador lateral, tal como se mostra na figura 4.13.
400
Posição Y [m]
300
200
100
0
−100
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
Posição X [m]
20
Leme [º]
10
0
−10
−20
340
360
380
400
420
440
460
Tempo [s]
Figura 4.12: Controlo lateral - Variação da posição resultante do controlo lateral.
φ [º]
5
0
−5
340
360
380
400
420
440
460
340
360
380
400
420
440
460
340
360
380
400
420
440
460
ψ [º]
15
10
5
0
β [º]
2
0
−2
Tempo [s]
Figura 4.13: Controlo lateral - yaw, roll e sideslip.
20
Visto que não existe nenhum regulador para o ângulo de sideslip existiram pequenas perturbações no ângulo β como se pode observar na figura 4.13.
Este primeiro controlador actuando apenas no leme será eventualmente insuficiente visto que
não conseguirá realizar manobras de curvas muito ”apertadas”(grandes variações no ângulo de
yaw num curto espaço de tempo).
Foi assim desenvolvido um segundo controlador que permite realizar manobras de uma forma
mais rápida, e que para tal recorre ao uso dos ailerons. Desta forma realimentando as duas
variáveis e actuando nos ailerons obtém-se o sistema de controlo da figura 4.14, que permite
realizar uma volta apertada.
r
+
K1(s)
-
y
ηa
+
K2(s)
-
G(s)
φ
ψ
Como se observa a estrutura do sistema de controlo consiste na cascata de dois PIDs, em que
o 2o controlador (interno) foi projectado de forma a reagir mais rapidamente. Por forma a que
a aeronave realize uma volta coordenada é necessário que β = 0. Para tal implementou-se o
sistema de regulação do ângulo de sideslip que se mostra na figura 4.15.
r
+
ηr
K(s)
-
G(s)
y
β
Os ganhos para os controladores são:
• Controlador de yaw (kp =0.3)
• Controlador de roll (kp = 2 e ki = 0.02)
• Controlador de sideslip (kp = 0.15, ki = 0.15 e kd = 0.3)
Tendo em conta os sistemas de controlo desenvolvidos é possı́vel realizar curvas como é visı́vel
na figura 4.16.
21
400
Posição Y [m]
300
200
100
0
−100
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
Posição X [m]
10
Ailerons [º]
5
0
−5
−10
340
360
380
400
420
440
460
Tempo [s]
Figura 4.16: Controlo lateral - Variação da posição resultante.
Note-se que as figuras 4.12 e 4.16 são praticamente iguais pois simulou-se a mesma manobra
podendo se observar as diferenças, entre estruturas, nas variáveis manipuladas (yaw, roll e
sideslip).
φ [º]
5
0
−5
340
360
380
400
420
440
460
340
360
380
400
420
440
460
340
360
380
400
420
440
460
ψ [º]
15
10
5
0
β [º]
0.5
0
−0.5
Tempo [s]
Figura 4.17: Controlo lateral - Variação da posição resultante do controlo lateral.
Dadas as maiores limitações no primeiro sistema, tanto para o controlo longitudinal como no
lateral, como seria de esperar, irá ter-se em conta a segunda estrutura de controlo, com alguns
ajustes que se irá ver mais adiante, em detrimento da primeira.
22
Capı́tulo 5
Controladores Locais Lineares
O objectivo neste capitulo é o projecto de controladores locais lineares para a aeronave usando
para tal técnicas polinomiais.
A dinâmica linearizada da aeronave, como foi visto anteriormente no capı́tulo 2, varia com
a velocidade. Tendo isto em conta projectaram-se, para cada uma das condições de voo,
controladores locais lineares.
Para o projecto de controladores polinomiais é necessário o conhecimento das funções de transferência entrada-saı́da que se querem controlar. É assim preciso identificar os sistemas para as
várias cadeias de controlo da aeronave. Visto que os controladores são projectados no domı́nio
discreto é necessário amostrar o sistema.
5.1
Amostragem do Sistema
Na figura 5.1 apresenta-se o modelo representativo do sistema amostrado. Na figura o bloco
D/A representa um conversor digital-analógico enquanto que o A/D um conversor analógicodigital (ZOH - Zero Order Hold ).
u(kh)
D/A
u(t)
G(s)
Sistema
y(t)
A/D
y(kh)
Figura 5.1: Modelo de um sistema amostrado.
Em controlo digital uma das principais questões é a escolha do perı́odo de amostragem. Este
varia muito dependente da aplicação (desde milisegundos até horas).
Como regra geral o perı́odo de amostragem deve ser aproximadamente igual a um quinto da
constante de tempo mais rápida, mas também irá depender da velocidade de computação e
outros factores (eg. aquisição de dados).
Quando um sistema contı́nuo é amostrado, os pólos, p, são transformados em epTs , onde Ts
é o perı́odo de amostragem. Porém, não existe uma transformação simples para os zeros.
Por exemplo, não é verdade que um sistema contı́nuo com os zeros no semi-plano esquerdo
transforme-se num sistema discreto com os zeros no interior do cı́rculo unitário. Por outro
lado, é possı́vel obter um sistema discreto com todos os zeros no interior do cı́rculo unitário
de um sistema contı́nuo com zeros no semi-plano direito. Verifica-se que todos os sistemas
contı́nuos com excesso de pólos superior a 2 irá sempre originar sistemas discretos com zeros
instáveis se o perı́odo de amostragem for suficientemente pequeno.
O menor perı́odo de amostragem encontra-se também limitado pelo tempo necessário para
calcular a saı́da de controlo e pelo tempo para actualizar os parâmetros. Uma possı́vel estratégia
para ultrapassar isto é actualizar os parâmetros entre perı́odos de amostragem e calcular a
saı́da de controlo em cada perı́odo de amostragem baseado na mais recente actualização dos
parâmetros.
23
Outra vantagem em manter o perı́odo de amostragem razoavelmente longo é que a largura de
banda do controlador fica limitada, e assim dinâmicas de alta frequências não irão ser excitadas
inadvertidamente pelo controlador.
Todavia perı́odos de amostragem demasiadamente longos podem provocar tempos em malha
aberta excessivos.
Assim quando se escolhe um perı́odo de amostragem, Ts , tem que se ter em conta diversos
factores como:
• Largura de banda pretendida.
• Localização dos zeros do sistema discretizado.
• Possı́vel perda de controlabilidade e/ou observabilidade por amostragem.
• Tempo de cálculo.
• Tipo de perturbações a que o sistema está sujeito.
• O máximo tempo admissı́vel para o sistema permanecer em cadeia aberta.
Tendo estes items em conta e o interesse que a amostragem replique as principais caracterı́sticas
do sistema o que se optou por fazer foi perturbar o sistema e observar a resposta definindo-se
um tempo de amostragem capaz de reproduzir o sistema - num tempo de subida definiu-se 30
amostras. Assim estabeleceu-se como tempo de amostragem 0.1 s.
Com o sistema amostrado passa-se à identificação.
5.2
Identificação
Para o projecto de controladores polinomiais é necessário o conhecimento das funções de transferência entrada-saı́da do sistema que se pretende controlar. No caso da aeronave, como se viu
no capı́tulo 4, temos 4 cadeias de controlo - velocidade, altitude, latitude e sideslip.
A cadeia de altitude foi projectada como uma cascata de dois controladores. Porém no projecto
de controladores locais considerou-se uma nova cadeia definida unicamente pelo controlador de
pitch, visto que o controlo da altitude fará parte do sistema de guiamento. Todavia manteve-se
a arquitectura anterior, para a identificação com o intuito de evitar instabilidade.
A cadeia de sideslip, têm com finalidade levar o β a zero de modo a melhorar a resposta da
cadeia lateral. Assim para esta cadeia manteve-se em funcionamento o controlador obtido no
capı́tulo 4.
A identificação para cada cadeia não pode ser feita excluindo as outras, visto que as variáveis
a controlar não são independentes entre si. Por exemplo, as cadeias de velocidade e altitude,
são influenciadas tanto pelo motor como pelos elevadores. Assim como a cadeia de latitude
e de voltas coordenadas estão ”ligadas entre si”pelos ailerons e leme. Todas estas influências
serão tratadas mais à frente.
Inicialmente antes de realizar a identificação é necessário escolher o método a utilizar. Este
pode ser paramétrico ou não paramétrico.
O método não paramétrico permite determinar, sob a forma de tabela ou gráficos, as respostas
impulsivas e em frequência de um sistema linear. Consegue-se assim uma primeira ideia das
24
principais caracterı́sticas dinâmicas, como as constantes de tempo dominantes, ganhos estáticos
e presença de atraso puro.
Visto que o objectivo é o controlo do sistema, e não a caracterização exaustiva do processo
em causa, escolheu-se o método paramétrico para a identificação, dado que este fornece modelos matemáticos adequados ao projecto de controladores. Para além disso os métodos não
paramétricos revelam sérias dificuldades na obtenção de modelos precisos em sistemas que
necessitem de trabalhar em cadeia fechada.
Dado que tal é necessário, como iremos ver mais adiante, o método paramétrico escolhido terá
que tratar ruı́do colorido. Para tal temos as seguintes alternativas:
• Variáveis Instrumentais (IV ).
• Minimização do Erro de Predição (PEM ).
• Máxima Verosimilhança (Maximum Likehood ).
Nota: os mı́nimos quadrados, em presença de ruı́do colorido, fornecem uma estimativa polarizada.
Escolheu-se a Máxima Verosimilhança (anexo C) por ser o mais geral e poderoso apesar de ser
computacionalmente mais pesado.
5.2.1
Sinal Utilizado
Após a escolha do método, seguem-se os sinais utilizados na identificação. Estes, independentemente do método, se forem mal escolhidos podem prejudicar o sucesso da identificação.
Dir-se-ia logo à partida que o sinal deve abranger toda a gama de frequências do sistema de
modo a se poder caracterizá-lo e por consequente identificá-lo. Por outro lado para que a
estimativa dos parâmetros exista e seja única é necessário que os dados levem a condições de
excitação persistente (dados suficientemente ”ricos”). Um sinal em que tal se verifica e que é
bastante usual na identificação é o Pseudo Random Binary Signals - PRBS. Este sinal tem as
seguintes caracterı́sticas:
• Binário - possui apenas dois estados (+V e -V).
• Determinı́stico - comuta entre estados em instantes discretos sendo estes pré-determinados.
• Periódico - perı́odo T0 = N.h, onde N é inteiro ı́mpar.
• Em cada perı́odo existem
N +1
2
intervalos a um estado e
N −1
2
a outro.
• A função de autocorrelação, num perı́odo, é semelhante a um impulso e o espectro constante.
Este, que foi o escolhido, tem uma grande vantagem em relação ao ruı́do branco que é o facto
de controlar os valores do sinal. A sua geração foi feita em MATLAB pela função idinput.
Nesta é necessário especificar a amplitude, a duração do sinal e por fim o tempo que queiramos
que este seja constante entre intervalos.
No que diz respeito à amplitude os valores escolhidos foram os mais alargados, de modo a
excitar o sistema o suficiente, mas sem passar do plano de trabalho em causa.
25
Relativamente à duração do sinal esta deve ser superior ao tempo de estabelecimento do sistema. Há aliás uma propriedade do estimador de máxima verosimilhança, a consistência, que
diz que com o aumento das amostras reduz-se a variância da estimativa dos parâmetros. Por
consequente usou-se dados com a duração de 10000 s (aproximadamente 2,78 horas).
Por fim existe um critério que revela que o mı́nimo perı́odo de tempo do sinal PRBS em que
se mantém constante deve ser menor que a menor constante de tempo do sistema.
5.2.2
Estrutura dos Modelos
Finalmente, com o sinal a aplicar tratado e o método escolhido pode-se passar à implementação
deste último. Em MATLAB, a função armax.m implementa o método de estimação por máxima
verosimilhança, podendo-se então obter os polinómios do modelo ARMAX (Auto-Regressive
Moving Average with Exogenous Input),
A(q)y(t) = B(q)u(t) + C(q)e(t)
(5.1)
Estes polinómios representam o modo como estes afectam, num dado instante, a saı́da, a
entrada e o ruı́do respectivamente. Logo terá que se especificar:
• A ordem de A(q) - equivalente ao número de pólos do sistema.
• A ordem de B(q) - equivalente ao número de zeros do sistema mais um.
• A ordem de C(q) - equivalente ao número de zeros do modelo de ruı́do.
• O atraso do sistema.
Através de experiências, como a resposta ao escalão, consegue-se prever, mais ou menos, o tipo
de sistema pela existência ou não de sobreelevações, oscilações ou derivada na origem. Com
isso consegue-se ter uma ideia da ordem do polinómio de A(q).
Para os restantes polinómios, também se consegue tirar algumas intuições no entanto optou-se
por testar diversas ordens e escolher aqueles que melhores resultados originassem.
Depois de se obter os modelos é necessário seleccionar o melhor. Existem diversos critérios
mas há uns mais apropriados que outros. Visto que o número de dados é suficiente optou-se
por repartir os dados em subconjuntos de treino e validação.
O conjunto de treino serve para efectuar a estimação dos parâmetros dos modelos. O conjunto
de validação serve para verificar o comportamento dos modelos estimados em dados novos e
escolher o modelo que produz erro mı́nimo no conjunto de validação.
Realizou-se a seguinte partição dos dados - 2/3 para treino e 1/3 para a validação.
Com estes subconjuntos realiza-se uma comparação, através da função do MATLAB ’compare.m’, entre os dados experimentais e a predição 10 passos à frente do modelo obtido. Todos
os dados anteriores ao instante actual são usados na predição. Com isto consegue-se obter, em
percentagem, o ajuste de treino e de validação.
Por não existir o critério ideal validou-se também a nı́vel gráfico, nomeadamente com a resposta
ao escalão.
26
5.2.3
Simulação
Existem algumas considerações importantes no processo de identificação.
Aos dados da simulação removeram-se as tendências lineares pela função do MATLAB ’detrend.m’. Esta subtrai aos dados a recta mais bem ajustada. Tal é feito pois interessa apenas
o comportamento dinâmico do processo e não constantes inerentes ao modelo da aeronave, que
prejudicam a identificação.
Quanto às zonas de funcionamento optou-se por separar o plano de trabalho em 4 zonas velocidade baixa (18 m/s), velocidade média-baixa (22 m/s), velocidade média-alta (26 m/s)
e velocidade alta (30 m/s). A escolha destas zonas foi determinada por via experimental.
Na escolha dos modelos teve-se em conta o seguinte critério: dos 4 melhores modelos, para
cada ponto de funcionamento, em termos de ajuste de validação, seleccionou-se o que tinha
melhor ajuste gráfico (resposta ao escalão).
Apesar de não ser um processo nada simples, devido à interligação entre estados da aeronave, e
de ser uma das fases mais delicadas no projecto de controladores, os resultados da identificação
para as várias cadeias apresentam-se no anexo C pois não fazem parte dos objectivos fulcrais
do trabalho.
5.3
Princı́pios do Controlo Polinomial
O objectivo nesta fase é o projecto de controladores polinomiais com dois graus de liberdade
com a estrutura que se mostra na figura 5.2,
d
r
T
R
u
B
A
y
S
R
Figura 5.2: Esquema de um controlador com dois graus de liberdade.
Sendo o processo modelado pela função transferência, H(z) = B(z)/A(z), pretende-se determinar um controlador causal (polinómios R, S e T ) tal que o sistema controlado se comporte
como H(z) = Bm (z)/Am (z), em que o modelo desejado para a cadeia fechada deve satisfazer
∂Am − ∂Bm ≥ ∂A − ∂B.
O controlador tem os objectivos acima definidos, bem como impor dinâmicas convenientes ao
sistema controlado e evitar que este entre em zonas de funcionamento não lineares.
Admite-se que o controlador é descrito por:
(5.2)
R(q)u(k) = T (q)r(k) + S(q)y(k)
em que R é mónico e q representa o operador avanço.
Após alguma manipulação algébrica (anexo D), o problema consiste em obter R, S e T que
27
satisfaçam:
BT
Bm Ao
=
AR + BS
Am Ao
(5.3)
onde Ao representa o polinómio observador. A solução para esta problema pode ser consultada
no anexo D.
A ordem do observador, bem como a sua localização, está também sujeita a certas restrições.
A escolha de observadores com dinâmicas muito rápidas (por exemplo com os pólos todos em
0) simplifica as contas mas pode não ser a ideal do ponto de vista da robustez do projecto face
à presença de erros de modelação ou da sensibilidade aos efeitos do ruı́do de alta-frequência.
Usualmente tornam-se os observadores mais lentos para tornar o controlo mais robusto, técnica
que foi adoptada neste projecto.
5.4
Especificações para os controladores
Como objectivos gerais de um sistema de controlo podem apontar-se:
• Rejeição de perturbações (incluindo ruı́do nos sistemas).
• Seguimento de sinais de comando.
• Estabilização do sistema.
• Robustez do sistema.
O projecto de sistemas de controlo realimentados não é trivial, visto não ser possı́vel verificar
todas as condições anteriores para todos os valores de frequência. Assim o projecto está sujeito
a compromissos no desempenho. Um compromisso evidente é o que opõe o seguimento de
comandos e rejeição de ruı́do de perturbações à saı́da contra a rejeição de ruı́do nos sensores.
Na secção de estabilidade robusta voltaremos abordar estes tópicos.
O projecto de controladores polinomiais baseia-se em funções de transferência desejadas. Neste
projecto escolheu-se como funções desejadas as respostas de sistemas contı́nuos de 2a ordem.
No caso do sistema total em que existem mais do que dois pólos, a dinâmica dominante é a
dos sistemas de 2a ordem sendo escolhidos outros pólos adicionais com dinâmicas mais rápidas
de forma a não influenciar significativamente a resposta global.
Um sistema contı́nuo de 2a ordem é definido por:
H(s) =
wo2
s2 + 2ξwo s + wo2
(5.4)
com,
(
ts =
4.6
ξwo
√−ξπ
S=e
(5.5)
1−ξ2
em que ts representa o tempo de estabelecimento a 1% e S a sobreelevação.
28
Definindo o tempo de estabelecimento e sobreelevação temos a resposta desejada para o sistema
continuo, o qual no discreto corresponde a,

m (z)
1 z+b2
= z2 b+a
com,
H(z) = B

Am (z)

1 z+a2

ξwo
o
b1 = 1 − α(β + w γ), b2 = α2 + α( ξw
γ − β)
w
2

a
=
−2αβ,
a
=
α
2

 1 √
w = 1 − ξ, α = e−ξwo ts , β = cos(wts ), γ = sin(wts )
(5.6)
Na tabela 5.1 encontram-se definidos os tempos de estabelecimento e sobreelevações para todos
os controladores desenvolvidos e para todas as velocidades.
Cadeia de controlo Especificações
ts (s)
Velocidade
S(%)
ts (s)
Pitch
S(%)
ts (s)
Roll
S(%)
ts (s)
Yaw
S(%)
18 m/s
2.5
3
3
5
5
5
10
2
22 m/s
2.5
3
3
5
5
5
10
2
26 m/s
2.5
3
3
5
5
5
8
2
30 m/s
2.5
3
3
5
5
5
8
2
Tabela 5.1: Especificações para os Controladores.
Como se pode observar na tabela acima para a cadeia de controlo de roll as especificações
foram para o tempo de 5s e na sobreelevação de 5%. No entanto, no projecto separado desta
cadeia, consegue-se satisfazer especificações mais exigentes. Mas, como esta cadeia é interna
à de yaw, tais especificações provocavam resultados insatisfatórios, ao nı́vel da actuação da
cadeia de yaw.
Salienta-se ainda que em relação à cadeia de yaw para velocidades mais baixas os tempos de
estabelecimento são superiores visto que a sustentação para estas velocidades é menor, o que
leva a um maior esforço da aeronave para realizar as manobras pretendidas.
Finalmente, no que diz respeito aos aspectos relacionados com o projecto dos controladores,
estes para as cadeias de velocidade, pitch e roll foram concebidos com efeito integral enquanto
que na cadeia de yaw não foi incluı́do efeito integral visto que o próprio sistema já inclui na
sua cadeia um integrador.
5.5
Limitações do Sistema - Saturações e Anti-windup
A saturação nos actuadores impõe certas limitações que devem ser tomadas em consideração.
Um sistema com acção integral combinado com um actuador que possa entrar em zonas de
saturações pode dar origem a resultados indesejáveis. Se o erro de controlo é tão elevado que o
integrador sature o actuador, a cadeia de retroacção pode ser ”quebrada”, visto que o actuador
se mantém saturado mesmo que a saı́da do processo se altere. O integrador, pode então integrar
até um valor elevado. Quando o erro é finalmente reduzido, o integral pode ser tão elevado
que leve um tempo considerável até que este assuma o seu valor normal, ou seja sempre que
29
se atinge estas saturações o sistema torna-se mais lento, o que pode originar sobreelevação
excessiva ou mesmo instabilidade. Este efeito é conhecido como integrator windup.
Por forma a resolver este problema é adoptada a técnica de Anti-windup que funciona como
um condensador a descarregar na zona em que se atinge as saturações, através de uma realimentação. Existem várias opções para a realização do Anti-windup. Uma possibilidade consiste
em parar de actualizar o integral quando o actuador entra nas saturações. Outro método, que
foi o realizado neste trabalho, e é ilustrado na figura 5.3, consiste em utilizar uma cadeia de
realimentação com o sinal de erro entre o sinal a enviar (sinal de controlo) e o sinal saturado
(sinal do actuador), que é fornecido ao integrador após multiplicado por um ganho 1/T . Este
sinal de erro é nulo quando o actuador não se encontra na zona de saturação, caso contrário a
cadeia de realimentação tenta levar este erro para zero (regulador) e tornando assim o sistema
mais rápido.
A vantagem deste esquema é que pode ser aplicado a qualquer actuador, com caracterı́sticas
arbitrárias tais como zonas mortas ou histereses, desde que se possa medir a saı́da do actuador
(ou correspondente descontinuidade).
1/T
Ganho
Controlo
Actuação
1
s
Integrador
Saturação
Figura 5.3: Esquema do Anti-windup.
Na figura 5.4 observam-se os efeitos indesejáveis das saturações, o que levou a uma sobreelevação mais elevada do que a especificada (tracejado). Com o esquema de anti-windup definido
anteriormente observam-se melhorias na resposta.
Velocidade (m/s)
23.5
23
22.5
22
21.5
21
20.5
20
60
80
100
120
140
160
180
200
220
240
260
0.25
Sem Anti−windup
Com Anti−windup
Th (%)
0.2
0.15
0.1
0.05
0
60
80
100
120
140
160
180
200
220
240
260
Tempo (s)
Figura 5.4: Exemplo do efeito integrator windup.
30
5.6
Limites de Incerteza nos Modelos e Estabilidade Robusta
O problema da estabilidade robusta está relacionado com uma importante questão que é a
quantificação da incerteza admissı́vel nos modelos para garantir que o controlador projectado
com base num modelo H (que tem erros relativamente ao sistema real) conduz a um sistema
em cadeia fechada estável, mesmo quando aplicado ao sistema real Ho . Ou seja, quão grande
pode ser o erro entre o sistema Ho e o modelo H, para que o controlador, que estabiliza o
modelo H, também estabilize o sistema real Ho .
5.6.1
Funções de Sensibilidade e Sensibilidade Complementar
O sistema de controlo tem a seguinte configuração:
e
d
r
H ff
u
H
y
Hfb
Figura 5.5: Esquema do sistema de controlo.
No caso especifico do controlo polinomial a função transferência Hf f corresponde a divisão dos
polinómios T /R e Hf b corresponde a S/R.
Tendo em conta a figura 5.5, é possı́vel obter a função transferência em cadeia fechada:

H = T /R
Hf f H  f f
Hf b = S/R
Hcl =
,
1+L 
L = Hf b H
(5.7)
Calculando a derivada de Hcl
Hf f
1 Hcl
δHcl
=
=
2
δH
(1 + L)
1+L H
(5.8)
Chama-se função de sensibilidade à função transferência:
S=
1
1+L
(5.9)
A função de sensibilidade complementar é definida como:
T =1−S =
L
1+L
(5.10)
31
Tendo em conta as especificações tı́picas dos controladores, atrás referidas, o seguimento da
referência na baixa frequência implica T ≈ 1 na baixa frequência; Rejeição de perturbações na
baixa frequência, que implica S ≈ 0 na baixa frequência. Ou seja nas bandas de frequência
em que se consegue seguir a referência, também se conseguem automaticamente rejeitar as
perturbações; Rejeição de ruı́do numa dada de frequência, que implica T ≈ 0 e consequentemente S ≈ 1 nessa banda de frequência, logo não se consegue ter seguimento nem rejeição de
perturbações.
5.6.2
Estudo da Robustez
Considerem-se duas situações em que o controlador é aplicado respectivamente, ao modelo
nominal H e ao sistema real Ho . Em cada caso, define-se os ganhos de malha L e Lo como o
produto de todos os ganhos na cadeia:
L = Hf b H Lo = Hf b Ho
(5.11)
Supondo que o controlador estabiliza o modelo nominal, a pergunta que se faz é: qual a
condição para que também estabilize o sistema real.
A resposta é dada pelo critério de estabilidade de Nyquist, ou seja, o controlador estabilizará
o sistema real se o número de voltas do ganho de malha em torno do ponto -1 e o número de
pólos instáveis for o mesmo.
A condição de estabilidade robusta é pois:
|L(jω) − Lo (jω)| < |1 + L(jω)|
(5.12)
que pode ser escrita como:
|Hf b H(jω) − Hf b Ho (jω)| < |1 + Hf b H(jω)|
(5.13)
Com alguma manipulação algébrica chega-se à seguinte expressão:
|H(jω) − Ho (jω)|
|1 + Hf b H(jω)|
<
|H(jω)|
|Hf b H(jω)|
(5.14)
O primeiro termo da desigualdade é o erro multiplicativo de modelação. O segundo termo da
desigualdade é o inverso da função de sensibilidade complementar (equação 5.10).
Para que o sistema real seja estável, tem então de ser:
¯
¯
¯ 1 ¯
|H − Ho |
¯
¯
¯ ∆m ¯ > |T |, onde ∆m =
|H|
(5.15)
Sendo l(ω) > |∆m (jω)| um majorante do erro de modelação a cada frequência ω para todos os
possı́veis erros multiplicativos ∆m .
Esta condição garante a estabilidade não apenas de um único sistema, mas de todos os possı́veis
sistemas da classe cujo erro multiplicativo em relação ao sistema nominal, ∆m , é inferior ao
majorante l para cada frequência ω.
32
Para se estudar a incerteza no modelo do processo são necessárias variantes do modelo nominal.
Uma vez que os parâmetros dos modelos obtidos foram estimados estatisticamente (recurso à
função ’armax.m’), encontram-se associados a estas estimativas os valores de incertezas (esta
função devolve um intervalo de valores). Assim combinando de diferentes formas a variância
associada ao valor de cada parâmetro do modelo nominal, podem-se obter alguns modelos que
traduzem a incerteza ao conhecimento do processo.
5.6.3
Estudos Realizados
Foram efectuados 2 estudos, em termos de robustez, para 2 cadeias - velocidade e pitch.
O primeiro consiste em saber se os controladores de velocidade e de pitch são robustos na gama
em que foram projectados. Este estudo mostra especial relevância quando se projectam estes
controladores numa arquitectura gain scheduling pois aı́ interessa saber se os controladores
cumprem o esperado na sua zona de funcionamento.
O segundo estudo, consiste em saber até que ponto um único controlador consegue estabilizar
o sistema na gama de velocidades desejada (16 m/s - 32 m/s) .
Na figura 5.6 apresentam-se os resultados obtidos com o modelo de velocidade para o primeiro
caso em estudo (a região testada foi a de 22 m/s).
50
Modelo Nominal
Modelo1
Modelo2
Modelo3
Modelo4
Modelo5
Modelo6
40
Amplitude (dB)
30
20
10
0
−10
−20
−30
−3
10
−2
10
−1
0
10
10
1
10
2
10
Frequência (rad/s)
Figura 5.6: Diagramas de Bode de modelos de incerteza.
Da análise da figura verifica-se que todos os modelos têm um comportamento do tipo passabaixo. Observa-se também que para as altas-frequências todos os modelos ”tendem”para o
mesmo valor, o que já seria de esperar visto que todos os modelos obtidos foram identificados a
partir de um modelo experimental e não de dados reais, pelo que não são corrompidos por ruı́do
de alta-frequência. Deste modo o erro multiplicativo de modelação será do tipo passa-baixo, e
o seu inverso será passa-alto.
Calculando o inverso do erro multiplicativo de modelação para cada um dos modelos e comparandose com a função sensibilidade complementar (figura 5.7) é então possı́vel observar que todos os
modelos, para o controlador desenvolvido, obedecem à condição de estabilidade robusta (5.15).
Este mesmo estudo, para a cadeia de pitch, pode ser consultado no anexo D.
Conclui-se que nas regiões definidas os controladores obedecem à condição de estabilidade
robusta, o que implica que a implementação da técnica de gain scheduling levará a controladores
33
100
Erro1
Erro2
Erro3
Erro4
Erro5
Erro6
Complementar
80
Amplitude (dB)
60
40
20
0
−20
−40
−3
10
−2
−1
10
0
10
10
1
10
2
10
Frequência (rad/s)
Figura 5.7: Verificação da condição de estabilidade robusta.
robustos dentro das suas gamas de velocidades.
Finalmente realizou-se o segundo estudo de robustez, quer para a cadeia de velocidade quer
para a de pitch. Para ambos os casos o estudo é baseado no controlador projectado para zona
de 22 m/s. Na figura 5.8 é possı́vel visualizar a condição de estabilidade robusta para as duas
cadeias.
Velocidade
Pitch
30
50
Erro18
Erro26
Erro30
Complementar
Erro18
Erro26
Erro30
Complementar
40
20
30
Amplitude (dB)
Amplitude (dB)
10
0
20
10
−10
0
−20
−10
−30
−3
10
−2
10
−1
10
0
10
1
10
2
10
Frequência (rad/s)
−20
−3
10
−2
10
−1
10
0
10
1
10
2
10
Frequência (rad/s)
Figura 5.8: Verificação da condição de estabilidade robusta entre os vários modelos locais velocidade e pitch.
Nota: Os diagramas de Bode de modelos de incerteza para as duas cadeias podem ser consultados no anexo D
Como se observa para a cadeia de velocidade todos os modelos obedecem à condição de estabilidade robusta. Assim é de esperar que apenas um controlador de velocidade seja necessário
para qualquer ponto de trabalho.
Já para a cadeia de pitch a condição de estabilidade robusta não se verifica para todos os
modelos. Tal implica que não se consegue garantir que o uso de um único controlador possa
levar à estabilização do sistema em toda a gama de velocidades.
34
5.7
Resultados
Nesta secção encontram-se os resultados relativos, ao projecto de controladores baseado nas
técnicas polinomiais, para as cadeias de velocidade e de pitch. Os controladores polinomiais
obtidos para as várias cadeias e regiões definidas podem ser consultados no anexo D.
São apenas apresentados os resultados para os 22 m/s podendo as respostas, para as restantes
cadeias e velocidades, serem consultadas no anexo D, sendo estas respostas, qualitativamente,
semelhantes. Para testar os controladores foram feitas simulações em que as referências são
escalões de amplitude 1 (velocidade) e 10 (para os ângulos de orientação da aeronave).
Testa-se ainda o efeito de perturbações atmosféricas nestas duas cadeias.
5.7.1
Cadeia de Velocidade
Os resultados obtidos para a cadeia de velocidade cumprem as especificações (figura 5.9).
Como se observa da figura o comportamento entre o sistema linear e real são muito semelhantes, apenas com ligeiras diferenças o que também é expectável dada a dificuldade inerente
à identificação.
Para as restantes velocidades os comportamentos são em tudo semelhantes aos apresentados
neste caso. Com estes resultados demonstra-se que os modelos identificados replicam bem o
sistema não linear nos respectivos pontos de funcionamento.
23.2
Velocidade (m/s)
23
22.8
Referência
Sist. Não Linear
Sist. Linear
22.6
22.4
22.2
22
21.8
18
20
22
24
26
28
30
0.2
0.18
Sist. Não Linear
Sist. Linear
Th (%)
0.16
0.14
0.12
0.1
0.08
0.06
18
20
22
24
26
28
30
Tempo [s]
Figura 5.9: Controlo de velocidade (22 m/s) - velocidade e TH .
5.7.2
Cadeia de pitch
Mais uma vez para a cadeia de pitch os resultados (figura 5.11) obtidos cumprem as especificações. Faz-se notar em relação à actuação que estas inicialmente apresentam um comportamento semelhante, não tendendo porém para os mesmos valores finais, que se devem às não
linearidades e restantes contribuições das outras entradas e cadeias de controlo da aeronave.
Também nesta cadeia o comportamento para as restantes velocidades é semelhante ao apresentado para uma velocidade de 22 m/s.
35
12
10
Pitch (º)
8
Referência
Sist. Não Linear
Sist. Linear
6
4
2
0
−2
28
30
32
34
36
38
40
−1
Elevadores (º)
−1.5
Sist. Não Linear
Sist. Linear
−2
−2.5
−3
−3.5
−4
28
30
32
34
36
38
40
Tempo (s)
Figura 5.10: Controlo de pitch (22 m/s) - pitch e elevadores.
5.7.3
Perturbações atmosféricas
Para estas duas cadeias, velocidade e pitch, testou-se o comportamento dos controladores
projectados face a uma perturbação atmosférica.
Considerou-se esta como severa, com altitude igual a 1000m e com velocidade inicial de 22m/s.
Assim obtiveram-se os seguintes resultados:
24
12
10
23.5
8
Ângulo Θ (º)
Velocidade (m/s)
23
22.5
6
4
Referência
Sist. Real
22
2
Referência
Sist. Real
21.5
21
28
0
30
32
34
36
38
40
Tempo (s)
−2
28
30
32
34
36
38
40
Tempo (s)
Figura 5.11: Controlo de velocidade e de pitch com perturbações atmosféricas.
Como se observa pelas figuras, as oscilações provocadas pela turbulência são atenuadas pelos controladores o que permite que a aeronave se mantenha estável seguindo as referências
desejadas.
36
Capı́tulo 6
Gain Scheduling
Quando se pretende controlar um sistema não linear, é muitas vezes conhecida/estudada antecipadamente a maneira como a dinâmica varia com os pontos de funcionamento. Na secção
da análise da dinâmica da aeronave verificou-se que a localização dos pólos do sistema é dependente da velocidade. Isto deve-se ao facto das forças aerodinâmicas serem proporcionais à
pressão dinâmica e logo proporcionais ao quadrado da velocidade.
Um dos método mais utilizados para lidar com a variação de parâmetros é a técnica de tabelamento de ganhos, ou em Inglês, gain scheduling, que consiste em fazer variar os parâmetros
(ganhos/polinómios) do controlador com os pontos de funcionamento de uma forma préprogramada.
6.1
Métodos de comutação de ganhos
O método de comutação dos ganhos, ou melhor dos controladores, talvez mais obvio é o
on/off. No entanto não se adoptou esta técnica de controlo pois embora cada controlador
individualmente estabilize o sistema, em certas condições de comutação rápida podem tornar
o sistema global instável. Na figura 6.1 ilustra-se esta situação, através da evolução no espaço
de estados de dois modelos estáveis e da instabilidade causada pela comutação rápida entre
eles.
Figura 6.1: Instabilidade causada por comutação rápida de controladores.
Existe um número de condições, em malha fechada, que garantem a estabilidade robusta [12].
As quais são:
• Não existência de cancelamento de pólos e zeros. Não existem raı́zes comuns nos polinómios
Ai (q −1 ) e Bi (q −1 ). E ainda Bi (1) 6= 0;
• Controladores locais estáveis - os pólos da função de transferência desejada em malha
fechada assim como os pólos do observador são tais que o sistema em malha fechada é
estável;
• Zonas de funcionamento bem escolhidas de modo a capturar as não linearidades do
sistema. Não pode haver sobreposição de mais de 2 controladores em cada caso;
37
Gain Scheduling
• Não existência de comutações rápidas - a variável de selecção caracteriza-se por ter um
tempo de variação lento;
• O ruı́do externo e perturbações são suficientemente pequenos;
Optou-se então por uma comutação mais suave, figura 6.2, de forma a que não existam
”saltos”no sinal de controlo devido à comutação dos controladores.
Após se ter obtido uma rede de modelos locais que traduzisse a dinâmica da aeronave, cobrindo
tanto quanto possı́vel toda a gama de pontos de funcionamento, e projectado os controladores
adequados respectivos (capitulo 5) é então necessário criar um bloco supervisor. Este tem
como tarefa determinar qual o controlador a aplicar em cada momento, ou seja os controladores
lineares resultantes são ”colados”de forma a que quando o ponto de funcionamento varie seja
implementado o controlador adequado. A técnica normalmente utilizada para a colagem é a
interpolação dos ganhos ao longo dos pontos de funcionamento através de uma variável de
selecção.
Definiu-se então uma função que atribui pesos, entre 0 e 1, aos controladores, ficando assim
definido qual dos controladores se encontra em funcionamento. Na figura 6.2 é então possı́vel
observar as curvas de atribuição de pesos na comutação entre dois controladores.
1
Controlador 18 m/s
Controlador 22 m/s
0.8
Peso
0.6
0.4
0.2
0
19
19.2
19.4
19.6
19.8
20
20.2
20.4
20.6
20.8
21
Velocidade (m/s)
Figura 6.2: Exemplo de atribuição de pesos.
A estabilidade e o desempenho do sistema com gain scheduling são avaliados, tipicamente, por
simulação, sendo requerida uma especial atenção às mudanças entre pontos de funcionamento
e a rapidez com que essas variações acontecem.
A principal vantagem da técnica gain scheduling é o uso de métodos de projecto de controladores lineares para os vários pontos de funcionamento; o bom comportamento, as medidas de
desempenho, a intuição para o projecto e as ferramentas computacionais já existentes podem
ser herdados para o projecto de controladores para sistemas não lineares multivariáveis.
As desvantagens do método prendem-se com a carga computacional exigida ao projecto e ao
funcionamento; e ainda com a dificuldade de proceder à selecção dos controladores as quais
são definidas numa base experimental.
6.2
Resultados
A utilização da técnica do gain scheduling neste projecto tem como objectivo tornar o comportamento do sistema de voo independente da sua velocidade. Foram feitas simulações fazendo
38
Gain Scheduling
Velocidade (m/s)
variar a velocidade de voo desde 17 m/s até 31 m/s num espaço de tempo de 80-100 segundos.
Nos testes a velocidade varia ou de um forma linear (rampa) ou em escada com degraus de 2.
Foram desenvolvidos blocos supervisores para cada uma das cadeias de controlo apenas para
se conseguir observar melhor o efeito da não utilização da técnica de gain scheduling em
cada cadeia de controlo, evitando assim os efeitos secundários que as várias cadeias tem entre
si. Estas foram testadas separadamente de forma a evitar efeitos das dinâmicas laterais e
longitudinais.
Na figura 6.3 compara-se o comportamento do sistema com gain scheduling com a resposta
do sistema com o controlador linear projectado com base no modelo linearizado da aeronave
a 22 m/s. O 1o gráfico, da figura 6.3, corresponde ao sistema com gain scheduling onde se
observa que se mantêm os tempos de resposta e sobreelevações especificados, mesmo nas zonas
de transição de controladores. No 2o gráfico corresponde ao sistema com um único controlador
linear, para 22 m/s, e como se observa o sistema também consegue estabilizar embora falhe,
insignificantemente, as especificações pretendidas.
Por fim no 3o gráfico a cadeia de pitch passou também a ser controlada com um único controlador (22 m/s) sendo possı́vel observar-se o efeito que esta cadeia exerce sobre a velocidade,
onde para as velocidades mais elevadas começa-se a fazer sentir oscilações, em grande parte causadas porque o controlador da cadeia pitch para estas velocidades já não consegue estabilizar
o sistema, como mais à frente se verifica.
30
25
Velocidade (m/s)
20
40
60
80
100
120
140
30
25
Referência
Velocidade s/ GS
20
20
Velocidade (m/s)
Referência
Velocidade c/ GS
20
40
60
80
100
120
140
30
25
Referência
Velocidade s /GS, Pitch s/ GS
20
20
40
60
80
100
120
140
Tempo (s)
Figura 6.3: Gain Scheduling - Velocidade.
Com base nos resultados obtidos pode então concluir-se que na cadeia de velocidade a técnica
de gain scheduling, embora cumpra com todas as especificações exigidas, pode não compensar
visto que um único controlador consegue igualmente estabilizar o sistema sem falhar significativamente as especificações. Este resultado já era de esperar dada a semelhança entre os
modelos obtidos (ver identificação - anexo C) e os resultados obtidos no estudo da robustez
dos controladores.
Procedeu-se de uma forma semelhante agora para a cadeia de pitch onde a cadeia de velocidade
encontra-se agora controlada com a técnica de gain scheduling. Testou-se a cadeia de pitch com
um sistema de gain scheduling e com um sistema de controlador linear fixo baseado no modelo
linearizado para 22 m/s (Figura 6.4).
Mais uma vez o sistema de gain scheduling mantém-se estável cumprindo todas as especificações. Em relação ao controlador fixo observa-se que para baixas velocidade este consegue
estabilizar o sistema, porém nas altas velocidades este torna-se bastante oscilatório.
39
Velocidade (m/s)
Gain Scheduling
35
30
25
20
15
20
30
40
50
60
70
80
90
100
110
120
40
50
60
70
80
90
100
110
120
40
50
60
70
80
90
100
110
120
Pitch (º)
20
10
Referência
Pitch c/ GS
0
−10
20
30
Pitch (º)
20
10
Pitch s/ GS
Referência
0
−10
20
30
Tempo (s)
Figura 6.4: Gain Scheduling - Pitch.
Velocidade (m/s)
Ao contrário do que se passa na cadeia de velocidade o uso de um sistema gain scheduling na
cadeia de pitch é essencial para se conseguir os desempenhos exigidos ao longo da gama de
velocidades de trabalho. Isto vem de encontro com os resultados obtidos no estudo da robustez
dos controladores locais lineares.
Finalmente realizou-se a simulação para a cadeia de roll, de forma em tudo idêntica à cadeia
de pitch, apresentando-se os resultados na figura 6.5.
Novamente o sistema com gain scheduling apresenta comportamentos desejados enquanto que
para o sistema com um controlador fixo este tem um desempenho que se degrada para baixas
velocidades e nas altas velocidades embora estabilize não cumpre com as especificações.
Em resumo tanto para a cadeia de pitch como para a cadeia de roll o comportamento com a
variação da velocidade tem algumas semelhanças, que se devem essencialmente à dependência
das forças e momentos aerodinâmicos com a pressão dinâmica, em que nas baixas velocidades a
sustentação é bastante menor o que provoca uma maior dificuldade para o controlo do sistema.
35
30
25
20
15
20
30
40
50
Roll (º)
60
70
80
90
100
110
120
80
90
100
110
120
80
90
100
110
120
Referência
Roll c/ GS
6
4
2
0
−2
20
30
40
50
60
Roll (º)
70
Referência
Roll s/ GS
6
4
2
0
−2
20
30
40
50
60
70
Figura 6.5: Gain Scheduling - Roll.
Concluindo, os sistemas com gain scheduling mantêm-se estáveis cumprindo com todas as
especificações para a gama de velocidades pretendida, apresentando em todos os casos desempenhos superiores em relação aos controladores fixos. Confirmou-se ainda os estudos anteriores,
nomeadamente a não linearidade da cadeia de pitch e de roll com a velocidade.
40
Capı́tulo 7
Controlo Adaptativo
Neste capitulo desenvolvem-se controladores discretos adaptativos para a cadeia longitudinal e
lateral. Estes controladores baseiam-se no algoritmo MUSMAR [9] e são aplicados ao modelo
da aeronave.
Por vezes a dinâmica de um sistema a controlar altera-se ao longo do tempo. Esta variação
pode ser devida, por exemplo, à existência de não linearidades nos actuadores ou no próprio
sistema. Assim, para este último caso, a dinâmica linearizada varia com o ponto de trabalho.
No inicio da década de 1950 começa a surgir o conceito de controlo adaptativo como resposta ao
problema de pilotos automáticos de aeronaves. No caso de uma aeronave a dinâmica varia com
a condição de operação (nomeadamente com a altitude, a velocidade e a localização do centro
de massa). Ultimamente situações extremas como o controlo em ângulos de ataque muito
elevados (caracterı́stica não linear) ou a recuperação de falhas também motivam a aplicação
de controlo adaptativo.
A técnica de selecção de ganhos, gain scheduling (capitulo 6), resolve os problemas colocados
com as variações lentas de velocidade e de altitude. No entanto variações imprevisı́veis de
pressão dinâmica e do centro de massa ou falhas na aeronave não são solucionadas por selecção
de ganhos. Foram assim implementados diversos esquemas adaptativos [8].
De modo a resolver a questão de pilotos automáticos de aeronaves, Whitaker [7][8] propôs um
esquema adaptativo baseado no modelo de referência (Model-Reference Adaptive Systems MRAS ) em que os parâmetros do controlador são ajustados de modo a que, quando excitados
pela mesma entrada, a saı́da do sistema tenda para a saı́da do modelo de referência (figura
7.1).
y
Modelo
m
Parâmetros do controlador
uc
u
Controlador
Mecanismo de
ajustamento
Processo
y
Figura 7.1: Diagrama de blocos do MRAS.
Na mesma década Kalman propôs um esquema adaptativo de colocação de pólos baseado na
minimização de um funcional de custo quadrático, que antecipou o controlo auto-sintonizável
(Self-Tuning Regulator - STR) clássico de Åstrom e Wittenmark [7][8]. O controlo autosintonizável realiza uma identificação que estima os parâmetros do processo e com isso um
mecanismo de projecto redesenha o novo controlador a ser aplicado (figura 7.2).
De modo a evitar modos internos instáveis, quando se trabalha com sistemas de fase não
mı́nima, visto que a lei de controlo ligada ao controlador auto-sintonizável é do tipo dead-beat,
41
Controlo Adaptativo
Projecto do
controlador
Estimação de
parâmetros
Parâmetros do
controlador
uc
u
Controlador
Processo
y
Figura 7.2: Diagrama de blocos do STR.
Clarke et al. [8] modificaram o funcional de custo com a adição de um termo quadrático que
pesa a acção de controlo. No entanto este ”novo”controlador tem limitações importantes. Tais
como:
• Não consegue estabilizar processos que sejam de fase não minima e ao mesmo tempo
instáveis em malha aberta.
• O controlador em presença de dinâmicas não modeladas pode originar sistemas em malha
fechada instáveis.
• Admite-se conhecido o atraso puro do processo.
Visto que as limitações resultam principalmente de o funcional de custo considerar apenas as
variáveis um passo à frente, foram sugeridos controladores em que:
• A predição da saı́da do processo seja ao longo de um intervalo futuro maior.
• O sinal de controlo penaliza o erro de seguimento futuro entre a saı́da do sistema e o
sinal de referência ao longo do horizonte de predição. Admite-se que se conhece o sinal
de referência futuro ou uma sua predição inicial.
• Estratégia de horizonte recidiva (apenas se utiliza a amostra actual de toda a sequência
de valores da variável de controlo, repetindo-se os mesmos passos em cada instante).
Um dos algoritmos desenvolvidos que sustenta estes princı́pios é o MUSMAR.
7.1
Algoritmos preditivos de horizonte extendido
Um dos principais critérios de controlo é a escolha da variável de manipulação que minimiza o
funcional de custo quadrático multi-passo:
T
1 X 2
y (t + i) + ρu2 (t + i − 1)]|I(t)]
J , E[ [e
T i=1
onde:
• ye(t + i) , y(t + i) − r(t + i).
42
(7.1)
Controlo Adaptativo
• y(.), u(.) e r(.) são respectivamente a saı́da, a entrada e a referência do processo.
• T é o horizonte de controlo.
• ρ é um factor de penalização da acção de controlo.
• E(.|I) representa o operador valor médio condicionado à informação I(t) obtida das
observações realizadas de y e u até ao instante t.
Para a minimização deste funcional, duas principais possibilidades podem ser consideradas:
1. Assume-se que as primeiras Nu amostras de controlo, desde a amostra t até t + Nu − 1,
são livres, e escolhidas de modo a minimizar J. As restantes amostras, desde t + Nu até
t + T + 1 são constantes e iguais a u(t + Nu − 1);
2. Assume-se que as amostras de controlo futuras, desde t + 1 até t + T − 1 são dadas por
retroacção constante do ”estado”, e escolhe-se u(t) que minimiza J.
A primeira hipótese é a seguida pelo algoritmo GPC (Generalized Predictive Control ) enquanto
que o algoritmo MUSMAR segue a segunda possibilidade.
Tendo em vista a minimização de (7.1) pretende-se construir modelos preditivos. Os modelos
preditivos do algoritmo MUSMAR para os erros de seguimento, ye, são definidos da seguinte
forma:
ye(t + i) = θi u(t) + ψi0 s(t) + νyi (t)
(7.2)
u(t + i − 1) = µi−1 u(t) + φ0i−1 s(t) + νui (t) onde i = 1, ..., T
(7.3)
Nota: s(t) é o vector pseudoestado. A dedução deste modelo pode ser consultada no anexo E.
O algoritmo de controlo MUSMAR resulta da minimização do funcional de custo (7.1). Substituindo no funcional os modelos considerados anteriormente (7.2 e 7.3) chega-se a:
T
1 X
J , E[ [(θi u(t) + ψi s(t))2 + ρ(µi−1 u(t) + φi−1 s(t))2 ]|I(t)]
T i=1
(7.4)
Da minimização do funcional de custo, em ordem a u(t), resulta,
PT −1
i=1 µi φi
i=1 θi ψi + ρ
s(t)
− PT 2
P
T −1 2
µ
)
θ
+
ρ(1
+
i
i=1
i=1 i
PT
u(t) =
(7.5)
O vector de ganho é igual a:
PT −1
i=1 µi φi
i=1 θi ψi + ρ
− PT 2
P
T −1 2
i=1 µi )
i=1 θi + ρ(1 +
PT
L=
(7.6)
Ao valor de controlo adiciona-se um sinal de perturbação (dither ), η(t), por forma a garantir
uma condição de excitação persistente.
u(t) = L0 s(t) + η(t)
(7.7)
43
Controlo Adaptativo
Os parâmetros θi , ψi0 , µi e φ0i , dos modelos (7.2 e 7.3) que são necessários para (7.5), são estimados em cada instante de amostragem usando um algoritmo de identificação nomeadamente os
mı́nimos quadrados recursivos com esquecimento direccional (DFRLS - Directional Forgetting
Recursive Least Squares) [9].
Os traços gerais deste método podem ser consultados o anexo E.
7.2
Parâmetros do MUSMAR
O algoritmo MUSMAR é definido pelos seguintes parâmetros:
• Número de amostras do erro de seguimento no pseudoestado, N A
• Número de amostras da entrada no pseudoestado, N B
• Número de amostras da referência no pseudoestado, N G
• Número de amostras da perturbação acessı́vel, V (t), no pseudoestado, N V
• Número de amostras da perturbação acessı́vel, X(t), no pseudoestado, N X
• Número de amostras da perturbação acessı́vel, W (t), no pseudoestado, N W
• Horizonte de predição, T
• Perı́odo de amostragem, Ts
• Factor de esquecimento, λ
• Penalização da acção de controlo, ρ
• Desvio padrão do dither (ruı́do de excitação persistente), η
• Carregar ou não o estado realizado na simulação anterior, f load
Existem no entanto considerações a serem feitas nestes parâmetros:
• Perı́odo de amostragem Ts
A selecção do perı́odo de amostragem é feita pelos mesmos critérios realizados no capitulo
5. Deve ter-se ainda em conta que o perı́odo de amostragem influencia o horizonte de
predição em tempo continuo. Deste modo Ts = 0.1s.
• Ordem do sistema.
Inicialmente pretende-se que a ordem seja a do sistema. No entanto, se o sistema de
controlo exibir boas caracterı́sticas face a dinâmicas não modeladas podem desprezarse as dinâmicas rápidas (desde que suficientemente amortecidas). Para modos pouco
amortecidos a utilização de filtros na referência, no controlo ou na saı́da pode garantir
atenuação suficiente nestes mesmos. Esta possibilidade de desprezar-se dinâmicas rápidas
pode ser bastante importante pois o uso de ordem elevadas pode levar a identificação a
incluir ruı́do no modelo do sistema.
O número de amostras da entrada, u, deve ser menor que N A:
44
Controlo Adaptativo
NB < NA
De acordo com a estrutura do pseudoestado ter-se-ia N G igual a N A. Mas, por causa de
problemas de identificabilidade, é aconselhável um número menor de referências. Se a referência se mantiver constante durante longos perı́odos de tempo, ou se variar lentamente,
deve-se escolher N G = 1.
• Factor de esquecimento λ.
O factor de esquecimento pode ser avaliado com base no número de amostras que podem
1
ser esquecidas, denominado por memória assimptótica, No = 1−λ
. Tipicamente λ está
compreendido entre 0.9 e 0.99.
• Horizonte de predição T .
Na escolha do horizonte T deverá ter-se em conta os casos limites nomeadamente quando
T = 1 e quando T → ∞.
No caso em que o horizonte é unitário o MUSMAR equivale a um STR que como se referiu
anteriormente pode dar origem a modos internos instáveis se o sistema a controlar for de
fase não mı́nima. Quando T tende para infinito o MUSMAR equivale a um controlador
linear quadrático (LQ) estocástico, evitando-se assim os modos internos instáveis.
Logo poderia-se pensar que o horizonte T deveria ser arbitrariamente grande. Mas como
a precisão na estimativa dos preditores diminui com o aumento do horizonte é necessário
estabelecer um compromisso. Existe ainda um limite superior imposto no horizonte pela
carga computacional.
• Ruı́do de excitação persistente (dither ), η.
Este ruı́do depende muito do sinal de controlo utilizado, mas deve ser suficientemente
reduzido para que não degrade demasiado o seguimento da referência. Tipicamente temse:
η≤
sinal de controlo
100
• Penalização do sinal de controlo , ρ.
A penalização, ρ, permite alterar a actuação no sinal de controlo. Com ρ → ∞ o sistema
ficaria em malha aberta e com ρ = 0 o sinal de controlo pode exceder as saturações. O
valor indicado para ρ depende de sistema para sistema logo não é possı́vel indicar um
valor tı́pico.
• Estado anterior, f load.
Com esta variável a 1 possibilita-se que se comece a simulação a partir de um estado
(ganhos do controlador, matriz de covariância e o regressor) anteriormente obtido. Este
facto pode ser determinante, para certo tipos de processos, no que diz respeito a atingir
a estabilidade.
45
Controlo Adaptativo
7.3
Controlo adaptativo na cadeia de pitch
O controlo da aeronave é feito pelos controladores obtidos anteriormente (capı́tulos 4 e 5)
exceptuando o controlo de pitch. Neste, o controlador é substituı́do pelo MUSMAR (bloco
do ambiente Simulink, fornecido pelo Prof. João Miranda Lemos, que realiza o algoritmo de
controlo MUSMAR).
O desenvolvimento do controlador adaptativo para a cadeia de pitch é feito numa lógica construtiva mostrando-se todos os passos tomados no projecto para esta cadeia.
7.3.1
MUSMAR sem integrador na cadeia de controlo
Considerando dinâmica longitudinal do sistema linearizado, têm-se dois modos oscilatórios
(Phugoid e o perı́odo curto) e uma dinâmica dos actuadores de primeira ordem (capitulo 2), o
que leva a que o sistema seja de ordem 5. Mas, como foi referido anteriormente, optou-se por
desprezar as dinâmicas rápidas nomeadamente a dinâmica de perı́odo curto e a dinâmica do
actuador, o que levou a um sistema de ordem 2.
Após algumas experiências escolheram-se os seguintes valores:
NA = 2 NB = 1 NG = 1 NV = 0 NX = 0 NW = 0
T = 5 Ts = 0.1 λ = 0.97 ρ = 1
η = 10−4 f load = 0
que levaram aos resultados apresentados na figura 7.3.
Ganhos L
2
1
0
−1
0
5
10
15
20
25
30
35
40
Pitch [graus]
10
5
0
−5
−15
Elevadores [graus]
Pitch
Referencia
−10
0
5
10
15
0
5
10
15
20
25
30
35
40
20
25
30
35
40
0
−10
−20
Tempo [s]
Figura 7.3: MUSMAR sem integrador aplicado à cadeia de pitch. Ganhos, seguimento e
elevadores.
Observando o gráfico de seguimento de pitch constata-se que depois da convergência dos ganhos
do MUSMAR o erro estático tende para 0.
O diagrama de blocos do MUSMAR, em regime estacionário, tem o seguinte aspecto:
onde K1 , K2 e K3 representam os ganhos estáticos associados à acção da referência, à realimentação do erro e à acção de controlo.
46
Controlo Adaptativo
K1
ref
y
1
K3
K2
u
Processo
y
Figura 7.4: Diagrama de blocos - MUSMAR.
Do esquema tira-se:
y = u H, H representa o ganho estático do processo
K3 u = K1 ref + K2 ye
(7.8)
(7.9)
o que leva a:
y = (K4 ref + K5 ye) H
K4 =
K1
,
K3
K5 =
(7.10)
K2
K3
(7.11)
Substituindo-se y por ref − ye fica-se com:
ye =
1 − HK4
ref
1 + HK5
(7.12)
Para que o erro estático seja nulo uma de duas possibilidades tem que ocorrer:
• ou 1 + HK5 → ∞.
• ou 1 − HK4 = 0.
A primeira condição verifica-se com a inclusão de um efeito integral na cadeia de controlo.
A segunda condição é satisfeita quando o ganho K4 é igual ao inverso do ganho estático do
sistema a controlar. Este último ponto explica a razão de o erro de seguimento na figura 7.3
tender para 0.
Ainda que tenda para 0, o erro depende do ganho K4 e por isso optou-se por incluir o integrador
na cadeia de controlo.
7.3.2
MUSMAR com integrador na cadeia de controlo
O diagrama de blocos, com a inclusão do integrador que tem um sistema anti-windup do mesmo
tipo que o referido em 5, assume o seguinte aspecto:
47
Controlo Adaptativo
T(q)
qn
ref
y
qn
R(q)
S(q)
qn
u
Integrador
ui
y
Processo
Figura 7.5: Diagrama de blocos - MUSMAR com integrador.
A lei de controlo tem a forma:
R(q)u(t) = T (q)ref (t) + S(q)e
y (t)
(7.13)
Em regime estacionário ui (sinal à entrada do processo) é constante, logo à entrada do integrador tem-se u = 0. Deste modo, em regime estacionário, chega-se a:
ye = −
T (q)
ref
S(q)
(7.14)
Para que ye = 0 é necessário T (q) = 0 ou ref = 0 (possibilidade que restringe a gama de
referências que permite um erro estático 0).
De modo a comprovar esta condição necessária, T (q) = 0, realizaram-se 2 simulações: uma
com uma referência no pseudoestado e outra sem. Na primeira considerou-se os seguintes
parâmetros:
NA = 3 NB = 2 NG = 1 NV = 0 NX = 0 NW = 0
T = 5 Ts = 0.1 λ = 0.97 ρ = 0.1
η = 10−4 f load = 1
Os resultados para o caso em que se inclui o integrador na cadeia de controlo e considera-se
uma referência no pseudoestado podem ser consultados na figura 7.6.
Ganhos L
1
0.5
0
−0.5
−1
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Pitch [graus]
10
5
0
−5
−15
Elevadores [graus]
Pitch
Referencia
−10
5
0
−5
−10
Tempo [s]
Figura 7.6: MUSMAR com integrador aplicado à cadeia de pitch e com uma referência no
pseudoestado. Ganhos, seguimento e elevadores.
48
Controlo Adaptativo
O erro estático como seria de esperar, dado (7.14), só é nulo quando a referência é também
nula. Para o caso em que se retira a referência do pseudoestado admitiu-se os parâmetros
NA = 3 NB = 2 NG = 0 NV = 0 NX = 0 NW = 0
T = 5 Ts = 0.1 λ = 0.97 ρ = 0.1
η = 10−4 f load = 1
Os resultados, apresentados na figura 7.7, são os esperados no que diz respeito ao erro estático
(nulo). No entanto a sobreelevação é excessiva, cerca de 49%.
Ganhos L
1
0.5
0
−0.5
−1
0
2
4
6
8
10
12
14
16
18
20
Pitch [graus]
10
5
0
−5
−15
Elevadores [graus]
Pitch
Referencia
−10
0
2
4
6
8
0
2
4
6
8
10
12
14
16
18
20
10
12
14
16
18
20
5
0
−5
−10
Tempo [s]
Figura 7.7: MUSMAR com integrador aplicado à cadeia de pitch e sem referências no pseudoestado. Ganhos, seguimento e elevadores.
Conclui-se que o efeito antecipativo da referência e o efeito integral podem competir, levando
a um erro de seguimento não nulo, o que é indesejável.
7.3.3
MUSMAR com inclusão de variáveis de estado no pseudoestado
Nesta secção inclui-se uma variável de estado no pseudoestado. A adição de informação tem
o objectivo de obter respostas pelo menos tão boas quanto as anteriores. Por exemplo, o caso
mais intuitivo é incluir a informação da derivada da variável a controlar.
No caso da cadeia de pitch inclui-se a velocidade de rotação Q = θ̇. Os parâmetros utilizados
foram:
NA = 3 NB = 2 NG = 0 NV = 1 NX = 0 NW = 0
T = 5 Ts = 0.1 λ = 0.97 ρ = 0.1
η = 10−4 f load = 1
Como se pode constatar na figura 7.8 os resultados obtidos melhoram consideravelmente, em
relação aos anteriores, pois a sobreelevação passou para cerca de 2.2% com um tempo de
estabelecimento de 1.5s.
49
Controlo Adaptativo
Ganhos L
1
0.5
0
−0.5
−1
0
2
4
6
8
10
12
14
16
18
20
Pitch [graus]
10
5
0
−5
Pitch
Referencia
−10
−15
0
2
4
6
8
0
2
4
6
8
10
12
14
16
18
20
10
12
14
16
18
20
Elevadores [graus]
2
0
−2
−4
−6
Tempo [s]
Figura 7.8: MUSMAR com inclusão da variável de estado Q. Ganhos, seguimento e elevadores.
7.3.4
MUSMAR com velocidade variável
Nos capı́tulos anteriores verificou-se a variação da dinâmica de uma aeronave com a velocidade. Como foi referido foi por causa de problemas como estes que surgiram os controladores
adaptativos.
Realizou-se então um estudo para o caso do controlo da cadeia de pitch com velocidade variável.
Aqui os parâmetros utilizados foram:
NA = 3 NB = 2 NG = 0 NV = 1 NX = 0 NW = 0
T = 5 Ts = 0.1 λ = 0.97 ρ = 10
η = 10−4 f load = 1
A resposta da aeronave, figura 7.9, apresenta resultados qualitativamente piores que anteriores
para velocidade mais baixas devido à baixa pressão dinâmica verificada nessas velocidades. Em
contrapartida, para velocidades maiores a resposta mostra ser quase independente da variação
de velocidade não revelando qualquer sinal de instabilidade.
Velocidade U [m/s]
40
35
30
25
20
15
10
20
25
30
35
40
45
50
55
60
45
50
55
60
Tempo [s]
20
Pitch [graus]
15
10
5
0
−5
−10
20
25
30
35
40
Tempo [s]
Figura 7.9: MUSMAR com velocidade variável. Velocidade e seguimento.
50
Controlo Adaptativo
Os ganhos, como se pode ver pela figura 7.10, ainda que com uma pequena variação estão
estáveis, o que não seria de esperar visto que a velocidade varia. Assim os resultados obtidos
devem-se essencialmente à qualidade do controlador em si, nomeadamente o projecto deste
mesmo, em vez da adaptação própria feita pelos MUSMAR.
Com a velocidade variável, a penalização da cadeia de controlo revela ter uma grande dependência com a qualidade do seguimento. Com ρ = 10 para velocidades baixas o seguimento
apresenta sobreelevações e tempos de estabelecimento maiores.
0.6
Ganhos L
0.4
0.2
0
−0.2
−0.4
20
25
30
35
20
25
30
35
40
45
50
55
60
40
45
50
55
60
Elevadores [graus]
4
2
0
−2
−4
−6
−8
Tempo [s]
Figura 7.10: MUSMAR com velocidade variável. Ganhos e elevadores.
Afinar o seguimento para velocidades menores implica uma menor penalização na cadeia de controlo, no entanto isso traz instabilidade nas velocidades superiores (figura 7.11) . Os parâmetros
considerados na afinação para velocidade menores foram:
NA = 3 NB = 2 NG = 0 NV = 1 NX = 0 NW = 0
T = 5 Ts = 0.1 λ = 0.97 ρ = 0.01
η = 10−4 f load = 1
Velocidade U [m/s]
40
35
30
25
20
15
10
20
25
30
35
40
45
50
55
60
45
50
55
60
Tempo [s]
20
Pitch [graus]
15
10
5
0
−5
−10
20
25
30
35
40
Tempo [s]
Figura 7.11: MUSMAR com menor peso na cadeia de controlo. Velocidade e seguimento.
51
Controlo Adaptativo
De modo a resolver este problema optou-se por variar a penalização da cadeia de controlo, ρ, em
função da velocidade. Assim considerou-se a afinação feita para os dois extremos e interpolouse uma recta, (7.15) de modo a que quando a velocidade variasse ρ também variasse. A recta
que melhores resultados originou foi:
ρ(U ) = 0.145U − 1.93
(7.15)
Na figura 7.12 é visı́vel a melhoria qualitativa dos resultados quando ρ depende de U .
Velocidade U [m/s]
40
35
30
25
20
15
10
20
25
30
35
40
45
50
55
60
45
50
55
60
Tempo [s]
20
Pitch [graus]
15
10
5
0
−5
−10
20
25
30
35
40
Tempo [s]
Figura 7.12: MUSMAR com velocidade variável e com ρ variável. Velocidade e seguimento.
7.3.5
Variação do custo em função do horizonte T
Pretende-se nesta secção apresentar a influência do horizonte T no custo, que neste caso foi
considerado o custo médio quadrático de seguimento.
Como foi referido anteriormente, na escolha do horizonte T tem que se ter em conta tanto a
aproximação do MUSMAR a um controlador LQ estocástico (que é tanto maior quanto mais
cresce T ) como a degradação da estimativa dos preditores com aumento do horizonte.
Realiza-se então uma experiência que consiste em, para ganhos estabilizados, medir o custo para
diversos horizontes usando um escalão como referência para o pitch. Os restantes parâmetros
do algoritmo MUSMAR foram mantidos para os diversos valores de T
NA = 3 NB = 2 NG = 0 NV = 1 NX = 0 NW = 0
Ts = 0.1 λ = 0.97 ρ = 0.1 η = 10−4
(7.16)
Os resultados, figura 7.13, revelam que o custo inicialmente decresce, com o aumento de T ,
atingindo um mı́nimo. No entanto, após esse mı́nimo, o aumento do horizonte provoca também
um aumento no custo que é devido à degradação da estimativa dos preditores que deixa de ser
”suficientemente boa”.
52
Controlo Adaptativo
0.14
0.12
Custo
0.1
0.08
0.06
0.04
0.02
3
3.5
4
4.5
5
5.5
6
6.5
7
7.5
8
Horizonte T
Figura 7.13: Influência do horizonte T no custo.
7.4
Controlo adaptativo nas restantes cadeias
O projecto de controlo realizado para as restantes cadeias foi similar ao realizado para a cadeia
de pitch. No entanto existem alguns comentários sobre as simulações realizadas para estas
cadeias.
7.4.1
Controlo adaptativo na cadeia de roll
Inicialmente, comparando a cadeia de roll com a de pitch, espera-se ver um certo ”paralelismo”,
ou seja, o projecto de controlo prevê-se similar ao realizado na cadeia de pitch.
Realmente, no projecto do controlador, foram tomados os mesmos passos que os da cadeia de
pitch. Por essa razão apresentam-se os resultados finais desta cadeia no anexo F. A única
excepção encontra-se que cadeia de roll não se considerou necessário uma variação do peso da
acção de controlo em função da velocidade quando esta era variável. Isto deve-se ao facto de
esta cadeia ser menos ”sensı́vel”à velocidade que a anterior.
7.4.2
Controlo adaptativo na cadeia de yaw
Neste caso o controlo foi mais complexo. Não se conseguiu, sem que se arrancasse de uma
condição inicial estabilizante, controlar ψ.
O método praticado, tendo em vista certa especificações, foi com sinais ”simples”, como um
escalão, ter um valor inicial do dither mais elevado com o objectivo pesar mais a identificação.
Com isto e reparando para onde tendiam os ganhos consegui-se um estado a partir do qual
posteriormente o ψ passou a estar estável.
Nesta cadeia os parâmetros do MUSMAR foram:
NA = 4 NB = 3 NG = 0 NV = 1 NX = 0 NW = 0
T = 10 Ts = 0.1 λ = 0.999 ρ = 1
η = 10−4 f load = 1
Obtiveram-se os seguintes resultados:
53
Controlo Adaptativo
10
Ganhos L
5
0
−5
−10
0
20
40
60
80
100
120
140
160
180
200
Aelerons [graus]
Yaw [graus]
6
4
Yaw
Referencia
2
0
0
20
40
60
80
0
20
40
60
80
100
120
140
160
180
200
100
120
140
160
180
200
0.2
0.1
0
−0.1
−0.2
Tempo [s]
Figura 7.14: MUSMAR - cadeia de yaw. Ganhos, seguimento e ailerons.
7.4.3
Controlo adaptativo na cadeia de velocidade
Nesta cadeia existiu um ponto adicional a ser considerado no projecto, nomeadamente o facto
de o sinal de controlo saturar quando se pretende um escalão na referência. As saturações tem
que ser evitadas, caso contrário a identificação ”apanha”não linearidades e irá tentar modelalas. Assim aplicou-se um filtro que suavizasse os escalões e que implicasse que o sinal de
controlo não saturasse.
Os parâmetros considerados nesta cadeia foram:
NA = 3 NB = 2 NG = 1 NV = 1 NX = 0 NW = 0
T = 14 Ts = 0.1 λ = 0.99 ρ = 50
η = 10−4 f load = 1
Com estes parâmetros obtiveram-se os seguintes resultados:
Ganhos L
1
0.5
0
−0.5
Velocidade [m/s]
0
50
100
150
200
250
23
22
Velocidade
Referencia
21
20
0
50
100
0
50
100
150
200
250
150
200
250
0.2
Th [%]
0.15
0.1
0.05
0
Tempo [s]
Figura 7.15: MUSMAR - cadeia de velocidade. Ganhos, seguimento e Th.
Note-se que, nos resultados, tanto a subida como a descida da velocidade são suavizadas, mas
realmente só seria necessário suavizar a descida de velocidade visto que é por causa desta
(limitação fı́sica) que o sinal de controlo satura.
54
Capı́tulo 8
Sistema de Guiamento
Tendo os controladores locais internos desenvolvidos pretende-se então o desenvolvimento de
controladores de coordenação (cadeia externa em cascata com os controlado-res internos) para
o seguimento de trajectórias.
Forças e
momentos
exteriores
Actuação
Comando
Trajectória
Controlo
Guiamento
Aeronave
Posição,
Velocidade,
Aceleração
Navegação
Figura 8.1: Diagrama de blocos genérico de navegação, guiamento e controlo.
Assim neste capı́tulo é estudado o planeamento de trajectórias e navegação em ambientes de
baixa complexidade de forma a permitir a geração de trajectórias que traduzem as manobras a
executar pela aeronave. São também estudados métodos de controlo clássicos que permitam o
seguimento de trajectórias. São realizadas simulações e testes que permitem validar os modelos
obtidos.
8.1
Geração de trajectórias
A geração de trajectórias trata-se de um problema com alguma complexidade e para o qual
existem diversas soluções.
Neste trabalho as trajectórias são geradas utilizando a aeronave e os controladores internos já
desenvolvidos. Desta forma, e definindo certas referências para estes controladores internos, é
então possı́vel criar um elevado leque de trajectórias possı́veis.
Assim sendo, foram então definidas as seguintes trajectórias de base :
• Curva simples.
• Manobras de subida.
• Sinusóides (tanto em curva como em altitude).
• Circunferência (com altitude constante).
• Espiral.
De notar que para o sistema de guiamento estas trajectórias de referência estão já definidas,
ou seja foram geradas em offline. Porém tal não é necessário visto que o sistema de guiamento
55
apenas necessita de saber a trajectória de referência a cada instante (tema que será abordado na
próxima secção). Assim as próprias trajectórias de referência poderiam ser geradas em tempo
real, o que permitiria uma coordenação de comportamentos de condução devido a factores
externos que não eram previstos inicialmente. Alguns destes factores podem ser tão simples
como a detecção de condições atmosféricas adversas ou existência de outros veı́culos a operar
na mesma zona.
8.2
Sistema de controlo
O controlo de uma aeronave é um tema bastante vasto, podendo-se desenvolver e testar desde
controladores simples até controladores mais sofisticados.
Os controladores desenvolvidos podem ser ajustados para dois tipos de comportamentos: Seguimento de trajectórias (Tracking) ou seguimento de caminhos (Path Following). Entende-se
como seguimento de trajectória, o seguimento em termos estritos do ponto de vista temporal
de uma dada trajectória de referência e seguimento de um dado caminho, o seguimento de uma
dada trajectória de referência mas com relaxação nas restrições temporais.
Neste trabalho apresenta-se um método de controlo para o seguimento de trajectórias embora
simples e intuitivo (baseado no Controlo Clássico - PID).
A aeronave constitui um sistema não linear e dadas as cadeias de controlo definidas anteriormente (Capı́tulos 4 e 5), as entradas para o bloco de controladores internos definidos
são a velocidade longitudinal U (t) e as orientações yaw ϕ(t) e pitch θ(t). Desta forma é
possı́vel realizar todas as trajectórias desejadas considerando-se como saı́das a posição da
aeronave (x(t), y(t) e z(t)). A referência consiste numa dada trajectória, definida pela posição
(xd (t), yd (t) e zd (t)), a partir da qual é também possı́vel obter as velocidades (vxd (t), vyd (t)
e vzd (t)) correspondentes. Na figura 8.2 é apresenta-se um diagrama de blocos que mostra as
referências e saı́das em causa.
xd (t), yd (t) e zd (t)
Sistema de
Guiamento
U(t), U (t) e
(t)
Controladores
internos
Processo
x(t), y(t) e z(t)
Figura 8.2: Diagrama de blocos - referências e saı́das.
É importante realçar que, uma vez que as trajectórias são sintetizadas de forma exacta, as
velocidades de referência também são sinais acessı́veis, não sendo necessário derivar esses sinais
em tempo real, podendo ser gerados offline.
Assim, o seguimento de uma dada trajectória consiste na transformação das posições de referência (e respectivas velocidades de referência) em velocidades e orientações para a aeronave.
A transformação é feita tendo em conta algumas simplificações tal como se demonstra na figura
8.3.
56
z
vz
y
U
vy
vx,vy
U
vx
x,y
x
Figura 8.3: Transformação do vector velocidade nos vários componentes vectoriais.
a projecção no plano XOY e não o plano X ou o plano Y.
∗
representa
Desta forma a velocidade e orientações necessárias para os controladores internos são dadas
por:

q
2
2
2

U
(t)
=
vxd
(t) + vyd
(t) + vzd
(t)



³
´
vyd (t)
ϕ(t) = arctan vxd

³ (t)´
q


 θ(t) = arctan vzd (t) , vd (t) = v 2 (t) + v 2 (t)
xd
yd
vd (t)
(8.1)
Na expressão 8.1 são utilizadas as velocidades de referência, correspondendo portanto ao seguimento de trajectórias em malha aberta cujo esquema de controlo se encontra no anexo F.
Deve ter-se ainda em conta que as aproximações efectuadas indicam desde logo que quanto
”mais apertadas”forem as curvas ou subidas pior será o comportamento da aeronave. De forma
a melhorar o guiamento seriam então necessário sistemas de controlo mais complexos.
Em cadeia fechada, o objectivo é, essencialmente, anular o erro de posição. Ao considerarse o sistema em cadeia aberta descrito anteriormente, a ideia é corrigir as velocidades de
referência de acordo com o erro de posição. O controlador final projectado é obtido, em grande
medida, de forma empı́rica. A correcção das velocidades é realizada com blocos PID, sendo o
dimensionamento deste bloco realizado de acordo com a intuição do problema. Desta forma a
velocidade e orientações são dadas por:

q

U (t) = vx2 (t) + vy2 (t) + vz2 (t)



´
³
ϕ(t) = arctan vvxy (t)

³ (t)´
q


 θ(t) = arctan vz (t) , v(t) = v 2 (t) + v 2 (t)
y
x
v(t)
(8.2)
em que

 vx (t) = vxd (t) + G1 [xd (t) − x(t)]
vy (t) = vyd (t) + G2 [yd (t) − y(t)]

vz (t) = vzd (t) + G3 [zd (t) − z(t)]
(8.3)
onde os ganhos Gi correspondem aos blocos PID.
Para o ajuste dos ganhos dos PID teve de existir um certo compromisso, em que se procurou
obter um único conjunto de ganhos que conseguisse revelar bons resultados para as várias
57
trajectórias testadas, ao invés de um conjunto de ganhos que estivesse muito dependente da
trajectória definida. Procurou-se não só obter boas respostas em termos de trajectória descrita e tempos de recuperação da trajectória baixos, como também que as referências para os
controladores internos fossem suaves ao longo do tempo.
Para este tipo de aeronaves as trajectórias de referências seriam o seguimento de dados percursos a uma altitude constante (por exemplo aeronaves que tiram fotografias aéreas). Logo
no plano XOY (no referencial Terra), e dada a simetria por parte da aeronave, os erros de
posição, tanto segundo o eixo do x como do y, devem ser muito semelhantes (por exemplo se
a trajectória for uma circunferência), pelo que faz todo o sentido os dois PID terem ganhos
iguais. Tal já não se aplica ao PID para correcção de altitude visto que neste caso as manobras
serão mais simples (manter altitude ou subidas).
Desta forma os ganhos utilizados foram então:
G1 = G2 ⇒ kp = 0.5, kd = 0.8 e ki = 0.055
G3 ⇒ kp = 0.85, kd = 0.5 e ki = 0.2
(8.4)
(8.5)
Os ganhos definidos foram obtidos de uma forma experimental, tendo em conta os pontos
anteriores e a diminuição da distância total à trajectória (idealmente levar este erro para zero).
Finalmente note-se que o sistema de guiamento necessita de ter acesso à sua posição em cada
instante, o que facilmente pode ser obtido com um sistema GPS (Global Positioning System),
em que não se assume qualquer dinâmica adicional por parte do sensor (anexo B).
8.3
Resultados
Para testar o controlador desenvolvido foram testadas as várias trajectórias definidas anteriormente, em que em todos os casos as trajectórias eram geradas offline e fornecidas ao sistema
de guiamento. Apenas se apresentam algumas das trajectórias testadas encontrando-se as
restantes no anexo F.
Em relação ao sistema em malha aberta, equação 8.1, para a orientação pitch é ainda necessário
ter em conta que existe um offset que tem de ser somado, de forma a manter sustentação da
aeronave. Num voo em linha recta apesar da altitude se manter constante, logo a sua velocidade
segundo o eixo z seria nula, o que pela equação daria um ângulo nulo de referência para o pitch.
Este ângulo provoca que a aeronave não mantenha a sua altitude, contrariamente ao desejado.
Para se compensar esta diferença e calcular-se o offset a somar efectuaram-se ensaios em que
para várias velocidades num voo em linha recta se registrou o valor de pitch exacto tendo-se a
partir desses valores calculado uma aproximação polinomial de quarta ordem, dada por:
Vel. (m/s)
pitch (rad)
18
0.0286
20
8.99 · 10−3
22
−5.61 · 10−3
24
26
−0.0167 −0.0254
28
30
−0.0323 −0.0378
Tabela 8.1: Interpolação - offset do pitch.
Offset (vel) = 1.03 × 10−6 vel4 − 1.17 × 10−4 vel3
+5.19 × 10−4 vel2 − 0.11vel + 0.87
58
(8.6)
2
1
Dados Experimentais
Aproximaçao polinomial
1.5
0.9
1
0.8
0.5
0.7
Pitch (º)
Pitch (º)
Dados Experimentais
Aproximaçao polinomial
0
0.6
−0.5
0.5
−1
0.4
−1.5
0.3
−2
0.2
−2.5
15
20
25
0.1
19
30
19.5
20
20.5
21
21.5
Velocidade (m/s)
Velocidade (m/s)
Figura 8.4: Aproximação polinomial para cálculo do offset de pitch - resultado obtido e respectivo zoom
Em certas manobras (nomeadamente curvas) o offset assim calculado, não é porém suficiente
para que a aeronave consiga estabilizar a uma certa altitude (ver mais adiante os resultados). Tal deve-se às simplificações que estão a ser admitidas no cálculo das referências dos
controladores internos.
No caso da malha fechada não é necessário adicionar este offset visto que como o controlador
tem acção integral este valor é ”aprendido”.
Para todas as manobras apresenta-se o comportamento do sistema, tanto do sistema em malha
aberta como do sistema em malha fechada, visualizando-se os gráficos com as trajectórias
desejadas e reais, e o erro em relação à trajectória ao longo do tempo. Este erro corresponde
a distância total à trajectória em cada instante.
As referências para os controladores internos podem ser visualizadas no anexo F. Estas apresentaram comportamentos suaves, permitindo aos controladores internos um bom seguimento
das referências.
8.3.1
Subida
A primeira manobra apresentada corresponde a uma manobra de subida (figura 8.5 a 8.6).
Como se observa, o sistema em malha aberta (figura 8.5) apresenta um bom comportamento
a nı́vel macroscópico sendo porém o erro em relação à trajectória sempre diferente de zero, o
que se deve essencialmente a um atraso inicial que não foi compensado.
59
1030
Altitude (m)
1020
1010
1000
Altitude Desejada
Altitude Real
990
0
20
40
60
80
100
120
140
0
20
40
60
80
100
120
140
3.5
Distância (m)
3
2.5
2
1.5
1
0.5
0
Tempo (s)
Figura 8.5: Subida em malha aberta - altitude e erro à trajectória
Para o sistema em malha fechada (figura 8.6) observa-se que a trajectória real é aproximada à
de referência e o próprio erro à trajectória tende para zero.
1035
1030
Altitude (m)
1025
1020
1015
1010
1005
Altitude Desejada
Altitude Real
1000
995
0
20
40
60
80
100
120
140
0
20
40
60
80
100
120
140
Distância (m)
2
1.5
1
0.5
0
Tempo (s)
Figura 8.6: Subida em malha fechada - altitude e erro à trajectória
Pode assim concluir-se que para a manobra de subida consegue-se obter um bom seguimento,
embora este estará sempre sujeito à própria trajectória de referência, se esta for mais ”puxada”apesar de o erro tender para zero já se observa alguma sobreelevação, como é visı́vel numa
outra manobra de subida apresentada no anexo F (também no anexo F são apresentadas outras
manobras em que se varia altitude, nomeadamente o seguimento a uma sinusóide).
8.3.2
Circunferência
Apresentado o comportamento do sistema de guiamento para a altitude mostra-se de seguida o
seu comportamento para curvas, em que a altitude se mantém constante, apresentando-se uma
circunferência como a trajectória desejada (No anexo F pode-se consultar outras manobras de
curvas com altitude constante - curva simples e sinusóides).
60
Nesta manobra, ao contrário do que se verificava para a manobra de subida, o sistema em
malha aberta (figura 8.7) já não apresenta tão bons resultados, tomando o erro em relação
à trajectória valores bastante elevados, como se observa pelo aspecto macroscópico no plano
XOY. De notar também que a aeronave não consegue manter uma altitude constante, tal
devendo-se ao facto de que aeronave, para efectuar curvas, recorre aos ailerons o que implica
que o ângulo de roll não é nulo, o que influência a própria sustentação da aeronave.
800
y (m)
600
Trajectória Desejada
Trajectória Real
400
200
0
−200
−100
0
100
200
300
400
500
600
700
800
x (m)
Altitude (m)
1002
Altitude Desejada
Altitude Real
1001
1000
999
998
0
20
40
60
80
100
120
140
100
120
140
Tempo (s)
Distância (m)
150
100
50
0
0
20
40
60
80
Tempo (s)
Figura 8.7: Circunferência em malha aberta - trajectória no plano XOY, altitude e erro à
trajectória
Velocidade (m/s)
A referência gerada para o yaw, figura 8.8, neste caso, não é seguido com um erro estático nulo
(ao contrário do que se sucede por exemplo se as referências forem escalões - curva simples).
Porém, tal era de esperado visto que no projecto deste controlador não foi incluı́do qualquer
acção integral. Como não há o seguimento da rampa com erro estático nulo também isso
contribuirá para que o erro à trajectória nunca seja nulo (existe sempre uma desfasagem).
24
Velocidade Desejada
Velocidade Real
22
20
0
20
40
60
80
100
120
140
80
100
120
140
80
100
120
140
Orientação Ψ (º)
400
Orientação Desejada
Orientação Real
300
200
100
0
0
20
40
60
Orientação θ (º)
0.5
Orientação Real
0
−0.5
−1
0
20
40
60
Tempo (s)
Figura 8.8: Circunferência em malha aberta - referências geradas para os controladores internos
Recorrendo ao sistema em malha fechada observam-se (figura 8.9) melhorias significativas tanto
ao nı́vel macroscópico na trajectória, tanto no plano XOY, como na própria altitude que é agora
61
estável. Constata-se também que o erro em relação à trajectória diminui drasticamente não
sendo porém nunca nulo.
y (m)
800
600
Trajectória Real
400
200
0
−200
−100
0
100
200
300
400
500
600
700
x (m)
Altitude (m)
1002
1001
1000
Altitude Desejada
Altitude Real
999
998
0
20
40
60
Distância (m)
80
100
120
140
100
120
140
Tempo (s)
8
6
4
2
0
0
20
40
60
80
Tempo (s)
Figura 8.9: Circunferência em malha fechada - trajectória no plano XOY, altitude e erro à
trajectória
Tal como se verificara para a manobra de subida, também nas manobras de curvas quanto mais
apertadas estas forem pior o sistema global se irá comportar. Este efeito pode ser observado
no anexo F em que outra circunferência com menor raio é seguida mas o seu erro à trajectória
aumenta ou comparando as duas sinusóides testadas (uma mais ”rápida”que outra).
8.3.3
Espiral
Até ao momento havia-se testado o sistema de guiamento mas separando a cadeia longitudinal
e a lateral, com uma trajectória espiral as duas cadeias irão ser actuadas simultaneamente.
No sistema em malha aberta (figuras 8.10 e 8.11) como seria de esperar as trajectórias referência
não são correctamente seguidas e existe um elevado erro que é essencialmente devido ao erro
da trajectória no plano XOY.
y (m)
600
400
Trajectória Real
200
0
0
100
200
300
400
x (m)
500
600
Altitude (m)
1400
1200
Altitude Desejada
Altitude Real
1000
800
0
20
40
60
80
100
120
140
0
20
40
60
80
100
120
140
Tempo (s)
Distância (m)
150
100
50
0
Tempo (s)
Figura 8.10: Espiral em malha aberta - trajectória no plano XOY, altitude e erro à trajectória
62
1400
1350
1300
z (m)
1250
1200
1150
(2)
1100
(1)
1050
800
(1) − Trajectória Desejada
(2) − Trajectória Real
1000
950
600
600
400
500
400
200
300
200
x (m)
0
y (m) 100
0
−100
−200
Figura 8.11: Espiral em malha aberta - trajectória
Convém porém realçar que apesar de não haver seguimento das referências o sistema consegue
gerar trajectórias semelhantes. Apesar das aproximações serem muito rudimentares, ainda
assim, dentro de certos limites, trajectória algo complexas conseguem ser geradas.
No sistema em malha fechada (figuras 8.12 e 8.13), como já acontecia para a circunferência, o
erro decresce drasticamente, não sendo porém nulo também pelas razões já enunciadas anteriormente. Apesar de tudo o aspecto macroscópico da trajectória global é bastante satisfatório.
y (m)
600
400
Trajectória Real
200
0
0
100
200
300
400
x (m)
500
600
Altitude (m)
1400
1200
1000
800
Altitude Desejada
Altitude Real
0
20
40
60
80
100
120
140
0
20
40
60
80
100
120
140
Tempo (s)
Distância (m)
10
5
0
Tempo (s)
Figura 8.12: Espiral em malha fechada - trajectória no plano XOY, altitude e erro à trajectória
63
1400
1350
1300
z (m)
1250
1200
1150
1100
(1)
1050
(2)
(1) − Trajectória Desejada
(2) − Trajectória Real
1000
600
400
950
600
500
200
400
300
200
y (m)
0
100
0
−100
x (m)
−200
Figura 8.13: Espiral em malha fechada - trajectória
8.3.4
Rajada discreta e aquisição
Um dos problemas que se põe no guiamento é o da aquisição. Este consiste em o avião, não se
encontrar na trajectória desejada tendo por isso que mudar, possivelmente de orientação, para
”entrar”na trajectória desejada.
Apresenta-se de seguida (figura 8.14) um teste com uma rajada em que a trajectória desejada
é uma sinusóide lateral (estudo sobre sinusóides pode ser consultado no anexo F). Este teste
visa compreender o resultado devolvido pelo sistema global face a uma perturbação. O teste
possibilita também o estudo do guiamento face a um problema de aquisição visto que a rajada
considerada é discreta o que possibilita a escolha do tempo em que a rajada se faz sentir.
A rajada considerada tem uma amplitude igual a 10m/s.
60
40
y (m)
20
0
Traj. Desejada
Traj. Real
Traj. Real Com Rajada
−20
−40
−60
0
500
1000
1500
2000
2500
3000
x (m)
Distância (m)
20
Erro Sem Rajada
Erro Com Rajada
15
10
5
0
0
20
40
60
80
100
120
140
Tempo (s)
Figura 8.14: Sinusóide lateral com uma rajada de ar
O resultado obtido depende muito da amplitude da rajada. Esta quanto maior for pior será a
aquisição.
Com base nas trajectórias testadas e apresentadas anteriormente e no anexo F, pode-se assim concluir que o sistema de guiamento desenvolvido, embora que simples, consegue fazer o
seguimento de trajectórias complexas, desde que não se exija muito destas.
64
Capı́tulo 9
Conclusões
Neste trabalho considera-se a aplicação várias técnicas de controlo a uma aeronave de pequenas
dimensões. Para tal, e de forma a permitir quer ensaios em simulação, quer a análise das
caracterı́sticas dinâmicas da aeronave, utilizou-se um modelo matemático não linear de base
fı́sica [2],[3]. A validade do modelo, só analisável com rigor com testes em túnel de vento,
foi verificada através da comparação das derivadas aerodinâmicas calculadas do modelo com
dados experimentais de um aparelho com caracterı́sticas semelhantes (Cessna 172). O modelo
matemático foi simulado usando o ambiente Simulink do MATLAB.
Com base no modelo, caracterizou-se o comportamento dinâmico, incluindo regimes lineares
(pequenas variações em torno de um ponto de equilı́brio) e não lineares. Mostra-se também a
variação do regime linear em função da velocidade.
Quando se efectua o controlo automático de uma aeronave o seu movimento é afectado por
comandos do sistema de guiamento, efeitos atmosféricos e ruı́do nos sensores, sendo os comandos do sistema de guiamento perturbações intencionais ou desejadas. Deste modo, fez-se
uma descrição das perturbações atmosféricas baseadas no modelo de Dryden de turbulência
atmosférica e estudou-se o efeito do ruı́do nos sensores de modo a que o sistema de controlo as
possa atenuar. Admite-se que os sensores não introduzem dinâmicas adicionais.
De forma a ter uma base de partida para os restantes controladores desenvolvidos e para
estabelecimento dos diagramas de blocos, projectou-se um sistema de controlo baseado em
controladores clássicos. As variáveis controladas - roll, yaw, pitch e velocidade - permitem a
estabilização da aeronave e são os comandos de um piloto remoto ou as saı́das de um sistema
de guiamento. A regulação do ângulo de sideslip permite a realização de volta coordenada nas
manobras efectuadas.
O projecto dos controladores locais foi baseado em técnicas polinomiais, tendo sido projectado
controladores locais lineares para cada uma das condições de voo (em função da velocidade).
No projecto de controladores polinomiais é necessário o conhecimento das funções transferência
entrada-saı́da a controlar, pelo que é necessário recorrer à identificação destas. Esta fase foi das
mais complicadas, visto que tratar-se de um sistema MIMO (Multiple Input Multiple Output),
ou seja a identificação de cada cadeia não pode ser feita excluindo as outras, visto que as
variáveis a controlar não independentes entre si. O método escolhido para identificação foi o
da Máxima Verosimilhança por ser o mais geral e poderoso apesar de ser o computacionalmente
mais pesado.
No projecto dos controladores, em alguns caso foi considerado a inclusão de efeito integral,
o que combinado com actuadores que possam entrar em zonas de saturação podem originar
resultados indesejáveis (efeito conhecido como integrator windup). De forma a resolver este
problema é adoptada uma técnica de Anti-windup, que funciona como um condensador a
descarregar na zona em que se atingem as saturações, através de uma realimentação.
A utilização da técnica de controladores polinomiais mostrou-se proveitosa. Apesar de ser
uma técnica de controlo baseada em modelos lineares e a dinâmica da aeronave ser não linear, os controladores desenvolvidos apresentam boas caracterı́sticas de robustez face às não
65
Conclusões
linearidades avaliadas em simulação.
No intuito de tornar o desempenho do sistema independente das variações de velocidade, utilizase técnicas de atribuição de ganhos (gain scheduling), que consiste na ”colagem”dos diversos
controladores lineares, dimensionados para os diversos pontos de funcionamento, através da
interpolação dos parâmetros dos controladores por uma variável de selecção. A estabilidade e
o desempenho do sistema com gain scheduling são avaliados através de simulações, que foram
pondo à prova a robustez do sistema face a variações rápidas do regime de voo. Em resumo,
os sistemas com gain scheduling mantêm-se estáveis, cumprindo com as especificações para
a gama de velocidades pretendida, apresentando em todos os casos desempenhos superiores
em relação aos controladores fixos. Tanto para cadeia de pitch como para a cadeia de roll o
comportamento com a velocidade tem algumas semelhanças, que se devem essencialmente à
dependência das forças e momentos aerodinâmicos com a pressão dinâmica, verificando-se o
forte acoplamento que existe na cadeia de pitch com a velocidade, sendo que o desempenho da
dinâmica lateral mostrou-se menos sensı́vel a estas variações.
Desenvolveu-se, de uma forma construtiva, um controlador adaptativo para a cadeia de pitch.
A inclusão de um integrador na cadeia de controlo revelou ser a melhor opção para que o
erro estático de posição fosse nulo. Verificou-se que a inclusão de referências no pseudoestado
nem sempre é a melhor opção, pois neste caso a coexistência de efeito integral levou a uma
”competição”, o que provocou um erro de seguimento não nulo.
De modo a reduzir a sobreelevação e o tempo de estabelecimento foi necessário incluir a velocidade de rotação Q no pseudoestado. Quando testado com velocidade variável, o controlador
originou resultados qualitativamente piores. Verificou-se que a penalização da cadeia de controlo revela ter uma grande dependência com a qualidade do seguimento. Deste modo variou-se
a penalização da cadeia de controlo, ρ, em função da velocidade. Assim considerou-se a afinação
feita para os dois extremos (baixas e altas velocidades) e interpolou-se uma recta, de modo a
que quando a velocidade variasse ρ também variasse.
Estudou-se ainda para esta cadeia a variação do custo em função do horizonte T . Os resultados
revelaram que o custo inicialmente decresce, com o aumento de T , atingindo um mı́nimo. No
entanto, após esse mı́nimo, o aumento do horizonte provoca também um aumento no custo que
é devido à degradação da estimativa dos preditores que deixa de ser ”suficientemente boa”.
Para as restantes cadeias o projecto de controlo foi similar ao realizado para a cadeia de pitch.
A única excepção na cadeia de roll foi que não se considerou necessário uma variação do peso
da acção de controlo em função da velocidade pois esta cadeia é menos ”sensı́vel”à velocidade
que a anterior. Na cadeia de yaw o arranque do algoritmo mostrou-se problemático enquanto
que na cadeia de velocidade as saturações revelaram-se criticas sendo necessário aplicar filtros.
Com os controladores locais internos desenvolvidos projectou-se então controladores de coordenação (cadeia externa em cascata com os controladores internos) para o seguimento de
trajectórias, baseados em técnicas de controlo clássico. Os controladores desenvolvidos foram
ajustados para o seguimento de trajectórias (Tracking), ou seja seguimento em termos estritos
do ponto de vista temporal. Com base nas trajectórias testadas conclui-se que o sistema de
guiamento desenvolvido consegue fazer o seguimento de trajectórias algo complexas.
Algumas questões que surgiram ao longo do trabalho ficaram em aberto. Algumas dessas
questões poderão proporcionar eventuais trabalhos futuros:
• Uso de outras técnicas de identificação, tendo em conta a não linearidade do sistema
(NARX e NARMAX ), que possam levar a modelos mais precisos.
66
Conclusões
• Identificação a partir de dados reais e comparação com os modelos obtidos a partir do
modelo matemático.
• Diversificação na classificação de regiões, ou seja não só definir regiões em função da
velocidade mas também em função da altitude e da localização do centro de massa.
• Escolha de outro tipo de variáveis de selecção para o gain scheduling, por exemplo baseado
em estatı́sticas ou redes neuronais.
• Sistema que integre os controladores adaptativos para as diferentes cadeias.
• Análise da robustez do sistema face a falhas. Identifica-se desde logo um problema caso
exista uma falha, nomeadamente com a função ρ(U ), visto que esta não se irá adaptar à
mudança que o sistema assumir.
• Desenvolvimento de um sistema de guiamento tendo em conta a cinemática global do
sistema aeronave/controladores internos (cinemática inversa).
• Coordenação de comportamentos - existência de outros veı́culos, tripulados ou não, a
operar na mesma zona e sob os quais não há qualquer tipo de informação. Esses objectos
tem de ser detectados de modo a realizar correcções na trajectória de forma a que,
cumprindo os objectivos da ”missão”, se evite colisões.
67
ANEXO A
Modelo da aeronave
Nesta secção apresentam-se todas as equações do modelo, os respectivos parâmetros da aeronave e a estrutura de blocos em Simulink. A base do modelo teve como referência o trabalho e
tese de mestrado de Luı́s Mendonça Rato e Rui Neves da Silva ([2],[3]).
A.1
O modelo
VxT = c(ψ)c(θ)U + [c(ψ)s(θ)s(φ) − s(ψ)c(φ)]V + [c(ψ)s(θ)c(φ) + s(ψ)s(φ)]W
VyT = s(ψ)c(θ)U + [s(ψ)s(θ)s(φ) + c(ψ)c(φ)]V + [s(ψ)s(θ)c(φ) − c(ψ)s(φ)]W
(A.1)
(A.2)
VzT = −s(θ)U + c(θ)s(φ)V + c(θ)c(φ)W
(A.3)
1
X
m
1
V̇ = P W − RU + Y
m
1
Ẇ = QU − P V + Z
m
U̇ = RV − QW +
(A.4)
(A.5)
(A.6)
Ṗ = i1 P Q + i2 QR + i3 L + i4 N
Q̇ = i5 P R + i6 (R2 − P 2 ) + i7 M
Ṙ = i8 P Q + i9 QR + i10 L + i11 N
(A.7)
(A.8)
(A.9)
φ̇ = P + R tan(θ) cos(φ) + Q tan(θ) sin(φ)
θ̇ = Q cos(φ) − R sin(φ)
ψ̇ = R
cos(φ)
sin(φ)
+Q
cos(θ)
cos(θ)
(A.10)
(A.11)
(A.12)
X = Xg + Xa + Xp
Y = Yg + Ya + Yp
Z = Zg + Za + Zp
(A.13)
(A.14)
(A.15)
L = La + Lp
M = Ma + Mp
N = Na + Np
(A.16)
(A.17)
(A.18)
69
Modelo da aeronave
Xg = −mg sin(θ)
Yg = mg cos(θ) sin(φ)
Zg = mg cos(θ) cos(φ)
(A.19)
(A.20)
(A.21)
Xa = LW sin(α) + LF sin(β) − (DW + DB ) cos(α) cos(β) + LT sin(α + αW )
Ya = −(DW + DB ) cos(α) sin(β) − LF cos(β)
Za = −LW cos(α) − LT cos(α + αW ) − (DW + DB ) sin(α) cos(β)
(A.22)
(A.23)
(A.24)
W
U
V
β =
U
α =
(A.25)
(A.26)
CLW = aW (α − αL0 + ∆f ηf )
αW = −K1 CLW + K2
(A.27)
Ẇ lT
V2
(A.28)
LW = qSW CLW
(A.29)
LT = qST aT (α + αW + εT + ∆e ηe +
LF = qSF aF (β + ∆r ηr −
DW = qSW (CD0
QlT
)
V
RlF
P γP
+
)
V
V
CL2 W
)
+
πAW e
(A.30)
(A.31)
(A.32)
DB = qSref CDB
(A.33)
1 2
ρV
2
√
V =
U2 + V 2 + W 2
q =
(A.34)
(A.35)
La = LW + LF
Ma = MW + MT + MB
Na = NW + NF + NB
(A.36)
(A.37)
(A.38)
70
Modelo da aeronave
LW
LF
MW
MT
MB
NW
=
=
=
=
=
=
qSW b∆la ηa + qSW bγ9 β + [γ4 + γ5 (α − αL0 )]ρVR + γ1 ρVP
−hF LF
qSW cCMac − lW LW
−lT LT
qKMB α
qSW b∆na ηa + qSW b[γ10 + γ11 (α − αL0 )]β +
[γ6 + γ7 (α − αL0 ) + γ8 (α − αL0 )2 ]ρVR + [γ2 + γ3 (α − αL0 )]ρVP
= lF LF
= −qKNB β
= K3 CLW
NF
NB
∆na
(A.39)
(A.40)
(A.41)
(A.42)
(A.43)
(A.44)
(A.45)
(A.46)
(A.47)
Xp = T
Yp = T sin(εy )
Zp = T sin(εz )
(A.48)
(A.49)
(A.50)
Lp = Q
Mp = −lp T sin(εz )
Np = lp T sin(εy )
(A.51)
(A.52)
(A.53)
Ṫ =
1
T V0
Pmax ηP TH −
Ke
Ke
(A.54)
Pmax PP TH
2π V0
s
T
V
V2
=
+
+
2
2ρSd
4
Q =
(A.55)
V0
(A.56)
η̇ = Aact η + Bact η ∗
£
¤0
ηa ηe ηr ηf
η =
£ ∗ ∗ ∗ ∗ ¤0
ηa ηe ηr ηf
η∗ =
A.2
(A.57)
(A.58)
(A.59)
Os parâmetros
ρ = 1.23 Kgm−3
g = 9.8065 ms−2
m = 10.5 Kg
Ixx = 1.9 Kgm2
71
Modelo da aeronave
Iyy = 2.5 Kgm2
Izz = 3.5 Kgm2
Ixz = 0.052 Kgm2
xx −Iyy )Ixz
i1 = (IzzI+I
2
xx Izz −I
xz
i2 =
2 −I 2
Iyy Izz −Izz
xz
2
Ixx Izz −Ixz
i3 =
Izz
2
Ixx Izz −Ixz
i4 =
Ixz
2
Ixx Izz −Ixz
i5 =
Izz −Ixx
Iyy
i6 =
Ixz
Iyy
i7 =
1
Iyy
i8 =
2 −I I +I 2
Ixx
yy xx
xz
2
Ixx Izz −Ixz
i9 =
(Iyy −Izz −Ixx )Ixz
2
Ixx Izz −Ixz
i10 =
Ixz
2
Ixx Izz −Ixz
i11 =
Ixx
2
Ixx Izz −Ixz
SW = 1.04 m2
b = 2.7 m
c = 0.4 m
lW = 0.0 m
AW = 7.0
aW = 4.7 rad−1
αL0 = −0.082 rad
CMac = −0.065
∆f = 0.27
∆la = 0.54 rad−1
K3 = 0.03
CD0 = 0.007
e = 0.90
ST = 0.19 m2
aT = 3.8 rad−1
εT = 0.017 rad
∆e = 0.75
lT = 1.0 m
SF = 0.09 m2
72
Modelo da aeronave
aF = 1.8 rad−1
∆r = −0.78
lF = 1.0 m
hF = 0.17 m
K1 = 0.086 rad
K2 = 0.4 rad
Sref CDB = 0.014 m2
KMB = 0.058m3 rad−1
KNB = 0.17m3 rad−1
γ1 = −2.0 m4 rad−1
γ2 = 0.17 m4 rad−1
γ3 = −3.0 m4 rad−2
γ4 = 0.16 m4 rad−1
γ5 = 1.6 m4 rad−2
γ6 = −0.018 m4 rad−1
γ7 = −0.14 m4 rad−2
γ8 = −0.086 m4 rad−3
γ9 = −0.028 rad−1
γ10 = −0.0022 rad−1
γ11 = −0.053 rad−2
γP = 0.43 m
εy = 2o = 0.035 rad
εz = 1o = 0.017 rad
lp = 0.4 m
Pmax = 3400 W
ηP = 0.8
PP = 0.5
Sd = 0.20 m2
Ke = 2.0 m2

Aact = −Bact

−60 0
0
0
 0 −60 0
0 

=
 0
0 −60 0 
0
0
0 −60
73
Modelo da aeronave
A.3
Modelo da Aeronave em Simulink
Figura A.1: Diagrama de blocos em Simulink do modelo da aeronave.
O modelo da aeronave pode ser visto como a associação de 3 submodelos - modelo gravı́tico,
modelo aerodinâmico e modelo propulsivo. Estes tem a finalidade de calcular as forças (X, Y e Z)
e momentos externos (L, M e N ) existentes na aeronave.
Integrando as forças e momentos chega-se às velocidade lineares (U, V e W ) e rotacionais
(P, Q e R) da aeronave (bloco Equações Movimento). Do bloco Ang. Euler calculam-se os
ângulos θ, φ e ψ a partir das velocidades de rotação.
74
ANEXO B
Sensores
Na escolha dos sensores para o controlo de um sistema devem-se considerar quais as variáveis
importantes e quais são as fisicamente mensuráveis. Existem vários factores que influenciam a
escolha de um sensor (tipo de tecnologia, caracterı́sticas fı́sicas, qualidade, custo ...).
Neste trabalho não se faz uso de sensores para medir todo o estado da aeronave; tenta-se
através de um número mı́nimo de sensores, obter toda a informação indispensável ao controlo
e estabilização da aeronave. Dessa forma consideram-se os seguintes sensores: giroscópio de
rotação, giroscópio vertical, velocı́metro, altı́metro e GPS.
B.1
Giroscópio de rotação
Os giroscópios de rotação indicam a rotação de um corpo em relação a um referencial de inércia.
Podem, deste modo, medir as rotações P , Q e R. O princı́pio de funcionamento dos giroscópios
de rotação baseia-se na ”Lei da Conservação do Momento Angular”.
Uma massa, com inércia I, em rotação constante ws , sujeito a uma rotação do eixo, wp ,
perpendicular a ws gera um binário T . Assim tem-se,
T = wp × ws I
(B.1)
Este binário é absorvido por uma mola e constitui uma medida da rotação wp . Os giroscópios
de rotação consistem então num rotor em movimento sobre um quadro acoplado a um detector
de ângulo, uma mola de restituição e um dispositivo de amortecimento.
Figura B.1: Giroscópio de rotação.
Devido ao método de medida, sistema massa-mola (sistema oscilatório) amortecido, os giroscópios
de rotação são modelados por sistemas de 2a ordem.
wn2
X(s)
= 2
Y (s)
s + 2ξwn s + wn2
(B.2)
Os valores tı́picos para esta dinâmica são:
fn = 20Hz
ξ = 0.7
(B.3)
(B.4)
75
Sensores
B.2
Giroscópio vertical
Ao contrário do giroscópio de rotação, o giroscópio vertical tem o eixo de rotação livre. Assim,
esse eixo aponta segundo uma direcção constante (vertical). De facto, devido à rotação da
terra e ao movimento sobre a superfı́cie da terra este eixo não é exactamente constante em
relação ao referencial Terra. A actualização da orientação do eixo faz-se com um mecanismo
do tipo pêndulo (usualmente interruptores de mercúrio) de forma que o eixo aponte sempre
segundo o vector força da gravidade. Uma vez estabilizado o eixo segundo a vertical, podem
medir-se os ângulos de roll, pitch e de yaw, directamente através de potenciómetros.
Figura B.2: Giroscópio vertical.
O mecanismo de estabilização do eixo tem tempos de resposta muito mais lentos do que a
aeronave. Assim, o sensor é representado por um ganho puro (unitário).
B.3
Altı́metro e velocı́metro
Um altı́metro é um instrumento que indica a altitude acima ou abaixo de um determinado
ponto. O altı́metro mais comum é o baseado na variação da pressão atmosférica (pressão
estática) com a altitude, e é designado por altı́metro barométrico.
Os velocı́metros usuais são tubos de Pitot, baseando-se na lei de Bernoulli no seu funcionamento para medir a velocidade de um fluı́do. O tubo de Pitot consiste num tubo com uma
abertura lateral e outra frontal, de modo a medir a pressão estática e a pressão total (pressão
estática mais pressão dinâmica). Sabendo que a pressão dinâmica é dada por,
1
∆P = Pf rontal − Plateral = ρU 2
2
(B.5)
Sabendo a diferença de pressões é então possı́vel calcular a velocidade do fluxo (U ). A dinâmica
do sensor é usualmente de terceira ordem, mas os termos de segunda ordem são desprezáveis,
pelo que se reduz a:
1
X(s)
=
Y (s)
sTs + 1
(B.6)
Valores tı́picos de Ts vão de 0.1 a 0.4 s.
Note-se que a pressão dinâmica depende da densidade do ar ρ, que por sua vez é função da temperatura, da humidade e da altitude, pelo que a velocidade determinada é uma aproximação.
Neste trabalho consideram-se as propriedades do ar constantes (atmosfera padrão).
76
Sensores
Figura B.3: Tubo de Pitot.
B.4
GPS
O sistema GPS é o sistema de navegação por satélite. O GPS providencia sinais de satélite
codificados que permitem calcular a posição, velocidade e tempo. Quatro sinais de satélites
são utilizados para a calcular a posição (a 3 dimensões) e o offset temporal do relógio receptor.
Figura B.4: GPS.
O Space Segment consiste em 24 satélites GPS que enviam sinais de rádio. Podem existir
mais do que 24 satélites operacionais, dado que novos satélites são lançados para substituir
outros mais antigos. A resolução de cada satélite é de aproximadamente 12 horas. Existem 6
planos orbitais com 4 satélites cada, igualmente espaçados de 60o e inclinados de cerca de 55o
relativamente ao plano equatorial e a uma altitude de 20200 Km. Em cada ponto da Terra são
visı́veis entre 5 a 8 satélites.
O Segmento de Controlo consiste nas estações de rasteio localizadas à volta da Terra. Nestas
estações são medidos os sinais provenientes dos satélites, os quais incorporados em modelos
orbitais para cada satélite, permitem calcular a órbita precisa e as correcções aos relógios de
cada satélite.
A estação principal reenvia para cada satélite os dados referentes à sua órbita e relógio; os
satélites posteriormente enviam, via rádio, subconjuntos de informação referentes à sua órbita
para os receptores GPS. Os receptores de GPS e o conjunto de utilizadores constituem o GPS
User Segment.
A obtenção da posição com exactidão é possı́vel utilizando receptores em locais de referência
que fornecem correcções e informação de posição relativa para cada um dos receptores remotos.
77
ANEXO C
Identificação
Neste anexo apresenta-se o método utilizado na identificação, das funções de transferência
entrada-saı́da dos sistemas que se pretendem controlar, denominado máxima verosimilhança.
Posteriormente seguem-se os resultados obtidos na identificação das várias cadeias de controlo.
C.1
Máxima Verosimilhança
Seja y uma variável aleatória cuja densidade de probabilidade p(y|θ) depende de um parâmetro
desconhecido θ.
Admitindo que se conhece a forma de p(y|θ) pretende-se escolher o θ que maximiza a função
de verosimilhança:
L(θ) = p(y|θ)
(Likehood Function)
Que é equivalente a maximizar:
log{L(θ)}
Assim:
θ̂M V = arg max log{L(θ)}
∂
log{L(θ)}|θ=θ̂M V = 0
∂θ
ou seja
O modelo ARMAX pode ser escrito, em termos de operador avanço, como:
A(q)y(t) = B(q)u(t) + C(q)e(t)
(C.1)
sendo e(t) ruı́do branco de variância desconhecida. Com alguma manipulação algébrica chegase a:
e(t) = y(t) +
n
X
ai y(t − i) −
i=1
n
X
bi u(t − i) −
i=1
n
X
ci e(t − i)
i=1
Logo dada uma estimativa inicial dos parâmetros θ, estima-se o erro de predição:
εθ (t) = y(t) +
n
X
i=1
aθi y(t
− i) −
n
X
bθi u(t
− i) −
i=1
n
X
cθi εθ (t − i)
i=1
Com o erro de predição consegue-se/segue-se a maximização log{L(θ, σ)} que é equivalente
a minimizar J(θ) = −log{L(θ, σ)}. Repare-se que na forma mais genérica a variância é desconhecida e por isso a função de verosimilhança depende dela. Para realizar a minimização é
necessário, por vezes, recorrer a um algoritmo numérico iterativo.
79
Identificação
C.2
Resultados
De seguida apresentam-se os resultados obtidos na identificação das cadeias de velocidade,
pitch, roll e yaw.
C.2.1
Cadeia de velocidade
A função de transferência a identificar, nesta cadeia, é TH → V elocidade U mas para a
identificar terá que haver um controlo de altitude, pois o sistema em malha aberta é instável.
Este controlo é feito com o controlador PID concebido anteriormente que actua nos elevadores.
No entanto, estes influenciam a velocidade o que leva a que a identificação tenha que passar
a multivariável. Toda a teoria exposta anteriormente mantém-se válida apenas com uma
excepção - o sistema passa a ter 2 entradas (necessário especificar 2 sinais). No fundo identificase os 2 sistemas: a influência do motor e dos elevadores na velocidade. A função do MATLAB
armax.m possibilita identificação de sistemas MISO (Multiple Input Single Output).
De seguida apresentam-se os resultados obtidos.
Veloc.
Ordens
Treino
Valid.
Pólos
Zeros
Modelo
A (q ) = 1 − 1.322q −1 + 0.325q −2
B1∗ (q −1 ) = 0.467q −1 + 0.348q −2
B2∗ (q −1 ) = 0.462q −1 − 0.072q −2
C ∗ (q −1 ) = 1 + 1.244q −1 + 0.991q −2
A∗ (q −1 ) = 1 − 1.258q −1 + 0.263q −2
B1∗ (q −1 ) = 0.440q −1 + 0.317q −2
B2∗ (q −1 ) = −0.016q −1 − 0.130q −2
C ∗ (q −1 ) = 1 + 1.333q −1 + 0.983q −2
A∗ (q −1 ) = 1 − 1.211q −1 + 0.218q −2
B1∗ (q −1 ) = 0.418q −1 + 0.292q −2
B2∗ (q −1 ) = −0.486q −1 + 0.575q −2
C ∗ (q −1 ) = 1 + 1.403q −1 + 0.972q −2
A∗ (q −1 ) = 1 − 1.168q −1 + 0.177q −2
B1∗ (q −1 ) = 0.395q −1 + 0.268q −2
B2∗ (q −1 ) = 0.688q −1 + 0.764q −2
∗ −1
C (q ) = 1 + 1.389q −1 + 0.956q −2
∗
18 m/s
2221
97.59 %
97.80 %
0.995
0.327
-0.746
22 m/s
2221
98.74 %
98.50 %
0.993
0.265
-0.721
26 m/s
2221
98.95 %
98.88 %
0.991
0.220
-0.699
30 m/s
2221
99.04 %
98.76 %
0.989
0.179
-0.679
−1
Tabela C.1: Resultados da identificação TH → V elocidade U .
Note-se que interessa apenas, para o controlo, o A∗ (q −1 ) e B1∗ (q −1 ) e que os zeros indicados são
referentes a B1∗ (q −1 ). Na coluna das ordens temos a indicação destas para A(q), B(q), C(q) e
o atraso respectivamente.
Como se pode ver, os ajustes de treino, validação e gráficos apresentam resultados elevados
para todas as zonas.
Salienta-se ainda que os modelo são estáveis em malha aberta, visto que os pólos estão dentro
do circulo unitário, o que faz sentido porque como temos a altitude controlada, qualquer que
seja o valor de comando a velocidade irá sempre estabilizar. É também visı́vel a semelhança
entre as estruturas ainda que variem entre elas dependendo da velocidade. Ainda assim os
pólos dominantes não variam significativamente com a velocidade.
80
Identificação
22 m/s
24.5
20
24
Velocidade (m/s)
Velocidade (m/s)
18 m/s
20.5
19.5
Sistema Não Linear
Sistema Linear
19
18.5
23.5
22.5
18
17.5
Sistema Não Linear
Sistema Linear
23
22
200
300
400
21.5
500
200
Tempo (s)
300
26 m/s
32
Velocidade (m/s)
28.5
Velocidade (m/s)
500
30 m/s
29
28
27.5
Sistema Linear
Sistema Não Linear
27
26.5
31.5
31
200
300
400
30
29.5
500
Sistema Linear
Sistema Não Linear
30.5
26
25.5
400
Tempo (s)
200
300
Tempo (s)
400
500
Tempo (s)
Figura C.1: Resposta ao escalão do sistema linear e não linear para as várias regiões.
Na figura C.2 podem-se observar as respostas ao escalão dos modelos obtidos.
25
Velocidade [m/s]
20
15
10
18 m/s
22 m/s
26 m/s
30 m/s
5
0
0
10
20
30
40
50
60
70
80
90
100
Tempo [s]
Figura C.2: Resposta ao escalão dos modelos obtidos para as várias zonas de funcionamento.
Dadas as estruturas obtidas esperam-se que os comportamentos destas sejam também eles
81
Identificação
semelhantes.
No entanto, da figura, é desde logo evidente os diferentes ganhos estáticos para cada ponto de
funcionamento. Para velocidades baixas temos ganhos maiores e à medida que se aumenta a
velocidade o ganho diminui. Tal faz sentido, porque com o aumento da velocidade da aeronave
mais nos aproximamos da limitação desta consequentemente menor é a capacidade de aumento.
Também nos diagramas de Bode (tanto de amplitude como de fase), figura C.3, é notório a
semelhança entre os modelos. Constata-se também a diferença de ganhos estáticos para as
várias velocidades, assim como a pequena variação da largura de banda do sistema com a
velocidade. Pelas margens de ganho e de fase comprova-se, a já referida, estabilidade dos
sistemas.
60
50
Amplitude (dB)
40
30
20
10
0
−10
−20
−30
−40
0
18 m/s
22 m/s
26 m/s
30 m/s
Fase (º)
−45
−90
−135
−180
−225
−3
10
−2
10
−1
0
10
10
1
10
2
10
Frequência (rad/s)
Figura C.3: Diagrama de Bode para os 4 pontos de funcionamento.
Velocidade
Baixa (18 m/s)
Média-baixa (22 m/s)
Média-alta (26 m/s)
Alta (30 m/s)
Largura de Banda
0.0501 rad/s
0.0702 rad/s
0.0904 rad/s
0.1106 rad/s
Margem de Fase
24o
33o
39o
45o
Margem de Ganho
5.81 dB
7.28 dB
8.52 dB
9.69 dB
Tabela C.2: Largura de banda, margem de fase e margem de ganho dos sistemas TH →
V elocidade U .
Na representação do mapa de pólos e zeros, figura C.4, dos vários modelos, pode ver-se o andamento destes com a variação da velocidade onde os pólos dominantes parecem independentes
da velocidade.
82
Identificação
Pólos (x) e Zeros (o)
1
0.8
0.6
0.4
0.2
(4) (1) (2) (3)
(3) (2) (1) (4)
(3) (2) (1) (4)
0
−0.2
−0.4
(1) − 22 m/s
(2) − 26 m/s
(3) − 30 m/s
(4) − 18 m/s
−0.6
−0.8
−1
−1
−0.5
0
0.5
1
Figura C.4: Mapa dos pólos e zeros para as diferentes velocidades.
C.2.2
Cadeia de altitude
Neste caso, como a cadeia de controlo é uma cascata, a função de transferência a identificar
primeiramente é ηe → θ.
Inicialmente é lógico pensar que a metodologia a aplicar neste caso é idêntica ao anterior. No
entanto, ao contrário do que se verifica no caso anterior, com a cadeia de velocidade controlada,
que influencia a cadeia de pitch, o sistema fica instável. Isto porque quando perturbamos, por
exemplo negativamente, os elevadores a velocidade baixa. Com isto o controlador de velocidade
aumenta a potência do motor de modo a compensar esta perca de velocidade. Isto faz com que
o pitch aumente ainda mais ficando instável. Ou seja, é difı́cil restringir o pitch a uma gama
de valores quando se perturba os elevadores e se tem o controlador de velocidade ligado.
Como nesta cadeia é possı́vel, identificou-se a função transferência com o sistema em malha
aberta, portanto, sem nenhum controlador ligado. Apenas tem que se ter cuidado para que
não se fuja da zona de funcionamento em causa.
De seguida mostram-se os resultados obtidos.
Veloc.
Ordens
Treino Valid.
18 m/s
4401
99.48
99.50
22 m/s
4401
99.45
99.44
26 m/s
4401
99.42
99.45
30 m/s
4401
99.38
99.37
Modelo
A (q ) = 1 − 3.038q + 3.443q −2 − 1.766q −3 + 0.362q −4
B ∗ (q −1 ) = −0.133q −1 + 0.013q −2 + 0.215q −3 − 0.097q −4
A∗ (q −1 ) = 1 − 2.877q −1 + 3.054q −2 − 1.470q −3 + 0.294q −4
B ∗ (q −1 ) = −0.192q −1 + 0.018q −2 + 0.291q −3 − 0.119q −4
A∗ (q −1 ) = 1 − 2.731q −1 + 2.706q −2 − 1.213q −3 + 0.238q −4
B ∗ (q −1 ) = −0.259q −1 + 0.024q −2 + 0.368q −3 − 0.138q −4
A∗ (q −1 ) = 1 − 2.584q −1 + 2.367q −2 − 0.973q −3 + 0.191q −4
B ∗ (q −1 ) = −0.334q −1 + 0.030q −2 + 0.445q −3 − 0.146q −4
∗
−1
−1
Tabela C.3: Resultados da identificação ηe → θ.
83
Identificação
18 m/s
22 m/s
0.035
0
Sistema Linear
Sistema Não Linear
Sistema Linear
Sistema Não Linear
−0.005
θ (rad)
θ (rad)
0.03
0.025
−0.01
−0.015
0.02
300
400
500
600
−0.02
100
700
200
Tempo (s)
300
400
500
Tempo (s)
26 m/s
30 m/s
−0.02
−0.03
Sistema Linear
Sistema Não Linear
−0.025
Sistema Linear
Sistema Não Linear
−0.035
−0.03
θ (rad)
θ (rad)
−0.04
−0.035
−0.045
−0.05
−0.055
−0.04
−0.06
−0.045
100
200
300
400
−0.065
100
500
200
Tempo (s)
300
400
500
Tempo (s)
Os ajustes de treino, validação e gráfico indicam uma identificação bem sucedida. Os modelos revelam estruturas semelhantes como no caso da velocidade. Em baixo apresentam-se as
respostas ao escalão para cada ponto de funcionamento.
1
18 m/s
22 m/s
26 m/s
30 m/s
0.5
0
θ [rad]
−0.5
−1
−1.5
−2
−2.5
0
20
40
60
80
100
120
140
160
180
Tempo [s]
Figura C.6: Resposta ao escalão dos modelos obtidos.
84
200
Identificação
Das respostas ao escalão ressaltam desde logo 3 factos - existência de regime oscilatório, diferentes ganhos estáticos para as várias velocidades e o sistema ser de fase não minima.
Como se viu no capı́tulo 2, um escalão nos elevadores vai excitar o modo de oscilação Phugoid.
Em relação à variação do ganho estático constata-se que para velocidades maiores os ganhos são
maiores. Pensando em termos aerodinâmicos, para a mesma actuação nos elevadores, quanto
maior for a velocidade maior é a sustentação e consequentemente maior será o pitch.
Na tabela C.4 disponibilizam-se informações adicionais sobre os sistema identificados.
Velocidade
18 m/s
22 m/s
26 m/s
30 m/s
Pólos
0.995+0.061i
0.995-0.061i
0.524+0.300i
0.524-0.300i
0.995+0.050i
0.995-0.050i
0.444+0.315i
0.444-0.315i
0.994+0.042i
0.994-0.042i
0.371+0.323i
0.371-0.323i
0.994+0.036i
0.994-0.036i
0.298+0.323i
0.298-0.323i
Zeros
-1.413
0.985
0.521
-1.359
0.988
0.462
-1.308
0.988
0.412
-1.252
0.988
0.353
-
Larg. de Banda
Marg. de Fase
Marg. de Ganho
4.12 rad/s
221.1o
35.2 dB
3.16 rad/s
216.4o
32.7 dB
2.24 rad/s
213.4o
30.9 dB
1.63 rad/s
209.4o
29.9 dB
Tabela C.4: Largura de banda, margem de fase e margem de ganho dos sistemas ηe → θ.
A nı́vel de estabilidade todos os sistemas são estáveis visto que os pólos encontram-se dentro
do circulo unitário. Esta estabilidade também pode ser vista pelas margens de fase e de ganho
assim como pela situação fı́sica em causa - uma perturbação nos elevadores irá sempre fazer
com que o pitch estabilize.
Observando os pólos vê-se que estes estão coerentes com os registados na figura 2.7. Analisando
os pólos dominantes conclui-se que estes são complexos conjugados, daı́ o regime oscilatório,
e que aproximam-se, no plano continuo, da origem à medida que a velocidade aumenta. Isto
leva a que a largura de banda seja maior para velocidade menores. Estes resultados apesar
de parecerem contraditórios estão coerentes com o que foi estudado anteriormente. De facto,
observando a figura C.6, o que se passa é que larguras de banda maiores não implicam tempos
de estabelecimento maiores. Isto porque este último depende não só da frequência natural
como do factor de amortecimento.
ts (x%) =
|ln0.01x|
ξωn
(C.2)
Assim, se pensando em rapidez de resposta como o tempo de estabelecimento, para velocidades
maiores mais rápido é o sistema.
De seguida encontra-se o diagrama de bode e o mapa de pólos e zeros para as várias velocidades.
85
Identificação
40
30
Amplitude (dB)
20
10
0
−10
−20
−30
−40
270
18 m/s
22 m/s
26 m/s
30 m/s
Fase (º)
180
90
0
−90
−180
−3
−2
10
−1
10
0
10
1
10
2
10
10
Frequência (rad/s)
1
(1) − 18 m/s
(2) − 22 m/s
(3) − 26 m/s
(4) − 30 m/s
0.8
0.6
(4) (3) (2) (1)
0.4
0.2
(4) (3) (2) (1)
(1) (2) (3) (4)
(1)
(2)
(3)
(4)
0
(4) (3) (2) (1)
−0.2
−0.4
−0.6
−0.8
−1
−1.5
−1
−0.5
0
0.5
1
C.2.3
Cadeia Lateral
O procedimento para identificar os 2 modelos necessários ao controlo lateral é em tudo identifico
ao de altitude. Assim o apresenta-se de seguida, apenas, os resultados obtidos.
• Cadeia roll.
Note-se apenas que nesta cadeia, para 18 m/s, o sistema é instável por, nesta situação, a
sustentação ser critica.
86
Identificação
Veloc.
Ordens
Treino Valid.
Pólos
Zeros
Modelo
A (q ) = 1 − 0.987q −1 − 0.013q −2
B1∗ (q −1 ) = 0.287q −1 + 0.272q −2
B2∗ (q −1 ) = −7.87e − 7q −1 + 5.81e − 5q −2
B3∗ (q −1 ) = 2.16e − 5q −1 + 1.47e − 5q −2
C ∗ (q −1 ) = 1 + 1.33q −1 + 1.00q −2
A∗ (q −1 ) = 1 − 1.046q −1 + 0.047q −2
B1∗ (q −1 ) = 0.423q −1 + 0.336q −2
∗ −1
B2 (q ) = −2.42e − 6q −1 + 1.07e − 6q −2
B3∗ (q −1 ) = 8.43e − 7q −1 + 1.57e − 6q −2
C ∗ (q −1 ) = 1 + 1.227q −1 + 0.973q −2
A∗ (q −1 ) = 1 − 1.081q −1 + 0.082q −2
B1∗ (q −1 ) = 0.559q −1 + 0.382q −2
∗ −1
B2 (q ) = −2.78e − 6q −1 + 9.88e − 7q −2
B3∗ (q −1 ) = −7.25e − 8q −1 − 5.67e − 7q −2
C ∗ (q −1 ) = 1 + 1.283q −1 + 0.873q −2
A∗ (q −1 ) = 1 − 1.103q −1 + 0.105q −2
B1∗ (q −1 ) = 0.698q −1 + 0.417q −2
∗ −1
B2 (q ) = −2.83e − 5q −1 − 4.87e − 6q −2
B3∗ (q −1 ) = 2.71e − 5q −1 + 2.02e − 5q −2
C ∗ (q −1 ) = 1 + 1.155q −1 + 1.004q −2
∗
18 m/s
2221
99.38
99.04
1.000
-0.013
22 m/s
2221
99.74
99.73
0.999
0.047
-0.795
26 m/s
2221
99.83
99.81
0.998
0.082
-0.685
99.27
0.998
0.105
-0.597
30 m/s
2221
98.88
-0.946
−1
Tabela C.5: Resultados da identificação ηa → φ.
18 m/s
22 m/s
0.07
0.08
0.06
φ (rad)
φ (rad)
0.06
Sistema Linear
Sistema Não Linear
0.05
0.04
0.03
0.02
Sistema Linear
Sistema Não Linear
0.04
0.02
0.01
0
0
200
400
600
800
0
1000
0
200
Tempo (s)
400
600
800
1000
Tempo (s)
26 m/s
30 m/s
0.07
0.08
0.06
0.06
0.04
φ (rad)
φ (rad)
0.05
Sistema Linear
Sistema Não Linear
0.03
0.02
Sistema Linear
Sistema Não Linear
0.04
0.02
0.01
0
0
200
400
600
800
1000
0
0
200
400
600
800
1000
Tempo (s)
Tempo (s)
Figura C.9: Resposta ao escalão do sistema linear e não linear para as várias cadeias.
87
Identificação
0.2
18 m/s
22 m/s
26 m/s
30 m/s
0.18
0.16
0.14
φ [rad]
0.12
0.1
0.08
0.06
0.04
0.02
0
0
100
200
300
400
500
600
700
800
900
1000
Tempo [s]
Figura C.10: Resposta ao escalão dos modelos obtidos para as várias zonas de funcionamento..
Amplitude (dB)
100
50
0
−50
0
18 m/s
22 m/s
26 m/s
30 m/s
Fase (º)
−45
−90
−135
−180
−225
−270
−5
10
−4
10
−3
10
−2
10
−1
10
0
10
1
10
2
10
Frequência (rad/s)
88
Identificação
1
0.8
0.6
(1) − 18 m/s
(2) − 22 m/s
(3) − 26 m/s
(4) − 30 m/s
0.4
0.2
(1) (2) (3) (4)
(4) (3) (2) (1)
(2) (1) (3) (4)
0
−0.2
−0.4
−0.6
−0.8
−1
−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
• Cadeia Yaw.
Aqui devido ao sistema ser uma cascata a identificação foi conseguida com alguma dificuldade.
Os modelos obtidos, ainda que com grandes valores nos ajustes de treino, validação e gráficos,
não têm estruturas tão coerentes no entanto foram os que melhor resultados originaram.
Refira-se ainda que houve um caso, para 18 m/s, que apesar de a identificação parecer bem
realizada, não se conseguiu identificar um modelo no qual se conseguisse projectar um controlador capaz de estabilizar o sistema. Assim usou-se o modelo obtido para 22 m/s ajustando-se
apenas o ganho.
Veloc.
Ordens
Treino
Valid.
Modelo
A (q ) = 1 − 1.548q −1 + 0.321q −2 + 0.251q −3
B1∗ (q −1 ) = −0.043q −1 + 0.037q −2 + 0.017q −3
B2∗ (q −1 ) = −0.309q −1 + 0.145q −2 + 0.163q −3
C ∗ (q −1 ) = 1 − 0.845q −1
∗ −1
A (q ) = 1 − 1.548q −1 + 0.321q −2 + 0.251q −3
B1∗ (q −1 ) = −0.043q −1 + 0.037q −2 + 0.017q −3
B2∗ (q −1 ) = −0.309q −1 + 0.145q −2 + 0.163q −3
C ∗ (q −1 ) = 1 − 0.845q −1
A∗ (q −1 ) = 1 − 1.376q −1 + 0.194q −2 + 0.223q −3
B1∗ (q −1 ) = −0.112q −1 + 0.126q −2 + 0.002q −3
B2∗ (q −1 ) = 0.162q −1 − 0.549q −2 + 0.406q −3
C ∗ (q −1 ) = 0
A∗ (q −1 ) = 1 − 1.319q −1 + 0.212q −2 + 0.155q −3
B1∗ (q −1 ) = −0.168q −1 + 0.210q −2 + −0.026q −3
B2∗ (q −1 ) = 0.476q −1 − 0.994q −2 + 0.541q −3
C ∗ (q −1 ) = 1 − 0.893q −1
∗
18 m/s
3311
98.76
98.39
22 m/s
3311
98.76
98.39
26 m/s
3301
97.44
97.41
30 m/s
3311
99.16
99.04
−1
Tabela C.6: Resultados da identificação φ → ψ.
89
Identificação
18 m/s
22 m/s
0.04
0.03
0.02
0.02
ψ (rad)
ψ (rad)
0.03
Sistema Linear
Sistema Não Linear
0.01
0
0
−0.01
100
Sistema Linear
Sistema Não Linear
0.01
200
300
400
500
−0.01
100
600
200
Tempo (s)
26 m/s
0.02
0.02
0.015
0.015
500
600
0.01
ψ (rad)
ψ (rad)
400
30 m/s
0.025
Sistema Linear
Sistema Não Linear
0.01
0.005
Sistema Linear
Sistema Não Linear
0.005
0
0
−0.005
−0.005
−0.01
100
300
Tempo (s)
200
300
400
500
600
Tempo (s)
−0.01
100
200
300
400
500
600
Tempo (s)
90
ANEXO D
Controlo Polinomial
D.1
Princı́pios do Controlo Polinomial
O objectivo nesta fase é o projecto de controladores polinomiais com dois graus de liberdade
com a estrutura que se mostra na figura D.1,
d
r
T
R
u
B
A
y
S
R
Figura D.1: Esquema de um controlador com dois graus de liberdade.
Sendo o processo modelado pela função transferência, H(z) = B(z)/A(z), pretende-se determinar um controlador causal (polinómios R, S e T) tal que o sistema controlado se comporte
como H(z) = Bm (z)/Am (z), em que o modelo desejado para a cadeia fechada deve satisfazer
∂Am − ∂Bm ≥ ∂A − ∂B.
O controlador tem os objectivos acima definidos, bem como impor dinâmicas convenientes ao
sistema controlado e evitar que este entre em zonas de funcionamento não lineares.
Admite-se que o controlador é descrito por:
R(q)u(k) = T (q)r(k) + S(q)y(k)
(D.1)
em que R é mónico e q representa o operador avanço.
Por forma a que a lei de controlo seja causal, tem que se ter:
½
∂R ≥ ∂S
∂R ≥ ∂T
(D.2)
No caso em que as ordens são todas iguais, então o controlador não introduz atrasos. Tendo
em conta a figura 5.2 (para d = 0) o problema de projecto do controlador, consiste em obter
R, S e T tal que:
Bm
BT
=
AR + BS
Am
(D.3)
podendo a solução do problema não ser única. Existe um conjunto de restrições que serão
abordadas mais adiante de forma a garantir a unicidade.
91
Controlo Polinomial
Porém, na maioria dos casos, é necessária a introdução de um observador (Ao ) de modo a
garantir condições de causalidade. Reformulando, o problema consiste em obter R, S e T que
satisfaçam:
Bm Ao
BT
=
AR + BS
Am Ao
(D.4)
A ordem do observador, bem como a sua localização, está também sujeita a certas restrições.
Como a resolução da equação (D.4) pode levar ao cancelamento de pólos e zeros, é necessário
ter algumas preocupações de forma a evitar o cancelamento de pólos e zeros de fase não mı́nima,
o que levaria a modos internos instáveis. Assim, apenas se podem cancelar os zeros ”estáveis”,
logo se existir um destes zeros em B e esse zero não for factor de Bm então deverá ser factor
de AR + BS de forma a ser cancelado.
Desta forma factoriza-se B como,
B = B+B−
(D.5)
em que B + é mónico e contém todos os zeros a cancelar.
Visto que nas especificações tem de estar incluı́das as raı́zes de B − factoriza-se,
Bm = B − B m
(D.6)
e como B + é para ser cancelado então terá de ser factor de AR + BS, pelo que também será
factor de R,
R = B+R
(D.7)
Tendo em conta as equações (D.4), (D.5), (D.6) e (D.7) obtém-se
T
B m Ao
=
Am Ao
AR + B − S
(D.8)
e, considerando a necessidade de inclusão de integradores para garantir o seguimento de referências com erro estático nulo, tem-se,
T
A(z −
1)λ R
1
+
B−S
=
B m Ao
Am Ao
(D.9)
em que R = (z − 1)λ R1 e λ é o número de integradores.
Os polinómios que definem os controladores são pois obtidos a partir de
½
T = B m Ao
A(z − 1)λ R1 + B − S = Am Ao → Eq. Diof antina
(D.10)
A solução para a equação de Diofantina pode admitir múltiplas soluções. A existência de
solução única é obtida com a restrição
½
∂S < λ + ∂A
∂R = ∂Ao + ∂Am − ∂A − λ
(D.11)
92
Controlo Polinomial
válida apenas no caso mais geral, sem qualquer tipo de perturbações.
A solução para a equação Diofantina foi obtida com a toolbox do MATLAB - Polbox.
A partir das soluções da equação de Diofantina obtêm-se finalmente os polinómios S e R
calculando,
R = B + (z − 1)λ R1
(D.12)
A ordem para o polinómio observador não é arbitrária, estando sujeita à seguinte condição de
causalidade,
∂Ao ≥ 2∂A − ∂Am − ∂B + + λ − 1
(D.13)
válida para o caso geral, sem qualquer tipo de perturbações aditivas ao sistema.
D.2
Controlo Robusto
• Estudo da robustez, da cadeia de pitch, para a zona de 22 m/s.
40
35
Modelo Nominal 22
Modelo1
Modelo2
Modelo3
Modelo4
Modelo5
Modelo6
30
Amplitude (dB)
25
20
15
10
5
0
−3
10
−2
10
−1
10
0
10
1
10
Frequência (rad/s)
Figura D.2: Diagramas de Bode de modelos de incerteza - pitch.
93
Controlo Polinomial
80
70
Erro1
Erro2
Erro3
Erro4
Erro5
Erro6
Complementar
60
Amplitude (dB)
50
40
30
20
10
0
−10
−3
10
−2
10
−1
0
10
10
1
10
2
10
Frequência (rad/s)
Figura D.3: Verificação da condição de estabilidade robusta.
• Modelo de incerteza, da cadeia de velocidade e pitch , para outras zonas de funcionamento.
50
Modelo Nominal 22
Modelo18
Modelo26
Modelo30
40
Amplitude (dB)
30
20
10
0
−10
−20
−30
−3
10
−2
10
−1
0
10
10
1
10
2
10
Frequência (rad/s)
Figura D.4: Diagramas de Bode de modelos de incerteza - velocidade.
94
Controlo Polinomial
40
Modelo Nominal 22
Modelo18
Modelo26
Modelo30
30
Amplitude (dB)
20
10
0
−10
−20
−30
−40
−3
10
−2
−1
10
0
10
10
1
10
2
10
Frequência (rad/s)
Figura D.5: Diagramas de Bode de modelos de incerteza - pitch.
D.3
Polinómios R, S, T
Região
Polinómio
R (q ) = 1.000 + 0.301q −1 + 0.000q −2
S ∗ (q −1 ) = 0.815 − 1.064q −1 + 0.316q −2
T ∗ (q −1 ) = 0.070 − 0.003q −1 + 0.000q −2
R∗ (q −1 ) = 1.000 + 0.269q −1 + 0.000q −2
S ∗ (q −1 ) = 0.759 − 0.931q −1 + 0.243q −2
T ∗ (q −1 ) = 0.073 − 0.003q −1 + 0.000q −2
R∗ (q −1 ) = 1.000 + 0.243q −1 + 0.000q −2
S ∗ (q −1 ) = 0.742 − 0.865q −1 + 0.197q −2
T ∗ (q −1 ) = 0.077 − 0.003q −1 + 0.000q −2
R∗ (q −1 ) = 1.000 + 0.218q −1 + 0.000q −2
S ∗ (q −1 ) = 0.712 − 0.769q −1 + 0.152q −2
T ∗ (q −1 ) = 0.080 − 0.003q −1 + 0.000q −2
∗
18m/s
22m/s
26m/s
30m/s
−1
Tabela D.1: Controladores R, S e T da cadeia de velocidade para as várias regiões.
95
Controlo Polinomial
Região
Polinómio
R (q ) = 1.000 + 0.036q −1 + 0.000q −2
S ∗ (q −1 ) = 0.332 − 0.305q −1 + 0.007q −2
T ∗ (q −1 ) = 0.029 − 0.001q −1 + 0.000q −2
R∗ (q −1 ) = 1.000 + 0.082q −1 + 0.000q −2
S ∗ (q −1 ) = 0.255 − 0.248q −1 + 0.014q −2
T ∗ (q −1 ) = 0.021 − 0.001q −1 + 0.000q −2
R∗ (q −1 ) = 1.000 + 0.103q −1 + 0.000q −2
S ∗ (q −1 ) = 0.218 − 0.225q −1 + 0.024q −2
T ∗ (q −1 ) = 0.017 − 0.001q −1 + 0.000q −2
R∗ (q −1 ) = 1.000 + 0.113q −1 + 0.000q −2
S ∗ (q −1 ) = 0.193 − 0.209q −1 + 0.030q −2
T ∗ (q −1 ) = 0.015 − 0.001q −1 + 0.000q −2
∗
18m/s
22m/s
26m/s
30m/s
−1
Tabela D.2: Controladores R, S e T da cadeia de roll para as várias regiões.
Região
Polinómio
R (q ) = 1.000 + 0.568q −1 + 0.917q −2 + 0.000q −3
S ∗ (q −1 ) = 97.555 − 58.892q −1 − 166.339q −2 + 129.383q −3
T ∗ (q −1 ) = 2.918 − 1.459q −1 + 0.263q −2 − 0.015q −3
R∗ (q −1 ) = 1.000 + 0.607q −1 + 0.930q −2 + 0.000q −3
∗ −1
S (q ) = 110.182 − 73.504q −1 − 170.832q −2 + 136.421q −3
T ∗ (q −1 ) = 3.874 − 1.937q −1 + 0.385q −2 − 0.020q −3
R∗ (q −1 ) = 1.000 + 0.907q −1 + 0.012q −2 + 0.000q −3
∗ −1
S (q ) = 82.505 − 132.113q −1 + 36.999q −2 + 15.059q −3
T ∗ (q −1 ) = 4.186 − 2.093q −1 + 0.377q −2 − 0.021q −3
R∗ (q −1 ) = 1.000 + 0.779q −1 − 0.125q −2 + 0.000q −3
∗ −1
S (q ) = 50.791 − 76.071q −1 + 20.004q −2 + 7.608q −3
T ∗ (q −1 ) = 3.984 − 1.992q −1 + 0.359q −2 − 0.020q −3
∗
18m/s
22m/s
26m/s
30m/s
−1
Tabela D.3: Controladores R, S e T da cadeia de yaw para as várias regiões.
96
Controlo Polinomial
Região
Polinómio
R (q ) = 1.000 − 0.498q − 1.006q −2 + 0.518q −3 + 0.000q −4
S ∗ (q −1 ) = −9.357 + 24.617q −1 − 24.288q −2 + 10.846q −3 − 1.938q −4
T ∗ (q −1 ) = −0.069 − 0.056q −1 + 0.005q −2 − 0.000q −3 + 0.000q −4
R∗ (q −1 ) = 1.000 − 0.497q −1 − 0.925q −2 + 0.435q −3 + 0.000q −4
S ∗ (q −1 ) = −5.935 + 15.064q −1 − 14.234q −2 + 6.091q −3 − 1.071q −4
T ∗ (q −1 ) = −0.049 − 0.040q −1 + 0.003q −2 − 0.000q −3 + 0.000q −4
R∗ (q −1 ) = 1.000 − 0.501q −1 − 0.852q −2 + 0.366q −3 + 0.000q −4
S ∗ (q −1 ) = −4.056 + 9.910q −1 − 8.925q −2 + 3.639q −3 − 0.633q −4
T ∗ (q −1 ) = −0.037 − 0.030q −1 + 0.003q −2 − 0.000q −3 + 0.000q −4
R∗ (q −1 ) = 1.000 − 0.498q −1 − 0.780q −2 + 0.293q −3 + 0.000q −4
S ∗ (q −1 ) = −2.867 + 6.704q −1 − 5.697q −2 + 2.193q −3 − 0.384q −4
T ∗ (q −1 ) = −0.029 − 0.024q −1 + 0.002q −2 − 0.000q −3 + 0.000q −4
∗
18m/s
22m/s
26m/s
30m/s
−1
−1
Tabela D.4: Controladores R, S e T da cadeia de pitch para as várias regiões.
Cadeia Velocidade
19.2
Velocidade (m/s)
D.4.1
Resultados do controlo polinomial
19
18.8
Referência
Sistema Linear
Sistema Não linear
18.6
18.4
18.2
18
18
20
22
24
26
28
30
0.16
Sistema Linear
Sistema Não Linear
0.14
0.12
Th
D.4
0.1
0.08
0.06
0.04
18
20
22
24
26
28
30
Tempo (s)
Figura D.6: Controlo de velocidade (18 m/s) - saı́das e actuações.
97
Controlo Polinomial
27.2
Velocidade (m/s)
27
26.8
26.6
Referência
Sistema Linear
Sistema Não Linear
26.4
26.2
26
25.8
18
20
22
24
26
28
30
0.25
Sistema Linear
Sistema Não Linear
Th
0.2
0.15
0.1
0.05
18
20
22
24
26
28
30
Tempo (s)
31.2
Velocidade (m/s)
31
30.8
30.6
Referência
Sistema Linear
Sistema Não Linear
30.4
30.2
30
29.8
18
20
22
24
26
28
30
28
30
0.3
Sistema Linear
Sistema Não Linear
Th
0.25
0.2
0.15
18
20
22
24
26
Tempo (s)
98
Controlo Polinomial
Cadeia Pitch
10
θ (º)
8
6
Referência
Sistema Linear
Sistema Não Linear
4
2
0
28
30
32
34
36
38
40
−2
Elevadores (º)
−3
Sistema Linear
Sistema Não Linear
−4
−5
−6
−7
28
30
32
34
36
38
40
Tempo (s)
Figura D.9: Controlo de pitch (18 m/s) - saı́das e actuações.
10
θ (º)
8
6
Referência
Sistema Linear
Sistema Não Linear
4
2
0
28
30
32
34
36
38
40
−0.5
Elevadores (º)
D.4.2
−1
Sistema Linear
Sistema Não Linear
−1.5
−2
28
30
32
34
36
38
40
Tempo (s)
99
Controlo Polinomial
10
θ (º)
8
6
Referência
Sistema Linear
Sistema Não Linear
4
2
0
28
30
32
34
36
38
40
0
Elevadores (º)
−0.2
−0.4
Sistema Linear
Sistema Não Linear
−0.6
−0.8
−1
−1.2
−1.4
28
30
32
34
36
38
40
Tempo (s)
Cadeia Roll
10
φ (º)
8
Referência
Sistema Linear
Sistema Não Linear
6
4
2
0
28
30
32
34
36
38
40
3
2.5
Ailerons (º)
D.4.3
2
Sistema Linear
Sistema Não Linear
1.5
1
0.5
0
−0.5
28
30
32
34
36
38
40
Tempo (s)
Figura D.12: Controlo de roll (18 m/s) - saı́das e actuações.
100
Controlo Polinomial
10
φ (º)
8
Referência
Sistema Linear
Sistema Não Linear
6
4
2
0
28
30
32
34
36
38
40
2
Sistema Linear
Sistema Não Linear
Ailerons (º)
1.5
1
0.5
0
−0.5
28
30
32
34
36
38
40
Tempo (s)
10
φ (º)
8
6
Referência
Sistema Linear
Sistema Não Linear
4
2
0
28
30
32
34
36
38
40
Ailerons (º)
1.5
Sistema Linear
Sistema Não Linear
1
0.5
0
−0.5
28
30
32
34
36
38
40
Tempo (s)
101
Controlo Polinomial
10
φ (º)
8
Referência
Sistema Linear
Sistema Não Linear
6
4
2
0
28
30
32
34
36
38
40
1.5
Ailerons (º)
1
Sistema Linear
Sistema Não Linear
0.5
0
−0.5
28
30
32
34
36
38
40
Tempo (s)
Cadeia Yaw
12
10
ψ (º)
8
Referência
Sistema Linear
Sistema Não Linear
6
4
2
0
−2
18
20
22
24
26
28
30
32
34
36
6
5
4
φ (º)
D.4.4
Sistema Não Linear
3
2
1
0
−1
18
20
22
24
26
28
30
32
34
36
Tempo (s)
Figura D.16: Controlo de yaw (18 m/s) - saı́das e actuações.
102
Controlo Polinomial
12
10
ψ (º)
8
6
Referência
Sistema Linear
Sistema Não Linear
4
2
0
−2
18
20
22
24
26
28
30
32
34
36
34
36
7
6
5
Sistema Não Linear
φ (º)
4
3
2
1
0
−1
18
20
22
24
26
28
30
32
Tempo (s)
12
10
ψ (º)
8
Referência
Sistema Linear
Sistema Não Linear
6
4
2
0
−2
18
20
22
24
26
28
30
32
34
36
10
8
φ (º)
6
Sistema Não Linear
4
2
0
−2
18
20
22
24
26
28
30
32
34
36
Tempo (s)
103
Controlo Polinomial
10
ψ (º)
8
6
Referência
Sistema Linear
Sistema Não Linear
4
2
0
−2
18
20
22
24
26
28
30
32
34
36
12
10
Sistema Não Linear
φ (º)
8
6
4
2
0
−2
18
20
22
24
26
28
30
32
34
36
Tempo (s)
104
ANEXO E
Controlo Adaptativo
Neste anexo apresentam-se modelos preditivos com especial destaque para o modelo preditivo
do MUSMAR.
Explicitam-se os princı́pios seguidos na identificação do modelo preditivo do MUSMAR.
Finalmente apresentam-se os resultados obtidos com o MUSMAR para a cadeia de roll.
E.1
Modelos preditivos
Tendo em vista a minimização de (7.1) pretende-se construir modelos preditivos. Admite-se
que o processo a controlar possa ser representado por um modelo ARX (Auto-Regressive with
Exogeneous Input):
A∗ (q −1 )y(t) = B ∗ (q −1 )u(t) + e(t)
A∗ (q −1 ) = 1 +
na
X
(E.1)
ai q −i
(E.2)
i=1
B ∗ (q −1 ) =
nb
X
bi q −i
(E.3)
i=0
em que y(.), u(.) e e(.) representam respectivamente a saı́da do processo, a entrada do processo e
uma perturbação incorrelacionada de média nula. A∗ (q −1 ), B ∗ (q −1 ) são polinómios no operador
atraso q −1 de ordem, respectivamente, na e nb .
A teoria das equações diofantinas garante que existem polinómios Fj∗ (q −1 ) e G∗j (q −1 ) com a
forma
Fj∗ (q −1 )
= 1+
j
X
fi q −i
(E.4)
i=1
G∗j (q −1 ) =
nX
a −1
gij q −i
(E.5)
i=0
que satisfazem:
1 = Fj∗ (q −1 )A∗ (q −1 ) + q −j−1 G∗j (q −1 )
(E.6)
Dado que se pretende um modelo preditivo, este deve ter a forma de y(t + j + 1) em função
de y(t) e u(t). Multiplicando (E.1) por Fj∗ (q −1 ) e considerando (E.6) chega-se a:
y(t + j + 1) = G∗j (q −1 )y(t) + Fj∗ (q −1 )B ∗ (q −1 )u(t + j) + Fj∗ (q −1 )e(t + j + 1)
105
(E.7)
Controlo Adaptativo
Como o termo e(t + j + 1) é incorrelacionado com as restantes parcelas, o estimador óptimo
de y(t + j + 1), dada a informação até ao instante t, é dado por:
ŷ(t + j + 1|t) = G∗j (q −1 )y(t) + Fj∗ (q −1 )B ∗ (q −1 )u(t + j)
(E.8)
Pretende-se separar a influência das entradas passadas das futuras. A teoria das equações
diofantinas garante que existem polinómios Ej∗ (q −1 ) e Hj∗ (q −1 ) com a forma
Hj∗ (q −1 )
=
j+1
X
hi q −i
(E.9)
i=1
nX
b −1
ζij q −i+1
(E.10)
Fj∗ (q −1 )B ∗ (q −1 ) = Hj∗ (q −1 ) + q −j−1 Ej∗ (q −1 )
(E.11)
Ej∗ (q −1 )
=
i=0
que satisfazem:
Com (E.11) rescreve-se (E.8) obtendo-se:
ŷ(t + j + 1|t) = G∗j (q −1 )y(t) + Hj∗ (q −1 )u(t + j) + Ej∗ (q −1 )u(t − 1)
(E.12)
Definindo os vectores de coeficientes,
Π0j+1 = [g0j , g1j , · · · , gnj a −1 , ζ0j , ζ1j , · · · , ζnj b −1 ]
0
Hj+1
= [h1 , h2 , · · · , hj+1 ]
(E.13)
(E.14)
o pseudoestado (vector com a informação passada para o cálculo da variável manipulada)
s(t) = [y(t), · · · , y(t − na − 1), u(t − 1), · · · u(t − nb )]0
(E.15)
e o vector de entradas futuras
U (t) = [u(t + T − 1), u(t + T − 2), · · · , u(t)]0
(E.16)
chega-se ao modelo preditivo
0
U (t) + Π0j+1 s(t) + ²t , j = 0, 1, · · · , T − 1
y(t + j + 1) = Hj+1
(E.17)
²t = [²1 (t), · · · , ²T (t)]0
(E.18)
onde
é um resı́duo incorrelacionado com os outros termos.
106
Controlo Adaptativo
E.2
Modelo preditivo do MUSMAR
Como foi referido anteriormente, o algoritmo MUSMAR restringe as amostras de controlo
futuras, de t + 1 até t + T − 1, por uma retroacção fixa do pseudoestado, deixando apenas u(t)
livre. Apenas este é aplicado ao processo - estratégia de horizonte recidivo. Esta restrição nas
amostras de controlo futuras modifica o modelo preditivo obtido anteriormente (E.17).
De acordo com a proposição 1 de [9] o modelo ARX (E.1), quando se considera uma retroacção
constante da amostra t + 1 até t + T − 1, admite modelos preditivos com a seguinte forma:
y(t + i) = θi u(t) + ψi0 s(t) + νyi (t)
(E.19)
u(t + i − 1) = µi−1 u(t) + φi−1 s(t) + νui (t) onde i = 1, ..., T
(E.20)
Nota: para i ≥ 2 os parâmetros do modelo (E.19 e E.20), contrariamente ao modelo (E.17),
dependem da retroacção aplicada ao processo.
Se ao modelo (E.19) se subtrair a referência, ref , obtém-se o modelo preditivo para os erros
de seguimento ye,
ye(t + i) = θi u(t) + ψi0 s(t) + νyi (t)
(E.21)
u(t + i − 1) = µi−1 u(t) + φ0i−1 s(t) + νui (t) onde i = 1, ..., T
(E.22)
Este modelo inclui as referências futuras no pseudoestado
s(t) = [y(t), · · · , y(t − na − 1), u(t − 1), · · · , u(t − nb ), ref (t + T ), · · · , ref (t + 1)]
Considerando a saı́da em função do erro de seguimento e da referência, y(t) = ref (t) − ye(t), o
pseudoestado assume a seguinte forma:
s(t) = [e
y (t), · · · , ye(t − na − 1), u(t − 1), · · · , u(t − nb ), ref (t + T ), · · · , ref (t + 1)]
Opcionalmente podem ser ainda adicionado ao pseudoestado variáveis de estado medidas e
perturbações acessı́veis.
E.3
Identificação do modelo preditivo do MUSMAR
Os parâmetros θi , ψi0 , µi e φ0i , dos modelos (E.21 e E.22) que são necessários para (7.4), são
estimados em cada instante de amostragem usando um algoritmo de identificação nomeadamente os mı́nimos quadrados recursivos com esquecimento direccional (DFRLS - directional
forgetting recursive least squares) [9].
Visto que os modelos (E.21 e E.22) apresentam o mesmo regressor, ϕ = [u(t)s0 (t)]0 , a carga
computacional envolvida na estimação é reduzida (apenas uma matriz de covariância, P , tem
que ser actualizada).
Nos mı́nimos quadrados recursivos com esquecimento direccional a matriz de informação,
Λ(t) = P −1 (t), é actualizada de acordo com:
Λ(t) = Λ(t − 1) + (1 − α(t))ϕ0 (t − 1)ϕ(t − 1)
107
(E.23)
Controlo Adaptativo
em que α(t) é um escalar que representa a quantidade de informação que vai ser perdida
segundo uma direcção ”dada”pela matriz caracterı́stica - ϕ0 (t − 1)ϕ(t − 1). Assim esquece-se
informação apenas segundo a direcção de onde nova informação chega.
Considera-se o seguinte modelo genérico:
y(t) = θ0 ϕ(t − 1) + η(t)
(E.24)
em que θ é o vector de parâmetros a estimar, ϕ(t) o regressor e η(t) ruı́do branco. As equações
de DFRLS para a estimação dos parâmetros θ são:
²(t) = y(t) − θ̂0 (t − 1)ϕ(t − 1)
K(t) =
1+
ϕ0 (t
(E.25)
P (t)ϕ(t − 1)
− 1)P (t − 1)ϕ0 (t − 1)[1 − α(t)]
θ̂(t) = θ̂(t − 1) + K(t)²(t)
P (t) = [I − ϕ(t)K(t)]P (t − 1)[1 + α(t)],
(E.26)
−1
com P (t) = Λ (t)
(E.27)
(E.28)
Um ponto a ser considerado é a quantidade de informação a ”esquecer”, α(t). Uma das
possibilidades, a utilizada pelo algoritmo MUSMAR, é fazer:
α(t) = (1 − λ) +
ϕ0 (t
1−λ
− 1)P (t − 1)ϕ(t − 1)
0< λ <1
(E.29)
(E.30)
onde λ pode ser visto como um factor de esquecimento segundo a direcção de onde chega
informação.
E.4
MUSMAR - Cadeia de roll
Apresentam-se duas simulações: uma com velocidade fixa e a outra com velocidade variável.
Para ambas mostram-se os ganhos, a actuação e o seguimento.
Os parâmetros considerados na simulação com velocidade fixa foram:
NA = 3 NB = 2 NG = 0 NV = 1 NX = 0 NW = 0
T = 5 Ts = 0.1 λ = 0.97 ρ = 1
η = 10−4 f load = 1
Com estes parâmetros obtiveram-se os seguintes resultados:
108
Controlo Adaptativo
Ganhos L
0.5
0
−0.5
−1
0
2
4
6
8
10
12
14
16
18
20
10
Roll [graus]
5
0
−5
Roll
Referencia
−10
Aelerons [graus]
−15
0
2
4
6
8
0
2
4
6
8
10
12
14
16
18
20
10
12
14
16
18
20
4
2
0
−2
−4
Tempo [s]
Figura E.1: MUSMAR - cadeia de roll. Ganhos, seguimento e ailerons.
Para o caso em que a velocidade varia definiu-se os seguintes parâmetros:
NA = 3 NB = 2 NG = 0 NV = 1 NX = 0 NW = 0
T = 5 Ts = 0.1 λ = 0.97 ρ = 10
η = 10−4 f load = 1
De seguida mostram-se os resultados obtidos na cadeia de roll para velocidade variável.
Velocidade U [m/s]
40
35
30
25
20
15
10
20
25
30
35
40
45
50
55
60
65
45
50
55
60
65
Tempo [s]
20
Roll [graus]
15
10
5
0
−5
−10
20
25
30
35
40
Tempo [s]
Figura E.2: MUSMAR - cadeia de roll com velocidade variável. Velocidade e seguimento.
109
Controlo Adaptativo
Ganhos L
0.2
0
−0.2
−0.4
0
10
20
0
10
20
30
40
50
60
30
40
50
60
3
Aelerons [graus]
2
1
0
−1
−2
−3
Tempo [s]
Figura E.3: MUSMAR - cadeia de roll com velocidade variável. Ganhos e ailerons.
110
ANEXO F
Guiamento
F.1
Sistemas de guiamento
Figura F.1: Sistema de guiamento em malha aberta
Figura F.2: Sistema de guiamento em malha fechada
111
Guiamento
F.2
Referências das trajectórias
Nesta secção apresentam-se as referências geradas para os controladores internos, das trajectórias que se encontram no capı́tulo 8.
• Subida
25
Velocidade (m/s)
24
23
22
21
20
19
Velocidade Desejada
Velocidade Real
0
20
40
60
80
100
5
140
Orientação Real
4
120
3
2
1
0
−1
0
20
40
60
80
100
120
140
Tempo (s)
Figura F.3: Subida em malha aberta - referências geradas para os controladores internos
25
Velocidade (m/s)
24
23
22
21
20
19
Velocidade Desejada
Velocidade Real
0
20
40
60
80
100
120
140
120
140
6
Orientação Real
5
4
3
2
1
0
−1
0
20
40
60
80
100
Tempo (s)
Figura F.4: Subida em malha fechada - referências geradas para os controladores internos
112
Guiamento
Velocidade (m/s)
• Circunferência
24
22
Velocidade Desejada
Velocidade Real
20
0
20
40
60
80
100
120
140
400
300
200
100
0
Orientação Real
0
20
40
60
80
100
120
140
120
140
0.5
0
Orientação Real
−0.5
−1
0
20
40
60
80
100
Tempo (s)
Figura F.5: Circunferência em malha fechada - referências geradas para os controladores internos
Velocidade (m/s)
• Espiral
24
22
Velocidade Desejada
Velocidade Real
20
0
20
40
60
80
100
120
140
1000
500
Orientação Real
0
−500
0
20
40
60
80
100
120
140
10
5
0
Orientação Real
−5
0
20
40
60
80
100
120
140
Tempo (s)
Figura F.6: Espiral em malha aberta - referências geradas para os controladores internos
113
Velocidade (m/s)
Guiamento
24
22
Velocidade Desejada
Velocidade Real
20
0
20
40
60
80
100
120
140
120
140
120
140
1000
500
Orientação Real
0
−500
0
20
40
60
80
100
20
10
Orientação Real
0
−10
0
20
40
60
80
100
Tempo (s)
Figura F.7: Espiral em malha fechada - referências geradas para os controladores internos
F.3
Outras trajectórias testadas no guiamento
Nesta secção apresentam-se os resultados obtidos para as restantes trajectórias testadas.
• Curva
600
y (m)
400
Trajectória Real
200
0
0
500
1000
1500
2000
x (m)
2500
3000
Altitude (m)
1002
Altitude Desejada
Altitude Real
1001
1000
999
998
0
20
40
Distância (m)
60
80
100
120
140
100
120
140
Tempo (s)
30
20
10
0
0
20
40
60
80
Tempo (s)
Figura F.8: Curva em malha aberta - trajectória no plano XOY, altitude e erro à trajectória
114
Velocidade (m/s)
Guiamento
24
22
Velocidade Desejada
Velocidade Real
20
0
20
40
60
80
100
120
140
80
100
120
140
120
140
30
20
10
Orientação Real
0
−10
0
20
40
60
0.5
Orientação Real
0
−0.5
−1
0
20
40
60
80
100
Tempo (s)
Figura F.9: Curva em malha aberta - referências geradas para os controladores internos
600
y (m)
400
Trajectória Real
200
0
0
500
1000
1500
2000
x (m)
2500
3000
Altitude (m)
1002
1001
1000
Altitude Desejada
Altitude Real
999
998
0
20
40
60
80
100
120
140
0
20
40
60
80
100
120
140
Tempo (s)
Distância (m)
15
10
5
0
Tempo (s)
Figura F.10: Curva em malha fechada - trajectória no plano XOY, altitude e erro à trajectória
115
Velocidade (m/s)
Guiamento
24
22
Velocidade Desejada
Velocidade Real
20
0
20
40
60
80
100
120
140
80
100
120
140
100
120
140
Orientação − ψ (º)
40
20
0
−20
Orientação Real
0
20
40
60
0.5
Orientação − θ (º)
Orientação Real
0
−0.5
−1
0
20
40
60
80
Tempo (s)
Figura F.11: Curva em malha fechada - referências geradas para os controladores internos
• Circunferência
y (m)
600
400
Trajectória Real
200
0
0
100
200
300
400
500
600
x (m)
Altitude (m)
1002
1000
Altitude Desejada
Altitude Real
998
996
0
20
40
60
0
20
40
60
80
100
120
140
80
100
120
140
Tempo (s)
Distância (m)
150
100
50
0
Tempo (s)
Figura F.12: Circunferência em malha aberta - trajectória no plano XOY, altitude e erro à
trajectória
116
Velocidade (m/s)
Guiamento
24
22
Velocidade Desejada
Velocidade Real
20
0
20
40
60
80
100
120
140
80
100
120
140
600
Orientação Real
400
200
0
0
20
40
60
0.5
Orientação Real
0
−0.5
−1
0
20
40
60
80
100
120
140
Tempo (s)
Figura F.13: Circunferência em malha aberta - referências geradas para os controladores internos
y (m)
600
400
Trajectória Real
200
0
−200
−100
0
100
200
x (m) 300
400
500
600
Altitude (m)
1002
1001
1000
999
998
Altitude Desejada
Altitude Real
0
20
40
60
80
100
120
140
0
20
40
60
80
100
120
140
Tempo (s)
Distância (m)
15
10
5
0
Tempo (s)
Figura F.14: Circunferência em malha fechada - trajectória no plano XOY, altitude e erro à
trajectória
117
Velocidade (m/s)
Guiamento
24
22
Velocidade Desejada
Velocidade Real
20
0
20
40
60
80
100
120
140
60
80
100
120
140
120
140
600
Orientação Real
400
200
0
0
20
40
0.5
Orientação Real
0
−0.5
−1
0
20
40
60
80
100
Tempo (s)
Figura F.15: Circunferência em malha fechada - referências geradas para os controladores
internos
• Sinusóide lateral 1
y (m)
50
0
Trajectória Real
−50
0
500
1000
1500
x (m)
2000
2500
3000
3500
Altitude (m)
1002
Altitude Desejada
Altitude Real
1001
1000
999
998
0
20
40
60
80
100
120
140
80
100
120
140
Tempo (s)
Distância (m)
15
10
5
0
0
20
40
60
Tempo (s)
Figura F.16: Sinusóide lenta em malha aberta - trajectória no plano XOY, altitude e erro à
trajectória
118
Velocidade (m/s)
Guiamento
24
22
Velocidade Desejada
Velocidade Real
20
0
20
40
60
80
100
120
140
100
120
140
100
120
140
10
5
0
Orientação Real
−5
−10
0
20
40
60
80
0.5
Orientação Real
0
−0.5
−1
0
20
40
60
80
Tempo (s)
Figura F.17: Sinusóide lenta em malha aberta - referências geradas para os controladores
internos
y (m)
50
0
Trajectória Real
−50
0
500
1000
1500
x (m)
2000
2500
3000
3500
Altitude (m)
1002
1001
1000
999
998
Altitude Desejada
Altitude Real
0
20
40
60
80
100
120
140
80
100
120
140
Tempo (s)
Distância (m)
6
4
2
0
0
20
40
60
Tempo (s)
Figura F.18: Sinusóide lenta em malha fechada - trajectória no plano XOY, altitude e erro à
trajectória
119
Velocidade (m/s)
Guiamento
24
22
Velocidade Desejada
Velocidade Real
20
0
20
40
60
80
100
120
140
60
80
100
120
140
100
120
140
20
10
0
−10
−20
Orientação Real
0
20
40
0.5
Orientação Real
0
−0.5
−1
0
20
40
60
80
Tempo (s)
Figura F.19: Sinusóide lenta em malha fechada - referências geradas para os controladores
internos
• Sinusóide lateral 2
A sinusóide desta simulação difere da anterior (sinusóide lateral 1) na frequência. Esta tem
uma frequência maior que a anterior o que provoca um erro maior de seguimento.
y (m)
20
0
Trajectória Real
−20
0
500
1000
1500
x (m)
2000
2500
3000
3500
Altitude (m)
1002
Altitude Desejada
Altitude Real
1001
1000
999
998
0
20
40
60
80
100
120
140
0
20
40
60
80
100
120
140
Tempo (s)
Distância (m)
15
10
5
0
Tempo (s)
Figura F.20: Sinusóide rápida em malha aberta - trajectória no plano XOY, altitude e erro à
trajectória
120
Velocidade (m/s)
Guiamento
24
22
Velocidade Desejada
Velocidade Real
20
0
20
40
60
80
100
120
140
60
80
100
120
140
10
Orientação Real
5
0
−5
−10
0
20
40
0.5
Orientação Real
0
−0.5
−1
0
20
40
60
80
100
120
140
Tempo (s)
Figura F.21: Sinusóide rápida em malha aberta - referências geradas para os controladores
internos
Trajectória Real
y (m)
20
0
−20
0
500
1000
1500
x (m)
2000
2500
3000
3500
Altitude (m)
1002
1001
1000
Altitude Desejada
Altitude Real
999
Distância (m)
998
0
20
40
60
80
100
120
140
0
20
40
60
80
100
120
140
Tempo (s)
8
6
4
2
0
Tempo (s)
Figura F.22: Sinusóide rápida em malha fechada - trajectória no plano XOY, altitude e erro à
trajectória
121
Velocidade (m/s)
Guiamento
24
22
Velocidade Desejada
Velocidade Real
20
0
20
40
60
80
100
120
140
60
80
100
120
140
120
140
20
Orientação Real
10
0
−10
−20
0
20
40
0.5
Orientação Real
0
−0.5
−1
0
20
40
60
80
100
Tempo (s)
Figura F.23: Sinusóide rápida em malha fechada - referências geradas para os controladores
internos
• Subida
1035
1030
Altitude (m)
1025
1020
1015
1010
1005
Altitude Desejada
Altitude Real
1000
995
0
20
40
60
80
100
120
140
0
20
40
60
80
100
120
140
Distância (m)
4
3
2
1
0
Tempo (s)
Figura F.24: Subida em malha aberta - altitude e erro à trajectória
122
Guiamento
25
Velocidade (m/s)
24
23
22
21
20
19
Velocidade Desejada
Velocidade Real
0
20
40
60
80
100
8
140
Orientação Real
6
120
4
2
0
−2
0
20
40
60
80
100
120
140
Tempo (s)
Figura F.25: Subida em malha aberta - referências geradas para os controladores internos
1040
Altitude (m)
1030
1020
1010
1000
990
Altitude Desejada
Altitude Real
0
20
40
60
80
100
120
140
0
20
40
60
80
100
120
140
Distância (m)
4
3
2
1
0
Tempo (s)
Figura F.26: Subida em malha fechada - altitude e erro à trajectória
123
Guiamento
25
Velocidade (m/s)
24
23
22
21
20
19
Velocidade Desejada
Velocidade Real
0
20
40
60
80
100
10
140
Orientação Real
8
120
6
4
2
0
−2
0
20
40
60
80
100
120
140
Figura F.27: Subida em malha fechada - referências geradas para os controladores internos
• Sinusóide longitudinal
Altitude (m)
1010
1005
1000
995
Altitude Desejada
Altitude Real
990
0
20
40
60
80
100
120
140
0
20
40
60
80
100
120
140
3
Distância (m)
2.5
2
1.5
1
0.5
0
Tempo (s)
Figura F.28: Sinusóide em altitude em malha aberta - altitude e erro à trajectória
124
Guiamento
25
Velocidade (m/s)
24
23
22
21
20
19
Velocidade Desejada
Velocidade Real
0
20
40
60
80
100
120
140
60
80
100
120
140
3
2
1
0
−1
−2
Orientação Real
−3
−4
0
20
40
Tempo (s)
Figura F.29: Sinusóide em altitude em malha aberta - referências geradas para os controladores
internos
1015
Altitude (m)
1010
1005
1000
995
990
985
Altitude Desejada
Altitude Real
0
20
40
60
80
100
120
140
0
20
40
60
80
100
120
140
2.5
Distância (m)
2
1.5
1
0.5
0
Tempo (s)
Figura F.30: Sinusóide em altitude em malha fechada - altitude e erro à trajectória
125
Guiamento
25
Velocidade (m/s)
24
23
22
21
20
19
Velocidade Desejada
Velocidade Real
0
20
40
60
80
100
120
140
60
80
100
120
140
4
2
0
−2
−4
Orientação Real
0
20
40
Tempo (s)
Figura F.31: Sinusóide em altitude em malha fechada - referências geradas para os controladores internos
126
Bibliografia
[1] Mendonça Rato, L.M. e Neves da Silva, R., 1993.
Piper PA 18 Super Cub 1/4 Escala - Modelo Não Linear
INESC, Lisboa.
[2] Neves da Silva, R., 1994.
Controlo de Aeronave Não Tripulada usando Técnicas LQG/LTR de Ganho Variável.
IST, Lisboa.
[3] Mendonça Rato, L.M., 1994.
Técnicas de Controlo Adaptativo aplicadas a uma Aeronave Não Tripulada.
IST, Lisboa.
[4] McLean, D., 1990.
Automatic Flight Control Systems
Prentice Hall International, U.K.
[5] Franklin, G.F., Powell, J.D. e Emami-Naeini, A., 2002.
Feedback Control of Dynamic Systems
Addisson-Wesley Publishing Company, U.S.A.
[6] Goodwin, G., Sin, K., 1984.
Adaptive Filtering Prediction and Control
Prentice Hall International, New Jersey.
[7] Åström, K., Wittenmark, B., 1990.
Computer Controlled Systems
Prentice Hall International Editions, London, UK.
[8] Åström, K., Wittenmark, B., 1989.
Adaptive Control
Addison-Wesley Publishing Company, U.S.A.
[9] George, W., Zobrist e Chung You, H., 1994.
Progress in Robotics and Intelligent Systems
Ablex Publishing Corporation, New Jersey.
[10] Lorenzo, S. e Bruno, S., 1996.
Modeling And Control Of Robot Manipulators
The MacGraw-Hill Companies, INC.
[11] MIL-F-8785C
Military Specification, Flying Qualities of Piloted Airplanes
November, 1980.
[12] Hunt, K.J. e Johansen, T.A.
Design and Analysis of Gain-Scheduled Local Controller Networks
Int.J.Control, vol. 66. pp.619-651, 1997.
127
BIBLIOGRAFIA
[13] Roskam, J., 1979
Airplane Flight Dynamics and Automatic Flight
Roskam Aviation and Engineering Corporation, Ottawa, Kansas.
[14] Aslin, P., 1985
Aircraft Simulation and Robust Flight Control System Design
The British Library, West Yorkshire, U.K.
[15] Craig, J. J., 1989
Introduction to Robotics
Addison-Wesley Publishing Company.
[16] Fu, K. S., Gonzalez, R. C. e Lee, C. S. G., 1987
ROBOTICS: Control, Sensing, Vision and Inteligence
McGraw Hill International.
[17] SIMULINK, User’s Guide
The Math Works, Inc.
[18] Aircraft Flight Control
Int.J.Control, vol. 59, Number 1, 1994.
[19] Balas, G. J., 2003
Flight Control Law Design: An Industry Perspective
European Journal Of Control, vol. 9, pp.207-226, 2003
[20] Johansen, T.A., Hunt, K.J. e Fritz, H., 1998
A Software Environment for Gain Scheduled Controller Design
IEEE Control Systems Magazine, 1998
[21] Rugh, W. J., 1991
Analytical Framework for Gain Scheduling
IEEE Control Systems Magazine, 1991
[22] Mulgund, S.S. e Stengel, R.F., 1996
Optimal Nonlinear Estimation for Aircraft Flight Control in Wind Shear
Automatica, vol. 32, Number 1, pp.3-13, 1996
[23] Tischler, M.B., 1995
System Identification Methods for Aircraft Flight Control Development and Validation
NASA Technical Memorandum 110369; USAATCOM Technical Report 95-A-007 1995
[24] Lemos, J.M. e Rato L.M, 1995
TunerPack, Técnicas de Identificação de sistemas e Afinação de Controladores
INESC, Intituto de Engenharia de Sistemas e Computadores
[25] Lemos, J.M. e Rato L.M, 1995
TunerPack, Manual de Referência
INESC, Intituto de Engenharia de Sistemas e Computadores
128

Piloto Automático de uma Aeronave

Transcrição

Documentos relacionados

VOACTIVO

Controlador de trânsito aéreo

controlador central estores zmsrp03

Teorema de Ptolomeu

Teorias da luz. Experiências

Baixar Material Teórico

Superando o Turismo

Empanada de Frango com Sultanas Ingredientes p/ a massa

MA13 – Geometria – AV1 – 2014 Quest˜ao 1 [ 2,0 pt ] Considere um

SOCCER