dE EQUAÇÕES DE EULER

Transcrição

UNIVERSIDADE FEDERAL DO CEARÁ
DEPARTAMENTO DE MATEMÁTICA
INTRODUÇÃO AO
CÁLCULO DAS VARIAÇÕES.
Juscelino Pereira Silva
FORTALEZA-CE
2005
Sumário
1 Introdução
3
2 Elementos da Teoria
5
2.1 Conceitos Básicos . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 A Variação de um Funcional . . . . . . . . . . . . . . . . . . . 11
2.3 O Teorema da Divergência . . . . . . . . . . . . . . . . . . . . 17
3 Equações de Euler-Lagrange
21
3.1 A Equação de Euler-Lagrange. . . . . . . . . . . . . . . . . . . 21
3.2 O Princı́pio de Fermat . . . . . . . . . . . . . . . . . . . . . . 27
4 Problemas Variacionais
30
4.1 Distância mı́nima no plano. . . . . . . . . . . . . . . . . . . . 30
4.2 Braquistócrona . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.3 Superfı́cie de revolução de área mı́nima . . . . . . . . . . . . . 34
5 Equação de Euler-Lagrange generalizada.
5.1 Equação de Euler-Lagrange generalizada. .
5.2 Geodésicas . . . . . . . . . . . . . . . . . .
5.3 Problemas Isoperimétricos . . . . . . . . .
5.4 A Catenária. . . . . . . . . . . . . . . . . .
5.5 O Problema Isoperimétrico Original. . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
37
37
39
42
43
45
6 Equações de Hamilton
47
6.1 As Equações de Hamilton . . . . . . . . . . . . . . . . . . . . 47
6.2 Integral Primeira para as Equações de Hamilton . . . . . . . . 49
7 O Princı́pio Variacional de Hamilton
54
7.1 Dinâmica Lagrangiana . . . . . . . . . . . . . . . . . . . . . . 54
7.2 Oscilador Harmônico Simples . . . . . . . . . . . . . . . . . . 58
7.3 Forças Centrais. . . . . . . . . . . . . . . . . . . . . . . . . . . 59
1
2
8 A Equação de Euler-Lagrange em RN .
62
8.1 A Equação de Euler-Lagrange em RN . . . . . . . . . . . . . . 62
8.2 O Princı́pio de Dirichlet . . . . . . . . . . . . . . . . . . . . . 64
8.3 O Problema de Plateau . . . . . . . . . . . . . . . . . . . . . . 66
Referências Bibliográficas
69
Capı́tulo 1
Introdução
Estas notas foram escritas no intuito de dar a alunos de graduação
em matemática, fı́sica ou engenharia, que possuam um curso de cálculo de
funções reais de várias variáveis e gosto pela matemática, uma breve introdução ao Cálculo das Variação. No capı́tulo 2 fizemos a breve apresentação
de alguns conceitos fundamentais sobre Algebra Linear e Cálculo Diferencial
indispensáveis ao desenvolvimento da teoria. No capı́tulo 3 é apresentadas as
equações de Euler-Lagrange e como aplicação para a mesma é apresentado o
prı́ncı́pio de Fermat para a propagação da luz. No capı́tulo 4 são apresentados
alguns problemas variacionais clássicos como: curva que minimiza distância
no plano euclidiano, o problema da Braquistócrona ou ainda conhecida como
a curva que une dois pontos de forma a minimizar o tempo e o problema de
encontrar a curva perfil que gera uma superfı́cie de rotação com área mı́nima.
No capı́tulo 5 são introduzidas as equações de Euler-Lagrange para problemas com N graus de liberdade e como aplicação às mesmas são feitos alguns
comentários sobre geodésicas sobre superfı́cies em R3 , entretanto o fato primordial de tal capı́tulo é o teorema do Multiplicador de Lagrange, que não é
demonstrado mas é indicada uma referência. No capı́tulo 6 são apresentadas
as equações de Hamilton e alguns exemplos onde tais equações podem ser
aplicadas e ainda é dada uma condição necessária e suficiente para tal sistema de equações possuir uma integrau primeira. O capı́tulo 7 versa sobre a
dinâmica lagrangiana e tem como ponto primordial o princı́pio variacional de
Hamilton e ainda alguns exemplos. No caı́tulo 8 é apresentada a equação de
Euler-Lagrange em RN e como aplicações às mesmas são apresentados o
princı́pio de Dirichlet e problema de Plateau para superfı́cies em R3 . É de
suma importância salientar que durante o decorrer destas notas fazemos o
uso das equações de Euler-Lagrange para estudar os problemas variacionais
admitindo, em várias circunstâncias, que as soluções das Equações de EulerLagrange são, de fato, mı́nimos(máximos) para os funcionais em questão, de3
CAPÍTULO 1. INTRODUÇÃO
4
vido as equações de Euler-Lagrange serem somente uma condição necessária
para tais fato, e não suficiente. tais condições suficientes são dadas com o
estudo mais profundo da segunda variação do funcional, o que pretendemos
fazer em breve. por último resta comentar que tais notas não são, em sua totalidade, originais, boa parte dela é inspirada e tem como principal referência
o excelente livro “Calculus of Variations”, dos autores Gelfand e Fomin, cujo
mesmo está nas referências bibliográficas dessas notas. Agradeço ainda a
Antonio Caminha M. Neto e Wilson Hugo C. Freire pela leitura, correções
de vários erros e pelas valiosas sugestões.
Juscelino P. Silva
Fortaleza-Ce
Junho de 2005
Capı́tulo 2
Elementos da Teoria
2.1
Conceitos Básicos
Introduziremos aqui alguns conceitos fundamentais para o desenvolvimento
da teoria que abordaremos nos próximos capı́tulos.
Definição 2.1.1 O par (E, ||.||) será dito um R-Espaço Vetorial Normado
se, dados x, y, z ∈ E e α, β ∈ R arbitrários, os seguintes axiomas forem
satisfeitos:
1. x + y = y + x;
2. (x + y) + z = x + (y + z);
3. Existe um elemento 0(elemento zero) tal que x+0 = x para todo x ∈ E;
4. Para cada x ∈ E existe um elemento −x tal que x + (−x) = 0;
5. 1.x = x;
6. α(βx) = (αβ)x;
7. (α + β)x = αx + βx;
8. α(x + y) = αx + αy;
9. ||x|| ≥ 0 e ||x|| = 0 se e somente se x = 0;
10. ||αx|| = |α|.||x||;
11. ||x + y| ≤ ||x|| + ||y||.(Desigualdade Triangular)
5
CAPÍTULO 2. ELEMENTOS DA TEORIA
6
Obs 2.1.1 Os axiomas 9, 10 e 11 são relativos a definição de espaço normado.
Definição 2.1.2 Um subconjunto X ⊆ E é dito um subespaço vetorial de E
se dados quaisquer dois elementos x, y ∈ X e α ∈ R então x + αy ∈ X.
Definição 2.1.3 Uma base {e1 , ..., ei , ...} é um conjunto de elementos de E
tais que cada elemento x ∈ E é uma combinação linear finita de elementos
{ei } da forma:
k
X
x=
αj ej , αj ∈ R
j=1
e mais ainda tal conjunto {ei } é linearmente independente(l.i.), ou seja, dada
combinação linear
α1 x1 + ... + αk xk = 0
teremos então, obrigatoriamente, que todos os escalares αi devem ser nulos.
Obs 2.1.2 Existem espaços vetoriais que não possuem base enumerável, e
portanto, uma base para tais espaços é da forma {eλ }λ∈Λ onde Λ é um conjunto de ı́ndices não enumerável. Mas, por simplicidade, consideraremos
aqui apenas espaços vetoriais que possuam base enumerável.
Obs 2.1.3 Qualquer base de um espaço vetorial E possui a mesma quantidade de elementos.
Definição 2.1.4 A dimensão dim E de um espaço vetorial E é definida como
sendo o número de elementos de uma base de E.
Definição 2.1.5 Sejam E e F dois R-espaços vetorais. Uma tranformação
linear T : E → F é uma regra que associa a cada elemento x ∈ E um único
elemento T (x) ∈ F e que satistaz as seguintes propriedades:
1. T (x + y) = T (x) + T (y);
2. T (αx) = αT (x).
para quaisquer x, y ∈ E e α ∈ R. Quando F = R, tais tansformações recebem
o nome de funcionais lineares.
Definição 2.1.6 Uma transformação linear T : (E, ||.||1 ) → (F, ||.||2 ) é dita
contı́nua em x ∈ E se dado > 0 existe δ > 0 tal que
||T (x) − T (y)||2 < se ||x − y||1 < δ. Tal transformação é dita contı́nua se a mesma o for em
todos os pontos x ∈ E.
7
Teorema 2.1.1 Seja T : (E, ||.||1 ) → (F, ||.||2 ) uma transformação linear entre espaços vetoriais normados E e F. As seguintes afirmações são
equivalentes:
1. T é contı́nua;
2. T é contı́nua em 0;
3. Existe M > 0 tal que ||T (x)||2 ≤ M ||x||1 (Limitação);
4. Existe M > 0 tal que ||T (x) − T (y)||2 ≤ M ||x − y||1 .
Demonstração: (1) ⇒ (2) É óbvia.
(2) ⇒ (3) Tomando = 1 tem-se que existe δ > 0 tal que ||x||1 < δ implica
que ||T (x)||2 < 1, pela continuidade de T em 0. Escolha agora M qualquer
tal que 0 < 1/M < δ. A relação ||T (x)||2 ≤ M ||x||1 é trivialmente satisfeita
x
para x = 0, daı́ considerando x 6= 0,
tem norma 1/M , portanto
M ||x||1
menor que δ. Logo,
x
||T (
)||2 < 1 ⇒ ||T (x)||2 ≤ M ||x||1 .
M ||x||1
(3) ⇒ (4) Decorre da linearidade de T .
(4) ⇒ (1) Dado > 0 arbitrário basta tomar δ = /M .
Definição 2.1.7 O conjunto formado pelos funcionais lineares f : E → R
é chamado de espaço dual de E e representado por E∗ (dual algébrico). E∗ é
um espaço vetorial munido das seguintes propriedades:
1. (f + g)(x) := f (x) + g(x) ∀x ∈ E;
2. (αf )(x) := αf (x) ∀x ∈ E λ ∈ R.
A base canônica de E∗ é formada pelos funcionais lineares {dx1 , ..., dxi , ...}
definidos pela seguinte sentença:
dxi (ej ) = δij (delta de Kronecker)
onde
δij =
1, se i = j
0, se i 6= j
Definição 2.1.8 E0 ⊆ E∗ (dual topológico) é o conjunto formado por todos
os funcionais lineares f : E → R contı́nuos. Tem-se que (E0 , ||.||E0 ) é um
subespaço vetorial normado de E∗ munido da seguinte norma:
||f ||E0 := sup |f (x)|
||x||=1
8
Obs 2.1.4 Se dim E = ∞ então E0 6= E∗ e se dim E < ∞ então E0 = E∗ .
Exemplo 1: Um funcional linear descontı́nuo. Seja E o conjunto dos
polinômios reais com uma variável. E é um espaço vetorial normado munido pela norma ||p|| = sup |p(x)|. Considere agora f : E → R definida
0≤x≤1
por f (p) = p(2), é claro que f é um funcional linear. Mostraremos
x nque f
é descontı́nuo em 0 ∈ E(polinômio nulo). De fato seja pn (x) =
uma
2
sequência de polinômios em E. Note que
x n 1
1
=
||pn − 0|| = ||pn || = sup <
n
2
2
n
0≤x≤1
e portanto temos que pn → 0 quando n → ∞. No entanto note que
|f (pn ) − f (0)| = |f (pn )| = pn (2) = 1 >
1
2
implicando dessa forma que f (pn ) 6→ f (0) quando n → ∞, e portanto, f é
descontı́nuo em 0.
Exemplo 2: O espaço Euclidiano RN . Tem-se que o (RN , ||.||e ) é um Respaço vetorial normado munido com as seguintes operações:
1. (x1 , ..., xN ) + (y1 , ..., yN ) := (x1 + y1 , ..., xN + yN );
2. α(x1 , ..., xN ) := (αx1 , ..., αxN ), α ∈ R.
e com a seguinte norma:
v
u N
uX
p
x2i .
||(x1 , ..., xN )||e := h(x1 , ..., xN ), (x1 , ..., xN )i = t
i=1
onde h, i simboliza o produto interno canônico em RN . Seja ainda {e1 , ..., eN }
i
z}|{
a base canônica de RN , ou seja, ei = (0, ..., 0, 1 , 0, ..., 0) temos associada a
mesma, a base dual {dx1 , ..., dxN } definida em (2.1.7).
Exemplo 3: O espaço de funções C([0, 1], R). O conjunto formado pelas
funções contı́nuas f : [0, 1] → R munido com as operações definidas em
(2.1.7) e pela norma
||f ||0 := sup |f (x)|
0≤x≤1
9
é um espaço vetorial normado. Em alguns contextos C([0, 1], R) é munido da
norma
s
Z 1
f (x)2 dx.
||f ||L2 :=
0
Tal norma provém do produto interno
Z 1
hf, giL2 :=
f (x)g(x)dx.
0
Note que ||f ||L2 ≤ ||f ||0 . O espaço C([0, 1], R) é chamado de espaço vetorial
das funções contı́nuas definidas em [0, 1].
Exemplo 4: O espaço de funções C 1 ([0, 1], R). O conjunto formado pelas
funções f : [0, 1] → R deriváveis cujas derivadas são contı́nuas, munido com
as operações definidas em 2.1.7 e pela norma
||f ||1 := sup |f (x)| + sup |f 0 (x)| = ||f ||0 + ||f 0 ||0
0≤x≤1
0≤x≤1
é um espaço vetorial normado. Em alguns contextos C 1 ([0, 1], R) é munido
da norma
s
s
Z 1
Z 1
||f ||H 1 :=
|f (x)|2 dx +
|f 0 (x)|2 dx.
0
0
Note que ||f ||0 ≤ ||f ||1 . O espaço C 1 ([0, 1], R) é chamado de espaço vetorial
das funções de classe C 1 definidas em [0, 1].
Obs 2.1.5 O espaço de funções C k ([0, 1], R), onde k ≥ 1 é inteiro, é definido
de forma análoga.
Definição 2.1.9 Uma forma bilinear B : E×E → R é uma regra que associa
a cada par de elementos (x, y) um único número real B(x, y) que satisfaz as
seguintes propriedades:
1. Para cada x ∈ E fixado, y 7→ B(x, y) é linear;
2. Para cada y ∈ E fixado, x 7→ B(x, y) é linear.
Definição 2.1.10 Uma forma bilinear B : E×E → R é dita contı́nua quando
existe uma constante M > 0 tal que
|B(x, y)| ≤ M ||x||.||y|| ∀x, y ∈ E
e dita coerciva quando existe uma constante N > 0 tal que
N ||x||2 ≤ B(x, x) ∀x ∈ E.
10
Obs 2.1.6 Um produto interno h, i é uma forma bilinear simétrica, ou seja,
B(x, y) = B(y, x) para quaisquer x, y ∈ E.
Definição 2.1.11 Uma forma quadrática Q : E → R associada a uma forma
bilinear B (2.1.9) é uma regra que associa a cada x ∈ E um único número
real Q(x) := B(x, x).
Vejamos agora a deigualdade de Cauchy1 -Schwarz2
Lema 2.1.1 (Desigualdade de Cauchy-Schwarz) Seja (E, h, i)
R-espaço vetorial com produto interno. Sejam x, y ∈ E então
um
| hx, yi | ≤ ||x||.||y||
e a igualdade vale se, e somente se, existe α ∈ R tal que x + αy = 0.
Demonstração: Sejam x, y ∈ E fixados. Defina a seguinte função real
g : R → R por g(t) = ||x + ty||2 . Usando a bilinearidade do produto interno
segue que
g(t) = ||x||2 + 2t hx, yi + t2 ||y||2 .
Portanto g é uma função quadrática não-negativa na variável t, implicando
assim que seu discriminante deve ser não positivo. Note que o discriminante
de g é
4 hx, yi2 − 4||x||2 .||y||2
daı́, segue que
| hx, yi | ≤ ||x||.||y||.
Por último note que, a igualdade acima é válida se, e somente se, g possui
uma raı́z real. Daı́ segue o resultado.
Definição 2.1.12 Seja (E, h, i) um espaço vetorial com produto interno. Uma
base {e1 , ..., ei , ...} de E é dita ortonormal se hei , ej i = δij .
Obs 2.1.7 Existe um processo denominado de Ortogonalização de
Gram-Schmidt pelo qual dada uma base qualquer é possı́vel transformá-la
em uma base ortonormal.
Vejamos o importante teorema de Riesz3
1
Augustin Louis Cauchy(1789-1857), nascido em Paris na França.
Hermann Amandus Schwarz(1843-1921) nascido em Hermdorf na Polônia.
3
Frigyes Riesz(1880-1956) nascido em Györ na Hungria.
2
11
Teorema 2.1.2 (Representação de Riesz) Seja (E, h, i) um espaço vetorial de dimensão finita e f : E → R um funcional linear, então existe um
único elemento vf ∈ E que representa f , i.e.,
f (x) = hx, vf i ∀x ∈ E.
Demonstração:
PN Seja {e1 , ..., eN } uma base ortonormal
PN de E, defina o elemento vf :=
f
(e
)e
.
Seja
x
∈
E,
então
x
=
i i
i=1
j=1 αj ej e portanto
PN
f (x) = j=1 αj f (ej ). Por outro lado, temos que
* N
+
N
N
N
X
X
X
X
hx, vf i =
αj ej ,
f (ei )ei =
αj f (ei )δij =
αi f (ei ) = f (x).
j=1
i=1
i,j=1
i=1
Daı́ está provada a existência. Suponhamos que existam dois representantes
para f em E, digamos, vf e wf , então segue, pela representação que
hx, vf i = hx, wf i ∀ x ∈ E
e por linearidade segue que hx, vf − wf i = 0 ∀x ∈ E, em particular, para
x = vf − wf e dessa forma ||vf − wf ||2 = 0, implicando que vf = wf , daı́
resultando a unicidade, e portanto o teorema está provado.
Obs 2.1.8 O teorema de Riesz é válido ainda em dimensão infinita com as
hipóteses de f ser contı́nuo e de E ser um espaço de Hilbert.45
2.2
A Variação de um Funcional
Definição 2.2.1 Um subconjunto A ⊆ E, onde E é um espaço vetorial
normado, é dito uma Variedade Afim quando a reta que une dois
pontos quaisquer de A está contida em A. Assim, A ⊆ E é uma variedade
afim se, e somente se, cumpre a seguinte condição:
x, y ∈ A, t ∈ R ⇒ (1 − t)x + ty ∈ A.
Obs 2.2.1 Todo espaço vetorial normado (E, ||.||) é um espaço é uma
variedade afim.
Obs 2.2.2 Encare A como um espaço vetorial transladado da origem, na
realidade dado um y ∈ A existe um único F ⊆ E, subespaço vetorial de E,
tal que A = y + F.6 F será chamado de Espaço Tangente a A.
4
David Hilbert(1862-1943) nascido em Königsberg na Prússia, hoje Rússia.
Ver Brezis.
6
Ver Elon L. Lima, Álgebra Linear.
5
12
Definição 2.2.2 Um funcional7 J : A → R é uma regra que a cada y ∈ A
associa um único número real J[y] onde A é uma variedade afim.
Obs 2.2.3 Em geral, funcionais não precisam ser definidos em uma
variedade afim, entretando, para os propósitos desse trabalho, defini-los dessa
forma é suficiente.
Definição 2.2.3 Um funcional J é dito contı́nuo em y ∈ A se dado > 0
existe δ > 0 tal que
|J[y] − J[x]| < se ||y − x|| < δ. Tal funcional é dito contı́nuo se o mesmo o for em todos os
pontos y ∈ A.
Definição 2.2.4 Sejam y ∈ A e h ∈ F ⊆ E o funcional J é dito diferenciável8 se
J[y + h] − J[y] = Φy (h) + R(h)||h||.
onde Φy : F → R é um funcional linear e R = R(h) é um funcional tal que
lim R(h) = 0.
||h||→0
A parte linear Φy (h) de J[y + h] − J[y] é chamada de variação(ou diferencial)
de J em y que denotaremos por δJ[y] = Φy .
Obs 2.2.4 Perceba a natureza da variação δJ. Tem-se que δJ : A → E∗ é
uma regra que associa a cada y ∈ A um único funcional linear δJ[y] : F → R,
como mostra o seguinte diagrama:
δJ : A −→
F∗
y 7−→ δJ[y] : F −→
R
h 7−→ δJ[y]h
Definição 2.2.5 Sejam y ∈ A e h ∈ F, definimos a derivada(funcional) de
J em y “na direção de h” como
J[y + th] − J[y]
t→0
t
δJ[y]h := lim
quando tal limite existe.
7
O funcional J não é, em geral, um funcional linear.
Em alguns livros, R é definido de uma forma um pouco diferente, mas equivalente a
essa definição.
8
13
Obs 2.2.5 Você pode achar estranho a nomenclatura “direcional”, pois h é
uma função. Lembre-se que h ∈ F que é um espaço vetorial, logo funções
como h são vetores num espaço de funções. A nomenclatura “direcional” é
apenas no sentido de fazer uma analogia com o caso Euclidiano.
Teorema 2.2.1 (Unicidade da diferencial) A diferencial de um funcional
diferenciável é única.
Demonstração: Seja y ∈ A fixado. Mostraremos inicialmente que se Φy é
um funcional linear tal que
Φy (h)
→0
||h||
quando ||h|| → 0, então Φy ≡ 0, i.e., Φy é o funcional nulo. De fato, suponha
que existe um h0 6= 0 ∈ E tal que Φy (h0 ) 6= 0. Defina a seguinte sequência
hn =
h0
,
n
λ=
Φy (h0 )
,
||h0 ||
note que ||hn || → 0 quanto n → ∞, entretanto
Φy (hn )
nΦy (h0 )
= lim
= λ 6= 0,
n→∞ ||hn ||
n→∞ n||h0 ||
lim
contrariando a nossa hipótese.
Suponhamos agora que a diferencial de J em y não seja única, digamos
Φy e Ψy , então
J[y + h] − J[y] = Φy (h) + R1 (h)||h||,
J[y + h] − J[y] = Ψy (h) + R2 (h)||h||,
onde R1 (h), R2 (h) → 0 quando k|h|| → 0. Dessa forma temos
(Φy − Ψy )(h) = R1 (h)||h|| − R2 (h)||h||
implicando assim que
(Φy − Ψy )(h)
= R1 (h) − R2 (h).
||h||
Tem-se que Φy − Ψy é um funcional linear e R1 (h) − R2 (h) → 0 quando
||h|| → 0, daı́ segue, pelo resultado provado inicialmente, que o funcional
linear Φy −Ψy é identicamente nulo, dessa forma ficando provado o teorema.
14
Definição 2.2.6 O funcional J : A → R é dito de classe C 1 quando
δJ : A → F0 ⊆ F∗ é contı́nua, isto dado y ∈ A arbitrário e > 0 existe
δ > 0 tal que
||y − x|| < δ ⇒ ||δJ[y] − δJ[x]||F0 < .
Definição 2.2.7 Um funcional J : A → R é dito duas vezes diferenciável se
dado y ∈ A e h ∈ F tem-se que
J[y + h] − J[y] = δJ[y]h + Ψy (h) + R(h)||h||2
onde Ψy : F → R é uma forma quadrática representada por δ 2 J[y] é
denominada de segunda variação(ou diferencial segunda) de J no ponto y
e R(h) → 0 quando ||h|| → 0.
Obs 2.2.6 Na realidade, a diferencial segunda de J é uma regra que associa
a cada ponto y ∈ A uma forma bilinear B(y) : F × F → R, no entanto,
como o vetor h é fixado temos B(y)(h, h), i.e., a forma quadrática associada
a B(y), que no caso acima é δ 2 J[y](h, h) = δ 2 J[y]h2 .
Obs 2.2.7 A diferencial segunda de um funcional duas vezes diferenciável é
única.
Exemplo 5: Seja Ω ⊆ RN um domı́nio, i.e., um aberto conexo. E seja
F : Ω → R uma função diferenciável de classe C 2 . Temos então que dados
y, v ∈ Ω tal que y + v ∈ Ω segue que
F(y + v) − F(y) = dF(y)v + d2 F(y)v 2 9 + R(v)||v||
onde R(v) → 0 quando ||v|| → 0. Onde aqui denotamos por dF a diferencial
de F. Temos então que dF(y) : E → R é um funcional linear, daı́ pelo
teorema de Riesz (2.1.2), existe um vetor, que representaremos por ∇F(y)
que representa dF(y), i.e.,
dF(y)v = hv, ∇F(y)i .
Como F é de classe C 2 , em particular C 1 , temos que a aplicação y 7→ ∇F(y)
é contı́nua. Tal aplicação é uma função vetorial, i.e., associa a cada y ∈ Ω o
vetor ∇F(y) denominado de Gradiente de F no ponto y.
Vejamos quem são as coordenadas do Gradiente. Temos que a derivada
direcional de F em y na direção de v é
F(y + tv) − F(y)
∂F(y)
= lim
,
t→0
∂v
t
9 2
d F(y)v 2 significa d2 F(y)(v, v).
15
ou seja,
∂F(y)
= dF(y)v,
∂v
no caso particular em que v = ei temos que tal derivada direcional recebe
o nome de derivada parcial com respeito a coordenada yi , considerando y =
(y1 , ..., yi , ..., yN ), e representada por
∂F(y)
= dF(y)ei .
∂yi
Escrevamos v como combinação linear do vetores canônicos ei , logo
v = α1 e1 + ... + αN eN ,
logo tem-se que v = (α1 , ..., αN ) e daı́ segue que
!
N
N
N
X
X
X
∂F(y)
dF(y)v = dF(y)
αi ei =
αi dF(y)ei =
αi
∂yi
i=1
i=1
i=1
implicando que
∂F(y)
∂F(y)
dF(y)v = v, (
, ...,
)
∂y1
∂yN
no entanto, a representação de dF(y) é única, logo
∇F(y) = (
∂F(y)
∂F(y)
, ...,
).
∂y1
∂yN
Outra forma de chegar a tal resultado seria em lembrar que dF(y) ∈ (RN )∗
e portanto o mesmo é uma combinação linear do elemento da base dual
{dx1 , ..., dxN }, logo
N
X
dF(y) =
βi dxi
i=1
lembrando-se que dxi ej = δij , segue que
∂F(y)
= dF(y)ei = βi
∂yi
e daı́ decorrendo tudo da mesma forma.
Usando que F é de classe C 2 temos, pelo teorema de Schwarz, que
∂ 2 F(y)
∂ 2 F(y)
=
(i, j = 1, ..., N)
∂yj ∂yi
∂yi ∂yj
16
e portanto
d2 F(y)(u, v) =
∂ 2 F(y)
∂ 2 F(y)
=
= d2 F(y)(v, u)
∂v∂u
∂u∂v
daı́ segue que
2
d F(y) =
∂ 2 F(y)
∂yj ∂yi
1≤i,j≤N
onde d2 F(y) é denominada de matriz Hessiana10 associada a F aplicada no
ponto y.
A partir de agora, quando não for especificado, J : A → R será um
funcional diferenciável.
Definição 2.2.8 Um elemento y ∈ A é dito estacionário para J se
δJ[y] ≡ 0,
i.e., δJ[y]h = 0, ∀h ∈ F.
Definição 2.2.9 Um elemento y ∈ A é dito um ponto de mı́nimo(máximo)
local para J se existe δ > 0 tal que
J[y] ≤ J[x] (≥)
para todo x ∈ E tal que ||y − x|| < δ.
Obs 2.2.8 No decorrer desse texto, frequentemente, iremos nos referir a
mı́nimos e/ou máximos(locais) dos funcionais em questão apenas
como extremos.
Teorema 2.2.2 Uma condição necessária para que y ∈ A seja um ponto de
mı́nimo(máximo) local para J é que y seja estacionário.
Demonstração: Vamos supor, sem perda de generalidade, que y seja
um ponto mı́nimo local para J. Então deve existir um δ > 0 tal que
J[x] − J[y] ≥ 0 para ||y − x|| < δ. Seja então h ∈ E tal que ||h|| = 1, e
consideremos x = y + th, segue então que
||y − x|| < δ ∀ t ∈ (−δ, δ).
Dessa forma segue que para todo t ∈ (−δ, δ) temos que J[y + th] − J[y] ≤ 0.
Usando agora o fato de que J é diferenciável temos que:
J[y + th] − J[y] = tδJ[y]h + R(th)|t|
10
Quando F é de classe C 2 , d2 F(y) é uma forma bilinear simétrica para cada y.
17
onde R(th) → 0 quando t → 0. Portanto temos
|t|
J[y + th] − J[y]
= δJ[y]h + R(th) .
t
t
O limite da quantidade que está do lado direito da igualdade acima existe, e
é igual a derivada direcional de J é y na direção de h 11 . Daı́ tem-se que
lim+
t→0
J[y + th] − J[y]
≤0
t
uma vez que J[y + th] − J[y] ≤ 0 para t ∈ (−δ, δ) e estamos considerando
t > 0. Entretanto, note que
lim−
t→0
J[y + th] − J[y]
≥0
t
uma vez que J[y+th]−J[y] ≤ 0 para t ∈ (−δ, δ) e agora estamos considerando
t < 0. Daı́ como o limite em questão existe, segue que
δJ[y]h = lim+
t→0
J[y + th] − J[y]
J[y + th] − J[y]
= lim−
=0
t→0
t
t
implicando assim que y é estacionário.
Obs 2.2.9 Note que, que pela linearidade de δJ[y], podemos considerar
acima ||h|| = 1 sem haver perda de generalidade, uma vez que
e
h
δJ[e
h] = ||e
h||δJ[y]
.
||e
h||
2.3
O Teorema da Divergência
Dedicaremos esta seção para breves comentários sobre o teorema da
divergência de Gauss12 e algumas de suas aplicações.
Definição 2.3.1 Seja X : Ω → RN , X(x) = (X1 (x), ..., XN (x)), um campo
vetorial de classe C 1 (Ω, R), i.e., as funções Xi : Ω → RN são funcões de
classe C 1 (Ω, R). Definimos o divergente do campo X por
divX(x) :=
N
X
∂Xi
i=1
11
12
∂xi
(x).
|t|
Note que limt→0 R(th) |t|
t = 0, mesmo não existindo limt→0 t .
Johann Carl Friedrich Gauss(1777-1855) nascido em Brunswick na Alemanha.
18
Teorema 2.3.1 (Divergência de Gauss) Seja X : Ω → R um campo
vetorial de classe C 1 (Ω, R), Ω ⊆ RN compacto, com fronteira ∂Ω suave,
orientável, orientada e com o vetor normal unitário exterior η. Então
Z
Z
divX dx =
hX, ηi dSx
(2.1)
Ω
∂Ω
Obs 2.3.1 Acima, dx é o elemento de volume em RN , dSx é o elemento de
área em ∂Ω e as integrais são respectivas a tais elementos.
Obs 2.3.2 O teorema de divergência de Gauss é também conhecido com
integração por partes generalizada, devido a identidade entre a integral em
Ω e a integral em ∂Ω.
Obs 2.3.3 Em R2 , o teorema da divergência resulta do teorema de Green13 ,
I
Z Z
P(x, y)dx + Q(x, y)dy =
(Qx (x, y) − Py (x, y))dxdy
(2.2)
γ
Ω
onde γ : [a, b] → ∂Ω ⊆ R2 é uma curva suave, simples e regular. A expressão
do lado esquerdo da igualdade significa, considerando γ(t) = (x(t), y(t)),
I
Z b
P(x, y)dx + Q(x, y)dy :=
(P(x(t), y(t))x0 (t) + Q(x(t), y(t))y 0 (t)) dt
γ
a
donde P, Q : Ω → R são funções de classe C 1 .
Obs 2.3.4 O teorema de Green em RN é chamado de teorema de Stokes.14
Obs 2.3.5 Seja Ω ⊆ R2 como nas hipóteses do teorema da divergência,
temos pela expressão (2.2), que
I
Z Z
1
−ydx + xdy =
dxdy = Área de Ω.
2 ∂Ω
Ω
Sejam u, v : Ω ⊆ RN → R funções de classe C 2 (Ω, R), considere o campo
definido por
X(x) = u∇v,
é imediato que X é de classe C 1 . Seja η o vetor normal exterior a ∂Ω. Então
hX, ηi = hu∇v, ηi = u
13
14
∂v
∂η
George Green(1793-1841) nascido em Nottingham na Inglaterra.
George Gabriel Stokes(1819-1903) nascido em Skreen na Irlanda.
donde
19
∂v
é chamada de derivada normal de v. Temos ainda
∂η
divX = h∇u, ∇vi + u∆v
onde
∆v =
N
X
∂2v
i=1
∂x2i
chama-se Laplaciano15 de v, segue, pelo teorema da divergência (2.1),
Z
Z
Z
∂v
h∇u, ∇vi dx + u∆dx =
u dSx
(2.3)
Ω
Ω
∂Ω ∂η
que é conhecida como primeira fórmula de Green. Se considerarmos o campo
X = u∇v − v∇u
segue, de forma análoga
Z
Z
∂v
∂u
(u∆v − v∆u)dx =
(u
− v )dSx
∂η
∂η
Ω
∂Ω
(2.4)
que é conhecida como segunda fórmula de Green. Vejamos uma aplicação,
ao Problema de Dirichlet16 , das fórmulas de Green.
Um famoso problema da teoria das equações diferenciais parciais é o
problema de Dirichlet:
∆u = 0, em Ω
(2.5)
u = g, em ∂Ω
onde u ∈ C 2 (Ω) ∩ C(∂Ω) é uma função, a priori, desconhecida, g ∈ C(∂Ω)
uma função conhecida e Ω é um domı́nio em RN .
Definição 2.3.2 Uma função u : Ω → R de classe C 2 (Ω) é dita harmônica
se ∆u ≡ 0.
Teorema 2.3.2 Seja u : Ω → R tal que u ∈ C 2 (Ω) ∩ C(∂Ω). Se u é
harmônica em Ω e u = 0 em ∂Ω então u é constante.
15
Em homenagem a Pierre-Simon Laplace(1749-1827) nascido em Normadia na França.
Johann Peter Gustav Lejeune Dirichlet(1805-1859) nascido em Düren na França, hoje,
Alemanha.
16
20
Demonstração: Usando a primeira fórmula de Green (2.3) para o campo
X = u∇u, temos
Z
Z
Z
∂u
2
||∇u|| dx + u∆udx =
u dSx
Ω
Ω
∂Ω ∂η
e daı́ usando que ∆u = 0 em Ω e u = 0 em ∂Ω, segue
Z
||∇u||2 dx = 0,
Ω
e portanto ||∇u|| = 0, implicando que u = C(cte). Entretanto u = em ∂Ω,
seguindo assim que u ≡ 0.
Teorema 2.3.3 (Unicidade) O problema de Dirichlet (2.5) possui, no
máximo, uma solução.
Demonstração: Sejam u, v : Ω → R funções pertencentes a C 2 (Ω) ∩ C(∂Ω)
soluções do problema (2.5). Então w = u − v é solução do problema de
Dirichlet
∆u = 0, em Ω
u = 0, em ∂Ω
no entanto, pelo teorema (2.3.2), tal problema possui somente a solução
trivial, logo u − v ≡ 0.
Capı́tulo 3
Equações de Euler-Lagrange
3.1
A Equação de Euler-Lagrange.
Consideraremos, a partir de agora, funções L : [0, 1] × R × R → R as quais
serão chamadas Lagrangianas, onde L = L(x, y(x), y 0 (x)) e y 0 simbolizará
dy
y 0 = dx
, sempre que não for previamente especificado. Em vários momentos, com o intuito de não sobrecarregarmos a notação, escreveremos somente
L = L(x, y, y 0 ). Desejaremos ainda que L possua derivadas parciais de 1a e 2a
ordem contı́nuas, sendo assim, em particular, L diferenciável, como função
de três variáveis.
Definiremos agora alguns espaços(vetoriais) de funções reais que serão
utilizados adiante:
Definição 3.1.1 O conjunto das funções contı́nuas que se anulam na
fronteira
C0 ([0, 1], R) := {f : [0, 1] → R; f é contı́nua; f (0) = f (1) = 0}
Definição 3.1.2 O conjunto das função de classe C k que se anulam na
fronteira
C0k ([0, 1], R) := {f : [0, 1] → R; f ∈ C k ; f (0) = f (1) = 0}
onde k ≥ 1 é um inteiro.
Obs 3.1.1 Note que tanto C0k ([0, 1], R) quanto C0 ([0, 1], R) são subespaços
vetoriais de C([0, 1], R) munidos das operações herdadas do mesmo.
Apresentemos agora um lema de suma importância:
21
CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE
22
Lema 3.1.1 (Lema fundamental do Cálculo das Variações) Seja
g : [0, 1] → R uma função contı́nua tal que
Z 1
g(x)f (x)dx = 0 ∀f ∈ C0 ([0, 1], R)
0
Então g ≡ 0.
Demonstração: Suponha, por absurdo, que g 6= 0. Então, sem perda de
generalidade, podemos supor, devido a continuidade de g, que g > 0 em um
intervalo [a, b] ⊆ [0, 1]. Defina h(x) := (a − x)(x − b) em [a, b] e h(x) = 0 em
[0, 1] ∩ [a, b]c . É imediato que h ∈ C0 ([0, 1], R). Por outro lado
Z
1
Z
g(x)h(x)dx =
0
b
g(x)h(x)dx > 0
a
uma vez que g(x)h(x) > 0 em [a, b]. Portanto obtivemos uma contradição à
nossa hipótese, donde g ≡ 0.
Obs 3.1.2 Note que o lema acima poderia ser reformulado para
f ∈ C0k ([0, 1], R) ao invés de f ∈ C0 ([0, 1], R), a demonstração seria, essencialmente a mesma, sendo feita apenas a definição de h(x) := ((a − x)(x − b))k
em [a, b] e h(x) = 0 em [0, 1] ∩ [a, b]c . É fácil ver que h ∈ C0k ([0, 1], R).
Definição 3.1.3 Fixados A, B ∈ R definiremos
A(A,B) := {y : [0, 1] → R; y = y(x) ∈ C 1 ; y(0) = A e y(1) = B}.
Chamaremos os elementos de A(A,B) de curvas admissı́veis.
Obs 3.1.3 Note que A(A,B) é uma variedade afim contida em C 1 ([0, 1], R)
com espaço tangente C01 ([0, 1], R), pois note que dadas duas curvas
y1 , y2 ∈ A(A,B) ambas não pertencem a C01 ([0, 1], R), entretanto y1 − y2 ∈
C01 ([0, 1], R).
Definição 3.1.4 Definiremos o funcional J : A(A,B) → R por
Z
J[y] :=
1
L(x, y(x), y 0 (x))dx
0
onde L é a Lagrangiana definida em (3.1).
23
Exemplo 6: Sejam y1 (x) = x e y2 (x) = x2 pertencentes a A(0,1) e considere
a seguinte lagrangiana
1
L(x, y, y 0 ) = (y 0 )2 + y 3 .
2
Assim segue
L(x, y1 , y10 ) = L(x, x, 1) =
1
+ x3
2
implicando assim que:
Z 1
1
1 1 1 1 1 1
3
J[y1 ] =
( + x3 )dx = x0 + x4 0 = + =
2
4
2 4
4
0 2
Temos ainda que:
1
L(x, y2 , y20 ) = L(x, x2 , 2x) = (2x)2 + x6
2
implicando
Z
1
2 1 1 1 2 1
17
(2x2 + x6 )dx = x3 0 + x7 0 = + = .
3
7
3 7
21
0
p
Exemplo 7: Considere ainda A(0,1) e a lagrangiana L(x, y, y 0 ) = 1 + (y 0 )2
e portanto o funcional
Z 1p
J[y] =
1 + (y 0 )2 dx.
J[y2 ] =
0
p
1 + |y 0 |
0
2
Usando o fato de que 1 + (y ) ≥ √ , temos que
2
Z 1p
Z 1
Z 1
√
1 + y0
1 + |y 0 |
0
2
√
√ dx = 2
J[y] =
1 + (y ) dx ≥
dx ≥
2
2
0
0
0
√
Note agora que y1 (x) = x ∈ A(0,1) e J[y1 ] = 2. Logo y1 minimiza tal
funcional. Daı́ eu diria que o objetivo é desenvolver uma teoria que permite
minimizar(maximizar) funcionais y 7→ J[y] mais gerais, para os quais os
métodos tradicionais do cálculo não dão suporte. Essa teoria é o Cálculo das
Variações.
Estaremos a partir de agora interessados em encontrar curvas admissı́veis,
que sejam extremos para J, na realidade curvas y estacionárias para o funcional J , i.e, desejamos encontrar curvas admissı́veis y tais que
δJ[y]h = 0 ∀ h ∈ C01 ([0, 1], R).
24
Consideremos então y ∈ A(A,B) uma curva admissı́vel que seja estacionária,i.e.,
δJ[y]h = 0
para toda curva h ∈ C0 ([0, 1], R). Fixada uma tal h, definamos a função
“perturbação” para J por ξ : (−, ) → R, > 0, dada por
ξ(t) := J[y + th].
O fato de y ∈ A(A,B) ser estacionária para J é equivalente a ξ 0 (0) = 0, uma
vez que ξ 0 (0) = δJ[y]h. Por outro lado,
Z 1
ξ(t) = J[y + th] =
L(x, y + th, y 0 + th0 )dx.
0
Como o sinal da integral é relativo a x e a derivada de ξ é relativa a t, temos:
Z 1
0
ξ (t) =
[Ly (x, y + th, y 0 + th0 )h + Ly0 (x, y + th, y 0 + th0 )h0 ]dx
0
donde, integrando por partes,
Z 1
1
0
ξ (t) =
Ly (x, y + th, y 0 + th0 )hdx + Ly0 (x, y + th, y 0 + th0 )h0
0
Z 1
d
Ly0 (x, y + th, y 0 + th0 )hdx
−
dx
0
Como h(0) = h(1) = 0, o segundo termo do lado direito da igualdade acima
se anula e obtemos
Z 1
d
0
ξ (t) =
[Ly (x, y + th, y 0 + th0 ) − Ly0 (x, y + th, y 0 + th0 )]hdx
dx
0
Fazendo t = 0, e usando que ξ 0 (0) = δJ[y]h = 0, chegamos finalmente a
Z 1
d
[Ly (x, y, y 0 ) − Ly0 (x, y, y 0 )]hdx = 0.
dx
0
Como h ∈ C01 ([0, 1], R) é arbitrária, segue da observação (3.1.1) que:
Ly (x, y, y 0 ) =
d
Ly0 (x, y, y 0 ).
dx
A equação acima é chamada de Equação de Euler1 -Lagrange2 associada ao
funcional J.
1
2
Leonhard Euler(1707-1783) nascido em Basiléia na Suiça.
Joseph-Louis Lagrange(1736-1813) nascido em Turim na Itália.
25
d
Obs 3.1.4 : Note a diferença entre dx
L e Lx . A primeira é a derivada de L
como função da variável x. A segunda é a derivada parcial de L como função
explicita de x, em outras palavras, se L = L(y, y 0 ) então terı́amos:
d
L = Ly y 0 + Ly0 y 00 e Lx = 0
dx
O teorema abaixo nos dá uma condição necessária para uma curva
y = y(x) ∈ A(A,B) seja uma curva extrema para J.
Teorema 3.1.1 Seja y = y(x) ∈ A(A,B) uma curva extremo para o funcional
J. Então y satisfaz a equação de Euler-Lagrange
Ly (x, y, y 0 ) =
d
Ly0 (x, y, y 0 ).
dx
Sabemos que dada uma solução y = y(x) da equação de Euler-Lagrange
d
Ly0 = Ly
dx
temos que a mesma é de classe C 1 ([0, 1], R), pois lembre-se que y = y(x) é
uma curva admissı́vel. Uma pergunta bastante pertinente seria tentar saber
se y 00 existe e se é contı́nua, e que condições sobre L deverı́amos impor para
que isso aconteça. O teorema a seguir responde tal pergunta.
Teorema 3.1.2 Suponha que y = y(x) possui derivada primeira contı́nua e
satisfaz a equação
d
Ly0 = Ly .
dx
Se L = L(x, y, y 0 ) possui derivadas parciais de primeira e segunda ordem
contı́nuas com respeito a todos os argumentos, então y = y(x) possui derivada
segunda contı́nua em todos os pontos x tais que
Ly0 y0 (x, y(x), y 0 (x)) 6= 0.
Demonstração: Seja g : [0, 1] → R dada por
g(t) := Ly0 (x + t∆x, y + t∆y, y 0 + t∆y 0 )
onde ∆x, ∆y e ∆y 0 são pequenas variações nas respectivas coordenadas.
Pelas hipóteses sobre L, g é de classe C 1 , e pelo teorema do valor médio de
Lagrange, deve existir c ∈ (0, 1) tal que
g(1) − g(0) = g 0 (c).
26
Temos então que
g 0 (c) = (Ly0 x ∆x + Ly0 y ∆y + Ly0 y0 ∆y 0 ) |t=c .
Fazendo ∆Ly0 = g(1) − g(0) = Ly0 (x + ∆x, y + ∆y, y 0 + ∆y 0 ) − Ly0 (x, y, y 0 )
temos que
∆Ly0
∆y ∆y 0 − Ly0 x + Ly0 y
= Ly 0 y 0
∆x
∆x t=c
∆x t=c
Note que existe o limite quando ∆x → 0 da expressão do lado esquerdo da
igualdade acima e tal limite é Ly − Ly0 x − Ly0 y y 0 (∗) uma vez que as derivadas
d
parciais de L são contı́nuas e dx
Ly0 = Ly . Daı́ segue que o limite quando
∆x → 0 da expressão do lado direito existe e é igual a (∗). Temos ainda que
lim Ly0 y0 |t=c = Ly0 y0
∆x→0
daı́ segue que se Ly0 y0 6= 0, então y 00 existe e
∆y 0
Ly − Ly0 x − Ly0 y y 0
=
∆x→0 ∆x
Ly0 y0
y 00 (x) = lim
e protanto contı́nua em x.
Façamos agora algumas considerações sobre casos particulares da equação
de Euler-Lagrange:
Caso 1: (L = L(x, y 0 )) Temos nesse caso que a equação de Euler-Lagrange
se reduz a :
d
Ly0 (x, y 0 ) = 0
dx
e portanto
Ly0 (x, y 0 ) = C(cte).
Caso 2: (L = L(y, y 0 )) Assumiremos aqui Ly0 y0 6= 0 e portanto nas hipóteses
do teorema anterior. Vejamos inicialmente que
Ly −
d
Ly0 = Ly − Ly0 y y 0 − Ly0 y0 y 00
dx
Multiplicando em ambos os lados por y 0 , temos:
Ly y 0 − (
d
Ly0 )y 0 = Ly y 0 − Ly0 y (y 0 )2 − Ly0 y0 y 00 y 0 .
dx
Note agora que
d
(L − y 0 Ly0 ) = Ly y 0 + Ly0 y 00 − y 00 Ly0 − y 0 Ly0 y y 0 − y 0 Lyy0 y 00
dx
= Ly y 0 − Ly0 y (y 0 )2 − Ly0 y y 0 y 00
27
E daı́ seguindo que:
d
d
Ly0 )y 0 =
(L − y 0 Ly0 ) .
dx
dx
Daı́, como y satisfaz a equação de Euler-Lagrange, segue que tal equação é
equivalente a
L(y, y 0 ) − y 0 Ly0 (y, y 0 ) = C(cte).
(Ly −
Caso 3:(L = L(x, y)) A equação de Euler-Lagrange nesse caso é equivalente
a:
Ly (x, y) = 0.
3.2
O Princı́pio de Fermat
Em 1657, Pierre de Fermat3 encontrou um novo método para determinar a trajetória dos raios luminosos, baseado na sua hipótese de que “a
natureza sempre atua pelo caminho mais curto”. Tal hipótese é conhecida
como princı́pio de Fermat e seu enunciado preciso é o seguinte é:
“Dentre todos os caminhos possı́veis para ir de um ponto a
outro, a luz segue aquele que é percorrido no tempo mı́nimo.”
Tal caminho escolhido pela luz é denominado de caminho ótico mı́nimo.
Para a propagação da luz num meio homogêneo, cujo ı́ndice de refração
da luz é constante, o caminho ótico mı́nimo também corresponde à distância
mı́nima, ou seja, o princı́pio de Fermat leva à propagação retilı́nea da luz
entre dois pontos.
Exemplo 8: (Propagação da luz em um meio inomogêneo). Um meio opticamente inomogêneo é um meio onde o ı́ndice de refração da luz (n) varia
continuamente de ponto em ponto, e portanto o mesmo acontece com sua
velocidade uma vez a velocidade da luz em tal meio que é dada por
c
v=
n
onde c é a velocidade da luz no vácuo. Suponha então que a luz se propague
num meio inomogêneo bidimensional xy e sua velocidade seja dada por uma
função contı́nua η = η(y). O caminho ótico mı́nimo y = y(x) da luz ligando
os pontos (0, A) e (1, B) minimiza o funcional
Z 1p
1 + y 02
J[y] =
dx.
η(y)
0
3
Pierre de Fermat(1601-1665) nascido em Beaumont-de-Lomagne na França.
28
Temos então que a lagrangiana associada a tal problema fı́sico é:
p
1 + y 02
L = L(y, y 0 ) =
.
η(y)
Temos que y deve satisfazer a equação de Euler-Lagrange para tal funcional,
daı́ calculando-a temos
p
1 + y 02
y 02
p
L − y 0 Ly0 =
−
= C(cte)
η(y)
η(y) 1 + y 02
portanto
p
1 + y 02 − y 02 = Cη(y) 1 + y 02 ,
p
1
η(y) 1 + y 02 = (cte).
C
(3.1)
Seja φ = φ(x) o ângulo formado entre a reta tangente a y = y(x) no ponto x
e o eixo y, temos então que:
y 0 (x) = cotgφ(x) ⇒ 1 + y 02 = 1 + cotg2 φ(x) =
1
sen2 φ(x)
.
Segue então que a equação de Euler-Lagrange(3.1) é equivalente a
senφ(x)
= κ(cte)
η(y(x))
que é conhecida como Lei de Snell da óptica geométrica.
Aos leitores amantes da fı́sica façamos mais alguns comentários:
Suponhamos que um determinado meio inomogêneo tenhamos η(y) = ρy,
onde ρ é uma constante real, vejamos quem são os caminhos óticos mı́nimos:
Temos
y 2 (1 + y 02 ) = µ2
Note que |y| ≤ |µ|, daı́ podemos fazer a seguinte mudança de varı́ável
y = µsent temos:
dy
dx
= µcost ⇒ y 0
= µcost.
dt
dt
Assim
dy
dx
( )2 = y 02 ( )2
dt
dt
e daı́
dx
dx
µ2 sen2 t[( )2 + µ2 cos2 t] = µ2 ( )2 .
dt
dt
29
segue que
µ2 (
dx
dx 2
) (1 − sen2 t) = µ4 sen2 tcos2 t ⇒
= ±µsent
dt
dt
donde
x(t) = ±µcost + x0
e os caminhos óticos mı́nimos os cı́rculos com centro sobre o eixo x dados
por
(x − x0 )2 + y 2 = µ2 .
Capı́tulo 4
Problemas Variacionais
Neste capı́tulo estaremos interessados em estudar três problemas variacionais clássicos: O problema de distância mı́nima no em R2 , o problema da
Braquistócrona e o problema da superfı́cie de revolução de área mı́nima. Não
seremos, para efeito didático, rigorosos na resolução de tais problemas, uma
vez que iremos admitir que os funcionais associados a tais problemas admitem
mı́nimos e iremos encontrá-los através das equações de Euler-Lagrange como
curvas estacionárias. Lembre-se que o fato de uma curva admissı́vel y = y(x)
ser solução para a equação de Euler-Lagrande é uma condição necessária para
que a mesma seja um extremo para o funcional em questão, entretanto não é
uma condição suficiente para tal propósito. Tais condições suficientes serão
dadas nos capı́tulos adiante, quando fizermos um estudo analı́tico sobre a
segunda variação de tais funcionais.
4.1
Distância mı́nima no plano.
Talvez o problema variacional mais simples seja o da distância mı́nima no
plano
Dados dois pontos A e B fixados no plano cartesiano xy.
Qual, dentre todas as curvas planas unindo tais pontos, possui comprimento minimo?
Considere inicialmente os tais dois pontos A e B no plano xy, imagine agora
uma curva unindo tais pontos. Sem nenhuma perda de generalidade, podemos considerar curvas α : [0, 1] → R2 onde α(0) = A e α(1) = B. Esperamos
de tais curvas um pouco de regularidade e ainda, para efeito didático, imaginemos que tais curvas sejam gráficos de funções y = y(x) ou x = x(y) de
classe C 1 , ou seja, estamos falando de curvas admissı́veis em A(A,B) . Qual
das curvas em questão minimiza a distância entre tais pontos?
30
CAPÍTULO 4. PROBLEMAS VARIACIONAIS
31
Solução: Se y = y(x) ∈ A(A,B) , então o comprimento S(y) da curva y é
dado pela seguinte integral:
Z 1p
S(y) =
1 + y 02 dx.
0
Logo, a curva desejada é tal que minimiza o seguinte funcional:
Z 1p
J[y] =
1 + y 02 dx.
0
A lagrangiana associada é
p
L(x, y, y 0 ) =
1 + y 02 ,
de forma que a curva desejada deve satisfazer a equação de Euler-Lagrange
associada a tal funcional. Como
y0
Ly0 = p
1 + y 02
e L não depende explicitamente de x, a equação de Euler-Lagrange associada
é equivalente a
L − y 0 Ly0 =
p
y 02
1
1 + y 02 − p
=p
= C(cte).
1 + y 02
1 + y 02
Portanto y 0 (x) = λ(cte), e daı́
y(t) = λt + β
onde λ e β são constante tais que y(0) = A e y(1) = B. Reobtemos assim
o resultado do exemplo 7, i.e., Temos assim que a curva que minimiza a
distância entre tais pontos é tais pontos é o segmento de reta que os une.
4.2
Braquistócrona
Um dos problemas famosos na história da matemática é o problema da
braquistócrona1
1
“Braquistócrona” deriva do grego: brachistos, menor e chronos, tempo.
32
Qual a curva ao longo da qual uma partı́cula desliza, sem
atrito, em tempo mı́nimo, atuando sobre a mesma apenas
a aceleração gravitacional, de um ponto P dado para outro ponto Q, o segundo ponto estando mais abaixo do que o
primeiro, mas não diretamente abaixo?
Esse problema foi proposto por Johann Bernoulli2 em 1696 como um desafio
aos matemáticos de sua época. Soluções corretas foram encontradas pelo
próprio Johann Bernoulli e ainda pelo seu irmão Jakob(Jacques) Bernoulli3 ,
além de Isaac Newton4 , Gottfried Leibniz5 e o Marquês de L’Hôpital6 .
Consideremos então um sistema de coordenadas cartesianas xy onde a
orientação do eixo y é contrária a usual. E consideremos tais pontos como
sendo P = (0, 0) e Q = (1, B).
Solução: Considerando nula a velocidade inicial da partı́cula , temos, pela
equação de Torricelli, que a velocidade da partı́cula em função de y é dada
por
p
v(y) = 2gy
onde g é a aceleração gravitacional. Temos ainda que o comprimento S da
curva y ligando P ao ponto (x, y(x)) é dado por
Z xp
S=
1 + y 02 ds.
0
Dessa forma, temos
p
d
S = 1 + y 02
dx
p
dS = 1 + y 02 dx
e daı́
Lembrando que,
v=
d
1
S ⇒ dS = vdt ⇒ dt = dS,
dt
v
obtemos
p
dt =
2
1 + y 02
√
dx,
2gy
Johann Bernoulli(1667-1748) nascido em Basiléia na Suiça.
Jakob(Jacques) Bernoulli(1654-1705) nascido em Basiléia na Suiça.
4
Sir Isaac Newton(1643-1727) nascido em Woolsthorpe na Inglaterra.
5
Gottfried Wilhelm von Leibniz(1646-1716) nascido em Leipzig na Alemanha.
6
Guillaume François Antoine Marquis de L’Hôpital(1661-1704) nascido em Paris na
França.
3
33
por sua vez, implicando que o tempo τ0,B gasto para ir de P a Q é dado por:
Z 1p
1 + y 02
√
τ0,B =
dx
2gy
0
Logo a curva procurada minimiza o funcional:
Z 1p
1 + y 02
1
J[y] = √
dx,
√
y
2g 0
com lagrangiana associada
p
0
L = L(y, y ) =
e portanto,
1 + y 02
.
√
y
y0
Ly0 = √ p
.
y 1 + y 02
A equação de Euler-Lagrange nesse caso é equivalente a
p
1 + y 02
y 02
L − y 0 Ly0 =
−√ p
= C(cte)
√
y
y 1 + y 02
segue que
√ p
1 + y 02 − y 02 = C y 1 + y 02 ⇒ y(1 + y 02 ) = κ2 (cte).
Veja que |y| ≤ κ2 , daı́ chamando y = κ2 sen2 t, segue que
dy
dx
= 2κ2 sent cost ⇒ 2κ2 sent cost = y 0 .
dt
dt
Assim:
y[(
dx 2
dy
dx
) + y 02 ( )2 ] = κ2 ( )2 ,
dt
dt
dt
o que nos dá
κ2 sen2 t[(
dx 2
dx
) + 4k 4 sen2 t cos2 t] = κ2 ( )2 ,
dt
dt
ou ainda:
4κ6 sen4 t cos2 t = κ2 (
dx 2
) (1 − sen2 t).
dt
Logo,
4κ4 sen4 t = (
dx 2
dx
) ⇒
= 2κ2 sen2 t
dt
dt
34
A escolha de dx
> 0 é devido y 0 > 0, resultante orientação imposta, e ainda
dt
dy
dx
> 0, logo dt > 0. Usando agora o fato de que 2sen2 t = 1 − cos2t, segue
dt
que:
dx
= κ2 − κ2 cos2t
dt
implicando em
sen2t
κ2
) e y(t) = (1 − cos2t)
2
2
finalmente, substituindo θ = 2t, temos:
x(t) = κ2 (t −
κ2
κ2
(θ − senθ) e y = (1 − cosθ)
2
2
Tal curva é conhecida como ciclóide.
x=
Obs 4.2.1 A ciclóide é obtida da seguinte forma: Considere um disco de
raio r > 0, imagine que o disco está inerte com centro no ponto (0, r) e
seja P o ponto do disco que está sobre a origem. Imagine agora que o disco
começa a rolar sobre o eixo x, sem atrito. A curva descrita pelo ponto P ao
longo do movimento é a ciclóide γ(t) = r(t − sent, 1 − cost).
4.3
Superfı́cie de revolução de área mı́nima
Mais um dos problemas variaionais clássico famosos é o seguinte problema:
Considere inicialmente uma curva y = y(x) ∈ A(A,B) , que não intercepta o
eixo x, sem perda de generalidade, y(x) > 0 ∀x ∈ [a, b] e seja σ a superfı́cie
de revolução gerada pela rotação de y em torno do eixo x
Qual dentre as curvas perfis y admissı́veis, com tais
hipóteses, gera a superfı́cie σ de área mı́nima?
Solução: Podemos encarar tal curva y = y(x) em R3 como sendo
γ : [0, 1] → R3 dada por γ(x) = (x, y(x), 0). Rotacionando γ em torno do eixo
x, encontramos a seguinte superfı́cie parametrizada Φ : [0, 1] × [0, 2π] → R3 ,
dada por:

  
1
0
0
x
Φ(x, θ) =  0 cosθ −senθ  .  y  = (x, ycosθ, ysenθ)
0 senθ cosθ
0
Temos assim que a área Sσ de σ é dada por:
Z 1 Z 2π
Sσ =
||Φx ∧ Φθ ||dθdx
0
0
35
onde o sinal “∧” simboliza o produto vetorial das derivadas parciais de Φ.
Das derivadas parciais de Φ
Φx (x, θ) = (1, y 0 cosθ, y 0 senθ), Φθ (x, θ) = (0, −ysenθ, ycosθ),
obtemos
Φx ∧ Φθ = (yy 0 , −ycosθ, −ysenθ)
e daı́ uma vez que y > 0,
||Φx ∧ Φθ || = y
p
1 + y 02 ,
logo,
Z
1
Z
Sσ =
2π
y
0
p
1+
Z
y 02 dθdx
1
= 2π
0
y
p
1 + y 02 dx
0
Assim, a curva procurada é tal que minimiza o funcional
Z 1 p
J[y] = 2π
y 1 + y 02 dx,
0
onde a lagrangiana associada é dada por
L = L(y, y 0 ) = y
e portanto
p
1 + y 02
yy 0
Ly0 = p
1 + y 02
,
Usando novamente o fato da não-dependência explı́cita de x da lagrangiana,
a curva procurada deve satisfazer a equação de Euler-Lagrange associada a
tal funcional, que nesse caso é equivalente a
L − y 0 Ly0 = y
y.(y 0 )2
1 + y 02 − p
= C(cte),
1 + y 02
p
ou ainda
y=C
p
1 + (y 0 )2 .
Agora,
y=C
p
1 + y 02 ⇒ y 2 = C2 + C2 (y 0 )2 ⇒ C2 (y 0 )2 = y 2 − C2
e daı́,
dy
=
dx
r
y 2 − C2
=
C2
p
y 2 − C2
.
C
36
Separando variáveis, temos
Cdy
p
y 2 − C2
= dx,
donde
x + C1 = C ln
y+
p
y 2 − C2
C
!
e portanto
y+
x + C1
= ln
C
p
y 2 − C2
C
!
e −
x + C1
C
= ln
y−
p
y 2 − C2
C
!
Assim,
e
x+C1
C
=
y+
p
y 2 − C2 −( x+C1 ) y −
C
e
=
C
Lembrando que
cosh t =
p
y 2 − C2
C
et + e−t
,
2
segue finalmente que
y(x) = C cosh
x + C1
C
.
Tal curva é conhecida com catenária.
Obs 4.3.1 A catenária será apresentada adiante como solução de um
problema variacional isoperimétrico.
Capı́tulo 5
Equação de Euler-Lagrange
generalizada.
5.1
Equação de Euler-Lagrange generalizada.
Consideremos agora a lagrangiana L : [0, 1] × RN × RN → R, onde
0
1 ≤ N é um número natural, L = L(x, y1 , ..., yN , y10 , ..., yN
), onde novamente
L possui derivadas parciais contı́nuas de primeira e segunda ordem em relação
a todas as coordenadas. O funcional associado a tal lagrangiana é
Z 1
0
J[y1 , ..., yN ] =
L(x, y1 , ..., yN , y10 , ..., yN
)dx.
0
Calculemos então a equação de Euler-Lagrangre associada a tal funcional,
portanto y1 , ..., yN curvas admissı́veis e h1 , ..., hN ∈ C01 ([0, 1], R), definindo
novamente a “ perturbação” ξ : (−, ) → R por
ξ(t) := J[y1 + th1 , ..., yN + thN ],
Temos
ξ 0 (t) =
Z
0
Z
=
1
N
X
Lyi hi +
N
X
Lyi0 h0i dx
i=1
N
1X
i=1
N
X
i=1
i=1
Lyi hi dx +
0
!
1
Lyi0 hi 0 −
Z
0
N
1X
i=1
d
Ly0 hi dx,
dx i
onde realizamos integração por partes na segunda igualdade. Usando o fato
de que hi (1) = hi (0) = 0, i = 1, ..., N e fazendo t = 0, temos
N Z 1
X
d
0
ξ (0) = δJ[y1 , ..., yN ](h1 , ..., hN ) =
(Lyi − Lyi0 )hi dx.
dx
i=1 0
37
CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.38
Daı́, se y1 , ..., yN forem curvas que extremizem(estacionárias) o funcional,
temos ξ 0 (0) = 0 e como hi é arbitrária, novamente segue
Lyi =
d
Ly0 (i = 1, ..., N ).1
dx i
Tais equações são chamadas de equações de Euler-Lagrange associadas ao
funcional J[y1 , ..., yN ]. Vejamos agora uma versão do teorema (3.1.2) do capı́tulo
3 sobre regularidade das soluções para as equações de Euler-Lagrange
generalizadas:
Teorema 5.1.1 Suponha que y1 = y1 (x), ..., yN = yN (x) possuem derivadas
primeira contı́nua e satisfazem as equações
d
Ly0 = Lyi (i = 1, ..., N ).
dx i
0
Se L = L(x, y1 , ..., yN , y10 , ..., yN
) possui derivadas parciais de primeira e segunda ordem contı́nuas com relação a todos os argumentos, então
yi = yi (x) (i = 1, ..., N ) possui derivada segunda contı́nua em todos os
pontos x tais que
det(Lyi0 yj0 )2 6= 0.
Demonstração: : Imitando a demonstração do teorema (3.1.2), definamos
gi : [0, 1] → R por
0
0
gi (t) = Lyi0 (x + t∆x, y1 + t∆y1 , ..., yN + t∆yN , y10 + t∆y10 , ..., yN
+ t∆yN
)
Pelo teorema do valor médio de Lagrange, deve existir ci ∈ (0, 1) tal que
gi (1) − gi (0) = gi0 (ci ).
por outro lado, pela regra da cadeia,
gi0 (ci ) =
Lyi0 x ∆x +
N
X
Lyi0 yj ∆yj +
j=1
N
X
j=1
!
Lyi0 yj0 ∆yj0 t=ci
e segue daı́ que
d
z
}|i
"
# {
N
N
X
X
∆Lyi0
∆yj0
∆yj − Lyi0 x +
Lyi0 yj (
) =
Lyi0 yj0 (
)
∆x
∆x
t=ci ∆x
j=1
j=1
t=ci
1
2
A observação (3.1.2) é utilizada para cada integral em questão.
(Lyi0 yj0 )1≤i,j≤N é uma matriz quadrada de ordem N .
Tal sistema de equações pode ser visto matricialmente da forma

 ∆y0 

1
d1 |t=c1
∆x

 . 

..

 = Ly0 y0  ..  .
.
i j
dN |t=cN
0
∆yN
∆x
Pelas hipóteses sobre L, quando ∆x → 0 todos os limites das entradas da
matriz (Lyi0 yj0 ) e das entradas da matriz coluna à esquerda existem e são
funções contı́nuas. Assim, se
det(Lyi0 yj0 ) 6= 0
então o limite quando ∆x → 0 de cada entrada da matriz coluna à direita,i.e.,
yi00 , existe,sendo contı́nuo pela identidade matricial.
5.2
Geodésicas
Como uma aplicação as equações de Euler-Lagrange generalizadas falaremos de curvas sobre superfı́cies que minimizam distância. Consideremos
então uma superfı́cie σ parametrizada por
Φ = Φ(u, v)
Dados A, B ∈ σ, uma curva suave γ : [0, 1] → σ é dita minimizante se γ
possuir comprimento mı́nimo dentre todas as curvas suaves sobre σ ligando
A e B. Se γ : [0, 1] → σ é uma curva suave tal que γ(0) = A e γ(1) = B,
dada por
γ(x) = Φ(u(x), v(x))
o seu comprimento `(γ)é dado por
Z
`(γ) =
1
||γ 0 (x)||dx.
0
Pela regra da cadeia, temos y 0 (x) = u0 Φu + v 0 Φv , donde
||y 0 (x)||2 = hΦu , Φv i u02 + 2 hΦu , φv i u0 v 0 + hΦu , Φv i v 02 .
Denotando
hΦu , Φu i = E, hΦu , Φv i = F e hΦv , Φv i = G
temos
Z
`(γ) =
0
1
√
Eu02 + 2F u0 v 0 + Gv 02 dx
Dessa forma as curvas minimizantes γ = γ(x) de σ minimizam o funcional
Z 1√
J[u, v] =
Eu02 + 2F u0 v 0 + Gv 02 dx,
(5.1)
0
com lagrangiana associada
L = L(x, u, v, u0 , v 0 ) =
√
Eu02 + 2F u0 v 0 + Gv 02 .
e as equações de Euler-Lagrange correspondentes são
Lu =
d
d
Lu0 e Lv =
Lv0 .
dx
dx
Derivando
L2 = Eu02 + 2F u0 v 0 + Gv 02
implicitamente com respeito a u, temos:
2LLu = Eu u02 + 2Fu u0 v 0 + Gu v 02
e daı́
Lu =
1 Eu u02 + 2Fu u0 v 0 + Gu v 02
√
.
2 Eu02 + 2F u0 v 0 + Gv 02
Lv =
1 Ev u02 + 2Fv u0 v 0 + Gv v 02
√
.
2 Eu02 + 2F u0 v 0 + Gv 02
De forma análoga,
Temos ainda que:
2LLu0 = 2Eu0 + 2F v 0 ⇒ Lu0 = √
Eu0 + F v 0
,
Eu02 + 2F u0 v 0 + Gv 02
F u0 + Gv 0
.
Eu02 + 2F u0 v 0 + Gv 02
Portanto as equações de Euler-Lagrange são:
Eu u02 + 2Fu u0 v 0 + Gu v 02
d
2(Eu0 + F v 0 )
√
√
=
dx
Eu02 + 2F u0 v 0 + Gv 02
Eu02 + 2F u0 v 0 + Gv 02
Ev u02 + 2Fv u0 v 0 + Gv v 02
d
2(F u0 + Gv 0 )
√
√
=
dx
Eu02 + 2F u0 v 0 + Gv 02
Eu02 + 2F u0 v 0 + Gv 02
Exemplo 9: Seja σ o cilindro parametrizado por
2LLv0 = 2F u0 + 2Gv 0 ⇒ Lv0 = √
Φ : [0, 2π] × [0, 1] → R3 ,
Φ(θ, τ ) = (ρcosθ, ρsenθ, τ )
então
Φθ (θ, τ ) = (−ρsenθ, ρcosθ, 0), Φτ (θ, τ ) = (0, 0, 1)
implicando em:
E = hΦθ , Φθ i = ρ2 , F = hΦθ , Φτ i = 0 e G = hΦτ , Φτ i = 1
Logo, as curva minimizantes γ = γ(x) = Φ(θ(x), τ (x)) são tais que:
"
"
#
#
d
ρ2 θ 0
τ0
d
p
p
=0 e
= 0,
dx
dx
ρ2 θ02 + τ 02
ρ2 θ02 + τ 02
i.e.,
ρ2 θ 0
p
ρ2 θ02 + τ 02
= C1
τ0
e p
ρ2 θ02 + τ 02
= C2 .
Considerando τ = τ (θ(x)) segue, pela regra da cadeia, que τ 0 =
dτ 0
θ.
dθ
Assim,
dτ
τ0
= 0 ⇒ τ = λθ + β(cte)
dθ
θ
e daı́
γ(θ) = φ(θ(x), τ (θ(x))) = Φ(θ, λθ + β) = (ρcosθ, ρsenθ, λθ + β)
é uma hélice(se λ 6= 0) ou um cı́rculo(se λ = 0.). Se θ = θ(τ (x)), um
raciocı́nio análogo permite concluir que
γ(x) = Φ(λτ + β, τ ) = (ρcos(λτ + β), ρsen(λτ + β), τ ),
e dessa forma uma hélice(se λ 6= 0) ou um segmento de reta(λ = 0). Ademais,
com
|γ 0 (x)|2 = ρ2 (θ0 )2 + (τ 0 )2 6= 0,
temos, para cada x ∈ [0, 1], θ0 (x) 6= 0 ou τ 0 (x) 6= 0. Portanto, numa vizinhança de cada x ∈ [0, 1], θ = θ(τ (x)) ou τ = τ (θ(x)), e é imediato concluir
que as curvas acima constituem todas as soluções das equações de EulerLagrange.
Exemplo 10: Seja σ o cilindro circular reto com base de raio r = 1 e
parametrizado por:
Φ(θ, τ ) = (cosθ, senθ, τ ) 0 ≤ θ ≤ 2π 0 ≤ τ ≤ 1.
√
√
√
√
Sejam A = ( 2/2, − 2/2, 1/2) e B = (− 2/2, − 2/2, 1/2) segue, pelas
afirmações feitas acima, que a curva γ : [0, 2π] → σ dada por
3
π
3
π 1
γ(θ) = cos( θ − ), sen( θ − ),
4
4
4
4 2
é uma solução da equação de Euler-Lagrange associada ao funcional (5.1),
entretanto tal curva não é minimizante, pois note que
3
3
π
3
π
0
γ (θ) =
−sen( θ − ), −cos( θ − ), 0
4
4
4
4
4
e dessa forma
||γ 0 (θ)|| =
3
4
implicando que
3π
>π
2
e portanto γ não pode ser minimizante, uma vez que tais pontos estão sobre
um cı́rculo e portanto a distância entre os mesmos deve, obrigatoriamente,
ser menor que π.
`(γ) =
Obs 5.2.1 O exemplo acima mostra que, apesar de as curvas minimizantes
sobre uma superfı́cie parametrizada da forma Φ(u, v) serem solução das
Equações de Euler-Lagrange para o funcional (5.1), nem toda solução de
tais equações será minimizante. Contudo, fixado A ∈ σ é possı́vel mostrar
que se B estiver suficientemente próximo de A(em R3 ), então dentre todas
as soluções das equações de Euler-Lagrange associadas a (5.1) haverá uma
que é minimizante.3
Definição 5.2.1 Uma curva γ solução das equações de Euler-Lagrange
associadas ao funcional (5.1) é denominada de geodésica de σ.
Obs 5.2.2 Note que
γ minimizante ⇒ γ geodésica 6⇒ γ minimizante.
5.3
Problemas Isoperimétricos
Alguns dos problemas variacionais podem vir acompanhados de vı́nculos, ou
seja, uma condição adicional a qual as curvas admissı́veis devem ainda satisfazer. Um problema isoperimétrico é uma problema da seguinte forma:
Encontrar a curva y = y(x) que extremiza o funcional
Z 1
J[y] =
L(x, x, y 0 )dx
0
3
Ver Manfredo P. do Carmo, Differential Geometry of Curves and Surfaces.
onde y(0) = A, y(1) = B e cujo funcional
Z 1
K[y] =
M(x, y, y 0 )dx
0
possua, sobre as curvas admissı́veis, valor fixado `.
Para tentar resolver tais problemas enunciemos o seguinte teorema:
Teorema 5.3.1 (Multiplicador de Lagrange) Considere o funcional
Z 1
J[y] =
L(x, x, y 0 )dx,
0
onde as curvas admissı́veis satisfazem as condições
Z 1
y(0) = A e y(1) = B, K[y] =
M(x, x, y 0 )dx = `,
0
K[y] sendo outro funcional, e se J[y] tem um extremo para y = y(x) e y não
é um extremo para K[y] então existe uma constante λ tal que y = y(x) é um
extremo do funcional
Z
1
(L + λM)dx,
0
i.e., y = y(x) satisfaz a equação diferencial
d
d
Ly − Ly0 + λ My − My0 = 0.
dx
dx
Para uma demonstração do seguinte teorema veja I.M. Gelfand e S.V. Fomin,
Calculus of Variations.
5.4
A Catenária.
Um problema variacional isoperimétrico clássico bastante famoso é o
problema da Catenária:
Considere a determinação da forma tomada por um cabo
flexı́vel, inextensı́vel, com densidade uniforme ρ e de comprimento `, suspenso entre dois pontos A e B, e sujeito somente ao seu próprio peso. Fisicamente falando, estamos
à procura dentre todas as curvas de comprimento ` a que
possua energia potencial mı́nima, uma vez que a única força
atuando sobre a mesma é o seu peso.
Solução: A massa de pequena porção infinitesimal ∆si do cabo é dada por
ρ∆si . Portanto a força P atuando sobre tal porção é, orientado o eixo y para
cima, sendo g o módulo da aceleração gravitacional:
P = −ρg∆si .
Como tal força atua somente na direção y temos que a energia potencial(gravitacional)
V de tal porção do cabo é dada por
V = ρgyi ∆si .
Dessa forma, energia potencial Ep do cabo é dada por
Z 1
Z 1 p
Ep = ρg
yds = ρg
y 1 + y 02 dx,
0
0
onde, sem perda de generalidade, as extremidades do cabo são dadas por
y(0) = A e y(1) = B.
Logo a curva y = y(x) que procuramos minimiza o funcional
Z 1 p
J[y] = ρg
y 1 + y 02 dx,
0
sujeita ao vı́nculo
Z
K[y] =
1
p
1 + y 02 dx = `.
0
Temos então as lagrangianas
p
p
L(y, y 0 ) = y 1 + y 02 e M(y, y 0 ) = 1 + y 02
Note que os funcionais J e K não possuem extremos em comum, uma vez
que os extremos de K são retas e os extremos de J foram encontrados no
problema da superfı́cie de rotação de área mı́nima. Daı́ usando o teorema
e = L + λM, temos, pelo fato
anterior e considerando a lagrangiana auxiliar L
0
e = L(y,
e y ), que a equação de Euler-Lagrange é equivalente a
de L
e − y0L
ey0 = C(cte)
L
ou ainda
p
y 02 (y + λ)
(y + λ) 1 + y 02 − p
= C.
1 + y 02
Segue daı́
y+λ
p
=C
1 + y 02
temos que tal EDO foi resolvida na seção AJEITAR!!!, donde
x + C1
y(x) = coshC(
) + C2
C
Concluı́mos assim que a curva procurada é a catenária.
5.5
O Problema Isoperimétrico Original.
Sem dúvida nenhuma, o problema isoperimétrico mais famoso é:
Considere como sendo as curvas admissı́veis o conjunto das
curvas fechada, que não auto-intersectam, com comprimento
total `. Qual, dentre tais curvas admissı́veis, encerra maior
área?
Solução: Sejam x = x(t), y = y(t) onde 0 ≤ t ≤ 1 e x(0) = x(1) =
0 e y(0) = y(1) = 0 a representação paramétrica das curvas adimı́ssı́veis
discutidas acima. Tais curvas devem satisfazer
Z 1p
K[x, y] =
ẋ2 + ẏ 2 dt = `
0
e a curva admissı́vel procurada deve ser um extremo para o funcional
Z 1
J[x, y] =
(xẏ − y ẋ)dt,
0
pois tal expressão determina a área encerrada pela curva γ(t) = (x(t), y(t)),
em virtude do teorema de Green. Temos que tais funcionais não possuem
pontos extremos em comum, uma vez que os pontos extremos de K são
segmentos de retas e não é difı́cil de verificar4 que os pontos extremos de J
satisfazem y = C1 e x = C2 . Introduzindo novamente a lagrangiana auxiliar
p
e y, ẋ, ẏ) = 1 (xẏ − y ẋ) + λ ẋ2 + ẏ 2 .
L(x,
2
Segue do teorema do multiplicador de Lagrange que a curva desejada satisfaz
as equações
eẋ
e
dL
ex dLẏ = L
ey ,
=L
dt
dt
seguindo que
!
!
1
1
d
1
λẋ
d 1
λẏ
ẏ =
− y+p
, − ẋ =
x+ p
2
dt
2
2
dt 2
ẋ2 + ẏ 2
ẋ2 + ẏ 2
e integrando com relação a t segue
λẋ
y + C1 = p
ẋ2 + ẏ 2
4
− x + C2 = p
λẏ
ẏ 2 + ẏ 2
Decorre direto das equações de Euler-Lagrange associadas a J.
.
Note que ẋ 6= 0 ou ẏ 6= 0, daı́, usando que y 0 =
ẏ
, segue
ẋ
−x + C2
dy
=
,
y + C1
dx
separando variáveis
(−x + C2 )dx = (y + C1 )dy,
e integrando em ambos os lados, segue que a curva procurada é
(y + C1 )2 + (x − C2 )2 = r2
como escolhemos curvas passando sobre a origem, segue
y 2 + x2 = C21 + C22 .
Portanto a curva procurada o cı́rculo de raio
p
`
C21 + C22 =
.
2π
Capı́tulo 6
Equações de Hamilton
6.1
As Equações de Hamilton
Consideremos as equações de Euler-Lagrange
dLyi0
= Lyi (i = 1, ..., N )
dx
(6.1)
associadas ao funcional
Z
J[y1 , ..., yN ] =
1
0
L(x, y1 , ..., yN , y10 , ..., yN
)dx,
0
e suponhamos ainda que a lagrangiana L satisfaç a condição
det Lyi0 yj0 6= 0.
As equações (6.1) formam então um sistema de N equações diferenciais de
segunda ordem. No entanto, tal sistema pode ser reduzido a um sistema de
2N equações de primeira ordem(a nomenclatura “reduzida” está associada
à ordem da derivada e não ao número de equações), que, em várias circunstâncias, é bastante conveniente. Por seguinte, a partir de agora, iremos
introduzir as chamadas variáveis canônicas. Escrevendo:
pi = Lyi0 (i = 1, ..., N ),
0
em termos das variáveis
gostarı́amos de expressar as funções y10 , ..., yN
x, y1 , ..., yN , p1 , ..., pN ,
47
(6.2)
CAPÍTULO 6. EQUAÇÕES DE HAMILTON
48
ou seja, estamos interessados numa mudança de variável conveniente, dada
por (6.2), que é perfeitamente possı́vel, uma vez que o jacobiano1
det(
∂pi
) = det(Lyi0 yj0 ) 6= 0.
∂yj0
Tal mudança de variável é garantida apenas localmente, pelo teorema da
função inversa.2
0
Daı́ expressaremos a função L = L(x, y1 , ..., yN , y10 , ..., yN
) em termos uma
0
0
nova função H = H(x, y1 , ..., yN , y1 , ..., yN ) relativa a L dada por:
H = −L +
N
X
yi0 pi
i=1
onde yi0 = yi0 (x, y1 , ..., yN , p1 , ..., pN ).
A função H é denominada de
Hamiltoniana correspondente a L. E finalmente introduzimos as novas variáveis
x, y1 , ..., yN , p1 , ..., pN , H
chamadas de variáveis canônicas.
Vejamos como se transformam as equações de Euler-Lagrange associadas a
J mediante as variáveis canônicas. Temos inicialmente, pela definição de H
que
N
N
X
X
0
dH = −dL +
pi dyi +
yi0 dpi
i=1
i=1
usando a expressão
dL = Lx +
N
X
Lyi dyi +
i=1
N
X
Lyi0 dyi0
i=1
segue
dH = −Lx −
N
X
i=1
Lyi dyi −
N
X
L
yi0
dyi0
i=1
+
N
X
i=1
pi dyi0
+
N
X
yi0 dpi
i=1
Encontrarı́amos agora o seguinte problema:
Como expressar dyi0 em função de x, y1 , ..., yN , p1 , ..., pN ?
1
Em homenagem a Carl Gustav Jacob Jacobi(1804-1851) nascido em Potsdam na
Prússia, hoje Rússia.
2
Para maiores informações veja Elon Lages Lima, Análise Real Vol.II.
49
No entanto, lembre-se que
pi = Lyi0 (i = 1, ..., N )
e portanto
dH = −Lx −
N
X
Lyi dyi +
i=1
N
X
yi0 dpi
i=1
dyi0 .
não envolvendo assim os
Por outro lado,
H = H(x, y1 , ..., yN , p1 , ..., pN ), e portanto
dH = Hx −
N
X
Hyi dyi +
i=1
N
X
lembre-se que
Hpi dpi
i=1
daı́ pela unicidade da diferencial, segue que:
Hx = −Lx , Hyi = −Lyi e Hpi =
dyi
(i = 1, ..., N )
dx
Veja que as quantidades Lyi e yi0 são conectadas as derivadas de H pelas
fórmulas acima. Supondo satisfeitas as equações de Euler-Lagrange
dLyi0
= Lyi (i = 1, ..., N )
dx
temos o seguinte sistema de equações:
dyi
= Hpi
dx
dpi
= −Hyi (i = 1, ..., N )
dx
As equações acima são chamadas de equações de Hamilton3 .
6.2
Integral Primeira para as Equações de
Hamilton
Definição 6.2.1 Uma função F = F(x, y1 , ..., yN , p1 , ..., pN ) é dita uma curva integral para um sistema de equações diferenciais se a mesma é constante
ao longo de cada curva integral do sistema, ou seja, sejam yi = yi (x) e
pi = pi (x) soluções de tal sistema, então
d
F(x, y1 (x), ..., yN (x), p1 (x), ..., pN (x)) = 0
dx
3
William Rowan Hamilton(1805-1865) nascido em Dublin na Irlanda.
50
0
Consideremos inicialmente uma Lagrangiana L = L(y1 , ..., yN , y10 , ..., yN
) que
não dependa explicitamente de x, segue dai que a Hamiltoniana associada à
mesma
N
X
H = −L +
yi0 pi
i=1
também não depende explicitamente de x. Assim segue que
N
N
N dH X
dyi X
dpi X
dyi
dpi
=
Hy i
+
Hpi
=
H yi
+ Hpi
dx
dx
dx
dx
dx
i=1
i=1
i=1
Supondo satisfeitas as equações de Hamilton
dyi
dpi
= Hpi ,
= −Hyi (i = 1, ..., N )
dx
dx
e portanto
N
dH X
=
(Hyi Hpi − Hpi Hyi ) = 0,
dx
i=1
ao longo das curvas que extremizam J. Assim segue que se L não depende
explicitamente de x então a Hamiltoniana H é uma curva integral para as
equações de Hamilton. Caracterizemos agora quando uma função arbitrária
Φ = Φ(y1 , ..., yN , p1 , ..., pN )
vem a ser uma curva integral para as equações de Hamilton. Temos, ao longo
das curvas integrais para as equações de Hamilton
N
N
N
dΦ X
dyi X
dpi X
=
Φyi
+
Φpi
=
(Φyi Hpi − Φpi Hyi )
dx
dx
dx
i=1
i=1
i=1
denotando
[Φ, H] :=
N
X
(Φyi Hpi − Φpi Hyi )
i=1
segue
dΦ
= [Φ, H],
dx
donde a expressão do lado direito da igualdade acima é chamado de colchete
de Poisson4 . Segue daı́ que a identidade acima determina uma condição
necessária e suficiente para as equações de Hamilton possuı́rem Φ como
integral primeira, ou seja, Φ é uma integral primeira para as equações de
Hamilton se, e somente se o colchete de Poisson [Φ, H] é identicamente nulo.
Obs 6.2.1 A condição suficiente acima é dada pelo teorema5 de Cauchy4
5
Siméon Denis Poisson(1781-1840) nascido em Pithiviers na França.
Ver Jorge Sotomayor, Lições de Equações Diferenciais Ordinárias.
51
Picard6 .
0
Obs 6.2.2 Se Φ = Φ(x, y1 , ..., yN , y10 , ..., yN
) então a condição é substituı́da
por
d
Φ = Φx + [Φ, H].
dx
Exemplo 11: Usaremos as equações de Hamilton para encontrar extremos
para o funcional
Z p
p
x2 + y 2 1 + y 02 dx
p
x2 + y 2 1 + y 02 , e daı́ segue que
p
y 0 x2 + y 2
Ly0 = p
1 + y 02
Solução: Temos que L(x, y, y 0 ) =
p
fazendo p = Ly0 , temos
p
p2 (1 + y 02 ) = y 02 (x2 + y 2 ) ⇒ p2 = y 02 (x2 + y 2 − p2 ) ⇒ y 0 = p
x2
como
d
y = Hp , segue
dx
p
Hp = p
x2
+ y 2 − p2
+ y 2 − p2
.
Lembrando da expressão do Hamiltoniano,
H = −L + y 0 p
como
p
p
x2 + y 2
x2 + y 2
02 = p
1+y = 2
⇒
1
+
y
x + y 2 − p2
x2 + y 2 − p2
02
temos
x2 + y 2
L(x, y, y 0 ) = p
x2 + y 2 − p2
e portanto
p
−(x2 + y 2 )
p2
p
p
H(x, y, p) =
+
= − x2 + y 2 − p2
x2 + y 2 − p2
x2 + y 2 − p2
6
Charles Émile Picard(1856-1941) nascido em Paris na França.
,
52
lembrando que
dp
= −Hy
dx
implicando em
y
d
p= p
dx
x2 + y 2 − p2
p
d
y=p
dx
x2 + y 2 − p2
Considerando p = p(y(x)), segue, pela regra da cadeia que
y
dp
=
dy
p
daı́ separando variáveis temos:
pdp = ydy ⇒ p2 = y 2 + C2 (cte)
substituindo o valor de p temos
p y
p
( )2 + 1
y 2 + C2
dy
= √
= p Cx 2
dx
(C) + 1
x 2 + C2
separando variáveis novamente
dy
( Cy )2
p
+1
=p
dx
( Cx )2
+1
seguindo
r
ln
y
y
( )2 + 1 −
C
C
r
= ln
x
x
( )2 + 1 −
C
C
+ C1
vamos supor, por simplicidade, que C1 = 0. Então
r
r
y 2
x
1
( ) + 1 − ( )2 + 1 = (y − x)
C
C
C
elevando ao quadrado em ambos os lados
r
r
y 2
x 2
y 2
x 2
y
2
x
( ) +2+( ) −2
( ) +1
( ) + 1 = ( )2 − xy + ( )2
C
C
C
C
C
C
C
seguindo assim
r
C
r
y 2
x 2
( ) +1
( ) + 1 = C + xy
C
C
e daı́
C
2
2
y2
x
+1
+ 1 = C2 + 2Cxy + x2 y 2
C2
C2
implicando
C
2
y 2 x2
y2
x2
+ 2 + 2 + 1 = C2 + 2Cxy + x2 y 2
C4
C
C
e portanto
y 2 x2
+ y 2 + x2 = 2Cxy + x2 y 2
2
C
e finalmente a solução é:
1
2
2
− 1 + y 2 + x2 − 2Cxy = 0.
y +x
2
C
53
Capı́tulo 7
O Princı́pio Variacional de
Hamilton
7.1
Dinâmica Lagrangiana
“Desde que existe como ciência, a Fı́sica tem como seu objetivo mais cobiçado a solução do problema de condensar todos
os fenômenos naturais num único princı́pio. Dentre as leis
mais ou menos gerais que marcam as conquistas da ciência
fı́sica durante o curso dos últimos séculos, o princı́pio da
mı́nima ação é talvez aquele que, no que se refere à forma e ao conteúdo, mais se aproxima desse objetivo final da
pesquisa teórica”.
Max Planck
Vı́nculos cinemáticos são limitações às possı́veis posições e velocidades
das partı́culas de um sistema mecânico, restringindo a priori o movimento. Se
y1 , ..., yN são coordenadas arbitrárias usadas para descrever a configuração1
de um sistema mecânico, um vı́nculo é chamado holônomo2 quando pode ser
expresso por uma equação da forma
f (t, y1 , ..., yN ) = 0,
(7.1)
onde f é uma função com um certo grau de regularidade. Em sistemas
holônomos é possı́vel introduzir um certo número N de variáveis independentes, denotadas genericamente por q1 , ..., qN e denominadas coordenadas
generalizadas de sorte que:
1
A posição de cada uma das partı́culas de um sistema mecânico num dado instante
define a configuração do sistema no referido instante.
2
Do grego hólos(inteiro, completo) e nómos(regra, lei).
54
CAPÍTULO 7. O PRINCÍPIO VARIACIONAL DE HAMILTON
55
• o vetor posição de cada partı́cula é determinado univocamente em cada
instante pelos “qs”;
• os vı́nculos, supostos todos da forma (7.1), são identicamente satisfeitos
se expressos em termos dos “qs”.
O espaço cartesiano N dimensional cujos pontos são as N -uplas formadas
pelas coordenadas generalizadas é chamado de espaço de configuração. A
medida que o tempo passa, o estado do sistema se modifica e o ponto
representativo do sistema descreve uma curva no espaço de configuração,
já que as equações q1 = q1 (t), ..., qN = qN (t) são a representação paramétrica
de uma curva tendo t como parâmetro. Designaremos, por simplicidade,
q = (q1 , ..., qN ).
Princı́pio de Hamilton: Dado um sistema mecânico holônomo descrito
pela lagrangiana L(t, q, q̇) seu movimento do instante t1 para o instante t2 é
tal que a ação
Z
t2
A(q) =
L(t, q, q̇)dt
t1
é mı́nima(mais geralmente, estacionária) para a trajetória real, mantidos
fixos os pontos inicial e final da trajetória no espaço de configuração.
Obs 7.1.1 O princı́pio de Hamilton é também conhecido como princı́pio da
mı́nima ação.
Considere um sistema mecânico N partı́culas, onde não são impostos nenhum tipo de vı́nculo3 , suponha que tal sistema possua uma energia potencial
V, i.e., existe uma função
V = V(t, x1 , y1 , z1 , ..., xN , yN , zN ),
tal que a força atuando na i-ésima partı́cula tem como componentes
Xi = −
∂V
∂V
∂V
, Yi = −
, Zi = −
.
∂xi
∂yi
∂zi
A quantidade definida por, onde mi simboliza a massa da i-ésima partı́cula,
N
1X
T =
mi (ẋ2i + ẏi2 + żi2 )
2 i=1
3
Para uma apresentação com alguns vı́culos incluı́dos veja Robert Weinstock, Calculus
of Variations.
56
é chamada de energia cinética do sistema4 . A Lagrangiana que descreve tal
sistema mecânico é defina por
L = T − V.
Tal lagrangiana é ainda conhecida com Potencial Cinético. Pelo princı́pio de
Hamilton, a evolução de tal sistena dar-se-á de um instante t1 a um intante
t2 de forma que a ação
Z
t2
A=
Ldt
t1
é estacionário. Portanto as equações de Euler-Lagrange
Lxi =
dLx˙i
dLy˙i
dLz˙i
, Lyi =
, Lzi =
dt
dt
dt
devem ser satisfeitas para i = 1, ..., N . Usando as expressões da energia
cinética e da energia potencial, segue
d
mi ẋi
dt
d
−Vyi = mi ẏi
dt
d
−Vzi = mi z˙i .
dt
−Vxi =
(7.2)
Substituindo −Vxi = Xi , −Vyi = Yi e −Vzi = Zi o sistema acima é reduzido
a
mi ẍi = Xi , mi ÿi = Yi , mi zï = Zi ,
que são justamente as equações de Newton do movimento do sistema de N
partı́culas. As variáveis canônicas correspondentes a ação A são
pix = Lẋi = mi ẋi ,
piy = Lẏi = mi ẏi ,
piz = Lżi = mi z˙i ,
as quantidades pix , piy e piz são chamadas de momentos generalizados e a
quantidade definida por
H=
N
X
(ẋi pix + ẏi piy + z˙i piz ) − L = 2T − (T − V) = T + V,
i=1
4
Como não são impostos vı́nculos as própria coordenadas x1 , y1 , z1 , ..., xN , yN , zN são
as coordenadas generalizadas do sistema.
57
é denominada de energia mecânica ou energia total do sistema. Suponha
que um dado sistema mecânico é conservativo, i.e., a energia potencial V
não depende explicitamente do tempo, daı́ decorre que a energia mecânica é
conservada, i.e., ele permanece constante das soluções do sistema (7.2). De
fato,
dT
dV
dH
=
+
,
dt
dt
dt
usando as expressões da energia cinética e da energia potencial, segue
N
d
1X
d
d
(T + V) =
mi (ẋi 2 + ẏi 2 + z˙i 2 ) + V(x1 , y1 , z1 , ..., xN , yN , zN )
dt
2 i=1
dt
dt
=
N
X
mi (ẋi ẍi + ẏi ÿi + +z˙i zï ) +
i=1
N
X
(Vxi ẋi + Vyi ẏi + Vzi z˙i )
i=1
e daı́
N
N
N
X
X
X
d
dH
= (T +V) =
ẋi (mi ẍi +Vxi )+
ẏi (mi ÿi +Vyi )+
z˙i (mi zï +Vzi ),
dt
dt
i=1
i=1
i=1
daı́ usando
d
mi ẋi = mi ẍi
dt
d
−Vyi = mi ẏi = mi ÿi
dt
d
−Vzi = mi z˙i = mi zï ,
dt
−Vxi =
segue que
dH
= 0 ⇒ H = C(cte).
dt
A expressão acima é conhecida como Lei da Conservação da Energia Mecânica.
Obs 7.1.2 Vejamos um exemplo simples onde a Lei da conservação da Energia Mecânica é obtida de forma mais simples. Considere um campo de
forças F : Ω ⊆ R3 → R3 conservativo, atuando sobre uma partı́cula P de
massa m e seja V o seu potencial, i.e.,
∇V(x, y, z) = −F(x, y, z).
Seja γ : [0, 1] → Ω uma curva suave descrevendo a trajetória de P sobre Ω ao
longo do tempo. Seja A = γ(0) e B = γ(1), o trabalho W(A,B) a ser realizado
para mover P de A até B é dado por
Z 1
W(A,B) =
F(γ(t)).γ 0 (t)dt
0
58
onde o ponto “ponto(.)” simboliza o produto interno em R3 . Pela segunda
lei de Newton, F(γ(t)) = mγ 00 t), daı́
Z 1
Z 1
1
d
0
00
W(A,B) = m
γ (t).γ (t)dt = m
(||γ 0 (t)||2 )dt
2
dt
0
0
1
1
0
2
0
2
=
m||γ (1)|| − m||γ (0)|| = TB − TA
2
2
donde as quantidades TA e TB representam a energia cinética da partı́culas
nos pontos indicados. Por outro lado,
Z 1
Z 1
0
W(A,B) =
F(γ(t)).γ (t)dt = −
∇V(γ(t))γ 0 (t)dt
0
0
Z 1
d
= −
(V(γ(t))dt = V(γ(0)) − V(γ(1)) = VA − VB
0 dt
donde as quantidades VA a VB representam a energia potencial da partı́cula
nos pontos indicados, seguindo então que
VA − VB = TB − TA ⇒ TA + VA = TB + VB ,
ou seja, a energia mecânica é a mesma nos pontos A e B, no entanto, o
mesmo procedimento pode ser feito para quaisquer dois pontos sobre a curva
γ, e portanto a energia mecânica é conservada.
7.2
Oscilador Harmônico Simples
Considere uma partı́cula de massa m fixada a uma mola e sobre a mesma atuando uma força restauradora −κx, i.e., oscilador harmônico simples.
Como a força atuando sobre a partı́cula é −κx, a energia potencial para a
mesma é
1
V(x) = κx2
2
e a energia cinética
1
T (ẋ) = mẋ2
2
e portanto o potencial cinético associado a tal sistema fı́sico é
1
1
L(x, ẋ) = mẋ2 − κx2
2
2
e daı́ o funcional ação de tal sistema é
Z
1 t1
J[x] =
(mẋ2 − κx2 )dt.
2 t0
59
uma vez que Lẋ = mẋ, implicando que p = mẋ, seguindo que
L(x, ẋ) =
1 2 1 2
ṗ − κx .
2m
2
Temos a Hamiltoniana associada
1
1 2 p2
1
1 2
H(x, p) = κx2 −
p +
= κx2 +
p,
2
2m
m
2
2m
daı́, as equações de Hamilton são:
ẋ = Hp , ṗ = −Hx ⇒ ẋ =
p
, ṗ = −κx
m
note daı́ que:
mẍ = ṗ = −κx
que é 2a lei de Newton. Calculemos ainda
[x, H] =
∂x
∂x
Hp −
Hx = Hp = ẋ
∂x
∂p
e mais
[p, H] =
como p = mẋ segue que
∂p
∂p
Hp − Hx
∂x
∂p
∂p
= 0, e portanto
∂x
[p, H] = −Hx = ṗ.
Vale a pena relembrar que fato de H não depender explicitamente de t implica
que H é uma integral primeira para as equações de Hamilton associadas a J.
7.3
Forças Centrais.
Usaremos aqui o princı́pio de Hamilton mı́nima para a formulação variacional do problema do movimento plano de uma partı́cula de massa m atraı́da
para a origem do sistema de coordenadas por uma força inversamente proporcional ao quadrado da distância a origem, ou seja, uma força central5 .
Usaremos coordenadas polares:
x(t) = r(t)cosθ(t) e y(t) = r(t)senθ(t)
5
Uma força é dita central quando ela depende somente da distância do corpo a um
referencial tomado.
60
temos que a energia cinética T atuando na partı́cula é
1
T = m[ẋ2 + ẏ 2 ]
2
como
ẋ = ṙcosθ − rsenθ θ̇ , ẏ = ṙsenθ + rcosθ θ̇,
segue que
1
T (r, ṙ, θ, θ̇) = m(ṙ2 + r2 θ̇2 ).
2
Temos que o quadrado distância da partı́cula a origem é r2 , e portanto a
força F atuando sobre a tal é
F(r) =
κ
r2
implicando que
κ
V(r) = − ,
r
onde V é a energia potencial da partı́cula. Daı́ segue que a Lagrangiana
associada a este problema fı́sico é
1
1
κ
H(r, θ, ṙ, θ̇) = mṙ2 + m2 θ̇2 + ,
2
2
r
daı́, pelo princı́pio de Hamilton, a evolução do sistema de instante t1 para o
instante t2 dar-se-á de forma que o funcional ação
Z t2
1
1
κ
J[r, θ] =
[ mṙ2 + mr2 θ̇ + ]dt
2
r
t1 2
sejá minimizado(estacionário).
Desejamos encontrar a Hamiltoniana
H(r, θ, pr , pθ ) associada a Lagrangiana L. Temos que:
pr
m
pθ
pθ = Lθ̇ ⇒ pθ = mr2 θ̇ ⇒ θ̇ =
mr2
Assim a Lagrangiana é
pr = Lṙ ⇒ pr = mṙ ⇒ ṙ =
L(r, θ, ṙ, θ̇) =
1 2
1 2 κ
pr +
p +
2m
2mr2 θ r
e portanto a Hamiltoniana associada ao sistema é
H(r, θ, pr , pθ ) = −L(r, θ, ṙ, θ̇) + ṙpr + θ̇pθ
61
seguindo que
H(r, θ, pr , pθ ) =
1 2
1 2 κ
pr +
p −
2m
2mr2 θ r
daı́ as equações de Hamilton são
ṙ = Hpr p˙r = −Hr
usando que
Hr =
θ̇ = Hpθ p˙θ = −Hθ ,
κ
pθ
Hθ = 0 Hpr = mpr Hpθ =
2
r
mr2
segue
ṙ = mpr p˙r = −
κ
pθ
θ̇ =
p˙θ = 0.
2
r
mr2
Calculemos os colchetes de Poisson
[Pr , H] = −
∂pr
κ
Hr = − 2
∂pr
r
[Pθ , H] = −
∂pθ
HHθ = 0
∂pθ
Logo pθ é uma integral primeira para as equações de Hamilton de tal problema. Calculemos as equações(explı́citas) do movimento da partı́cula. Temos
1
1
κ
L(r, θ, ṙ, θ̇) = mṙ2 + mr2 θ̇2 +
2
2
r
logo as equações de Euler-Lagrange são
L − ṙLṙ = C1 (cte)
e daı́
L − θ̇θ̇ = C2 (cte),
1
1
κ
− mṙ2 + mr2 θ̇2 + = C1
2
2
r
e
1 2 1 2 2 κ
mṙ − mr θ̇ + = C2 ,
2
2
r
2κ
= C1 + C2 ⇒ r = ρ(cte). Daı́
r
mr2 θ̇2 = C1 − C2
implicando
θ̇2 = cte ⇒ θ = µt + β
onde µ e β são constantes. E finalmente as equações do movimento são
x(t) = ρcos(µt + β) e x(t) = ρsen(µt + β)
ou seja, a partı́cula está movendo-se sobre cı́rculo de raio ρ e centro na origem.
Capı́tulo 8
A Equação de Euler-Lagrange
em RN .
8.1
A Equação de Euler-Lagrange em RN .
Consideremos agora L : Ω × R × RN → R onde Ω ⊆ RN é um aberto,
conexo e limitado com fronteira ∂Ω suave e L possuindo derivadas parciais
contı́nuas de primeira e segunda ordem com respeito a todas as variáveis em
questão. Seja ainda funcional
Z
J[u] =
L(x, u, ∇u)dx
Ω
1
0
onde u ∈ C (Ω, R) ∩ C (∂Ω, R) e x = (x1 , ..., xN ), dx = dx1 ...dxN , tal integral
simboliza a integral múltipla sobre a região Ω e ∇u = (ux1 , ..., uxN ) representa
o vetor gradiente associado a função u = u(x).
Segue um lema análogo ao do capı́tulo 3.
Lema 8.1.1 (Lema fundamental do Cálculo das Variações) Seja
g : Ω → R uma função contı́nua tal que
Z
g(x)f (x)dx = 0 ∀f ∈ C0 (Ω, R)
Ω
Então g ≡ 0.
Demonstração: Suponha, por absurdo, que g 6= 0. Então, sem perda de
generalidade, podemos supor, devido a continuidade de g, que g > 0 em uma
bola aberta Br (x0 ) ⊆ Ω, para algum r > 0. Defina h(x) := r2 − ||x − x0 ||2
em Br (x0 ) e h(x) = 0 em Br (x0 )c ∩ Ω. É imediato que h ∈ C0 (Ω, R). Por
outro lado
Z
Z
g(x)h(x)dx =
g(x)h(x)dx > 0
Ω
Br (x0 )
62
CAPÍTULO 8. A EQUAÇÃO DE EULER-LAGRANGE EM RN .
63
uma vez que g(x)h(x) > 0 em Br (x0 ). Portanto obtivemos uma contradição
à nossa hipótese, donde g ≡ 0.
Obs 8.1.1 Da mesma forma como no capı́tulo 3, o lema acima pode ser
modificado para h ∈ C0k (Ω), pois basta definir h(x) := (r2 − ||x − x0 ||2 )k .
Vamos estabelecer as equações de Euler-Lagrange para o funcional J.
Seja h ∈ C01 (Ω, R), i.e., uma função de classe C 1 em Ω que é identicamente
nula sobre a fronteira ∂Ω. Definamos a “perturbação” para o funcional J,
ξ : (−, ) → R, onde > 0, dada por
ξ(t) := J[u + th]
então ξ 0 (0) = δJ[u]h. Por definição,
Z
ξ(t) =
L(x, u + th, ∇u + t∇h)dx
Ω
e, pela regra da cadeia,
N
X
∂L
ξ (t) = (Lu h +
hxi )dx
∂u
x
Ω
i
i=1
0
Z
usaremos agora o teorema da divergência de Gauss (2.1) para o campo
X = (hLux1 , ..., hLuxi ).
Temos que X é C 1 e portanto
N
N
N
X
X
∂(hLuxi ) X
∂Lux1
∂h
div X =
=
Luxi +
h
∂xi
∂xi
∂xi
i=1
i=1
i=1
Veja que X ≡ 0 ∈ ∂Ω, uma vez que h ≡ 0 ∈ ∂Ω, daı́ temos que:
Z
hX, υi dSx = 0
∂Ω
e portanto
Z
div Xdx = 0
Ω
e portanto
Z X
Z X
N
N
∂Luxi
∂h
Luxi dx + (
)hdx = 0.
Ω i=1 ∂xi
Ω i=1 ∂xi
64
Daı́, voltando a expressão de ξ 0 (t), segue
Z
0
(Lu −
ξ (t) =
Ω
N
X
∂Lux
i
∂xi
i=1
)hdx
e fazendo t = 0,
0
Z
(Lu −
ξ (0) =
Ω
N
X
∂Lux
i
∂xi
i=1
)hdx
Daı́ se u for um extremo para J, usando que ξ 0 (0) = δJ[u]h = 0 e a
observação do lema (8.1.1), segue que
Lu =
N
X
∂Lux
i
i=1
∂xi
.
(8.1)
A equação acima é chamada de equação de Euler-Lagrange associada ao
funcional J.
Vejamos uma aplicação da equação de Euler-Lagrange acima ao problema
de Poisson.
8.2
O Princı́pio de Dirichlet
Uma generalização do problema de Dirichlet, visto no capı́tulo 1, é o
problema de Poisson:
∆u = f, em Ω
(8.2)
u = g, em ∂Ω
onde u ∈ C 2 (Ω) ∩ C(∂Ω) é uma função, a priori, desconhecida, g ∈ C(∂Ω)
e f ∈ C(Ω) funções conhecidas e ainda Ω um domı́nio limitado em RN com
fronteira suave.
Obs 8.2.1 Note que o problema de Dirichlet é uma caso particular do
problema de Poisson quando f ≡ 0.
Teorema 8.2.1 (Unicidade) O problema de Poisson (8.2) possui, no máximo,
uma solução.
Demonstração: A demonstração é idêntica ao teorema 1.3.3.
Seja v ∈ C01 (Ω) e u satisfazendo
−∆u = f em Ω
65
multiplicando ambos os lados da igualdade acima por v e integrando em Ω,
temos
Z
Z
− ∆u vdx =
f vdx
Ω
Ω
devido v = 0 em ∂Ω segue, pelo primeira fórmula de Green (2.3), que
Z
Z
− ∆u vdx =
∇u∇vdx,
Ω
Ω
e portanto
Z
Z
∇u∇vdx =
f vdx.
Ω
(8.3)
Ω
Note que a expressão (8.3) é linear em relação a v, motivados por tal linearidade definamos o funcional Energia J : A → R por
Z
1
(8.4)
J[w] = ( ||∇w||2 − wf )dx,
Ω 2
onde A = {w ∈ C 2 (Ω); u = g em ∂Ω}.
variacional do problema de Poisson (8.2).
Vejamos agora a versão
Teorema 8.2.2 (Princı́pio de Dirichlet) Uma função u é uma solução
para o problema de Poisson (8.2) se e somente se
J[u] = min J[w]
w∈A
(8.5)
Demonstração: Seja u uma solução para o problema de Poisson (8.2) e
w ∈ A, segue que
Z
(−∆u − f )(u − w)dx = 0
Ω
como u − w = 0 em ∂Ω, segue pela primeira fórmula de Green (2.3) que
Z
Z
− ∆u(u − w)dx =
∇u(∇u − ∇w)dx,
Ω
Ω
daı́ segue que
Z
2
Z
(||∇u|| − f u)dx =
Ω
(h∇u, ∇wi − f w)dx.
Ω
Por Cauchy-Schwarz,
Z
Z
Z
Z
1
1
2
h∇u, ∇wi dx ≤
||∇u||.||∇w||dx ≤
||∇u|| dx +
||∇w||2 dx,
2
2
Ω
Ω
Ω
Ω
66
implicando
Z
Z
Z
1
1
2
2
(||∇u|| − f udx) ≤
||∇u|| dx + ( ||∇w||2 − f w)dx
2 Ω
Ω
Ω 2
e portanto
Z
Z
1
1
2
||∇u|| − f udx ≤ ( ||∇w||2 − f w)dx,
Ω 2
Ω 2
ou seja,
J[u] ≤ J[w],
donde w ∈ A é arbitrário, logo, u minimiza o funcional (8.4).
Suponha agora que u minimiza o funcional (8.4), então u satisfaz a equação de
Euler-Lagrange
Lu =
N
X
∂Lux
i
i=1
∂xi
,
(8.6)
onde a Lagrangiana L associada ao funcional (8.4) é
N
1
1X 2
L(x, u, ∇u) = h∇u, ∇ui − f u =
u − f u,
2
2 i=1 xi
daı́ segue que
Lu = −f
e ainda
Luxi = uxi ⇒
∂Luxi
= u xi xi
∂xi
e como u satisfaz a equação (8.6)
∆u =
N
X
uxi xi = −f
i=1
e como u ∈ A, segue que u é solução para o problema de Poisson (8.2).
8.3
O Problema de Plateau
Vejamos uma aplicação da equação de Euler-Lagrange a teoria de
superfı́cies mı́nimas1 . Seja então γ : [0, 1] → R2 uma curva, simples, suave
e fechada, e ainda Ω ⊆ R2 o subconjunto compacto em R2 , cuja fronteira
∂Ω = γ. Um problema, da Geometria Diferencial, bastante famoso é o
problema de Plateau2
1
2
Veja Manfredo Perdigão do Carmo, Differential Geometry of Curves and Surfaces.
Joseph Antoine Ferdinand Plateau(1801-1883), nascido em Bruxelas na Bélgica.
67
“Qual, dentre as superfı́cies σ em R3 , possuindo γ como
fronteira, possui área mı́nima?”
Consideramos tais superfı́cies σ, parametrizadas por Φ : Ω → R3 ,
Φ(x, y) = (x, y, z(x, y)), onde z : Ω → R é uma função, a ser encontrada, de
classe C 2 . Vejamos então a formulação variacional de tal problema.
Temos que a área de σ, que representaremos por Sσ , é dada por
Z Z
Sσ =
||Φx ∧ Φy ||dxdy,
Ω
daı́ como Φx = (1, 0, zx ) e Φy = (0, 1, zy ), seguindo que Φx ∧Φy = (−zx , −zy , 1),
e portanto
Z Z p
Sσ =
1 + ||∇z||2 dxdy,
Ω
seguindo assim que a superfı́cie procurada minimiza o funcional
Z Z p
J[z] :=
1 + ||∇z||2 dxdy.
(8.7)
Ω
Temos então a lagrangiana
L(x, y, z, zx , zy ) =
p
1 + ||∇z||2
(8.8)
e portanto a função z : Ω → R procurada deve satisfazer a equação
Lu =
∂Lux ∂Luy
+
∂x
∂y
(8.9)
que é a equação de Euler-Lagrange associada ao funcional (8.7). Usando a
expressão da lagrangiana (8.8), segue
Lu = 0,
ux
Lux = p
1 + ||∇u||2
e portanto a equação (8.9) é dada por
!
∂
∂
ux
p
+
∂x
∂y
1 + ||∇u||2
,
1 + ||∇u||2
uy
p
1 + ||∇u||2
ou então,
div
∇u
p
uy
Luy = p
1 + ||∇u||2
!
= 0.
!
=0
68
Dada uma superfı́cie regular em R2 , existem duas quantidades que são
intrı́nsecas de tal superfı́cie, tais quantidades são
1 eG − 2fF + gE
√
H=
,
2
EG − F2
eg − f 2
√
K=
EG − F2
onde K é de denominadas de curvatura gaussiana e H curvatura média e
{e, g, f} e {E, G, F} são os coeficientes da Segunda Forma Fundamental e
Primeira Forma Fundamental, respectivamente. Uma superfı́cie regular em
R3 é dita Mı́nima quando sua curvatura média é identicamente nula. No
caso em que estamos trabalhando onde as parametrizações são da forma
Φ(x, y) = (x, y, z(x, y)) é possı́vel mostrar que
!
p
∇u
,
2 1 + ||∇u||2 H = div p
1 + ||∇u||2
daı́ concluı́mos que uma superfı́cie σ é mı́nima se, e somente se, a mesma é
estacionária para o funcional (8.7).
Obs 8.3.1 Note que se a função z minimiza o funcional (8.7) então a superficie σ parametrizada por Φ é uma superfı́cie mı́nima. Entretanto se σ é uma
superfı́e mı́nima parametrizada por Φ tem-se que o funcional (8.7) é apenas
estacionário para função z, devido a equação de Euler-Lagrange ser apenas
uma condição necessária para tal funcional ser minimiza(maximizado).
Referências Bibliográficas
[1] Boyce, W. E., DiPrima, R. C., Equações Diferenciais Elementares e
Problemas de Valores de Contorno. Editora LTC 2002.
[2] Brezis, H., Analyse Functionelle, Maison, Paris 1983.
[3] Do Carmo, M. P., Differential Geometry of Curves and Surfaces,
Prentice Hall 1976.
[4] Evans, L. C., Partial Differential Equations, Graduate Studies in
Mathematics 1997.
[5] Figueiredo, D. G. de, Neves, A. F., Equações Diferenciais Aplicadas,
Coleção Matemática Universitária 1997.
[6] Gelfand, I. M., Fomin, S. V., Calculus of Variations., Editora Dover
2000.
[7] Lemos, N. A., Mecânica Analı́tica, Editora Livraria da Fı́sica 2003. 1979.
[8] Lima, L. E., Curso de Análise vol.2, Projeto Euclides 2000.
[9] Lima, L. E., Espaços Métricos, Projeto Euclides 1993.
[10] Lima, L. E., Álgebra Linear, Projeto Euclides 1998.
[11] Neto, J. B., Mecânica: Newtoniana, Lagrangiana e Hamiltoniana.,
Livraria da Fı́sica 2004.
[12] Sotomayor, J., Lições de Equações Diferenciais Ordinárias, Projeto Euclides
[13] Nussenzveig, H. M., Curso de Fı́sica Básica vol.4, Ótica, Relatividade e
Fı́sica Quântica., Editora Edgar Blücher 2002.
[14] Weinstock, R., Calculus of Variations with applications to physics &
engineering, Editora Dover 1974.
69

dE EQUAÇÕES DE EULER

Transcrição

Documentos relacionados

Lista B (Limites e Continuidade)

Lista de Exerc´ıcios 11 1. Um balde de água contendo 10 litros de

Estruturas - Nicolau Corção Saldanha

CAP´ITULO 4 INTEGRAIS 4.1 Antiderivadas ou Primitivas

Prática

Solução 2ª Eliminatória

2013/2014 - Curso Mentor

Prova I - Thanos Tsouanas

Sabendo que 1 pé tem 30,48 cm e que 1 polegada tem 2,54 cm

Introdução aos Corpos de Funções Algébricas